Modèle de fiche technique pour jeu de données
Résumé
Ce modèle LaTeX transforme la documentation des jeux de données d'une réflexion tardive en un processus structuré et professionnel. Basé sur l'article influent « Datasheets for Datasets » de Timnit Gebru et collègues, il fournit un cadre complet pour documenter tout, de la méthodologie de collecte de données aux considérations éthiques.
À qui s'adresse cette ressource
Utilisateurs principaux :
- Data scientists et ingénieurs ML créant des jeux de données pour un usage interne ou une publication publique
- Chercheurs académiques préparant des jeux de données pour publication ou soumission à des conférences
- Chefs de produit supervisant le développement IA qui doivent assurer une documentation appropriée des jeux de données
- Équipes de conformité dans les industries réglementées nécessitant une documentation détaillée de la lignée des données et des biais
Utilisateurs secondaires :
- Consommateurs de données qui doivent évaluer si un jeu de données correspond à leur cas d'utilisation
- Auditeurs et régulateurs examinant les systèmes IA pour la conformité ou l'évaluation des risques
Ce qu'il y a réellement dans le modèle
Le modèle structure la documentation autour de sept sections essentielles, chacune avec des invites et un formatage spécifiques :
- Section motivation couvre pourquoi le jeu de données a été créé et qui a financé son développement.
- Section composition détaille ce qu'il y a réellement dans le jeu de données—types de données, nombre d'instances.
- Section processus de collecte documente comment les données ont été rassemblées.
- Prétraitement et étiquetage couvre toutes les transformations appliquées aux données brutes.
- Distribution et maintenance aborde comment le jeu de données sera partagé, mis à jour ou déprécié.
- Utilisations et limitations indique explicitement les utilisations recommandées et interdites.
- Considérations légales et éthiques couvre les protections de la vie privée et les mécanismes de consentement.
Mots-clés
En bref
Publié
2021
Juridiction
Mondial
Catégorie
Transparency and documentation
Accès
Accès public
Ressources connexes
IEEE 7001 - Norme pour la transparence des systèmes autonomes
Standards and certifications • IEEE
IEEE 7001-2021 - Norme IEEE pour la transparence des systèmes autonomes
Standards and certifications • IEEE
ISO/IEC 38507:2022 - Implications de gouvernance de l'utilisation de l'intelligence artificielle
Standards and certifications • ISO
Construisez votre programme de gouvernance de l'IA
VerifyWise vous aide à implémenter des cadres de gouvernance de l'IA, à suivre la conformité et à gérer les risques dans vos systèmes d'IA.