Overleaf
ModèleActif

Modèle de fiche technique pour jeu de données (LaTeX)

Overleaf

Voir la ressource originale

Modèle de fiche technique pour jeu de données

Résumé

Ce modèle LaTeX transforme la documentation des jeux de données d'une réflexion tardive en un processus structuré et professionnel. Basé sur l'article influent « Datasheets for Datasets » de Timnit Gebru et collègues, il fournit un cadre complet pour documenter tout, de la méthodologie de collecte de données aux considérations éthiques.

À qui s'adresse cette ressource

Utilisateurs principaux :

  • Data scientists et ingénieurs ML créant des jeux de données pour un usage interne ou une publication publique
  • Chercheurs académiques préparant des jeux de données pour publication ou soumission à des conférences
  • Chefs de produit supervisant le développement IA qui doivent assurer une documentation appropriée des jeux de données
  • Équipes de conformité dans les industries réglementées nécessitant une documentation détaillée de la lignée des données et des biais

Utilisateurs secondaires :

  • Consommateurs de données qui doivent évaluer si un jeu de données correspond à leur cas d'utilisation
  • Auditeurs et régulateurs examinant les systèmes IA pour la conformité ou l'évaluation des risques

Ce qu'il y a réellement dans le modèle

Le modèle structure la documentation autour de sept sections essentielles, chacune avec des invites et un formatage spécifiques :

  • Section motivation couvre pourquoi le jeu de données a été créé et qui a financé son développement.
  • Section composition détaille ce qu'il y a réellement dans le jeu de données—types de données, nombre d'instances.
  • Section processus de collecte documente comment les données ont été rassemblées.
  • Prétraitement et étiquetage couvre toutes les transformations appliquées aux données brutes.
  • Distribution et maintenance aborde comment le jeu de données sera partagé, mis à jour ou déprécié.
  • Utilisations et limitations indique explicitement les utilisations recommandées et interdites.
  • Considérations légales et éthiques couvre les protections de la vie privée et les mécanismes de consentement.

Mots-clés

transparencedocumentationjeux de donnéesgouvernance IAstandardisationresponsabilité

En bref

Publié

2021

Juridiction

Mondial

Catégorie

Transparency and documentation

Accès

Accès public

Construisez votre programme de gouvernance de l'IA

VerifyWise vous aide à implémenter des cadres de gouvernance de l'IA, à suivre la conformité et à gérer les risques dans vos systèmes d'IA.

Modèle de fiche technique pour jeu de données (LaTeX) | Bibliothèque de la gouvernance de l'IA | VerifyWise