OLMES (Open Language Model Evaluation Standard) est un cadre d'évaluation standardisé développé par l'Allen Institute for AI. Le cadre se concentre sur la reproductibilité et la cohérence dans les évaluations de modèles de langage.
Publié
2024
Juridiction
Mondial
Catégorie
Assessment and evaluation
Accès
Accès public
Modèle de fiche technique pour jeu de données (LaTeX)
Transparency and documentation • Overleaf
Divulgations de systèmes IA
Transparency and documentation • National Telecommunications and Information Administration
Jeu de donnees d'images centrees sur l'humain pour le benchmarking ethique de l'IA
Datasets and benchmarks • Nature
VerifyWise vous aide à implémenter des cadres de gouvernance de l'IA, à suivre la conformité et à gérer les risques dans vos systèmes d'IA.