Le LM Evaluation Harness d'EleutherAI est devenu l'outil standard pour évaluer les grands modèles de langage dans la communauté de recherche. Ce framework open source permet une évaluation cohérente à travers des centaines de tâches et benchmarks.
Publié
2023
Juridiction
Mondial
Catégorie
Assessment and evaluation
Accès
Accès public
VerifyWise vous aide à implémenter des cadres de gouvernance de l'IA, à suivre la conformité et à gérer les risques dans vos systèmes d'IA.