Le LM Evaluation Harness d'EleutherAI est devenu l'herramienta standard pour évaluer les grands modelos de langage dans la communauté de Investigacion. Ce framework codigo abierto permet une evaluacion cohérente à travers des centaines de tâches et Benchmarks.
Publicado
2023
Jurisdicción
Global
Categoría
Assessment and evaluation
Acceso
Acceso público
VerifyWise le ayuda a implementar frameworks de gobernanza de IA, hacer seguimiento del cumplimiento y gestionar riesgos en sus sistemas de IA.