Métricas inestables y culturas de evaluación comparativa de los constructores de modelos de IA
Métricas inestables y culturas de benchmarking en IA: cómo afectan la evaluación de modelos y la comparación de resultados. Claves para entender su impacto.