El punto ciego de la evaluación: teoría estereológica para benchmarks de LLMs
Descubre cómo la teoría estereológica expone puntos ciegos en benchmarks de LLMs, revelando que el ranking puede ser engañoso. Aprende a identificar evaluaciones irreemplazables.