Más allá de los escalares: Evaluación y comprensión del razonamiento de los LLM mediante el progreso geométrico y la estabilidad.
Evaluación de LLM: progreso geométrico y estabilidad más allá de escalares. Descubre métricas avanzadas para medir modelos de lenguaje con precisión.