ComplexConstraints y más allá: Rúbricas expertas para RLVR
Las rúbricas expertas mejoran la evaluación y entrenamiento de LLMs. Nuevo dataset ComplexConstraints logra +15.5% en seguimiento de instrucciones. ¡Lee más!
Las rúbricas expertas mejoran la evaluación y entrenamiento de LLMs. Nuevo dataset ComplexConstraints logra +15.5% en seguimiento de instrucciones. ¡Lee más!