AdaRubric: Rúbricas Adaptativas a la Tarea para la Evaluación de Agentes LLM
Rúbricas adaptativas para la evaluación de agentes LLM: descubre criterios dinámicos y precisos que optimizan el rendimiento.
Rúbricas adaptativas para la evaluación de agentes LLM: descubre criterios dinámicos y precisos que optimizan el rendimiento.
Estudio de 823 casos: rúbricas para evaluar IA clínica y concordancia LLM-clínicos. Metodología y resultados clave.