MediEval: Un Benchmark Médico Unificado para el Razonamiento Contextual del Paciente y Basado en Conocimiento en Modelos de Lenguaje Grande
MediEval: benchmark médico unificado que mide razonamiento contextual y conocimiento en LLMs. Ideal para evaluar IA en salud.