ClinEnv: Entorno EHR interactivo multi-etapa para agentes
ClinEnv evalúa LLMs como médicos en un EHR interactivo. Mide decisiones y proceso: el diagnóstico es más fiable que las acciones (0.51 vs 0.17 F1).
ClinEnv evalúa LLMs como médicos en un EHR interactivo. Mide decisiones y proceso: el diagnóstico es más fiable que las acciones (0.51 vs 0.17 F1).