MedGym: un benchmark continuo para tratamiento médico con RL
Descubre MedGym, un benchmark realista para evaluar algoritmos de RL en tratamientos médicos con tiempo continuo, personalización y seguridad.
Descubre MedGym, un benchmark realista para evaluar algoritmos de RL en tratamientos médicos con tiempo continuo, personalización y seguridad.
ClinEnv evalúa LLMs como médicos en un EHR interactivo. Mide decisiones y proceso: el diagnóstico es más fiable que las acciones (0.51 vs 0.17 F1).