Verdad, Confianza y Problemas: La IA Médica al Límite
Descubre cómo los LLMs como AlpaCare y BioMistral enfrentan el desafío de la precisión y seguridad en preguntas médicas. Resultados sorprendentes.
Descubre cómo los LLMs como AlpaCare y BioMistral enfrentan el desafío de la precisión y seguridad en preguntas médicas. Resultados sorprendentes.
PaCX-MAE mejora el diagnóstico de rayos X integrando datos fisiológicos (ECG, laboratorio) sin requerirlos en inferencia. Logra +2.7 AUROC y +6.5 F1 con solo 1% de datos.
AutoMedBench: el benchmark que evalúa agentes de IA en investigación médica autónoma. Analiza cinco etapas y revela que la validación es el punto débil. Descubre más.