OpenMedQ: Preentrenamiento abierto para modelos médicos de visión-lenguaje
OpenMedQ: modelo de VLM médico preentrenado en 14 datasets abiertos logra SOTA en PathVQA y VQA-MED. Supera modelos 80x mayores. Código abierto.
OpenMedQ: modelo de VLM médico preentrenado en 14 datasets abiertos logra SOTA en PathVQA y VQA-MED. Supera modelos 80x mayores. Código abierto.
Descubre TerraBench, un benchmark que evalúa el razonamiento de agentes IA sobre datos terrestres heterogéneos. 400+ tareas, 24.500 pasos.
Descubre cómo Mental-R1 y el marco CRPO mejoran la evaluación de trastornos mentales con razonamiento similar al humano. Precisión aumentada en un 10%.
Descubre UXBench, un nuevo benchmark con 2000 muestras para evaluar el razonamiento UX en modelos multimodales. UI-UX alcanza un 79.63% de precisión.
Descubre MOSAIC, un framework de aprendizaje continuo que supera los desafíos de nuevos sensores en la evaluación del Parkinson.
Descubre MOSAIC, un marco de aprendizaje continuo que adapta cada modalidad de sensor para evaluar la marcha en Parkinson evitando el olvido.
Descubre cómo ProFact usa aprendizaje por refuerzo agéntico para optimizar la verificación de hechos en múltiples etapas, mejorando precisión y eficiencia.
Aprende cómo la IA guiada por física estima períodos de olas costeras desde video para un monitoreo marino preciso y económico.
Descubre cómo ProFact optimiza la verificación de hechos multi-etapa con aprendizaje por refuerzo agéntico y recompensas de proceso. ¡Lee más!
Descubre cómo ReSum, un nuevo marco de RL, mejora el razonamiento de LLMs un 4% y reduce el largo de las cadenas un 18.6% mediante auto-resúmenes.
Descubre cómo un marco de aprendizaje profundo guiado por física estima el período pico de olas costeras desde video, mejorando el monitoreo marino.
Descubre ReSum, que combina aprendizaje por refuerzo y autosummarización para mejorar el razonamiento de LLMs reduciendo su longitud en un 18.6%.
Descubre IterCAD, un agente multimodal que revoluciona la generación y edición de CAD con cierre de bucle, precisión geométrica y ejecución de código.
Descubre IterCAD, un agente multimodal que revoluciona la generación y edición de CAD con IA iterativa. Benchmark y precisión sin sesgo.
Un estudio experimental muestra que evaluar solo los resultados finales oculta inestabilidad y rendimientos decrecientes en modelos de lenguaje con recursos limitados.
Descubre OrchRM, un marco auto-supervisado que mejora hasta 10x la eficiencia de tokens y un 8% la precisión en orquestación multi-agente sin anotaciones humanas.
Descubre cómo DoorDash optimiza el despacho en marketplaces tripartitos usando aprendizaje por refuerzo multiagente con feedback retardado, mejorando eficiencia sin sacrificar calidad.
Descubre el nuevo enfoque: la síntesis de escudos como herramienta de diseño para evaluar la defendibilidad de redes adversariales.
Descubre cómo EurekAgent revoluciona el descubrimiento científico autónomo mediante ingeniería del entorno, logrando récords con menos de $11 en costos de API. ¡Lee más!
Mejora la retroalimentación en programación con un asistente de IA explicable y colaboración instructor-IA. Resultados precisos y confiables.