#aprendiz

OpenMedQ: Preentrenamiento abierto para modelos médicos de visión-lenguaje

OpenMedQ: modelo de VLM médico preentrenado en 14 datasets abiertos logra SOTA en PathVQA y VQA-MED. Supera modelos 80x mayores. Código abierto.

2026-06-12 · 1 min

TerraBench: Razonamiento IA sobre datos terrestres heterogéneos

Descubre TerraBench, un benchmark que evalúa el razonamiento de agentes IA sobre datos terrestres heterogéneos. 400+ tareas, 24.500 pasos.

2026-06-12 · 2 min

Mental-R1: Alineando el razonamiento de LLM para la salud mental

Descubre cómo Mental-R1 y el marco CRPO mejoran la evaluación de trastornos mentales con razonamiento similar al humano. Precisión aumentada en un 10%.

2026-06-12 · 2 min

UXBench: Evaluación de la experiencia de usuario con modelos multimodales

Descubre UXBench, un nuevo benchmark con 2000 muestras para evaluar el razonamiento UX en modelos multimodales. UI-UX alcanza un 79.63% de precisión.

2026-06-12 · 3 min

MOSAIC: aprendizaje continuo para evaluar el Parkinson con sensores

Descubre MOSAIC, un framework de aprendizaje continuo que supera los desafíos de nuevos sensores en la evaluación del Parkinson.

2026-06-12 · 2 min

MOSAIC: Aprendizaje continuo incremental adaptado a modalidades para Parkinson

Descubre MOSAIC, un marco de aprendizaje continuo que adapta cada modalidad de sensor para evaluar la marcha en Parkinson evitando el olvido.

2026-06-12 · 3 min

Del veredicto al proceso: verificación factual con RL agéntico

Descubre cómo ProFact usa aprendizaje por refuerzo agéntico para optimizar la verificación de hechos en múltiples etapas, mejorando precisión y eficiencia.

2026-06-12 · 2 min

Aprendizaje guiado por física para estimar períodos de olas costeras desde video

Aprende cómo la IA guiada por física estima períodos de olas costeras desde video para un monitoreo marino preciso y económico.

2026-06-12 · 2 min

ProFact: Optimización multi-etapa de verificación de hechos con RL agéntico

Descubre cómo ProFact optimiza la verificación de hechos multi-etapa con aprendizaje por refuerzo agéntico y recompensas de proceso. ¡Lee más!

2026-06-12 · 2 min

ReSum: Sinergia entre Razonamiento y Resumen de LLMs con RL

Descubre cómo ReSum, un nuevo marco de RL, mejora el razonamiento de LLMs un 4% y reduce el largo de las cadenas un 18.6% mediante auto-resúmenes.

2026-06-12 · 2 min

Cómo la IA guiada por física estima el período pico de olas desde video

Descubre cómo un marco de aprendizaje profundo guiado por física estima el período pico de olas costeras desde video, mejorando el monitoreo marino.

2026-06-12 · 2 min

ReSum: Sinergizando Razonamiento de LLM y Resumen con Aprendizaje por Refuerzo

Descubre ReSum, que combina aprendizaje por refuerzo y autosummarización para mejorar el razonamiento de LLMs reduciendo su longitud en un 18.6%.

2026-06-12 · 3 min

IterCAD: Un Agente Multimodal Iterativo para Generación y Edición de CAD

Descubre IterCAD, un agente multimodal que revoluciona la generación y edición de CAD con cierre de bucle, precisión geométrica y ejecución de código.

2026-06-12 · 2 min

IterCAD: Un Agente Multimodal Iterativo para Generación y Edición de CAD

Descubre IterCAD, un agente multimodal que revoluciona la generación y edición de CAD con IA iterativa. Benchmark y precisión sin sesgo.

2026-06-12 · 3 min

Estudio experimental de dinámicas de entrenamiento en modelo Llama pequeño con presupuesto de tokens

Un estudio experimental muestra que evaluar solo los resultados finales oculta inestabilidad y rendimientos decrecientes en modelos de lenguaje con recursos limitados.

2026-06-12 · 2 min

Modelado de Recompensa para Orquestación Multi-Agente

Descubre OrchRM, un marco auto-supervisado que mejora hasta 10x la eficiencia de tokens y un 8% la precisión en orquestación multi-agente sin anotaciones humanas.

2026-06-12 · 2 min

Optimización de despacho tripartito con RL multiagente y feedback retardado

Descubre cómo DoorDash optimiza el despacho en marketplaces tripartitos usando aprendizaje por refuerzo multiagente con feedback retardado, mejorando eficiencia sin sacrificar calidad.

2026-06-12 · 2 min

Síntesis de escudos: análisis de defendibilidad para redes adversariales

Descubre el nuevo enfoque: la síntesis de escudos como herramienta de diseño para evaluar la defendibilidad de redes adversariales.

2026-06-12 · 2 min

EurekAgent: Ingeniería del entorno para descubrimiento científico autónomo

Descubre cómo EurekAgent revoluciona el descubrimiento científico autónomo mediante ingeniería del entorno, logrando récords con menos de $11 en costos de API. ¡Lee más!

2026-06-12 · 2 min

Un asistente de IA explicable para mejorar la retroalimentación en programación

Mejora la retroalimentación en programación con un asistente de IA explicable y colaboración instructor-IA. Resultados precisos y confiables.

2026-06-12 · 2 min