#qa · DeepCodeNews

MAR: Reflexión Multi-Agente para Mejorar Razonamiento en LLMs

Descubre cómo la reflexión multi-agente con múltiples personalidades supera la degeneración del pensamiento en LLMs, logrando un 47% en HotPot QA y 82.7% en

2026-06-16 · 2 min

VeriGeo: Generación Controlable de Preguntas de Geometría con Verificación

Descubre cómo VeriGeo genera problemas de geometría verificados numérica y analíticamente, mejorando el razonamiento multimodal en educación asistida por IA.

2026-06-15 · 2 min

Modelado de audio espacio-temporal para fuentes de sonido dinámicas

Descubre cómo el nuevo modelo ST-AudioLM combina audio, lenguaje y datos espaciales para entender sonidos en movimiento. Un avance en IA para audio.

2026-06-15 · 2 min

Kualitee lanza Hootie Copilot, generador de scripts de automatización con IA

Descubre Hootie Copilot de Kualitee: genera scripts de automatización desde tus casos de prueba en minutos. Reduce el trabajo manual y enfócate en pruebas exploratorias.

2026-06-12 · 2 min

Kualitee lanza Hootie Copilot, generador de scripts de automatización con IA

Hootie Copilot de Kualitee convierte casos de prueba en scripts automatizados en minutos. Reduce horas de mantenimiento manual. ¡Optimiza tu QA con IA!

2026-06-12 · 3 min

OpenMedQ: Preentrenamiento abierto para modelos médicos de visión-lenguaje

OpenMedQ: modelo de VLM médico preentrenado en 14 datasets abiertos logra SOTA en PathVQA y VQA-MED. Supera modelos 80x mayores. Código abierto.

2026-06-12 · 1 min

MiniMax Sparse Attention: eficiencia en contexto largo

Descubre cómo MiniMax Sparse Attention (MSA) reduce 28.4 veces el cómputo de atención en contextos de 1M tokens, logrando aceleraciones de hasta 14.2x en prefill y 7.6x en decoding en GPUs H800.

2026-06-12 · 2 min

ReFoCUS: Selección de Fotogramas con Refuerzo para Comprensión Contextual

Descubre cómo ReFoCUS utiliza aprendizaje por refuerzo para seleccionar fotogramas clave en video, mejorando la precisión en tareas de comprensión contextual.

2026-06-12 · 2 min

MoCA-Agent: Agente de código con mercado de afirmaciones financieras

MoCA-Agent: agente de código con mercado de afirmaciones para razonamiento financiero robusto y verificado. Resultados destacados.

2026-06-11 · 2 min

ProcessThinker: mejora el razonamiento multimodal con recompensas de proceso

ProcessThinker mejora el razonamiento multimodal mediante recompensas de proceso paso a paso, sin entrenar un PRM. Supera en benchmarks de video.

2026-06-11 · 2 min

PermDoRA: Límites de la geometría en interferencia de adaptadores

La geometría del espacio de parámetros no predice la interferencia al combinar adaptadores en LLMs. Análisis con DoRA-RBAC y benchmarks de QA.

2026-06-11 · 2 min

Cómo agentes de IA crearon un generador global de datos simulados

Descubre nuestro generador global de datos simulados y anonimizador creado por IA. Ideal para testing sin riesgos GDPR. ¡Pruébalo gratis!

2026-06-11 · 1 min

RL offline logra planificación efectiva con soluciones aleatorias

CDQAC: RL offline que aprende planificación efectiva incluso de soluciones aleatorias, superando heurísticas complejas con mínimos datos.

2026-06-11 · 2 min

IAPO: Optimización de Políticas con Atribución de Entradas para Agentes Multimodales

IAPO: un algoritmo de RL que mejora la capacidad de llamar a herramientas en agentes multimodales pequeños, logrando un 3% más de precisión en VQA.

2026-06-11 · 2 min

IAPO: Optimización con atribución de entrada para agentes multimodales

Aumenta un 3% la precisión en VQA con IAPO, algoritmo RL que alinea la atribución de entrada en agentes multimodales pequeños. ¡Descubre cómo!

2026-06-11 · 2 min

Arquitectura consciente de familias para predicción de simulación cuántica

Arquitectura de IA consciente de familias predice rendimiento de simulaciones cuánticas con 79.5% de precisión, eliminando costosas pruebas.

2026-06-11 · 3 min

MSUE: Experto Multimodal en Comprensión de Fútbol

MSUE combina texto, imagen y video para responder preguntas sobre fútbol con un 95% de precisión. Conoce su arquitectura multi-experto.

2026-06-11 · 1 min

Reroute, no eliminar: enrutamiento visual recuperable en VLMs

Descubre cómo Reroute optimiza tokens visuales en VLMs, mejora grounding y mantiene rendimiento VQA. Técnica sin entrenamiento que redirige tokens.

2026-06-11 · 2 min

Un Token por Evidencia Multimodal: Memoria Latente para QA con Recursos Escasos

Descubre Latent Memory: comprime evidencia multimodal en un token, reduce hasta 10x el consumo de tokens en QA con recursos limitados. Eficiente y competitivo.

2026-06-10 · 2 min

SD-GRPO: Descomposición verificable de segmentos en VL larga

SD-GRPO mejora la generación de respuestas largas en modelos multimodales al descomponer segmentos verificables y asignar recompensas precisas.

2026-06-10 · 2 min