#preguntas visuales

KeepLoRA++: Aprendizaje continuo con gradientes residuales escalados por capas

Descubre cómo KeepLoRA++ equilibra retención de conocimiento y plasticidad en modelos de visión-lenguaje mediante adaptación residual de gradientes por capas.

2026-06-16 · 1 min

Cuando el RAG perjudica: distracción atencional en LVLMs

La distracción atencional en RAG perjudica a los LVLMs al suprimir la atención visual. MAD-RAG lo corrige sin entrenamiento, mejorando hasta un 74% de los

2026-06-16 · 2 min

Cuestionador Visual Autoevolutivo: Mejora Continua sin Datos Externos

¿Puede un modelo de IA aprender a formular preguntas más inteligentes sin ayuda externa? Descubre cómo un VLM se autoevoluciona como cuestionador visual.

2026-06-15 · 2 min

Atención Consistente en Preguntas Visuales Médicas con Modelos Base

Aprende cómo la atención consistente guiada por modelos base de visión optimiza el diagnóstico en radiografías de tórax con preguntas visuales longitudinales.

2026-06-08 · 3 min

Agente de IA personal para responder preguntas de tu carrete fotográfico

¿Puede una IA entender tu carrete de fotos? Conoce camroll-agent, un asistente que responde preguntas visuales personales con memoria jerárquica. Dataset de 50 usuarios.

2026-06-06 · 2 min

Agente de IA personal para VQA en galería de fotos

Un agente de IA personal responde preguntas visuales sobre tu galería. El dataset Camroll y agente Camroll-Agent con memoria jerárquica.

2026-06-06 · 2 min

Efectos de los distractores en modelos de razonamiento visual-lingüístico

Los distractores visuales afectan a los modelos visión-lenguaje de forma distinta a los textuales: reducen precisión sin alargar el razonamiento. Aprende a mitigarlos.

2026-06-02 · 2 min