KeepLoRA++: Aprendizaje continuo con gradientes residuales escalados por capas
Descubre cómo KeepLoRA++ equilibra retención de conocimiento y plasticidad en modelos de visión-lenguaje mediante adaptación residual de gradientes por capas.
Descubre cómo KeepLoRA++ equilibra retención de conocimiento y plasticidad en modelos de visión-lenguaje mediante adaptación residual de gradientes por capas.
La distracción atencional en RAG perjudica a los LVLMs al suprimir la atención visual. MAD-RAG lo corrige sin entrenamiento, mejorando hasta un 74% de los
¿Puede un modelo de IA aprender a formular preguntas más inteligentes sin ayuda externa? Descubre cómo un VLM se autoevoluciona como cuestionador visual.
Aprende cómo la atención consistente guiada por modelos base de visión optimiza el diagnóstico en radiografías de tórax con preguntas visuales longitudinales.
¿Puede una IA entender tu carrete de fotos? Conoce camroll-agent, un asistente que responde preguntas visuales personales con memoria jerárquica. Dataset de 50 usuarios.
Un agente de IA personal responde preguntas visuales sobre tu galería. El dataset Camroll y agente Camroll-Agent con memoria jerárquica.
Los distractores visuales afectan a los modelos visión-lenguaje de forma distinta a los textuales: reducen precisión sin alargar el razonamiento. Aprende a mitigarlos.