MAGE-RAG: Evidencia Gráfica Adaptativa Multigranular para RAG Multimodal Agéntico
MAGE-RAG optimiza la recuperación multimodal en documentos largos con evidencia gráfica adaptativa. Mejora precisión y reduce ruido. ¡Resultados superiores!
MAGE-RAG optimiza la recuperación multimodal en documentos largos con evidencia gráfica adaptativa. Mejora precisión y reduce ruido. ¡Resultados superiores!
La distracción atencional en RAG perjudica a los LVLMs al suprimir la atención visual. MAD-RAG lo corrige sin entrenamiento, mejorando hasta un 74% de los
Las alucinaciones de objetos en LVLMs reducen su fiabilidad. Descubre cómo AIR, una nueva técnica de rectificación de atención, las mitiga hasta un 35.1% y
Descubre TLVS, un método de control de sensibilidad visual por token que reduce alucinaciones en modelos de visión-lenguaje sin afectar contenido veraz.
Descubre la auto-mejora en localización de objetos pequeños con LVLMs usando atención: hasta 19% de mejora sin ajuste fino.
Descubre AsyMoE: nueva arquitectura para LVLMs que reduce alucinaciones y mejora eficiencia con expertos hiperbólicos y priorización de evidencia.