De los sentidos a las decisiones: flujo auditivo-visual en MLLMs Descubre como los modelos multimodales combinan audio y video para decisiones. Las rutas internas de informacion en AVLLMs permiten inferencia eficiente. 2026-06-10 · 2 min