AVIS: Escalado Adaptativo en Tiempo de Prueba para Modelos de Visión-Lenguaje
Descubre cómo AVIS optimiza la inferencia en VLMs adaptando el escalado visual y de razonamiento, mejorando precisión y reduciendo costos.
Descubre cómo AVIS optimiza la inferencia en VLMs adaptando el escalado visual y de razonamiento, mejorando precisión y reduciendo costos.
Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.