#optimización de cómputo

AVIS: Escalado Adaptativo en Tiempo de Prueba para Modelos de Visión-Lenguaje

Descubre cómo AVIS optimiza la inferencia en VLMs adaptando el escalado visual y de razonamiento, mejorando precisión y reduciendo costos.

2026-06-11 · 1 min

FOCUS: Los DLLMs saben cómo domar su límite de cómputo

Descubre cómo FOCUS optimiza la inferencia de DLLMs, enfocando el cómputo en tokens decodables para lograr hasta 3.5x más rendimiento sin pérdida de calidad.

2026-06-11 · 2 min