STaR-KV: Compresión de caché KV en modelos de lenguaje visual para GUI STaR-KV comprime la caché KV en modelos GUI sin entrenamiento, reduciendo memoria GPU un 40% sin penalizar precisión. Descubre cómo. 2026-06-02 · 2 min