KVarN: Cuantificación de caché KV con normalización de varianza Reduce errores en razonamiento con KVarN. Cuantificación KV de 2 bits que optimiza la memoria y mejora el rendimiento en modelos de lenguaje. 2026-06-03 · 2 min