#normalización de varianza

KVarN: Cuantificación de caché KV con normalización de varianza

Reduce errores en razonamiento con KVarN. Cuantificación KV de 2 bits que optimiza la memoria y mejora el rendimiento en modelos de lenguaje.