eOptShrinkQ: Compresión de caché KV casi sin pérdida mediante eliminación de ruido espectral óptima y cuantización
Compresión casi sin pérdida de caché KV con denoising espectral óptimo y cuantización. Técnica avanzada para reducir memoria en modelos de lenguaje.