PolarQuant: Cuantificación de Cache de Claves y Aceleración de Decodificación Optimiza el uso de memoria en LLMs con PolarQuant. Esta técnica de cuantificación polar acelera la decodificación al transformar claves en coordenadas polares. 2026-06-08 · 2 min