SPEAR: Recuperación adaptativa post-cuantización para servir LLMs eficientes Descubre cómo SPEAR recupera hasta 75% de la brecha de calidad en cuantización de LLMs, con mínimo overhead y latencia estable. Ideal para despliegues eficientes. 2026-06-11 · 2 min