Compresión de contexto 16x para LLM sin pérdida de precisión Nueva investigación logra comprimir el contexto de LLM 16 veces sin perder precisión. Reduce memoria, acelera inferencia y optimiza costos en producción. 2026-06-11 · 2 min