Sentinel: Compresión eficiente de contexto en LLMs Descubre Sentinel, un método ligero de compresión de contexto para LLMs que usa patrones de atención. Logra hasta 5x de compresión en QA sin perder rendimiento. 2026-06-15 · 2 min