OBCache: poda óptima de caché KV para LLMs de contexto largo Descubre OBCache, la técnica de poda de caché KV que optimiza la memoria en LLMs para inferencia en contextos largos sin sacrificar precisión. 2026-06-01 · 2 min