Prefill superficial, decodificación profunda: Inferencia eficiente de contexto largo mediante visibilidad de KV asimétrica por capas <meta name=description content=Inferencia eficiente de contexto largo con visibilidad KV asimétrica por capas> 2026-05-09 · 2 min