K-Forcing: Decodificación conjunta de K tokens con push-forward K-Forcing: acelera la inferencia de LLMs hasta 3.5x en servidores de lotes, manteniendo calidad. Descúbrelo. 2026-06-10 · 2 min