Arbitraje de tokens multilingüe: optimización de ventanas de contexto con LLM local Middleware local con Llama 3.2 reduce tokens hasta 47% en prompts multilingües para agentes de IA sin perder precisión. Optimiza costos de inferencia. 2026-06-03 · 1 min