TokenWeave: Superposición eficiente de cómputo y comunicación para inferencia distribuida de LLM <meta content=TokenWeave optimiza la inferencia de LLM superponiendo cómputo y comunicación para mayor eficiencia y velocidad.> 2026-05-04 · 3 min