Entrenamiento Paralelo Eficiente en Ancho de Banda con Mezclas de Subespacios Descubre cómo mezclas de subespacios comprimen la comunicación un 95% para entrenar modelos de lenguaje con contextos de 100K tokens, incluso en redes lentas. 2026-06-16 · 2 min