MGUP: Alineación de gradiente de momento para optimización estocástica Descubre MGUP: acelera el entrenamiento de modelos de IA con actualizaciones selectivas y garantías de convergencia. Mejora AdamW, Lion y Muon. 2026-06-17 · 3 min