Muon-OGD: Proyección de Gradiente Ortogonal Espectral basada en Muon para el Aprendizaje Continuo de LLM
Muon-OGD: aprendizaje continuo de LLMs con proyección ortogonal espectral. Técnica avanzada para evitar el olvido catastrófico en modelos de lenguaje.