Zeta: Blanqueo Dual para Optimización de Matrices
Zeta: optimizador con blanqueo dual que acelera el entrenamiento de modelos grandes, superando a Muon en convergencia y generalización.
Zeta: optimizador con blanqueo dual que acelera el entrenamiento de modelos grandes, superando a Muon en convergencia y generalización.
Zeta aplica blanqueamiento dual para resolver la heterogeneidad de escala en matrices, acelerando la convergencia y mejorando la generalización en modelos de IA.
Descubre cómo un experto en ciberseguridad identifica al líder del grupo ransomware The Gentlemen, un jefe ruso que opera desde Izhevsk.
Descubre cómo un pequeño transformer aprende el mapa zeta en caminos de Dyck, y cómo la interpretabilidad mecánica revela un nuevo algoritmo verificable por humanos.