PowerStep: Optimización Adaptativa Eficiente en Memoria mediante Descenso de Máxima Pendiente con Norma $\ell_p$
PowerStep revoluciona la optimización con descenso de gradiente ℓp adaptativo y eficiente en memoria. Acelera el entrenamiento y reduce el consumo de recursos.