Tasas óptimas de generalización del descenso de gradiente en clasificación ReLU profunda
Descubre cómo el descenso de gradiente logra tasas de generalización óptimas en redes ReLU profundas con dependencia polinomial de la profundidad, mejorando resultados previos.