#funciones lineales

Entrenamiento conjunto de capas en redes ReLU para modelos lineales

Aprende cómo el descenso de gradiente logra convergencia lineal en redes ReLU, evitando puntos silla y alcanzando el mínimo global.