#sobreparametrización

Poda estructurada vs no estructurada: una brecha exponencial

Un estudio revela que la poda de neuronas requiere exponencialmente más neuronas iniciales que la poda de pesos, una brecha sorprendente en el SLTH.

2026-06-12 · 1 min

Estudio sistemático de profundidad en STGCN para predicción de tráfico

¿Cuántos bloques necesita un STGCN? Un solo bloque predice tráfico con precisión similar y 61% menos latencia que el estándar de 2 bloques. Eficiencia para ITS.

2026-06-09 · 1 min

Tasas óptimas de generalización en descenso de gradiente con redes profundas

Descubre cómo GD y SGD alcanzan tasas óptimas de generalización en redes ReLU profundas, con resultados minimax comparables a kernels.

2026-06-08 · 2 min

¿Qué tan abundantes son los buenos interpoladores?

Descubre cómo la mayoría de los interpoladores lineales tienen un rendimiento similar, y por qué algunos métodos superan al resto en inteligencia artificial.

2026-06-05 · 3 min

¿El orden importa? La Ley de Robustez y la Generalización Robusta

Analizamos la conexión entre la Ley de Robustez y la generalización robusta. ¿Cómo afecta el orden de las cotas de Lipschitz a la complejidad de Rademacher? Descúbrelo.

2026-06-04 · 2 min

Mínimos locales en redes ReLU de dos capas: un análisis preciso

Descubre cómo se caracterizan los mínimos locales en redes ReLU de dos capas y cómo la sobreparametrización facilita el acceso a mínimos globales.

2026-06-03 · 3 min

Generalización de los algoritmos Gibbs y Langevin Monte Carlo en el régimen de interpolación

Nuevas cotas de generalización para algoritmos Monte Carlo en el régimen de interpolación, con resultados en MNIST, CIFAR-10 y SVHN.

2026-06-02 · 2 min

Regularización óptima para aprendizaje performativo

Descubre cómo la regularización óptima reduce el riesgo en aprendizaje performativo, beneficiándose incluso en regímenes sobreparametrizados. Clave para IA robusta.

2026-06-02 · 2 min

Convergencia lineal local en mezclas gaussianas sobreparametrizadas

Descubre cómo los métodos de gradiente logran convergencia lineal en mezclas gaussianas sobreparametrizadas, superando la lentitud tradicional. Leer más.

2026-06-01 · 2 min