#metro

¿Red más profunda o más ancha? Error de generalización óptimo

¿Red más profunda o ancha? Descubre cómo datos, parámetros y regularidad determinan la arquitectura óptima. Aplicación en PDEs con deep Ritz y PINN.

2026-06-10 · 2 min

Cotas superiores para coeficientes de aprendizaje locales en redes de tres capas

Investigación presenta cotas superiores para coeficientes de aprendizaje locales en redes neuronales de tres capas, ampliando aplicaciones a funciones de activación como swish.

2026-06-10 · 2 min

mlr3mbo: Optimización Bayesiana en R

Descubre mlr3mbo, la potente caja de herramientas para optimización Bayesiana en R. Soporta mono y multiobjetivo, paralelización y más. ¡Comparado con HEBO, SMAC3, Ax y Optuna!

2026-06-10 · 2 min

Sigma-Branch: Red Jerárquica para Inferencia Dinámica con Parámetros Reducidos

Sigma-Branch: nueva técnica de inferencia dinámica que reduce parámetros activos un 60% en edge, sin perder precisión.

2026-06-10 · 4 min

Aprendizaje de hiperparámetros para factorización latente de tensores en redes dinámicas

Descubre cómo DE-LFT automatiza la búsqueda de hiperparámetros en factorización de tensores para mejorar la precisión en redes dinámicas. Menos esfuerzo, mejores resultados.

2026-06-10 · 2 min

Optuna TPE con restricciones: generalización de densidad conjunta de c-TPE

Descubre cómo Optuna implementa el TPE con restricciones como una generalización de densidad conjunta, mejorando la optimización de hiperparámetros. ¡Lee más!

2026-06-10 · 2 min

Políticas multi-parámetro interpretables para algoritmos evolutivos con DRL

Aprende cómo el deep RL crea políticas interpretables de control multi-parámetro para algoritmos evolutivos, con rendimiento excepcional.

2026-06-10 · 2 min

GIF: Planificación inteligente para HPO en alta dimensionalidad

Descubre cómo el algoritmo GIF optimiza hiperparámetros en alta dimensión, logrando mejor convergencia y eficiencia.

2026-06-10 · 2 min

Hacia el Mecanismo de Ramificación Crítica en Redes Neuronales Recurrentes

Redes LSTM pequeñas exhiben dinámicas near-críticas con avalanchas de escala libre. Las grandes son subcríticas. ¿Qué implica esto para la IA?

2026-06-10 · 2 min

Refactoring 010: Extraer Método a Objeto

Aprende a extraer métodos largos en objetos reutilizables con la técnica Method Object. Mejora la testabilidad y reduce la complejidad accidental de tu código.

2026-06-10 · 3 min

Nueva arquitectura de Apple sortea el límite de memoria de la IA local

Apple presenta AFM 3 Core Advanced: modelo de 20B parámetros en flash que sortea el límite de DRAM. Descubre el enrutamiento por consulta.

2026-06-10 · 2 min

Marco de evaluación y comparación de métodos de detección de deriva de conceptos

Marco de evaluación para detección de deriva de conceptos. Nuevas métricas y protocolos. Resultados de benchmark en 7 datasets.

2026-06-09 · 1 min

¿Cuánta capacidad necesita la eliminación de ruido en EEG?

Descubre cómo redes ultracompactas de solo 3K parámetros saturan benchmarks de EEG y por qué las métricas de reconstrucción no predicen utilidad en BCI.

2026-06-09 · 2 min

Geometría del espacio de parámetros en transformers para funciones booleanas

La geometría del espacio de parámetros de transformers revela por qué fallan en funciones booleanas sensibles como PARITY: un sesgo hacia baja sensibilidad.

2026-06-09 · 1 min

Selección del parámetro μ en Privacidad Diferencial Gaussiana

Aprende a elegir el parámetro μ en privacidad diferencial gaussiana. Te ofrecemos una conversión práctica de ε a μ y recomendamos μ ≈ ε/5 para proteger tus datos.

2026-06-09 · 2 min

Complejidad de Muestra de los Transformers

Descubre cómo se caracteriza la complejidad de muestra de los transformers y el aprendizaje por cadena de pensamiento. Un análisis profundo de la eficiencia en el entrenamiento.

2026-06-09 · 2 min

Dendrogramas para mezcla de expertos gaussiana con softmax: consistencia sin barridos

Los dendrogramas ofrecen una selección consistente del número de expertos en SGMoE, sin barridos de modelo, superando a AIC/BIC en datos contaminados.

2026-06-09 · 2 min

Flujos normalizadores condicionales para estimación conjunta de estado y parámetros

Descubre cómo los flujos normalizadores condicionales mejoran la estimación de estado y parámetros en sistemas no lineales, aplicados a conducción autónoma y predicción de epidemias. ¡Lee más!

2026-06-09 · 1 min

56 optimizadores puestos a prueba en inferencia variacional

Descubre la comparativa de 56 optimizadores para inferencia variacional. Más de 550,000 ejecuciones revelan los mejores sin ajuste manual.

2026-06-09 · 2 min

Selección adaptativa de prior en bandidos Gaussianos con Thompson

Descubre cómo seleccionar adaptativamente el prior en bandidos de procesos Gaussianos con Thompson Sampling. Dos algoritmos innovadores: PE-GP-TS y HP-GP-TS par

2026-06-09 · 3 min