#metro

AutoML para Deep Learning Sostenible: HPO Multiobjetivo en Redes Shift

Aprende a usar AutoML y HPO multiobjetivo en redes shift para obtener modelos con >80% de precisión y mínimo consumo energético. ¡Deep Learning sostenible!

2026-06-17 · 2 min

Modelos de supervivencia con retrasos de notificación censurados por la derecha

Mejora la evaluación de riesgos con modelos de supervivencia que manejan retrasos censurados. Descubre nuestro método con aprendizaje por transferencia.

2026-06-17 · 3 min

Operator Boosting produce sustitutos PDE Pareto-eficientes

Operator Boosting permite crear modelos sustitutos de PDE más precisos y con hasta 95% menos parámetros. Descubre cómo optimizar tus simulaciones científicas.

2026-06-17 · 2 min

MGUP: Alineación de gradiente de momento para optimización estocástica

Descubre MGUP: acelera el entrenamiento de modelos de IA con actualizaciones selectivas y garantías de convergencia. Mejora AdamW, Lion y Muon.

2026-06-17 · 3 min

Evolución del uso del metro: modelo semi-Markov oculto con análisis supervivencia

Descubre cómo un modelo semi-Markov oculto y análisis de supervivencia revelan la evolución del uso del metro y ayudan a retener pasajeros.

2026-06-17 · 2 min

Incertidumbre en simulaciones de Monte Carlo impulsadas por IA

El Método PEM cuantifica la incertidumbre epistémica en simulaciones de Monte Carlo con IA, mejorando la fiabilidad de los resultados.

2026-06-17 · 2 min

Clasificación meta de modelos de una clase usando ranking y vecinos cercanos

Meta-clasificación de modelos OCC con ranking y vecino cercano: alta precisión clasificando datos y algoritmos. Solución unificada de modelos, datos y rankings.

2026-06-17 · 2 min

Ganancias del transporte público y cambios desiguales en demanda tras peaje NYC

Peaje de congestión en NYC impulsó el uso del transporte público, pero con cambios desiguales en la demanda de viajes. Análisis con modelos de pronóstico.

2026-06-17 · 2 min

Equivalencia funcional en atención: estudio sobre codificaciones posicionales

Descubre cómo las codificaciones posicionales sinusoidales y RoPE afectan la equivalencia funcional en Transformers y su conectividad lineal. Un estudio clave

2026-06-17 · 2 min

Olvido Catastrófico de Bajo Rango: Teoría para Adaptación Continua

Descubre cómo el olvido catastrófico se concentra en modos de baja dimensión. Teoría del espacio de funciones permite predicción exacta y regularizador

2026-06-17 · 2 min

Por qué el VibeThinker-3B de Weibo reaviva la polémica de los benchmarks

Un pequeño modelo de 3B parámetros desafía a los gigantes de la IA en benchmarks de matemáticas y código. ¿Es el fin de la escalada paramétrica? Análisis

2026-06-17 · 3 min

Traducción con LLM de código Fortran a JAX: modelo de superficie terrestre

Descubre cómo un pipeline con LLM traduce código Fortran a JAX, acelerando 24x modelos de superficie terrestre con optimización por gradientes.

2026-06-16 · 2 min

Decodificando la intención de cruce peatonal con modelos de visión y lenguaje

Investigación que utiliza modelos de lenguaje y visión para predecir intención de cruce peatonal desde vídeos egocéntricos, con un 14.5% más de precisión.

2026-06-16 · 2 min

Fabs inteligentes confiables con proxies profesionales

Los proxies profesionales permiten a fabs inteligentes cumplir con SSbD mediante espacios de datos, garantizando privacidad y trazabilidad.

2026-06-16 · 2 min

VibeThinker-3B: Razonamiento verificable en modelos pequeños

VibeThinker-3B demuestra que modelos pequeños pueden alcanzar rendimiento de vanguardia en razonamiento verificable, superando a sistemas mucho mayores.

2026-06-16 · 2 min

Test-time training: adaptación óptima desde la teoría de decisión

Descubre cuándo y cómo adaptar modelos en test-time training usando teoría de decisión, mejorando precisión y estabilidad. Evita sobreajuste con estrategias

2026-06-16 · 2 min

Pronóstico bursátil con Transformers y aumento de datos desplazados

Mejora el pronóstico bursátil con aumento de datos desplazados y Transformers. Resultados en VN30 y S&P 500.

2026-06-16 · 2 min

Predicción de parámetros de ejecución con aprendizaje activo y generativo

Predice parámetros de ejecución en química computacional con aprendizaje activo y generativo. Modelos alcanzan 99.9% de precisión.

2026-06-16 · 2 min

LiFT: Búsqueda Local con Programación Lineal para Control de Sobreajuste

Descubre LiFT, un método basado en programación lineal que ajusta transformers controlando el sobreajuste, mejorando la perplejidad en GPT-2 con WikiText-2.

2026-06-16 · 1 min

GENIE: optimizador basado en OSGR para generalización de dominio

Descubre GENIE, un optimizador que usa el ratio OSGR para equilibrar actualizaciones de parámetros y mejorar la generalización a dominios no vistos. Supera a

2026-06-16 · 2 min