#metro

Test-time training: adaptación óptima desde la teoría de decisión

Descubre cuándo y cómo adaptar modelos en test-time training usando teoría de decisión, mejorando precisión y estabilidad. Evita sobreajuste con estrategias

2026-06-16 · 2 min

Pronóstico bursátil con Transformers y aumento de datos desplazados

Mejora el pronóstico bursátil con aumento de datos desplazados y Transformers. Resultados en VN30 y S&P 500.

2026-06-16 · 2 min

Predicción de parámetros de ejecución con aprendizaje activo y generativo

Predice parámetros de ejecución en química computacional con aprendizaje activo y generativo. Modelos alcanzan 99.9% de precisión.

2026-06-16 · 2 min

LiFT: Búsqueda Local con Programación Lineal para Control de Sobreajuste

Descubre LiFT, un método basado en programación lineal que ajusta transformers controlando el sobreajuste, mejorando la perplejidad en GPT-2 con WikiText-2.

2026-06-16 · 1 min

GENIE: optimizador basado en OSGR para generalización de dominio

Descubre GENIE, un optimizador que usa el ratio OSGR para equilibrar actualizaciones de parámetros y mejorar la generalización a dominios no vistos. Supera a

2026-06-16 · 2 min

HiRo: Compacto mezclador jerárquico de tokens para clasificación de imágenes

HiRo logra 99.46% en MNIST, 85.57% en CIFAR-10 y 59.10% en CIFAR-100 con menos de 1M de parámetros. Descubre este modelo eficiente de clasificación de imágenes.

2026-06-16 · 3 min

Ley de conservación en propagación de equilibrio y aprendizaje acoplado

Descubre cómo una nueva ley de conservación en métodos de aprendizaje físico estabiliza el entrenamiento de redes, garantizando convergencia en circuitos

2026-06-16 · 2 min

Aprendizaje automático permite diseño inverso de fresado basado en rugosidad

Aprendizaje automático para diseño inverso de fresado: reduce rugosidad superficial con redes neuronales y optimización bayesiana.

2026-06-16 · 3 min

Simulación rápida de impactos en CLAS12 mediante GPT autorregresivo

Descubre cómo un modelo GPT acelera la simulación de impactos en el detector CLAS12, superando a Geant4 con 700 eventos por segundo y manteniendo precisión

2026-06-16 · 2 min

Restricciones en las salidas de redes neuronales ReLU

Descubre cómo las redes neuronales ReLU pueden ser caracterizadas mediante ecuaciones polinómicas y variedades algebraicas, revelando su expresividad y

2026-06-16 · 1 min

Marco Koopman-PINN para modelos epidémicos: inferencia y pronóstico

Descubre cómo el marco Koopman-PINN mejora la inferencia y el pronóstico a largo plazo en modelos epidémicos, usando datos sintéticos y reales de COVID-19.

2026-06-16 · 2 min

Geometría de la separación en mezclas Gaussianas finitas

Estudio geométrico revela cómo la separación mínima entre componentes afecta la convergencia en la estimación de parámetros de mezclas Gaussianas. ¡Más!

2026-06-16 · 3 min

DP-Hype: Búsqueda Federada de Hiperparámetros con Privacidad Diferencial

DP-Hype: algoritmo federado para búsqueda de hiperparámetros con privacidad diferencial. Escalable, independiente de tareas y garantías de privacidad.

2026-06-16 · 3 min

El papel del cómputo en el aprendizaje por refuerzo

Descubre cómo la cantidad de cómputo impacta el aprendizaje por refuerzo. Un nuevo estudio demuestra que más cómputo supera a redes con más parámetros en

2026-06-16 · 2 min

GRASP: Transferencia secuencial con alineación de gradientes para multisource

Aprende cómo GRASP logra un 93.5% de precisión media usando solo memoria constante, fusionando modelos secuencialmente.

2026-06-16 · 2 min

No releas: Agentes ReAct con estado para experimentación eficiente

Descubre cómo los agentes ReAct con estado reducen hasta un 90% el consumo de tokens en experimentación autónoma, optimizando hiperparámetros y código.

2026-06-16 · 2 min