#tiempo continuo

Parada Óptima Continua mediante Aprendizaje por Refuerzo Profundo

CARLOS: un nuevo algoritmo de RL en tiempo continuo que supera a los solvers Bermudas, acercándose al límite superior americano con alta eficiencia.

2026-06-17 · 3 min

Parada óptima en tiempo continuo mediante aprendizaje por refuerzo profundo

CARLOS: algoritmo de RL profundo para parada óptima en tiempo continuo sin discretización, mejorando precisión y eficiencia en valoración de opciones.

2026-06-17 · 2 min

Predicción de tráfico entre dominios con redes de tiempo líquido y memoria

MA-GLTC revoluciona la predicción de tráfico entre dominios: usa redes líquidas y memoria para reducir errores hasta un 10% en zonas sin datos.

2026-06-16 · 2 min

Gradiente de Política para MDP Robustos en Tiempo Continuo

Descubre cómo los algoritmos de gradiente de política en tiempo continuo mejoran la robustez en MDPs, con convergencia lineal y menor complejidad muestral.

2026-06-04 · 2 min