#aprendizaje por refuerzo robusto

Convergencia en tiempo finito del Q-learning robusto distribucional

Descubre cómo el Q-learning robusto con aproximación lineal converge en tiempo finito bajo incertidumbre chi-cuadrado, usando solo trayectorias markovianas.

2026-06-16 · 1 min

Gradiente de Política para MDP Robustos en Tiempo Continuo

Descubre cómo los algoritmos de gradiente de política en tiempo continuo mejoran la robustez en MDPs, con convergencia lineal y menor complejidad muestral.

2026-06-04 · 2 min

Aprendizaje por refuerzo robusto con currículo para UAV en entornos hostiles

Novedoso aprendizaje por refuerzo robusto con currículo adaptativo protege UAV contra suplantación GNSS, logrando 100% éxito.

2026-06-03 · 2 min