#rl basado en modelos

Robustez post-hoc para aprendizaje por refuerzo basado en modelos

Mejora la robustez de agentes de RL en inferencia sin entrenar, usando control predictivo con rollouts adversariales y mitigando problemas fuera de distribución.

2026-06-03 · 1 min