Robustez post-hoc para aprendizaje por refuerzo basado en modelos Mejora la robustez de agentes de RL en inferencia sin entrenar, usando control predictivo con rollouts adversariales y mitigando problemas fuera de distribución. 2026-06-03 · 1 min