OGER: Una recompensa de exploración robusta guiada offline para el aprendizaje por refuerzo híbrido OGER: Recompensa robusta offline para aprendizaje por refuerzo híbrido 2026-05-28 · 2 min