Aprendizaje por refuerzo con agente autorrefinado para navegación UAV con visión AgenticRL usa un agente GPT para diseñar recompensas y refinar la navegación UAV con visión, logrando un 91% de éxito real y un 94% de precisión sim-real. 2026-06-03 · 2 min