ROVE: Liberando Intervenciones Humanas con Aprendizaje por Refuerzo ROVE optimiza la manipulación humanoide con aprendizaje por refuerzo e intervenciones humanas imperfectas. Mejora modelos VLA para tareas de contacto fino. 2026-06-16 · 2 min