Robometer: Escalando Modelos de Recompensa Robóticos de Propósito General mediante Comparaciones de Trayectorias
Robometer: escalando modelos de recompensa robóticos mediante comparaciones de trayectorias. Optimiza el aprendizaje por refuerzo en robótica de forma eficiente.