Aumento de datos a nivel de trayectoria para el aprendizaje por refuerzo fuera de línea
<meta name=description content=Aumento de trayectorias en RL offline: mejora el rendimiento de políticas con datos limitados mediante técnicas de aumento de datos en aprendizaje por refuerzo offline.>