Aprendiendo modelos de recompensa de razonamiento a partir de demostraciones de expertos a través del aprendizaje por refuerzo inverso
Descubre cómo se pueden aprender modelos de recompensa a través del aprendizaje por refuerzo inverso en este interesante estudio.