#aprendizaje por refuerzo inverso

Aprendizaje por refuerzo inverso de máxima entropía en juegos de campo medio

Descubre cómo la máxima entropía permite recuperar políticas óptimas en juegos de campo medio a partir de demostraciones expertas. Algoritmos eficientes con

2026-06-16 · 3 min