#qr-max

Aprendizaje por Refuerzo Basado en Modelos con Recompensas No Markovianas

Descubre QR-MAX, algoritmo que logra convergencia PAC y eficiencia en problemas de recompensa no markoviana.