#rainbow

Variación de rendimiento en aprendizaje por refuerzo profundo

Descubre cómo la variación de rendimiento entre ejecuciones afecta a los algoritmos de RL y nuevas métricas basadas en percentiles para evaluarla.

Descubre cómo la variación de rendimiento afecta a algoritmos de deep RL y nuevas métricas percentiles para evaluarla. Casos con PPO, SAC, DQN y más.