Convergencia Rápida y Robusta de TD(0) con Aproximación Lineal
Descubre cómo TD(0) con aproximación lineal logra una convergencia rápida y robusta, con tasa óptima de 1/k y sin depender del menor autovalor. Ideal para aprendizaje por refuerzo.
Descubre cómo TD(0) con aproximación lineal logra una convergencia rápida y robusta, con tasa óptima de 1/k y sin depender del menor autovalor. Ideal para aprendizaje por refuerzo.