Actualizaciones de objetivo periódicas y suaves estabilizan el Q-learning lineal Descubre cómo las actualizaciones periódicas y suaves de objetivo garantizan la convergencia del Q-learning lineal, según un riguroso análisis teórico. 2026-06-03 · 2 min