#dinámicas suaves

Actualizaciones de objetivo periódicas y suaves estabilizan el Q-learning lineal

Descubre cómo las actualizaciones periódicas y suaves de objetivo garantizan la convergencia del Q-learning lineal, según un riguroso análisis teórico.

2026-06-03 · 2 min