#markoviano

Tasa robusta O(1/√T) para aprendizaje TD sin proyección

Descubre cómo el algoritmo TD(0) sin proyección logra una tasa de convergencia sublineal robusta, incluso con ruido markoviano. Una mejora clave para el RL.

2026-06-09 · 2 min

Cierre no markoviano asistido por Mamba para modelado de orden reducido

Descubre cómo el modelo MAC, basado en Mamba, mejora la precisión y estabilidad en el modelado de orden reducido de sistemas dinámicos.

2026-06-05 · 2 min

Convergencia de aproximaciones bi-escala markovianas en RL

Descubre cómo se demuestra la convergencia de algoritmos bi-escala bajo ruido markoviano, un avance clave para el aprendizaje por refuerzo off-policy.

2026-06-01 · 2 min

Convergencia no asintótica de algoritmos estocásticos: marco de Lyapunov

Descubre cómo las funciones de Lyapunov permiten analizar la convergencia finita de algoritmos estocásticos en aprendizaje automático y refuerzo.

2026-06-01 · 2 min