Complejidad polinomial de iteración de políticas para MDP robustos L∞ Descubre cómo la iteración de políticas alcanza tiempo polinomial fuerte para MDPs robustos con conjuntos L∞. Un avance clave en optimización secuencial. 2026-06-03 · 2 min