Convergencia casi óptima de la última iteración para juegos de suma cero con retroalimentación de bandido y acciones del oponente
Convergencia casi óptima de última iteración en juegos de suma cero con retroalimentación de bandido. Descubre los hallazgos clave y su aplicación.