#juegos de suma cero

Convergencia casi óptima de la última iteración para juegos de suma cero con retroalimentación de bandido y acciones del oponente

Convergencia casi óptima de última iteración en juegos de suma cero con retroalimentación de bandido. Descubre los hallazgos clave y su aplicación.