Aprendizaje en mercados de emparejamiento con bandido
Descubre cómo un algoritmo UCB aprende equilibrios en juegos de emparejamiento con retroalimentación de bandido. Resultados sublineales.
Descubre cómo un algoritmo UCB aprende equilibrios en juegos de emparejamiento con retroalimentación de bandido. Resultados sublineales.