Primeras cotas de arrepentimiento en el peor caso para el Muestreo de Thompson combinatorio en Semi-bandidos durmientes
Cotas de arrepentimiento en el peor caso para el Muestreo de Thompson combinatorio en semi-bandidos durmientes. Análisis teórico de límites superiores e implicaciones para aprendizaje secuencial.