Optimismo estabiliza el muestreo de Thompson para inferencia adaptativa Descubre cómo el optimismo en el muestreo de Thompson estabiliza la inferencia adaptativa, permitiendo estimaciones Wald válidas en bandidos multi-brazo con un 2026-06-17 · 2 min