Bandidos contextuales lineales con ruido acotado: set-membership Descubre cómo el algoritmo SME-OFU para bandits contextuales con ruido acotado logra una cota de error O(log T), mejorando los enfoques sub-Gaussianos. 2026-06-19 · 2 min