Bandidos contextuales lineales con ruido acotado: set-membership
Descubre cómo el algoritmo SME-OFU para bandits contextuales con ruido acotado logra una cota de error O(log T), mejorando los enfoques sub-Gaussianos.
Descubre cómo el algoritmo SME-OFU para bandits contextuales con ruido acotado logra una cota de error O(log T), mejorando los enfoques sub-Gaussianos.