#feedback retardado

Bandits Lineales Estocásticos: Casi Óptimos con Retraso

Descubre cómo el retraso en la retroalimentación afecta a los algoritmos de bandits lineales. Resultados casi óptimos con penalizaciones aditivas o