Bandits Lineales Estocásticos: Casi Óptimos con Retraso Descubre cómo el retraso en la retroalimentación afecta a los algoritmos de bandits lineales. Resultados casi óptimos con penalizaciones aditivas o 2026-06-16 · 2 min