Algoritmo óptimo para bandits contextuales lineales con actualizaciones escasas Descubre un algoritmo práctico y óptimo para bandits contextuales lineales con O(log log T) actualizaciones. Máximo rendimiento con mínima complejidad. 2026-06-02 · 2 min