#bandidos lineales

Arrepentimiento Casi Óptimo en Bandidos Adversariales Distribuidos

Descubre cómo un nuevo algoritmo de caja negra logra arrepentimiento casi óptimo en bandidos adversariales distribuidos, superando records previos. ¡Lee más!

2026-06-16 · 2 min

Análisis preciso del muestreo por conjuntos lineales

Analizamos el muestreo por ensamble lineal en bandidos lineales: demostramos una cota de regret casi óptima con tamaño de conjunto Θ(d log n). ¡Lee el análisis!

2026-06-16 · 2 min

Bandidos para Experimentación con Grupo de Control, Preferencias y Derivas

Optimiza experimentación con bandidos contextuales usando Dri-MED. Se adapta a derivas, preferencias y restricciones. Ideal para decisiones bajo incertidumbre.

2026-06-16 · 2 min

Cuándo y por qué funciona la exploración aleatoria en bandidos lineales

Exploración aleatoria (Thompson sampling) logra arrepentimiento óptimo en bandidos lineales con espacios convexos. ¡Un avance clave!

2026-06-04 · 2 min

Aprendizaje offline-online en bandidos lineales

Descubre cómo nuestro algoritmo combina datos offline y exploración online en bandidos lineales para minimizar el arrepentimiento. Resultados empíricos demuestran su eficacia.

2026-06-04 · 2 min

Enfoque de perturbación para bandidos lineales

Descubre cómo un enfoque de perturbación logra arrepentimiento óptimo en bandidos lineales no restringidos, con nuevas garantías de alta probabilidad y tasas adaptativas.

2026-06-03 · 2 min