AT-DPT: Aprendizaje por refuerzo robusto en contexto contra envenenamiento Descubre cómo AT-DPT mejora la robustez del aprendizaje por refuerzo en contexto frente a ataques de envenenamiento de recompensas. Resultados sorprendentes. 2026-06-09 · 1 min