PBSD: Destilación Bayesiana Privilegiada para Crédito en Horizonte Largo Descubre cómo PBSD asigna crédito granular en tareas de largo plazo con auto-destilación bayesiana, mejorando el aprendizaje con recompensas dispersas. 2026-06-09 · 2 min