Optimización de políticas Bradley-Terry para modelado generativo de preferencias Modelado generativo de preferencias con optimización de políticas Bradley-Terry: Una técnica avanzada para comprender y maximizar las preferencias de los usuarios. 2026-03-11 · 2 min