Evaluación de trayectorias basada en preferencias offline Descubre cómo la evaluación basada en preferencias de trayectorias reduce los empates en benchmarks de IA del 75% al 35%, mejorando la discriminación y 2026-06-17 · 3 min