Emparejamiento de Puntuación de Recompensa: Unificando el Ajuste Fino Basado en Recompensa para Modelos de Flujo y Difusión
Optimiza el ajuste fino para modelos de flujo y difusión con el emparejamiento de puntuación de recompensa. Un enfoque unificado para mejorar tus resultados.