Reforzar la Correspondencia Adjunta: Escalando el Entrenamiento Posterior con RL de Modelos de Difusión y de Coincidencia de Flujo
Escala el post-entrenamiento con RL y correspondencia adjunta en difusión y flujo. Descubre cómo mejorar modelos generativos con técnicas de refuerzo.