Reforzando modelos de difusión de pocas etapas con recompensas no diferenciables Optimización de modelos de difusión con recompensas no diferenciables. Descubre cómo mejorar la difusión de información de manera eficiente. 2026-03-10 · 2 min