Decodificación paralela guiada por atención a nivel de clúster para modelos de lenguaje de difusión enmascarados Decodificación paralela guiada por atención de clúster optimiza modelos de difusión enmascarados para generación eficiente. 2026-05-29 · 3 min