DyLLM: Inferencia Eficiente de LLMs de Difusión mediante Token Saliente Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código. 2026-06-02 · 2 min