#dyllm

DyLLM: Inferencia Eficiente de LLMs de Difusión mediante Token Saliente

Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código.

2026-06-02 · 2 min