#dream

DyLLM: Inferencia Eficiente de LLMs de Difusión mediante Token Saliente

Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código.

2026-06-02 · 2 min

DREAM-S: Decodificación especulativa para generación multimodal

Acelera la generación multimodal con DREAM-S, un novedoso método de decodificación especulativa que alcanza 3.85x de velocidad en VLMs.

2026-06-02 · 2 min

DREAM-R: Razonamiento Especulativo Multimodal con Redacción Refinada Basada en RL, Verificación Precisa y Ejecución Totalmente Paralela

DREAM-R: razonamiento especulativo multimodal con redacción por refuerzo, verificación precisa y paralelismo para inferencia eficiente.

2026-05-29 · 3 min