Predecir-luego-Difundir: Longitud de Respuesta Adaptativa para Inferencia con Presupuesto de Cómputo en LLMs de Difusión
Descubre cómo Predecir luego difundir optimiza la inferencia en LLMs de difusión con longitud adaptativa y presupuesto limitado. Eficiente y preciso.