DyLLM: Inferencia Eficiente de LLMs de Difusión mediante Token Saliente
Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código.
Descubre DyLLM, un marco de inferencia sin entrenamiento que acelera hasta 9.6x los LLMs de difusión seleccionando solo tokens relevantes. Ideal para razonamiento y código.
DSL-LLaDA adapta LLaDA para denoising continuo, evitando el compromiso longitud/calidad. Obtiene el mejor ROUGE-1 en resumen con pocos pasos.
Descubre SkillAdaptor, un marco sin entrenamiento que adapta habilidades de agentes LLM paso a paso, mejorando éxito en WebShop, PinchBench y Claw-Eval.
Estudio revela que MDLMs descifran entidades primero en generación texto-gráfico. SFT puede fallar, pero decodificación lambda recupera +9.4 BLEU.
<meta content=FineVLA ofrece instrucciones detalladas para crear políticas orientables de visión, lenguaje y acción. Optimiza tu modelo VLA con esta guía práctica y efectiva.>