Selección de capa adaptativa para poda de tokens por capa en la inferencia de LLM Selección de capa adaptativa para mejorar la inferencia de modelos de lenguaje mediante un enfoque innovador y eficiente. 2026-04-17 · 2 min