BitsMoE: Asignación eficiente de bits para cuantización de MoE LLM BitsMoE asigna bits inteligentemente en MoE LLM, logrando cuantización 2 bits con 27.83% más precisión, 12.3x más rápida y 1.76x más velocidad. 2026-06-02 · 2 min