MuonQ: Mejora de la cuantización de muones de bajo bit mediante la optimización de la fidelidad direccional
MuonQ: Método de cuantización de bajo bit que optimiza la fidelidad direccional para mejorar la precisión de modelos sin aumentar el costo computacional.