ADMM-Q: Un cuantificador de pesos mejorado basado en la Hessiana para la cuantización post-entrenamiento de modelos de lenguaje grandes
ADMM-Q cuantización de pesos con Hessiana para optimizar modelos de lenguaje grandes, reduciendo tamaño y manteniendo precisión.