Cuantización de modelos de series temporales como sistemas dinámicos: TQS
TQS mide propagación de errores de cuantificación en series temporales. Permite presupuesto de bits sin calibración. Ideal para baja precisión.
TQS mide propagación de errores de cuantificación en series temporales. Permite presupuesto de bits sin calibración. Ideal para baja precisión.
La calidad no es sinónimo de seguridad en modelos cuantizados. Este estudio revela riesgos ocultos que pasan desapercibidos con métricas tradicionales.
WaterSIC: algoritmo de cuantización casi óptimo que supera a GPTQ. Nuevo récord en LLMs Llama y Qwen para 1-4 bits. ¡Mejora la eficiencia!
GPTQ-intrinsic LoRA: mejora la cuantización de baja precisión con corrección de bajo rango. Algoritmo casi óptimo para modelos grandes.
GPTQ-intrinsic LoRA combina cuantización de baja precisión y adaptación de bajo rango para comprimir redes neuronales. Algoritmo sin entrenamiento mejora modelos como Qwen3 y DeiT.