#ptq · DeepCodeNews

Cuantización de modelos de series temporales como sistemas dinámicos: TQS

TQS mide propagación de errores de cuantificación en series temporales. Permite presupuesto de bits sin calibración. Ideal para baja precisión.

2026-06-15 · 3 min

Calidad no es un proxy de seguridad en la cuantificación

La calidad no es sinónimo de seguridad en modelos cuantizados. Este estudio revela riesgos ocultos que pasan desapercibidos con métricas tradicionales.

2026-06-10 · 2 min

WaterSIC: Cuantización lineal casi óptima (teoría de la información)

WaterSIC: algoritmo de cuantización casi óptimo que supera a GPTQ. Nuevo récord en LLMs Llama y Qwen para 1-4 bits. ¡Mejora la eficiencia!

2026-06-03 · 2 min

GPTQ-intrinsic LoRA: Cuantización de baja precisión con adaptación de bajo rango

GPTQ-intrinsic LoRA: mejora la cuantización de baja precisión con corrección de bajo rango. Algoritmo casi óptimo para modelos grandes.

2026-06-02 · 2 min

GPTQ-intrinsic LoRA: algoritmo cuasióptimo para cuantización y adaptación de bajo rango

GPTQ-intrinsic LoRA combina cuantización de baja precisión y adaptación de bajo rango para comprimir redes neuronales. Algoritmo sin entrenamiento mejora modelos como Qwen3 y DeiT.

2026-06-02 · 2 min