QFlash: Uniendo la Cuantización y la Eficiencia de Memoria en la Atención del Transformer de Visión
QFlash optimiza la atención de Vision Transformer mediante cuantización, logrando alta eficiencia de memoria sin perder precisión. Ideal para modelos de visión artificial.