#awq

TileFuse: Biblioteca de kernels de precisión mixta para LLM en NPUs AMD

TileFuse optimiza la inferencia de LLM en NPUs AMD con kernels fusionados de precisión mixta, logrando hasta 2x menor latencia y 64% menos consumo energético.

2026-06-11 · 2 min

Calidad no es un proxy de seguridad en la cuantificación

La calidad no es sinónimo de seguridad en modelos cuantizados. Este estudio revela riesgos ocultos que pasan desapercibidos con métricas tradicionales.

2026-06-10 · 2 min