SMEPilot: Acelerando la inferencia LLM con extensiones matriciales Descubre cómo SMEPilot optimiza la inferencia de LLM en CPUs usando extensiones matriciales, logrando hasta 3.94x de mejora en rendimiento. 2026-06-16 · 2 min