SpenseGPT: Poda práctica de una sola pasada con GEMMs dispersos y densos Descubre SpenseGPT: poda one-shot que acelera la inferencia de LLMs hasta 1.2x en GPUs B200 con FP8, manteniendo la precisión. Formato híbrido 2:4 y denso. 2026-06-10 · 2 min