El futuro estructurado: decodificación especulativa de LLM difusivos Spiffy acelera la inferencia de LLM difusivos hasta 6.3x en tasa de tokens, preservando la distribución de salida. ¡Descubre cómo! 2026-06-12 · 2 min