#b200

SpenseGPT: Poda práctica de una sola pasada con GEMMs dispersos y densos

Descubre SpenseGPT: poda one-shot que acelera la inferencia de LLMs hasta 1.2x en GPUs B200 con FP8, manteniendo la precisión. Formato híbrido 2:4 y denso.

2026-06-10 · 2 min

SpenseGPT: poda de una sola pasada para inferencia de LLM

Descubre SpenseGPT: un método de poda one-shot que acelera la inferencia de LLMs hasta 1.2 veces en GPUs B200 con FP8, manteniendo la precisión del modelo.

2026-06-10 · 2 min

Alpha Compute: $79.2M en activos, $23M de ingresos y adquisición GAMEE

Alpha Compute anuncia $79.2M en activos, $23M de ingresos anuales proyectados, cierra adquisición de GAMEE y lanza campaña 'Own Your Data' en CNBC.

2026-06-06 · 4 min

KForge: generación de kernels mediante LLMs para aceleradores de IA

KForge automatiza la generación de kernels para aceleradores IA mediante agentes LLM. Logra mejoras de hasta 5x en Intel Arc y 2% en NVIDIA B200. ¡Descubre más!

2026-06-03 · 3 min