Moonshot AI libera como código abierto FlashKDA: kernels CUTLASS para la Atención Delta de Kimi con lotes de longitud variable y benchmarks H20
Moonshot AI lanza FlashKDA: kernels CUTLASS para la atención Delta de Kimi con lotes variables y benchmarks H20. Optimiza rendimiento.