Moonshot AI publica en código abierto FlashKDA: Kernels CUTLASS para Kimi Delta Attention con lotes de longitud variable y benchmarks H20
Moonshot AI lanza FlashKDA: kernels CUTLASS para Kimi Delta Attention con lotes variables y benchmarks H20. Optimiza atención eficiente en GPU.