Add deepseek style fused moe group gate selection kernel (#4530)

2025-03-29 11:51:45 -07:00
parent ddf8981d91
commit 45dcfc2e76
9 changed files with 616 additions and 1 deletions
--- a/sgl-kernel/include/sgl_kernel_ops.h
+++ b/sgl-kernel/include/sgl_kernel_ops.h
@@ -199,6 +199,9 @@ void topk_softmax(
    torch::Tensor& token_expert_indices,
    torch::Tensor& gating_output);

+std::vector<at::Tensor>
+moe_fused_gate(at::Tensor& input, at::Tensor& bias, int64_t num_expert_group, int64_t topk_group, int64_t topk);
+
 /*
 * From csrc/speculative
 */