[sgl-kernel] Add cuda kernel for moe_ep_silu_and_mul (#6919)

Co-authored-by: luoyuan.luo <luoyuan.luo@antgroup.com>
2025-06-12 11:43:08 +08:00
parent ef32677444
commit 84727a5139
8 changed files with 381 additions and 0 deletions
--- a/sgl-kernel/include/sgl_kernel_ops.h
+++ b/sgl-kernel/include/sgl_kernel_ops.h
@@ -266,6 +266,14 @@ void ep_moe_pre_reorder(
    int64_t topk,
    bool use_per_token_if_dynamic);

+void ep_moe_silu_and_mul(
+    torch::Tensor gateup_output,
+    torch::Tensor down_input,
+    torch::Tensor reorder_topk_ids,
+    torch::Tensor scales,
+    int64_t start_expert_id,
+    int64_t end_expert_id);
+
 void ep_moe_post_reorder(
    torch::Tensor down_output,
    torch::Tensor output,