sglang/sgl-kernel/python/sgl_kernel/expert_specilization.py

import torch


def es_fp8_blockwise_scaled_grouped_mm(
    output,
    a,
    b,
    scales_a,
    scales_b,
    stride_a,
    stride_b,
    stride_d,
    problem_sizes,
    expert_offsets,
):
    torch.ops.sgl_kernel.es_fp8_blockwise_scaled_grouped_mm.default(
        output,
        a,
        b,
        scales_a,
        scales_b,
        stride_a,
        stride_b,
        stride_d,
        problem_sizes,
        expert_offsets,
    )
[sgl-kernel][1/N]Support Expert Specialization Grouped GEMM (#11432) Co-authored-by: luoyuan.luo <luoyuan.luo@antgroup.com> Co-authored-by: PGFLMG <1106310035@qq.com> Co-authored-by: Xiaoyu Zhang <35585791+BBuf@users.noreply.github.com> 2025-10-13 11:19:21 +08:00			`import torch`


			`def es_fp8_blockwise_scaled_grouped_mm(`
			`output,`
			`a,`
			`b,`
			`scales_a,`
			`scales_b,`
			`stride_a,`
			`stride_b,`
			`stride_d,`
			`problem_sizes,`
			`expert_offsets,`
			`):`
			`torch.ops.sgl_kernel.es_fp8_blockwise_scaled_grouped_mm.default(`
			`output,`
			`a,`
			`b,`
			`scales_a,`
			`scales_b,`
			`stride_a,`
			`stride_b,`
			`stride_d,`
			`problem_sizes,`
			`expert_offsets,`
			`)`