Fix shared experts fusion + weight requant (#7177)

2025-06-14 17:35:18 +08:00
parent 98538822d5
commit b57d87c297
1 changed files with 9 additions and 8 deletions
--- a/python/sglang/srt/models/deepseek_v2.py
+++ b/python/sglang/srt/models/deepseek_v2.py
@@ -1960,14 +1960,15 @@ class DeepseekV2ForCausalLM(nn.Module):
                )
            if layer_id in moe_layers:
-                shared_experts = layer.mlp.shared_experts
+                shared_experts = getattr(layer.mlp, "shared_experts", None)
-                for module in [
+                if shared_experts is not None:
-                    shared_experts.gate_up_proj,
+                    for module in [
-                    shared_experts.down_proj,
+                        shared_experts.gate_up_proj,
-                ]:
+                        shared_experts.down_proj,
-                    requant_weight_ue8m0_inplace(
+                    ]:
-                        module.weight, module.weight_scale_inv, weight_block_size
+                        requant_weight_ue8m0_inplace(
-                    )
+                            module.weight, module.weight_scale_inv, weight_block_size
                        )
                experts = layer.mlp.experts
                if isinstance(experts, DeepEPMoE):