xc-llm-ascend

Files

realliujiaxu 09f71c14a6 Revert "[feat] enable hierarchical mc2 ops on A2 by default (#5300 )" (#5434 )

We'll release 0.13.0 soon. The main branch is freeze. Let's revert the
newest change and redo it once 0.13.0 is released.

- vLLM version: release/v0.13.0
- vLLM main:
81786c8774

Signed-off-by: realliujiaxu <realliujiaxu@163.com>

2025-12-27 17:06:58 +08:00

__init__.py

[Refactor] [MoE] Rename moe-related classes & files (#3646 )

2025-10-25 11:22:03 +08:00

comm_utils.py

[Refactor] [MoE] Rename moe-related classes & files (#3646 )

2025-10-25 11:22:03 +08:00

experts_selector.py

[refactor] Remove unnecessary attributes from set_ascend_forward_context (#5204 )

2025-12-23 08:49:52 +08:00

fused_moe.py

[Refactor][MoE] Reuse vLLM's all_reduce logic (#5189 )

2025-12-23 18:53:48 +08:00

moe_comm_method.py

[Feature]Use DispatchGmmCombineDecode operator to replace MC2(Optional) (#5040 )

2025-12-21 15:23:59 +08:00

moe_mlp.py

[refactor] Remove unnecessary attributes from set_ascend_forward_context (#5204 )

2025-12-23 08:49:52 +08:00

prepare_finalize.py

[Refactor][MoE] Reuse vLLM's all_reduce logic (#5189 )

2025-12-23 18:53:48 +08:00

token_dispatcher.py

Revert "[feat] enable hierarchical mc2 ops on A2 by default (#5300 )" (#5434 )

2025-12-27 17:06:58 +08:00