xc-llm-ascend

Files

Jade Zheng 22f253142a [Feature] Support fine-grained shared expert overlap (#5482 )

Fine-grained control over shared expert overlap to prevent resource
contention.

- vLLM version: v0.13.0
- vLLM main:
5326c89803

---------

Signed-off-by: Jade Zheng <zheng.shoujian@outlook.com>

2026-01-17 11:53:22 +08:00

__init__.py

[Refactor] [MoE] Rename moe-related classes & files (#3646 )

2025-10-25 11:22:03 +08:00

comm_utils.py

[Refactor] [MoE] Rename moe-related classes & files (#3646 )

2025-10-25 11:22:03 +08:00

experts_selector.py

[Kernel] Add moe_gating_top_k operator support for Ascend NPU (#5579 )

2026-01-07 21:42:31 +08:00

fused_moe.py

[Feature] Support fine-grained shared expert overlap (#5482 )

2026-01-17 11:53:22 +08:00

moe_comm_method.py

[Feature] Support fine-grained shared expert overlap (#5482 )

2026-01-17 11:53:22 +08:00

moe_mlp.py

[refactor] Remove unnecessary attributes from set_ascend_forward_context (#5204 )

2025-12-23 08:49:52 +08:00

prepare_finalize.py

[Feature] Support fine-grained shared expert overlap (#5482 )

2026-01-17 11:53:22 +08:00

token_dispatcher.py

[Feature] Support fine-grained shared expert overlap (#5482 )

2026-01-17 11:53:22 +08:00