xc-llm-ascend

Files

rjg-lyh 6b7117dbb7 [main] addrmsnorm + quant fusion optim in Dense Models (#2772 )

### What this PR does / why we need it?
This PR fused addrmsnorm op and w8a8 quant op to get better perf.

### Does this PR introduce _any_ user-facing change?
No.

### How was this patch tested?
CI passed with new added/existing test.

- vLLM version: v0.10.2
- vLLM main:
0faf3cc3e8

Signed-off-by: rjg-lyh <1318825571@qq.com>

2025-09-16 22:31:38 +08:00

e2e

[refactor] refactor deepseek-related files (#2849 )

2025-09-16 14:13:07 +08:00

[main] addrmsnorm + quant fusion optim in Dense Models (#2772 )

2025-09-16 22:31:38 +08:00

__init__.py

[SpecDecode] Add spec decode support (#500 )

2025-04-17 20:16:32 +08:00