xc-llm-ascend/index.md at eccfb715f64b3764bf177a7cd547b8395ee4fb09 - xc-llm-ascend - Gitea: Git with a cup of tea

EngineX/xc-llm-ascend

Files

22dimensions 440d28a138 [Tutorial] Add qwen3 8b w4a8 tutorial (#2249 )

### What this PR does / why we need it?

Add a new single npu quantization tutorial, and using the latest qwen3
model.

- vLLM version: v0.10.0
- vLLM main:
8e8e0b6af1

Signed-off-by: 22dimensions <waitingwind@foxmail.com>

2025-08-07 14:39:38 +08:00

19 lines

283 B

Markdown

Raw Blame History

 # Tutorials
 :::{toctree}
 :caption: Deployment
 :maxdepth: 1
 single_npu
 single_npu_multimodal
 single_npu_audio
 single_npu_qwen3_embedding
 single_npu_qwen3_quantization
 multi_npu
 multi_npu_moge
 multi_npu_qwen3_moe
 multi_npu_quantization
 single_node_300i
 multi_node
 multi_node_kimi
 :::