xc-llm-ascend/index.md at bdfb065b5da753ca99ccaa97fe6a921e34a4d6ff - xc-llm-ascend - Gitea: Git with a cup of tea

EngineX/xc-llm-ascend

Files

wangxiyuan b5b7e0ecc7 [Doc] Add qwen3 embedding 8b guide (#1734 )

1. Add the tutorials for qwen3-embedding-8b
2. Remove VLLM_USE_V1=1  in docs, it's useless any more from 0.9.2


- vLLM version: v0.9.2
- vLLM main:
5923ab9524

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>

2025-07-11 17:40:17 +08:00

17 lines

237 B

Markdown

Raw Blame History

 # Tutorials
 :::{toctree}
 :caption: Deployment
 :maxdepth: 1
 single_npu
 single_npu_multimodal
 single_npu_audio
 single_npu_qwen3_embedding
 multi_npu
 multi_npu_moge
 multi_npu_qwen3_moe
 multi_npu_quantization
 single_node_300i
 multi_node
 :::