sunjichen/enginex-c_series-vllm

forked from EngineX-MetaX/enginex-c_series-vllm

Go to file

wangjing 24fab12b2f [qwen3-omni] Add Qwen3-Omni moe thinker

2025-10-09 17:51:14 +08:00

[qwen3-omni] Add Qwen3-Omni moe thinker

2025-10-09 17:51:14 +08:00

.gitignore

[gpt-oss] Add gpt-oss mxfp4 support

2025-08-25 17:41:34 +08:00

code_generator.py

add Dockerfile

2025-08-18 02:43:10 +00:00

Dockerfile

[qwen3-omni] Add Qwen3-Omni moe thinker

2025-10-09 17:51:14 +08:00

README.md

[qwen3-omni] Add Qwen3-Omni moe thinker

2025-10-09 17:51:14 +08:00

README.md

metax-c500-vllm

本项目包含了对于原版 vllm 的升级，使其可以在沐曦 C500芯片上支持运行 gpt-oss, qwen3-omni

本项目中提供的 Dockerfile 中的主要内容为：

将 vllm 目录覆盖到镜像中的 /opt/conda/lib/python3.10/site-packages/vllm。运行gpt-oss时需指定VLLM_ATTENTION_BACKEND=TRITON_ATTN_VLLM_V1
将 code_generator.py 覆盖到镜像中的 /opt/conda/lib/python3.10/site-packages/triton/compiler/code_generator.py

镜像成功编译以后，可以参照标准 vllm 使用方式。