Files
enginex-c_series-vllm/README.md

10 lines
538 B
Markdown
Raw Normal View History

2025-08-18 02:43:10 +00:00
# metax-c500-vllm
2025-08-28 16:13:08 +08:00
本项目包含了对于原版 vllm 的升级,使其可以在沐曦 C500芯片上支持运行 gpt-oss
本项目中提供的 Dockerfile 中的主要内容为:
1.`vllm` 目录覆盖到镜像中的 `/opt/conda/lib/python3.10/site-packages/vllm`。运行`gpt-oss`时需指定`VLLM_ATTENTION_BACKEND=TRITON_ATTN_VLLM_V1`
2025-08-18 02:43:10 +00:00
2.`code_generator.py` 覆盖到镜像中的 `/opt/conda/lib/python3.10/site-packages/triton/compiler/code_generator.py`
2025-08-28 16:13:08 +08:00
镜像成功编译以后,可以参照标准 vllm 使用方式。