bc57e2ef6041b904202b972eda0e4e4186ee6018
metax-c500-vllm
本项目包含了对于原版 vllm 的升级,使其可以在沐曦 C500芯片上支持运行 gpt-oss
本项目中提供的 Dockerfile 中的主要内容为:
- 将
vllm目录覆盖到镜像中的/opt/conda/lib/python3.10/site-packages/vllm。运行gpt-oss时需指定VLLM_ATTENTION_BACKEND=TRITON_ATTN_VLLM_V1 - 将
code_generator.py覆盖到镜像中的/opt/conda/lib/python3.10/site-packages/triton/compiler/code_generator.py
镜像成功编译以后,可以参照标准 vllm 使用方式。
Languages
Python
100%