xc-llm-ascend/README.zh.md at befbee5883446ccb8b0df255a911168079a414f1

Files

wangxiyuan befbee5883 Update README and add collect_env info (#369 )

1. Doc: Fix error link
2. Doc: make Chinese version the same with english
3. remove useless file `test.py`
4. update `collect_env.py`
5. Fix v1 import error

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>

2025-03-21 15:43:43 +08:00

3.6 KiB

Raw Blame History

vLLM Ascend Plugin

English | 中文

最新消息 🔥

[2025/03] 我们和vLLM团队举办了vLLM Beijing Meetup! 你可以在这里找到演讲材料.
[2025/02] vLLM社区正式创建了vllm-project/vllm-ascend仓库，让vLLM可以无缝运行在Ascend NPU。
[2024/12] 我们正在与 vLLM 社区合作，以支持 [RFC]: Hardware pluggable.

总览

vLLM 昇腾插件 (vllm-ascend) 是一个由社区维护的让vLLM在Ascend NPU无缝运行的后端插件。

此插件是 vLLM 社区中支持昇腾后端的推荐方式。它遵循[RFC]: Hardware pluggable所述原则：通过解耦的方式提供了vLLM对Ascend NPU的支持。

使用 vLLM 昇腾插件，可以让类Transformer、混合专家(MOE)、嵌入、多模态等流行的大语言模型在 Ascend NPU 上无缝运行。

准备

硬件：Atlas 800I A2 Inference系列、Atlas A2 Training系列
操作系统：Linux
软件：
- Python >= 3.9
- CANN >= 8.0.RC2
- PyTorch >= 2.5.1, torch-npu >= 2.5.1.dev20250308
- vLLM (与vllm-ascend版本一致)

开始使用

请查看快速开始和安装指南了解更多.

贡献

请参考 CONTRIBUTING 文档了解更多关于开发环境搭建、功能测试以及 PR 提交规范的信息。

我们欢迎并重视任何形式的贡献与合作：

请通过Issue来告知我们您遇到的任何Bug。
请通过用户论坛来交流使用问题和寻求帮助。

分支策略

vllm-ascend有主干分支和开发分支。

main: 主干分支，与vLLM的主干分支对应，并通过昇腾CI持续进行质量看护。
vX.Y.Z-dev: 开发分支，随vLLM部分新版本发布而创建，比如v0.7.3-dev是vllm-asend针对vLLM v0.7.3版本的开发分支。

下面是维护中的分支：

分支	状态	备注
main	Maintained	基于vLLM main分支CI看护
v0.7.1-dev	Unmaintained	只允许文档修复
v0.7.3-dev	Maintained	基于vLLM v0.7.3版本CI看护

请参阅版本策略了解更多详细信息。

许可证

Apache 许可证 2.0，如 LICENSE 文件中所示。

3.6 KiB Raw Blame History Unescape Escape

vLLM Ascend Plugin

总览

准备

开始使用

贡献

分支策略

许可证

3.6 KiB

Raw Blame History