运行于【昇腾-910】系列算力卡的【文本生成】引擎,基于 vLLM 引擎进行架构特别适配优化,支持 Qwen、DeepSeek、Llama 等最新开源模型
Updated 2025-10-29 22:50:38 +08:00
运行于【天数智芯-天垓】系列算力卡的【文本生成】引擎,基于 vLLM 引擎进行架构特别适配优化,率先实现在天垓 100 芯片上支持 Qwen3 系列等最新流行模型,并且引入 prefix-caching 等开源社区流行优化技术
Updated 2025-10-24 15:46:47 +08:00