add more test results

2025-10-17 14:22:33 +08:00
parent 5981370919
commit d1c0f68ab4
1 changed files with 8 additions and 2 deletions
--- a/README.md
+++ b/README.md
@@ -150,11 +150,17 @@ curl http://localhost:80/v1/chat/completions \

 作为测试对比，我们也提供a100相对应的镜像 `harbor.4pd.io/sagegpt-aio/pk_platform/vllm-installed_wyq:1.0.1`
 ## 寒武纪mlu370-X4上文本生成模型运行测试结果
-在mlu370-X8上对部分视觉理解多模态模型进行适配，测试方式为在 Nvidia A100 和 mlu370-X4 加速卡上对10个图片相关问题回答，获取运行时间
+在mlu370-X8上对部分视觉理解多模态模型进行适配，测试方式为在 Nvidia A100 和 mlu370-X4 加速卡上对上述问题进行请求，获取运行时间

 | 模型名称   | 模型类型               | 适配状态 | mlu370-X4首字延迟(秒) |	mlu370-X4输入处理速度(字每秒) |	mlu370-X4输出速度(字每秒) |	mlu370-X4输出质量 | Nvidia A100字延迟(秒) |	Nvidia A100输入处理速度(字每秒) |	Nvidia A100输出速度(字每秒) |	Nvidia A100输出质量 |
 | ------------------- | ------------------- | -------------------| ------------------- | ------------------- | ------------------- | -------------------  | ------------------- | -------------------  | -------------------  | ------------------- |
 | Qwen1.5-1.8B-Chat     |  Qwen 系列   | 成功     |0.124	| 10086.6 |	89.6 |	53.8 | 0.069 | 19601.3 |	154.3 |	61.2|
 | Llama-2-7b-chat-hf    |  Llama 系列   | 成功     |0.262	| 6147.5 |	62.2 |	75.0 | 0.083 | 11776.5 |	146.7 |	31.2|
 | chatglm3-6b    |  chatglm 系列   | 成功     |0.244	| 4974.0	 |	34.1 |	80.0 | 0.053 | 15788.3 |	110.6 |	80.0|						
-					
+					
+## 寒武纪mlu370-x8上文本生成模型运行测试结果
+
+| 模型名称    | mlu370-X8首字延迟(秒) |	mlu370-X8输入处理速度(字每秒) |	mlu370-X8输出速度(字每秒) |	mlu370-X8输出质量 | Nvidia A100字延迟(秒) |	Nvidia A100输入处理速度(字每秒) |	Nvidia A100输出速度(字每秒) |	Nvidia A100输出质量 |
+| ------------------- | ------------------- | -------------------| ------------------- | ------------------- | ------------------- | -------------------  | ------------------- | -------------------  |
+| Qwen/Qwen-1_8B   |0.203	| 13493.2	 |	119.2 |	10.0 | 0.052 | 25591.5 |	165.0 |	15.0|					
+| Qwen/Qwen1.5-0.5B   |0.132	| 12366.6	 |	106.9 |	15.0 | 0.066 | 24935.4 |	151.4 |	10.0|