update Readme
This commit is contained in:
29
README.md
29
README.md
@@ -6,20 +6,23 @@ transformers框架支持多种图像分类模型,现对天垓100加速卡进
|
||||
## Quick Start
|
||||
1、首先从 modelscope上下载视觉分类的模型,例如 microsoft/beit-base-patch16-224
|
||||
```python
|
||||
modelscope download --model microsoft/beit-base-patch16-224 README.md --local_dir /mnt/contest_ceph/zhoushasha/models/microsoft/beit-base-patch16-224
|
||||
modelscope download --model microsoft/beit-base-patch16-224 README.md --local_dir /mnt/contest_ceph/zhoushasha/models/microsoft/beit_base_patch16_224_pt22k_ft22k
|
||||
```
|
||||
2、使用Dockerfile生成镜像
|
||||
从仓库的【软件包】栏目下载基础镜像 bi100-3.2.1-x86-ubuntu20.04-py3.10-poc-llm-infer:v1.2.2
|
||||
使用 Dockerfile_bi100 生成 镜像,例如 bi100-3.2.1-x86-ubuntu20.04-py3.10-poc-llm-infer:test
|
||||
注意 Dockerfile_bi100 中已预先将模型 microsoft/beit-base-patch16-224 放在了 /model 下面
|
||||
注意 Dockerfile_bi100 中已预先将模型 microsoft_beit_base_patch16_224_pt22k_ft22k 放在了 /model 下面
|
||||
|
||||
3、启动docker
|
||||
```python
|
||||
docker run -it --rm \
|
||||
-p 10086:80 \
|
||||
--name test_zss \
|
||||
-v /mnt/contest_ceph/zhoushasha/models/microsoft/beit-base-patch16-224:/model:rw \
|
||||
-v /mnt/contest_ceph/zhoushasha/models/image_models/microsoft_beit_base_patch16_224_pt22k_ft22k:/model:rw \
|
||||
--privileged bi100-3.2.1-x86-ubuntu20.04-py3.10-poc-llm-infer:test
|
||||
```
|
||||
其中/mnt/contest_ceph/zhoushasha/models/image_models/microsoft_beit_base_patch16_224_pt22k_ft22k为你存放的模型文件的实际地址
|
||||
|
||||
4、测试服务
|
||||
```python
|
||||
curl -X POST http://localhost:10086/v1/private/s782b4996 \
|
||||
@@ -46,27 +49,7 @@ AutoModelForImageClassification,执行图像分类的核心计算,输入预
|
||||
3、 轻量级模型:MobileNet 系列
|
||||
4、其他特殊设计:ConvNeXt
|
||||
|
||||
## 视觉分类 模型测试服务请求示例
|
||||
```python
|
||||
import requests
|
||||
|
||||
# 服务地址(根据实际部署修改)
|
||||
BASE_URL = "http://localhost:80"
|
||||
PREDICT_ENDPOINT = "/v1/private/s782b4996"
|
||||
|
||||
# 本地图片路径(替换为你的图片路径)
|
||||
IMAGE_PATH = "test_image.jpg"
|
||||
|
||||
# 读取图片文件并发送请求
|
||||
with open(IMAGE_PATH, "rb") as f:
|
||||
files = {"image": f} # 键名必须为 "image",与服务端接收字段一致
|
||||
response = requests.post(f"{BASE_URL}{PREDICT_ENDPOINT}", files=files)
|
||||
|
||||
# 打印响应结果
|
||||
print("预测接口响应状态码:", response.status_code)
|
||||
print("预测结果:")
|
||||
print(response.json())
|
||||
```
|
||||
|
||||
## 天垓100视觉分类模型适配情况
|
||||
| 模型地址 | 类型 | 适配状态 | 天垓100准确率 | 天垓100吞吐量(张/秒) | cpu准确率 | cpu吞吐量(4C)(张/秒) | Submit Id |
|
||||
|
||||
Reference in New Issue
Block a user