71 lines
2.5 KiB
Markdown
71 lines
2.5 KiB
Markdown
---
|
||
frameworks:
|
||
- Pytorch
|
||
license: Apache License 2.0
|
||
tags: []
|
||
tasks:
|
||
- image-text-to-text
|
||
|
||
#model-type:
|
||
##如 gpt、phi、llama、chatglm、baichuan 等
|
||
#- gpt
|
||
|
||
#domain:
|
||
##如 nlp、cv、audio、multi-modal
|
||
#- nlp
|
||
|
||
#language:
|
||
##语言代码列表 https://help.aliyun.com/document_detail/215387.html?spm=a2c4g.11186623.0.0.9f8d7467kni6Aa
|
||
#- cn
|
||
|
||
#metrics:
|
||
##如 CIDEr、Blue、ROUGE 等
|
||
#- CIDEr
|
||
|
||
#tags:
|
||
##各种自定义,包括 pretrained、fine-tuned、instruction-tuned、RL-tuned 等训练方法和其他
|
||
#- pretrained
|
||
|
||
#tools:
|
||
##如 vllm、fastchat、llamacpp、AdaSeq 等
|
||
#- vllm
|
||
- visual-grounding
|
||
language:
|
||
- zh
|
||
base_model:
|
||
- Qwen/Qwen2.5-VL-3B-Instruct
|
||
base_model_relation: finetune
|
||
metrics:
|
||
- accuracy
|
||
- ANLS
|
||
---
|
||
|
||
#### Qwen2.5-VL-3B-SFT简介
|
||
Qwen2.5-VL-3B-SFT是一款基于Qwen2.5-VL-3B的微调模型,面向通用证照关键信息提取。微调数据集:约40万张标注证照数据,包含身份证、学历证书、学位证书、营业执照、事业单位法人证书、ISO9001系列质量管理体系认证证书、ISO14001族环境管理体系认证证书、ISO45001认证证书、OHSAS18001认证证书、SA8000认证证书、通信网络安全服务能力证书(风险评估)、通信网络安全服务能力证书(设计与集成)、通信网络安全服务能力证书(应急响应)、通信网络安全服务能力证书(安全培训)等。同时加入了一些其他数据来避免原有能力遗忘,比如问答数据、公式提取、表格信息提取等。
|
||
|
||
在11类证照测试集上,Qwen2.5-VL-3B-SFT ANLS和字段级ACC均超过Qwen2.5-VL-72B和Qwen2.5-VL-7B。测试结果如下:
|
||
|
||
| 模型名称 | ANLS | 字段级ACC |
|
||
| :--- | :--- | :--- |
|
||
| Qwen2.5-VL-72B | 93.49 | 86.92 |
|
||
| Qwen2.5-VL-7B | 93.3 | 86.7 |
|
||
| Qwen2.5-VL-3B-SFT | 96.43 | 93.28 |
|
||
|
||
#### 您可以通过如下git clone命令,或者ModelScope SDK来下载模型
|
||
SDK下载
|
||
```bash
|
||
#安装ModelScope
|
||
pip install modelscope
|
||
```
|
||
```python
|
||
#SDK模型下载
|
||
from modelscope import snapshot_download
|
||
model_dir = snapshot_download('Fairme/qwen2.5-vl-7b-sft')
|
||
```
|
||
Git下载
|
||
```
|
||
#Git模型下载
|
||
git clone https://www.modelscope.cn/Fairme/qwen2.5-vl-7b-sft.git
|
||
```
|
||
|
||
<p style="color: lightgrey;">如果您是本模型的贡献者,我们邀请您根据<a href="https://modelscope.cn/docs/ModelScope%E6%A8%A1%E5%9E%8B%E6%8E%A5%E5%85%A5%E6%B5%81%E7%A8%8B%E6%A6%82%E8%A7%88" style="color: lightgrey; text-decoration: underline;">模型贡献文档</a>,及时完善模型卡片内容。</p> |