--- frameworks: - Pytorch license: Apache License 2.0 tags: [] tasks: - image-text-to-text #model-type: ##如 gpt、phi、llama、chatglm、baichuan 等 #- gpt #domain: ##如 nlp、cv、audio、multi-modal #- nlp #language: ##语言代码列表 https://help.aliyun.com/document_detail/215387.html?spm=a2c4g.11186623.0.0.9f8d7467kni6Aa #- cn #metrics: ##如 CIDEr、Blue、ROUGE 等 #- CIDEr #tags: ##各种自定义,包括 pretrained、fine-tuned、instruction-tuned、RL-tuned 等训练方法和其他 #- pretrained #tools: ##如 vllm、fastchat、llamacpp、AdaSeq 等 #- vllm - visual-grounding language: - zh base_model: - Qwen/Qwen2.5-VL-3B-Instruct base_model_relation: finetune metrics: - accuracy - ANLS --- #### Qwen2.5-VL-3B-SFT简介 Qwen2.5-VL-3B-SFT是一款基于Qwen2.5-VL-3B的微调模型,面向通用证照关键信息提取。微调数据集:约40万张标注证照数据,包含身份证、学历证书、学位证书、营业执照、事业单位法人证书、ISO9001系列质量管理体系认证证书、ISO14001族环境管理体系认证证书、ISO45001认证证书、OHSAS18001认证证书、SA8000认证证书、通信网络安全服务能力证书(风险评估)、通信网络安全服务能力证书(设计与集成)、通信网络安全服务能力证书(应急响应)、通信网络安全服务能力证书(安全培训)等。同时加入了一些其他数据来避免原有能力遗忘,比如问答数据、公式提取、表格信息提取等。 在11类证照测试集上,Qwen2.5-VL-3B-SFT ANLS和字段级ACC均超过Qwen2.5-VL-72B和Qwen2.5-VL-7B。测试结果如下: 模型名称 | ANLS | 字段级ACC Qwen2.5-VL-72B | 93.49 | 86.92 Qwen2.5-VL-7B | 93.3 | 86.7 Qwen2.5-VL-3B-SFT | 96.43 | 93.28 #### 您可以通过如下git clone命令,或者ModelScope SDK来下载模型 SDK下载 ```bash #安装ModelScope pip install modelscope ``` ```python #SDK模型下载 from modelscope import snapshot_download model_dir = snapshot_download('Fairme/qwen2.5-vl-7b-sft') ``` Git下载 ``` #Git模型下载 git clone https://www.modelscope.cn/Fairme/qwen2.5-vl-7b-sft.git ```
如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。