初始化项目,由ModelHub XC社区提供模型

Model: Jason-hu/Qwen2.5-3B-GSM8K-GRPO-H200
Source: Original Platform
This commit is contained in:
ModelHub XC
2026-05-10 05:35:47 +08:00
commit c8c8843908
14 changed files with 152291 additions and 0 deletions

19
README.md Normal file
View File

@@ -0,0 +1,19 @@
---
license: apache-2.0
datasets:
- openai/gsm8k
language:
- zh
- en
base_model: Qwen/Qwen2.5-3B-Instruct
pipeline_tag: text-generation
library_name: transformers
tags:
- gsm8k
- sft
- verl
---
# Qwen2.5-3B-GSM8K-SFT
这是一个基于 Qwen2.5-3B-Instruct 构建的数学微调模型,使用了 verl 框架在 GSM8K 数据集上进行了 LoRA SFT。