初始化项目，由ModelHub XC社区提供模型

Model: Jason-hu/Qwen2.5-3B-GSM8K-GRPO-H200 Source: Original Platform
2026-05-10 05:35:47 +08:00
commit c8c8843908
14 changed files with 152291 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -0,0 +1,19 @@
+---
+license: apache-2.0
+datasets:
+- openai/gsm8k
+language:
+- zh
+- en
+base_model: Qwen/Qwen2.5-3B-Instruct
+pipeline_tag: text-generation
+library_name: transformers
+tags:
+- gsm8k
+- sft
+- verl
+---
+
+# Qwen2.5-3B-GSM8K-SFT
+
+这是一个基于 Qwen2.5-3B-Instruct 构建的数学微调模型，使用了 verl 框架在 GSM8K 数据集上进行了 LoRA SFT。