Go to file

ModelHub XC c8c8843908 初始化项目，由ModelHub XC社区提供模型

Model: Jason-hu/Qwen2.5-3B-GSM8K-GRPO-H200
Source: Original Platform

2026-05-10 05:35:47 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 05:35:47 +08:00

README.md

license, datasets, language, base_model, pipeline_tag, library_name, tags

license

datasets

language

base_model

pipeline_tag

library_name

Qwen2.5-3B-GSM8K-SFT

这是一个基于 Qwen2.5-3B-Instruct 构建的数学微调模型，使用了 verl 框架在 GSM8K 数据集上进行了 LoRA SFT。