Qwen2.5-3B-Instruct-RG-Math

Go to file

ModelHub XC a77026bb1a 初始化项目，由ModelHub XC社区提供模型

Model: zafstojano/Qwen2.5-3B-Instruct-RG-Math
Source: Original Platform

2026-05-01 17:10:10 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

all_results.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

train_results.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

trainer_state.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

training_args.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-01 17:10:10 +08:00

README.md

library_name, pipeline_tag, base_model

library_name

pipeline_tag

base_model

transformers

text-generation

Qwen/Qwen2.5-3B-Instruct

This model was trained for our Reasoning Gym paper (https://arxiv.org/abs/2505.24760) using our Reasoning Gym repo (https://github.com/open-thought/reasoning-gym)