Go to file

ModelHub XC 979b77c1c7 初始化项目，由ModelHub XC社区提供模型

Model: RoadQAQ/Qwen2.5-Math-7B-16k-think
Source: Original Platform

2026-05-13 20:59:30 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00001-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00001-of-00007.safetensors model-00002-of-00007.safetensors model-00003-of-00007.safetensors model-00004-of-00007.safetensors model-00005-of-00007.safetensors model-00006-of-00007.safetensors model-00007-of-00007.safetensors tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00002-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00003-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00004-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00005-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00006-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model-00007-of-00007.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 20:59:30 +08:00

README.md

license, library_name, pipeline_tag

license	library_name	pipeline_tag
mit	transformers	text-generation

The base Qwen2.5-Math-7B model used by ReLIFT. We change to rope_theta from 10000 to 40000 and extend the context window to 16k. Also, we modify the chat_template for the system prompt and add .

Github: https://github.com/TheRoadQaQ/ReLIFT

Citation

If you find our model, data, or evaluation code useful, please kindly cite our paper:

@article{ma2025learning,
  title={Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions},
  author={Ma, Lu and Liang, Hao and Qiang, Meiyi and Tang, Lexiang and Ma, Xiaochen and Wong, Zhen Hao and Niu, Junbo and Shen, Chengyu and He, Runming and Cui, Bin and others},
  journal={arXiv preprint arXiv:2506.07527},
  year={2025}
}