RuleReasoner-4B

Go to file

ModelHub XC 9717054d4a 初始化项目，由ModelHub XC社区提供模型

Model: RuleReasoner/RuleReasoner-4B
Source: Original Platform

2026-05-13 10:04:35 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-13 10:04:35 +08:00

README.md

base_model, datasets, language, library_name, license, metrics, pipeline_tag, tags, new_version

base_model

datasets

language

library_name

license

metrics

pipeline_tag

tags

new_version

Qwen/Qwen3-4B-Base

RuleReasoner/rule-reasoning

transformers

mit

accuracy

text-generation

rule-based reasoning

RuleReasoner/RuleReasoner-4B

If you use the model in your research, please cite the original papers as below.

@article{liu2025rulereasoner,
      title={RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling}, 
      author={Yang Liu and Jiaqi Li and Zilong Zheng},
      year={2025},
      eprint={2506.08672},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2506.08672}, 
}

Code: https://github.com/bigai-nlco/RuleReasoner