Go to file

ModelHub XC 6dd2c38ae4 初始化项目，由ModelHub XC社区提供模型

Model: lkevinzc/Llama-3.2-3B-NuminaQA
Source: Original Platform

2026-06-16 10:40:17 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

model-00001-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

model-00002-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

model-00003-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 10:40:17 +08:00

README.md

library_name, license, datasets, base_model

library_name

license

datasets

base_model

transformers

apache-2.0

lkevinzc/numia-1.5-qa-concatenated

HuggingFaceTB/FineMath-Llama-3B

Llama-3.2-3B-NuminaQA

Introduction

This model serves as a 3B base in our minimalist R1-Zero recipe.

Training details:

Base model: HuggingFaceTB/FineMath-Llama-3B
Dataset: lkevinzc/numia-1.5-qa-concatenated
Epochs: 2
Learning rate: 1e-5

Citation

@article{liu2025understanding,
  title={Understanding r1-zero-like training: A critical perspective},
  author={Liu, Zichen and Chen, Changyu and Li, Wenjun and Qi, Penghui and Pang, Tianyu and Du, Chao and Lee, Wee Sun and Lin, Min},
  journal={arXiv preprint arXiv:2503.20783},
  year={2025}
}

README.md

Llama-3.2-3B-NuminaQA

Links

Introduction

Citation