hyunseoki/verl-math-transfer-7bi-to-3bi-fix05-pool7to1

Go to file

ModelHub XC 00eeb6f4d0 初始化项目，由ModelHub XC社区提供模型

Model: hyunseoki/verl-math-transfer-7bi-to-3bi-fix05-pool7to1
Source: Original Platform

2026-06-04 13:01:02 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

model-00001-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

model-00002-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

model-00003-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

model-00004-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-06-04 13:01:02 +08:00

README.md

library_name, pipeline_tag, tags

library_name

pipeline_tag

VERL Math Transfer 7B to 3B fix05 pool7to1

Math transfer experiment trained with verl. This repo groups all exported Hugging Face checkpoints for the 7B-to-3B fix_0_5 pool7to1 configuration.

Layout

main: latest exported checkpoint, currently step-090
step revisions: step-010, step-020, step-030, step-040, step-050, step-060, step-070, step-080, step-090

Usage

from transformers import AutoTokenizer, AutoModelForCausalLM

repo_id = "hyunseoki/verl-math-transfer-7bi-to-3bi-fix05-pool7to1"
tokenizer = AutoTokenizer.from_pretrained(repo_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(repo_id, trust_remote_code=True)

Load a specific checkpoint revision:

from transformers import AutoTokenizer, AutoModelForCausalLM

repo_id = "hyunseoki/verl-math-transfer-7bi-to-3bi-fix05-pool7to1"
revision = "step-090"
tokenizer = AutoTokenizer.from_pretrained(repo_id, revision=revision, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(repo_id, revision=revision, trust_remote_code=True)

Notes

Architecture detected from the exported config: Qwen2ForCausalLM
The original base model Hub ID is not encoded in these local checkpoints, so base_model metadata is not set automatically.
Checkpoints were exported from verl FSDP shards into Hugging Face safetensors format.