Qwen3-4B-GRPO-math-reasoning/model-00001-of-00002.safetensors

version https://git-lfs.github.com/spec/v1
oid sha256:572de89fbcdd2eeabd9df5bb2d00e2124656a771b8af1ede03ff300dad2bc4e9
size 4967215360
初始化项目，由ModelHub XC社区提供模型 Model: jaygala24/Qwen3-4B-GRPO-math-reasoning Source: Original Platform 2026-04-25 05:10:00 +08:00			`version https://git-lfs.github.com/spec/v1`
			`oid sha256:572de89fbcdd2eeabd9df5bb2d00e2124656a771b8af1ede03ff300dad2bc4e9`
			`size 4967215360`