Qwen2.5-3B-GRPO-math-reasoning/model-00002-of-00002.safetensors

version https://git-lfs.github.com/spec/v1
oid sha256:ecb0e923018cf9dbda64f6bb02221e357bab3909423fe9c733a7d0e13a8dfbc0
size 1214366696
初始化项目，由ModelHub XC社区提供模型 Model: jaygala24/Qwen2.5-3B-GRPO-math-reasoning Source: Original Platform 2026-05-04 16:34:59 +08:00			`version https://git-lfs.github.com/spec/v1`
			`oid sha256:ecb0e923018cf9dbda64f6bb02221e357bab3909423fe9c733a7d0e13a8dfbc0`
			`size 1214366696`