DAPO_E2H-gsm8k-gaussian_0p2…/.hydra/overrides.yaml

- mode=train
- task=gsm8k
- algorithm=grpo
- algorithm.training.curriculum_schedule=gaussian
- model=qwen15
- algorithm.training.max_steps=1600
- algorithm.training.vllm_mode=colocate
- algorithm.training.scheduler_params.mu_exp=0.25
- algorithm.training.scheduler_params.sigma=0.75
- algorithm.training.scheduler_params.max_dapo_iter=4
初始化项目，由ModelHub XC社区提供模型 Model: divelab/DAPO_E2H-gsm8k-gaussian_0p25_0p75 Source: Original Platform 2026-04-29 01:01:06 +08:00			`- mode=train`
			`- task=gsm8k`
			`- algorithm=grpo`
			`- algorithm.training.curriculum_schedule=gaussian`
			`- model=qwen15`
			`- algorithm.training.max_steps=1600`
			`- algorithm.training.vllm_mode=colocate`
			`- algorithm.training.scheduler_params.mu_exp=0.25`
			`- algorithm.training.scheduler_params.sigma=0.75`
			`- algorithm.training.scheduler_params.max_dapo_iter=4`