DAPO_E2H-math-gaussian_0p5_0p5/overrides.yaml at main - DAPO_E2H-math-gaussian_0p5_0p5 - Gitea: Git with a cup of tea

divelab/DAPO_E2H-math-gaussian_0p5_0p5

Files

ModelHub XC 7856869d2f 初始化项目，由ModelHub XC社区提供模型

Model: divelab/DAPO_E2H-math-gaussian_0p5_0p5
Source: Original Platform

2026-04-26 00:29:08 +08:00

9 lines

237 B

YAML

Raw Permalink Blame History

 - mode=train
 - task=math
 - algorithm=grpo
 - algorithm.training.curriculum_schedule=gaussian
 - model=qwen15
 - algorithm.training.max_steps=1600
 - algorithm.training.vllm_mode=colocate
 - algorithm.training.vllm_gpu_memory_utilization=0.25