deepseek-prover-v2-cpt-sft-feedback-1e/README.md at 505a950b10bcb7380310dd41d0f6c149ca14c12a

Files

ModelHub XC 505a950b10 初始化项目，由ModelHub XC社区提供模型

Model: formalmathatepfl/deepseek-prover-v2-cpt-sft-feedback-1e
Source: Original Platform

2026-05-30 18:32:16 +08:00

library_name, license, base_model, tags, model-index

library_name

license

base_model

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 1e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
distributed_type: multi-GPU
num_devices: 8
total_train_batch_size: 16
total_eval_batch_size: 16
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.05
num_epochs: 1.0

Training Loss	Epoch	Step	Validation Loss
0.0399	0.0827	1000	0.0343
0.0261	0.1654	2000	0.0284
0.0283	0.2481	3000	0.0264
0.0228	0.3308	4000	0.0250
0.0215	0.4135	5000	0.0242
0.0216	0.4962	6000	0.0235
0.0228	0.5789	7000	0.0229
0.0214	0.6616	8000	0.0225
0.0232	0.7444	9000	0.0221
0.0205	0.8271	10000	0.0219
0.0214	0.9098	11000	0.0218
0.0241	0.9925	12000	0.0217