初始化项目，由ModelHub XC社区提供模型

Model: openbmb/BitCPM-CANN-3B-unquantized Source: Original Platform
2026-06-04 14:45:07 +08:00
commit aeb0f4e247
28 changed files with 181546 additions and 0 deletions
--- a/example/run.sh
+++ b/example/run.sh
@@ -0,0 +1,38 @@
+#!/bin/bash
+
+MODEL_PATH="/model/BitCPM-CANN-1B-unquantized"
+DATA_PATH="/dataset/c4-pro/data/000_1_7.parquet"
+OUTPUT_DIR="./output"
+DS_CONFIG="./ds_config_z2.json"
+
+NUM_GPUS=8
+BATCH_SIZE_PER_GPU=8
+GRAD_ACCUM_STEPS=8
+MAX_SEQ_LENGTH=1024
+
+export ASCEND_RT_VISIBLE_DEVICES=8,9,10,11,12,13,14,15
+export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
+export DS_SKIP_CUDA_CHECK=1
+torchrun --nproc_per_node=$NUM_GPUS train.py \
+    --model_name_or_path $MODEL_PATH \
+    --data_path $DATA_PATH \
+    --max_seq_length $MAX_SEQ_LENGTH \
+    --output_dir $OUTPUT_DIR \
+    --per_device_train_batch_size $BATCH_SIZE_PER_GPU \
+    --gradient_accumulation_steps $GRAD_ACCUM_STEPS \
+    --max_steps 100 \
+    --learning_rate 4e-5 \
+    --lr_scheduler_type cosine \
+    --warmup_ratio 0.1 \
+    --weight_decay 1e-2 \
+    --logging_steps 2 \
+    --save_steps 500 \
+    --save_total_limit 3 \
+    --bf16 \
+    --deepspeed $DS_CONFIG \
+    --gradient_checkpointing \
+    --seed 42 \
+    --dataloader_num_workers 4 \
+    --report_to tensorboard \
+    --logging_dir /data/tensorboard/pretrain \
+    --gradient_checkpointing_kwargs '{"use_reentrant": false}'