--- license: apache-2.0 datasets: - openai/gsm8k language: - zh - en base_model: Qwen/Qwen2.5-3B-Instruct pipeline_tag: text-generation library_name: transformers tags: - gsm8k - sft - verl --- # Qwen2.5-3B-GSM8K-SFT 这是一个基于 Qwen2.5-3B-Instruct 构建的数学微调模型,使用了 verl 框架在 GSM8K 数据集上进行了 LoRA SFT。