20 lines
353 B
Markdown
20 lines
353 B
Markdown
---
|
|
license: apache-2.0
|
|
datasets:
|
|
- openai/gsm8k
|
|
language:
|
|
- zh
|
|
- en
|
|
base_model: Qwen/Qwen2.5-3B-Instruct
|
|
pipeline_tag: text-generation
|
|
library_name: transformers
|
|
tags:
|
|
- gsm8k
|
|
- sft
|
|
- verl
|
|
---
|
|
|
|
# Qwen2.5-3B-GSM8K-SFT
|
|
|
|
这是一个基于 Qwen2.5-3B-Instruct 构建的数学微调模型,使用了 verl 框架在 GSM8K 数据集上进行了 LoRA SFT。
|