Files

97 lines
2.0 KiB
Markdown
Raw Permalink Normal View History

---
frameworks:
- Pytorch
license: Apache License 2.0
tasks:
- chatbot
model-type:
- qwen
domain:
- nlp
language:
- zh
metrics:
- CIDEr
- BLEU
- ROUGE
tags:
- instruction-tuned
- lora
- 4-bit
- quantized
- 聊天
- 猫娘
tools:
- llamafactory
base_model:
- Qwen/Qwen3-1.7B-Base
base_model_relation: finetune
datasets:
- NaClNeZn/Shizuku-DataSet
---
# Qwen3-1.7B-QLoRA-Shizuku-Instruct
> 基于 Qwen3-1.7B-Base 的高质量指令微调模型,适用于中文对话与推理任务。
## 📌 模型介绍
本模型基于 **Qwen3-1.7B-Base**,使用 **QLoRA** 方法在 `Shizuku-dataset`(v1.0) 数据集上进行指令微调SFT专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术,在保持轻量级的同时显著提升任务表现。
## 🛠 微调配置
- **基座模型**: Qwen3-1.7B-Base
- **微调方法**: QLoRA (LoRA + 4-bit Quantization)
- **量化方式**: BitsAndBytes 4-bit, Double Quantization
- **LoRA 配置**:
- rank: 16
- alpha: 32
- dropout: 0.2
- target modules: `q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj`
- **训练方式**: SFT监督微调
- **启用特性**:
- NEFTunenoise_alpha=5
- Gradient Checkpointing
- Thinking Modeenable_thinking=True
- 长上下文支持cutoff_len=4096
## 📊 训练数据
- **数据集**: Shizuku-dataset(v1.0)
- **数据量**: 最多 100,000 条样本max_samples
- **验证集比例**: 20%
- **模板**: `qwen` 模板(适配 Qwen 系列)
## 🏋️ 训练参数
- **训练轮数**: 3.0 epochs
- **学习率**: 2e-4cosine 调度)
- **Batch Size**: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
- **优化器**: `adamw_8bit`
- **最大长度**: 4096
- **精度**: fp16
## 🚀 使用方式
下载项目
```shell
git lfs install
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git
```
安装环境
```shell
uv sync
```
运行模型
```shell
uv run run.py
```