初始化项目,由ModelHub XC社区提供模型
Model: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1 Source: Original Platform
This commit is contained in:
97
README.md
Normal file
97
README.md
Normal file
@@ -0,0 +1,97 @@
|
||||
---
|
||||
frameworks:
|
||||
- Pytorch
|
||||
license: Apache License 2.0
|
||||
tasks:
|
||||
- chatbot
|
||||
|
||||
model-type:
|
||||
- qwen
|
||||
|
||||
domain:
|
||||
- nlp
|
||||
|
||||
language:
|
||||
- zh
|
||||
|
||||
metrics:
|
||||
- CIDEr
|
||||
- BLEU
|
||||
- ROUGE
|
||||
|
||||
tags:
|
||||
- instruction-tuned
|
||||
- lora
|
||||
- 4-bit
|
||||
- quantized
|
||||
- 聊天
|
||||
- 猫娘
|
||||
|
||||
tools:
|
||||
- llamafactory
|
||||
|
||||
base_model:
|
||||
- Qwen/Qwen3-1.7B-Base
|
||||
base_model_relation: finetune
|
||||
datasets:
|
||||
- NaClNeZn/Shizuku-DataSet
|
||||
---
|
||||
|
||||
# Qwen3-1.7B-QLoRA-Shizuku-Instruct
|
||||
|
||||
> 基于 Qwen3-1.7B-Base 的高质量指令微调模型,适用于中文对话与推理任务。
|
||||
|
||||
## 📌 模型介绍
|
||||
|
||||
本模型基于 **Qwen3-1.7B-Base**,使用 **QLoRA** 方法在 `Shizuku-dataset`(v1.0) 数据集上进行指令微调(SFT),专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术,在保持轻量级的同时显著提升任务表现。
|
||||
|
||||
## 🛠 微调配置
|
||||
|
||||
- **基座模型**: Qwen3-1.7B-Base
|
||||
- **微调方法**: QLoRA (LoRA + 4-bit Quantization)
|
||||
- **量化方式**: BitsAndBytes 4-bit, Double Quantization
|
||||
- **LoRA 配置**:
|
||||
- rank: 16
|
||||
- alpha: 32
|
||||
- dropout: 0.2
|
||||
- target modules: `q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj`
|
||||
- **训练方式**: SFT(监督微调)
|
||||
- **启用特性**:
|
||||
- NEFTune(noise_alpha=5)
|
||||
- Gradient Checkpointing
|
||||
- Thinking Mode(enable_thinking=True)
|
||||
- 长上下文支持(cutoff_len=4096)
|
||||
|
||||
## 📊 训练数据
|
||||
|
||||
- **数据集**: Shizuku-dataset(v1.0)
|
||||
- **数据量**: 最多 100,000 条样本(max_samples)
|
||||
- **验证集比例**: 20%
|
||||
- **模板**: `qwen` 模板(适配 Qwen 系列)
|
||||
|
||||
## 🏋️ 训练参数
|
||||
|
||||
- **训练轮数**: 3.0 epochs
|
||||
- **学习率**: 2e-4(cosine 调度)
|
||||
- **Batch Size**: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
|
||||
- **优化器**: `adamw_8bit`
|
||||
- **最大长度**: 4096
|
||||
- **精度**: fp16
|
||||
|
||||
## 🚀 使用方式
|
||||
|
||||
下载项目
|
||||
```shell
|
||||
git lfs install
|
||||
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git
|
||||
```
|
||||
|
||||
安装环境
|
||||
```shell
|
||||
uv sync
|
||||
```
|
||||
|
||||
运行模型
|
||||
```shell
|
||||
uv run run.py
|
||||
```
|
||||
Reference in New Issue
Block a user