Qwen3-1.7B-QLoRA-Shizuku-v1/README.md

---
frameworks:
- Pytorch
license: Apache License 2.0
tasks:
- chatbot

model-type:
- qwen

domain:
- nlp

language:
  - zh

metrics:
- CIDEr
- BLEU
- ROUGE

tags:
- instruction-tuned
- lora
- 4-bit
- quantized
- 聊天
- 猫娘

tools:
- llamafactory

base_model:
  - Qwen/Qwen3-1.7B-Base
base_model_relation: finetune
datasets:
  - NaClNeZn/Shizuku-DataSet
---

# Qwen3-1.7B-QLoRA-Shizuku-Instruct

> 基于 Qwen3-1.7B-Base 的高质量指令微调模型，适用于中文对话与推理任务。

## 📌 模型介绍

本模型基于 **Qwen3-1.7B-Base**，使用 **QLoRA** 方法在 `Shizuku-dataset`(v1.0) 数据集上进行指令微调（SFT），专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术，在保持轻量级的同时显著提升任务表现。

## 🛠 微调配置

- **基座模型**: Qwen3-1.7B-Base
- **微调方法**: QLoRA (LoRA + 4-bit Quantization)
- **量化方式**: BitsAndBytes 4-bit, Double Quantization
- **LoRA 配置**:
    - rank: 16
    - alpha: 32
    - dropout: 0.2
    - target modules: `q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj`
- **训练方式**: SFT（监督微调）
- **启用特性**:
    - NEFTune（noise_alpha=5）
    - Gradient Checkpointing
    - Thinking Mode（enable_thinking=True）
    - 长上下文支持（cutoff_len=4096）

## 📊 训练数据

- **数据集**: Shizuku-dataset(v1.0)
- **数据量**: 最多 100,000 条样本（max_samples）
- **验证集比例**: 20%
- **模板**: `qwen` 模板（适配 Qwen 系列）

## 🏋️ 训练参数

- **训练轮数**: 3.0 epochs
- **学习率**: 2e-4（cosine 调度）
- **Batch Size**: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
- **优化器**: `adamw_8bit`
- **最大长度**: 4096
- **精度**: fp16

## 🚀 使用方式

下载项目
```shell
git lfs install
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git
```

安装环境
```shell
uv sync
```

运行模型
```shell
uv run run.py
```
-												初始化项目，由ModelHub XC社区提供模型

Model: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1
Source: Original Platform

											
										
										
											2026-06-19 04:04:14 +08:00
+								---
 								frameworks:
 								- Pytorch
 								license: Apache License 2.0
 								tasks:
 								- chatbot
 								model-type:
 								- qwen
 								domain:
 								- nlp
 								language:
 								  - zh
 								metrics:
 								- CIDEr
 								- BLEU
 								- ROUGE
 								tags:
 								- instruction-tuned
 								- lora
 								- 4-bit
 								- quantized
 								- 聊天
 								- 猫娘
 								tools:
 								- llamafactory
 								base_model:
 								  - Qwen/Qwen3-1.7B-Base
 								base_model_relation: finetune
 								datasets:
 								  - NaClNeZn/Shizuku-DataSet
 								---
 								# Qwen3-1.7B-QLoRA-Shizuku-Instruct
 								> 基于 Qwen3-1.7B-Base 的高质量指令微调模型，适用于中文对话与推理任务。
 								## 📌 模型介绍
 								本模型基于 **Qwen3-1.7B-Base**，使用 **QLoRA** 方法在 `Shizuku-dataset`(v1.0) 数据集上进行指令微调（SFT），专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术，在保持轻量级的同时显著提升任务表现。
 								## 🛠 微调配置
 								- **基座模型**: Qwen3-1.7B-Base
 								- **微调方法**: QLoRA (LoRA + 4-bit Quantization)
 								- **量化方式**: BitsAndBytes 4-bit, Double Quantization
 								- **LoRA 配置**:
 								    - rank: 16
 								    - alpha: 32
 								    - dropout: 0.2
 								    - target modules: `q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj`
 								- **训练方式**: SFT（监督微调）
 								- **启用特性**:
 								    - NEFTune（noise_alpha=5）
 								    - Gradient Checkpointing
 								    - Thinking Mode（enable_thinking=True）
 								    - 长上下文支持（cutoff_len=4096）
 								## 📊 训练数据
 								- **数据集**: Shizuku-dataset(v1.0)
 								- **数据量**: 最多 100,000 条样本（max_samples）
 								- **验证集比例**: 20%
 								- **模板**: `qwen` 模板（适配 Qwen 系列）
 								## 🏋️ 训练参数
 								- **训练轮数**: 3.0 epochs
 								- **学习率**: 2e-4（cosine 调度）
 								- **Batch Size**: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
 								- **优化器**: `adamw_8bit`
 								- **最大长度**: 4096
 								- **精度**: fp16
 								## 🚀 使用方式
 								下载项目
 								```shell
 								git lfs install
 								git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git
 								```
 								安装环境
 								```shell
 								uv sync
 								```
 								运行模型
 								```shell
 								uv run run.py
 								```