Files
ModelHub XC b517852390 初始化项目,由ModelHub XC社区提供模型
Model: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1
Source: Original Platform
2026-06-19 04:04:14 +08:00

97 lines
2.0 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
frameworks:
- Pytorch
license: Apache License 2.0
tasks:
- chatbot
model-type:
- qwen
domain:
- nlp
language:
- zh
metrics:
- CIDEr
- BLEU
- ROUGE
tags:
- instruction-tuned
- lora
- 4-bit
- quantized
- 聊天
- 猫娘
tools:
- llamafactory
base_model:
- Qwen/Qwen3-1.7B-Base
base_model_relation: finetune
datasets:
- NaClNeZn/Shizuku-DataSet
---
# Qwen3-1.7B-QLoRA-Shizuku-Instruct
> 基于 Qwen3-1.7B-Base 的高质量指令微调模型,适用于中文对话与推理任务。
## 📌 模型介绍
本模型基于 **Qwen3-1.7B-Base**,使用 **QLoRA** 方法在 `Shizuku-dataset`(v1.0) 数据集上进行指令微调SFT专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术,在保持轻量级的同时显著提升任务表现。
## 🛠 微调配置
- **基座模型**: Qwen3-1.7B-Base
- **微调方法**: QLoRA (LoRA + 4-bit Quantization)
- **量化方式**: BitsAndBytes 4-bit, Double Quantization
- **LoRA 配置**:
- rank: 16
- alpha: 32
- dropout: 0.2
- target modules: `q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj`
- **训练方式**: SFT监督微调
- **启用特性**:
- NEFTunenoise_alpha=5
- Gradient Checkpointing
- Thinking Modeenable_thinking=True
- 长上下文支持cutoff_len=4096
## 📊 训练数据
- **数据集**: Shizuku-dataset(v1.0)
- **数据量**: 最多 100,000 条样本max_samples
- **验证集比例**: 20%
- **模板**: `qwen` 模板(适配 Qwen 系列)
## 🏋️ 训练参数
- **训练轮数**: 3.0 epochs
- **学习率**: 2e-4cosine 调度)
- **Batch Size**: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
- **优化器**: `adamw_8bit`
- **最大长度**: 4096
- **精度**: fp16
## 🚀 使用方式
下载项目
```shell
git lfs install
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git
```
安装环境
```shell
uv sync
```
运行模型
```shell
uv run run.py
```