ModelHub XC b517852390 初始化项目,由ModelHub XC社区提供模型
Model: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1
Source: Original Platform
2026-06-19 04:04:14 +08:00

frameworks, license, tasks, model-type, domain, language, metrics, tags, tools, base_model, base_model_relation, datasets
frameworks license tasks model-type domain language metrics tags tools base_model base_model_relation datasets
Pytorch
Apache License 2.0
chatbot
qwen
nlp
zh
CIDEr
BLEU
ROUGE
instruction-tuned
lora
4-bit
quantized
聊天
猫娘
llamafactory
Qwen/Qwen3-1.7B-Base
finetune
NaClNeZn/Shizuku-DataSet

Qwen3-1.7B-QLoRA-Shizuku-Instruct

基于 Qwen3-1.7B-Base 的高质量指令微调模型,适用于中文对话与推理任务。

📌 模型介绍

本模型基于 Qwen3-1.7B-Base,使用 QLoRA 方法在 Shizuku-dataset(v1.0) 数据集上进行指令微调SFT专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术,在保持轻量级的同时显著提升任务表现。

🛠 微调配置

  • 基座模型: Qwen3-1.7B-Base
  • 微调方法: QLoRA (LoRA + 4-bit Quantization)
  • 量化方式: BitsAndBytes 4-bit, Double Quantization
  • LoRA 配置:
    • rank: 16
    • alpha: 32
    • dropout: 0.2
    • target modules: q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj
  • 训练方式: SFT监督微调
  • 启用特性:
    • NEFTunenoise_alpha=5
    • Gradient Checkpointing
    • Thinking Modeenable_thinking=True
    • 长上下文支持cutoff_len=4096

📊 训练数据

  • 数据集: Shizuku-dataset(v1.0)
  • 数据量: 最多 100,000 条样本max_samples
  • 验证集比例: 20%
  • 模板: qwen 模板(适配 Qwen 系列)

🏋️ 训练参数

  • 训练轮数: 3.0 epochs
  • 学习率: 2e-4cosine 调度)
  • Batch Size: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
  • 优化器: adamw_8bit
  • 最大长度: 4096
  • 精度: fp16

🚀 使用方式

下载项目

git lfs install
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git

安装环境

uv sync

运行模型

uv run run.py
Description
Model synced from source: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1
Readme 4.4 MiB
Languages
Jinja 70.4%
Python 29.6%