Go to file

ModelHub XC b517852390 初始化项目，由ModelHub XC社区提供模型

Model: NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1
Source: Original Platform

2026-06-19 04:04:14 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

.gitignore

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

.python-version

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

1.py

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

configuration.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

Modelfile

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

pyproject.toml

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

run.py

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

uv.lock

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-06-19 04:04:14 +08:00

README.md

frameworks, license, tasks, model-type, domain, language, metrics, tags, tools, base_model, base_model_relation, datasets

frameworks

license

tasks

model-type

domain

language

metrics

Qwen3-1.7B-QLoRA-Shizuku-Instruct

基于 Qwen3-1.7B-Base 的高质量指令微调模型，适用于中文对话与推理任务。

📌 模型介绍

本模型基于 Qwen3-1.7B-Base，使用 QLoRA 方法在 Shizuku-dataset(v1.0) 数据集上进行指令微调（SFT），专注于提升模型在中文对话、逻辑推理和指令遵循方面的能力。通过 4-bit 量化与 LoRA 低秩适配技术，在保持轻量级的同时显著提升任务表现。

🛠 微调配置

基座模型: Qwen3-1.7B-Base
微调方法: QLoRA (LoRA + 4-bit Quantization)
量化方式: BitsAndBytes 4-bit, Double Quantization
LoRA 配置:
- rank: 16
- alpha: 32
- dropout: 0.2
- target modules: q_proj, k_proj, v_proj, o_proj, up_proj, down_proj, gate_proj
训练方式: SFT（监督微调）
启用特性:
- NEFTune（noise_alpha=5）
- Gradient Checkpointing
- Thinking Mode（enable_thinking=True）
- 长上下文支持（cutoff_len=4096）

📊 训练数据

数据集: Shizuku-dataset(v1.0)
数据量: 最多 100,000 条样本（max_samples）
验证集比例: 20%
模板: qwen 模板（适配 Qwen 系列）

🏋️ 训练参数

训练轮数: 3.0 epochs
学习率: 2e-4（cosine 调度）
Batch Size: per_device_train_batch_size=2, gradient_accumulation_steps=8 → 实际 batch size = 16
优化器: adamw_8bit
最大长度: 4096
精度: fp16

🚀 使用方式

下载项目

git lfs install
git clone https://www.modelscope.cn/NaClNeZn/Qwen3-1.7B-QLoRA-Shizuku-v1.git

安装环境

uv sync

运行模型

uv run run.py

README.md Unescape Escape

Qwen3-1.7B-QLoRA-Shizuku-Instruct

📌 模型介绍

🛠 微调配置

📊 训练数据

🏋️ 训练参数

🚀 使用方式

README.md