Go to file

ModelHub XC d13f2dc5be 初始化项目，由ModelHub XC社区提供模型

Model: JunHowie/Qwen3-8B-Instruct
Source: Original Platform

2026-05-19 11:48:07 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

model-00001-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

model-00002-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

model-00003-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

model-00004-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-19 11:48:07 +08:00

README.md

library_name, license, license_link, pipeline_tag, base_model

library_name

license

license_link

pipeline_tag

base_model

transformers

apache-2.0

https://huggingface.co/Qwen/Qwen3-8B/blob/main/LICENSE

text-generation

Qwen/Qwen3-8B

Qwen3-8B-Instruct

NOTE：This model is the Instruct-aligned variant, and it will not generate <think></think> blocks in its outputs. Additionally, there is no need to specify enable_thinking=False anymore.

This model was trained using ms-swift as the post-training framework, with full-parameter SFT on 4 × 80GB GPUs.
The dataset used is the Chinese Distillation Dataset based on Qwen3-235B-2507
available at: https://www.modelscope.cn/datasets/swift/Chinese-Qwen3-235B-2507-Distill-data-110k-SFT

【vLLM Startup Command】

vllm serve JunHowie/Qwen3-8B-Instruct

【Dependencies】

vllm>=0.10.2
transformers>=4.56.1

【Model Download】

from modelscope import snapshot_download
snapshot_download('JunHowie/Qwen3-8B-Instruct', cache_dir="your_local_path")

README.md Unescape Escape

Qwen3-8B-Instruct

【vLLM Startup Command】

【Dependencies】

【Model Download】

README.md