ertghiu256/deepseek-r1-0528-distilled-qwen3-gguf

Go to file

ModelHub XC e4123379b5 初始化项目，由ModelHub XC社区提供模型

Model: ertghiu256/deepseek-r1-0528-distilled-qwen3-gguf
Source: Original Platform

2026-06-20 08:15:17 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

converted-model-Q4_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

converted-model-Q8_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-06-20 08:15:17 +08:00

README.md

base_model, tags, license, language, datasets

base_model

Uploaded finetuned model

Developed by: ertghiu256
License: apache-2.0
Finetuned from model : unsloth/qwen3-4b-unsloth-bnb-4bit

This qwen3 model was trained 2x faster with Unsloth and Huggingface's TRL library.

Model information

This is Qwen 3 4b parameters finetuned on 18k samples from sequelbox/Celestia3-DeepSeek-R1-0528 dataset that is distilled from Deepseek R1 0528.

Model purposes

General reasoning
Code (note: this model is not trained on html code, so the html code generated might look horible)
Solving problems

README.md

Uploaded finetuned model

Model information

Model purposes

Note: This model development is not from the deepseek team.