kmno4zx/Qwen2.5-3B-Instruction-IQEQ-Distill

Go to file

ModelHub XC 069169a9ed 初始化项目，由ModelHub XC社区提供模型

Model: kmno4zx/Qwen2.5-3B-Instruction-IQEQ-Distill
Source: Original Platform

2026-05-06 12:22:47 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

configuration.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-06 12:22:47 +08:00

README.md

frameworks, license, tasks

frameworks

license

tasks

Pytorch

MIT License

text-generation

IQ-EQ Qwen2.5-3B-Distill 技术报告

团队名称：不要葱姜蒜

1. 摘要

本次比赛我们选择了推理领域/IQ-EQ任务作为微调的目标领域。微调后的模型具备基本的推理能力，且可以对智商/情商问题进行回答，可以应用于智商/情商测试、教育辅助等场景。我们采用了 Qwen2.5-3B 模型作为基础模型，通过微调和蒸馏技术，成功提升了模型的效率和性能。

2. 方法

2.1 数据集选择

我们使用了以下开源数据集或 AI 合成数据：

Chinese-DeepSeek-R1-Distill-data-110k：中文基于满血DeepSeek-R1蒸馏数据集，我们对数据进行了清洗和格式转换，并在110k数据中挑选了有关长思维链推理的 800 条数据作为我们的一部分微调数据。
AI-ModelScope/IQuiz：智商测试：收集自网络公开的面试题、脑筋急转弯、弱智吧、模型陷阱题等，目前一共40道题目，分成了level 1，2，3（level 1 是基础题，level 2 是中等难度，level 3 是高难度），分别有13，13，14道题目。使用该数据集通过DeepSeek-R1蒸馏生成了 118 条数据作为我们的一部分微调数据。
数据预处理：我们对数据进行了数据清洗、格式转换等等。

2.2 模型选择及微调策略

我们采用了以下微调策略：

模型架构：基于 Qwen 模型的 Qwen2.5-3B-Instruction 模型作为基础模型。
微调技术：使用了 PEFT 中的 Lora 策略进行微调。
训练设置：训练超参数设置如下：
- 学习率：1e-4- 批量大小：4- 训练轮数：3

3. 蒸馏方法

为了进一步提升模型的效率和性能，我们采用了以下蒸馏技术：

蒸馏目标：将 DeepSeek-R1-671B 模型的推理能力迁移到 Qwen2.5-3B-Instruction 模型当中，例如更小的模型或特定任务模型。
蒸馏方法：使用了任务蒸馏、特征蒸馏的方法。
蒸馏效果：蒸馏后的模型在 EQ Score 上提升了 22.5%，同时模型学会了推理能力。

3. 实验结果

3.1 评估指标

我们使用 Evalscope 对模型进行评估，主要评估指标如下：

任务：IQ-EQ 任务。
准确性：模型回答的正确率。
EQ Score：模型在 EQ 任务上的得分。
IQ Score：模型在 IQ 任务上的得分。

3.2 实验结果

Model	IQ	EQ	Score
Qwen2.5-3B-Instruct	0.45	0.3625	0.3917
Qwen2.5-7B-Instruct	0.50	0.6125	0.575
Qwen2.5-14B-Instruct	0.525	0.750	0.6750
Qwen2.5-32B-Instruct	0.650	0.7875	0.7417
Qwen2.5-72B-Instruct	0.775	0.825	0.8083
DeepSeek-R1-Distill-Qwen-7B	0.675	0.30	0.425
DeepSeek-R1-Distill-Qwen-14B	0.625	0.725	0.6917
DeepSeek-R1-671B	0.90	0.947	0.915
Qwen2.5-3B-Distill (ours)	0.275	0.5875	0.4313

Model	IQ	EQ	Score
Qwen2.5-3B-Instruct	0.45	0.3625	0.3917
Qwen2.5-3B-Distill (ours)	0.275	0.5875	0.4313

4. 总结

本次比赛中，我们通过对 Qwen2.5-3B-Instruction 模型的微调和蒸馏，成功实现让小模型具备推理的能力。我们的方法在技术实现难度、模型表现效果、实际使用价值等方面展现了独特的优势。未来，我们将继续优化模型，探索更多应用场景。

5. 参考链接

代码仓库：[魔搭社区代码链接]
SwanLab日志：[SwanLab 日志链接]
开源模型权重：[魔搭社区模型权重链接]
Demo体验：[魔搭社区 Demo 链接]

README.md Unescape Escape

IQ-EQ Qwen2.5-3B-Distill 技术报告

1. 摘要

2. 方法

2.1 数据集选择

2.2 模型选择及微调策略

3. 蒸馏方法

3. 实验结果

3.1 评估指标

3.2 实验结果

4. 总结

5. 参考链接

README.md