Files
ModelHub XC 14cffe6a58 初始化项目,由ModelHub XC社区提供模型
Model: phpcool/DeepSeek-R1-Distill-SRE-Qwen-7B
Source: Original Platform
2026-05-21 02:18:12 +08:00

137 lines
6.3 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# DeepSeek-R1-Distill-SRE-Qwen-7B
## 模型简介
基于 DeepSeek 架构的 7B 参数量模型,经过 LoRA 微调专为运维领域Site Reliability Engineering, SRE任务设计。它能够提供高可用性、稳定性相关的技术建议并生成逐步分析过程适用于服务器管理、集群优化和故障排查等场景强化了以下三块能力
- 自动化脚本生成
- 系统监控分析
- 故障排查与根因定位
## 模型概述
- **基础模型**: `deepseek-ai/DeepSeek-R1-Distill-Qwen-7B`
- **参数量**: 7B
- **微调方法**: LoRA (Low-Rank Adaptation)
- **训练数据**: SRE 领域数据集(约 18,236 条记录),数据集地址https://github.com/HC-Guo/OWL/tree/main/OWL-Instruct/data
- **精度**: BF16 (Brain Floating Point 16)
- **最大上下文长度**: 2048 tokens
- **语言**: 中文(主要),支持部分英文输入
- **发布日期**: 2025-03-02
- **训练loss趋势变化**
![training_loss](training_loss.png)
## 评测结果
下表对比了基模deepseek-ai/DeepSeek-R1-Distill-Qwen-7B和微调后模型在运维领域任务上的性能表现。微调使用 LoRA 方法,基于 SRE 领域数据集(约 18,236 条记录)进行优化。
| **指标** | **基模结果** | **微调后结果** | **提升项说明** |
|---------------------------|--------------|----------------|--------------------------------------------------------------------------------|
| **predict_bleu-4** | 4.52 | 13.54 | BLEU-4 衡量生成文本与参考答案的 4-gram 精确匹配度。提升约 199%,表明微调后模型生成的回答与参考答案在短语级别更加一致,准确性显著提高。 |
| **predict_rouge-1** | 23.60 | 39.40 | ROUGE-1 衡量单字重叠率。提升约 67%,表明词汇级别的匹配度大幅改善,模型生成内容更贴近参考答案的用词。 |
| **predict_rouge-2** | 5.84 | 22.07 | ROUGE-2 衡量双字重叠率。提升约 278%,表明短语和句子结构的相似性显著增强,生成文本更具连贯性。 |
| **predict_rouge-l** | 9.91 | 23.63 | ROUGE-L 衡量最长公共子序列,反映句子结构相似性。提升约 138%,表明微调后模型在整体回答结构上更接近参考答案。 |
| **predict_model_preparation_time** | 0.0033 | 0.0032 | 模型准备时间(秒),微调后略减 0.0001 秒,变化微小,表明模型加载效率基本不变。 |
| **predict_runtime** | 1325.61 | 878.39 | 推理总耗时(秒)。减少约 34%447.22 秒),表明微调后推理速度加快,可能是优化了生成效率或减少了冗余计算。 |
| **predict_samples_per_second** | 0.377 | 0.57 | 每秒处理样本数。提升约 51%,反映推理吞吐量提高,模型处理效率显著增强。 |
| **predict_steps_per_second** | 0.094 | 0.096 | 每秒推理步数。提升约 2%,变化较小,可能是推理步长未显著优化,但整体效率仍受益于 runtime 改进。 |
### 指标说明
- **BLEU-4**:计算生成文本与参考文本的 4-gram 精确匹配度,分数范围 0-100值越高表示短语级匹配越好。
- **ROUGE-1**衡量单字unigram重叠率分数范围 0-100反映词汇级相似性。
- **ROUGE-2**衡量双字bigram重叠率分数范围 0-100反映短语级相似性。
- **ROUGE-L**衡量最长公共子序列LCS分数范围 0-100反映句子结构相似性。
- **predict_model_preparation_time**:模型加载和准备的耗时(秒),值越低表示启动越快。
- **predict_runtime**:推理总耗时(秒),值越低表示生成速度越快。
- **predict_samples_per_second**:每秒处理的样本数,值越高表示吞吐量越高。
- **predict_steps_per_second**:每秒推理步数,值越高表示单步效率越高。
### 结论
微调后的 `DeepSeek-R1-Distill-SRE-Qwen-7B` 在生成质量和推理效率上均有显著提升,尤其在运维领域的结构化回答能力上表现优异。推荐用于高可用性集群设计、服务器优化等场景。
- **下载方式**:
### SDK下载
```bash
#安装ModelScope
pip install modelscope
#SDK模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('phpcool/DeepSeek-R1-Distill-SRE-Qwen-7B')
```
### Git下载
```bash
#Git模型下载
git clone https://www.modelscope.cn/phpcool/DeepSeek-R1-Distill-SRE-Qwen-7B.git
```
---
## 如何使用模型进行推理
本模型支持高效推理,已验证兼容 `vLLM` 和 `SGLang` 框架以下提供vLLM使用示例(推荐)。
### 1. 使用 SGLang 进行推理
`SGLang` 是一个高性能服务框架,适合复杂运维任务的快速推理。
#### 环境准备
```bash
pip install sglang
```
#### 启动 SGLang 服务
```bash
vllm serve /root/autodl-tmp/model/outputs/deepseek-ai/DeepSeek-R1-Distill-SRE-Qwen-7B --tensor-parallel-size 1 --max-model-len 2048 --enforce-eager
```
#### Python 推理示例
```python
from openai import OpenAI
client = OpenAI(api_key="EMPTY", base_url="http://localhost:8000/v1")
response = client.chat.completions.create(
model="/path/to/DeepSeek-R1-Distill-SRE-Qwen-7B",
messages=[
{"role": "system", "content": "你是一位智能运维助手"},
{"role": "user", "content": "如何优化服务器的存储性能以提高数据读写速度?"}
],
max_tokens=1500,
temperature=0.7,
stop=["<|end>"]
)
print(response.choices[0].message.content.strip())
```
---
## 使用场景
- **自动化运维**: 生成脚本、配置管理。
- **系统监控**: 分析指标、生成告警规则。
- **故障排查**: 日志解析、根因分析。
该模型在 SRE 和 DevOps 场景中表现出色,尤其适合需要快速响应和资源优化的企业级应用。
---
## 社区贡献
由于当前文档信息有限,我们鼓励社区参与:
- 在 modelscope.cn 中的【交流反馈】提出问题、使用案例或改进建议。
- 提交 Pull Request 以补充模型细节、优化推理代码或分享运维相关的 Prompt 示例。
感谢你的使用与支持如果有任何问题请随时联系微信yorkoliu 邮件liutiansi@gmail.com。
---