2026-06-10 21:45:27 +08:00
|
|
|
|
# xc_validation_strategy
|
|
|
|
|
|
|
2026-06-12 21:02:56 +08:00
|
|
|
|
批量向 ModelHub XC 平台提交模型验证任务的策略服务,之后保持 HTTP 服务存活供平台探活。
|
2026-06-10 21:45:27 +08:00
|
|
|
|
|
2026-06-12 21:02:56 +08:00
|
|
|
|
## 功能
|
|
|
|
|
|
|
|
|
|
|
|
- 自动登录 ModelHub 获取 Token
|
|
|
|
|
|
- 批量提交模型验证任务(vLLM 框架,Cambricon MLU-370-x8)
|
|
|
|
|
|
- 提交结果写入 `submitted_validation_tasks.txt`
|
|
|
|
|
|
- 暴露 `/health` 和 `/status` 接口满足平台运行时契约
|
|
|
|
|
|
|
|
|
|
|
|
## 项目结构
|
|
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
|
.
|
|
|
|
|
|
├── main.py # 主入口:HTTP 服务 + 提交逻辑
|
|
|
|
|
|
├── Dockerfile # 平台镜像构建配置
|
|
|
|
|
|
├── requirements.txt # Python 依赖
|
|
|
|
|
|
└── submitted_validation_tasks.txt # 运行后自动生成,记录提交结果
|
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
|
|
## 平台契约说明
|
|
|
|
|
|
|
|
|
|
|
|
本项目满足平台对策略镜像的全部必要约束:
|
|
|
|
|
|
|
|
|
|
|
|
- Dockerfile 位于仓库根目录,基于官方轻量基础镜像
|
|
|
|
|
|
- 暴露 8080 端口并实现 `GET /health`
|
|
|
|
|
|
- 通过环境变量 `STRATEGY_ID` 获取策略 ID
|
|
|
|
|
|
- 正确处理 `SIGTERM` 信号,支持优雅停机
|