Go to file

Docker Build and Push / docker (push) Successful in 1m14s

Details

Add fix_tokenizer.py, vllm_wrapper.sh, Dockerfile, and README for
automatic tokenizer_config.json repair on Iluvatar BI-100 vLLM images.

2026-07-01 17:59:17 +08:00

.gitea/workflows

Initial commit: bi100 tokenizer patch

2026-07-01 17:59:17 +08:00

Dockerfile

Initial commit: bi100 tokenizer patch

2026-07-01 17:59:17 +08:00

fix_tokenizer.py

Initial commit: bi100 tokenizer patch

2026-07-01 17:59:17 +08:00

README.md

Initial commit: bi100 tokenizer patch

2026-07-01 17:59:17 +08:00

vllm_wrapper.sh

Initial commit: bi100 tokenizer patch

2026-07-01 17:59:17 +08:00

README.md

bi100-tokenizer-patch

基于 harbor-contest.4pd.io/luopingyi/bi100/vllm:0.6.3 的 tokenizer 自动修复镜像。

问题背景

部分模型的 tokenizer_config.json 存在以下问题，导致 vLLM 服务启动失败：

错误	原因
`ValueError: Tokenizer class TokenizersBackend does not exist`	`tokenizer_class` 不是 transformers 合法类名
`AttributeError: 'list' object has no attribute 'keys'`	`extra_special_tokens` 为 list 格式，transformers 要求 dict

修复方式

构建时将镜像内的 vllm 二进制替换为同名 wrapper 脚本，原二进制重命名为 vllm_real。

容器启动时 wrapper 自动检测 tokenizer_config.json：

存在问题 → 将 tokenizer 文件复制到 /tmp/fixed_tokenizer/ 并修复，追加 --tokenizer /tmp/fixed_tokenizer 参数后调用 vllm_real
无问题 → 直接调用 vllm_real，行为与原镜像完全一致

原始模型目录不做任何修改。

使用方式

原始 docker run 命令只需替换镜像名，其他参数不变：

# 原镜像
harbor-contest.4pd.io/luopingyi/bi100/vllm:0.6.3

# 替换为
<this-image>

示例：

docker run -dit --name <container_name> \
  -p <port>:8000 \
  -v /lib/modules:/lib/modules -v /dev:/dev \
  --device=/dev/iluvatar0:/dev/iluvatar0 \
  -v /path/to/model:/model \
  --entrypoint vllm <this-image> \
  serve /model --port 8000 --served-model-name llm \
  --max-model-len 2048 --gpu-memory-utilization 0.9 \
  --enforce-eager --trust-remote-code -tp 1

构建

docker build -t bi100-tokenizer-patch:latest .

CI 通过推送 v* tag 自动触发构建并推送镜像。

README.md Unescape Escape

bi100-tokenizer-patch

问题背景

修复方式

使用方式

构建

README.md