EngineX-Iluvatar/enginex-mr_series-asr

Fork 0

Go to file

sunjichen 4aebd0a465 Fix underscore in conformer models

2026-02-10 10:39:29 +08:00

replaced_files

Add fastapi service

2026-02-04 17:34:39 +08:00

test_scripts

Add fastapi service

2026-02-04 17:34:39 +08:00

utils

initial commit

2025-08-20 14:29:42 +08:00

.gitignore

Add fastapi service

2026-02-04 17:34:39 +08:00

Dockerfile.funasr-a100

Fix typo

2026-02-09 14:12:59 +08:00

Dockerfile.funasr-mr100

Fix dependencies

2026-02-05 10:51:40 +08:00

fastapi_funasr.py

Fix underscore in conformer models

2026-02-10 10:39:29 +08:00

main.py

Add fastapi service

2026-02-04 17:34:39 +08:00

nltk_data.tar.gz

Add fastapi service

2026-02-04 17:34:39 +08:00

README.md

Fix paraformer Englishword split

2026-02-09 13:48:45 +08:00

requirements.txt

Bump nltk version

2026-02-05 15:47:56 +08:00

README.md

天数智芯智铠100 FunASR

镜像构造

docker build -f ./Dockerfile.funasr-mr100 -t <your_image> .

其中，基础镜像 corex:4.3.0 通过联系天数智芯智铠100厂商技术支持可获取

使用说明

使用 FastAPI 测试ASR服务：

例如：

docker run -it --rm --name iluvatar_test_asr -p 23333:1111 \
    --privileged \
    -v /lib/modules:/lib/modules \
    -v /dev:/dev \
    -v /usr/src:/usr/src \
    -v /mnt/gpfs/leaderboard/modelHubXC/iic/SenseVoiceSmall:/model \
    -e CUDA_VISIBLE_DEVICES=0 \
    --entrypoint python3 <IMAGE_NAME> main.py \
    --port 1111 --model_dir /model --model_type sensevoice

快速镜像测试

对funasr的测试需要在以上构造好的镜像容器内测试，测试步骤

本项目中附带上了示例测试数据，音频文件为lei-jun-test.wav，音频的识别准确内容文件为lei-jun.txt，用户需要准备好相应的ASR模型路径，本例中假设我们已经下载好了SenseVoiceSmall模型存放于/model/SenseVoiceSmall
在本项目路径下执行以下快速测试命令

docker run -it \
    -v /usr/src:/usr/src \
    -v /lib/modules:/lib/modules --device=/dev/iluvatar0:/dev/iluvatar0 \
    -v $PWD:/tmp/workspace \
    -v /model:/model \
    -e MODEL_DIR=/model/SenseVoiceSmall \
    -e TEST_FILE=lei-jun-test.wav \
    -e ANSWER_FILE=lei-jun.txt \
    -e RESULT_FILE=result.json \
    --cpus=4 --memory=16g \
    <your_image>

上述测试指令成功运行将会在terminal中看到对测试音频的识别结果，运行时间以及1-cer效果指标，并且当前文件下会生成一个result.json文件记录刚才的测试结果

定制化手动运行

用户可使用类似上述的docker run指令以交互形式进入镜像中，主要的测试代码为test_funasr.py,用户可自行修改代码中需要测试的模型路径、测试文件路径以及调用funASR逻辑

智铠100模型适配情况

我们在智铠100上针对funASR部分进行了所有大类的适配，测试方式为在Nvidia A100环境下和智铠100加速卡上对同一段长音频进行语音识别任务，获取运行时间，1-cer指标。运行时都只使用一张显卡

模型大类	模型地址	A100运行时间(秒)	智铠100运行时间(秒)	A100 1-cer	智铠100 1-cer	备注
sense_voice	https://www.modelscope.cn/models/iic/SenseVoiceSmall	1.8327	1.2579	0.980033	0.980033
whisper	https://www.modelscope.cn/models/iic/Whisper-large-v3	23.8337	22.9085	0.910150	0.910150
paraformer	https://modelscope.cn/models/iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch	4.7246	4.7719	0.955075	0.955075
conformer	https://www.modelscope.cn/models/iic/speech_conformer_asr_nat-zh-cn-16k-aishell2-vocab5212-pytorch	95.9631	125.8649	0.349418	0.346090
uni_asr	https://www.modelscope.cn/models/iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline	70.5289	88.9481	0.717138	0.717138	该部分的适配修改了一些funASR源码

README.md Unescape Escape

天数智芯 智铠100 FunASR

镜像构造

使用说明

使用 FastAPI 测试ASR服务：

快速镜像测试

定制化手动运行

智铠100模型适配情况

README.md

天数智芯智铠100 FunASR