2025-09-19 14:41:14 +08:00
2025-08-19 16:23:51 +08:00
2025-08-19 16:23:51 +08:00
2025-08-19 16:23:51 +08:00
2025-08-26 15:25:56 +08:00
2025-08-19 16:23:51 +08:00
2025-09-19 14:41:14 +08:00
2025-08-19 16:23:51 +08:00
2025-08-19 16:23:51 +08:00
2025-08-19 16:23:51 +08:00

昆仑芯R200-8F FunASR

镜像构造

docker build -f ./Dockerfile.funasr-kunlun-r200-8f -t <your_image> .

其中基础镜像 r200-8f_xmlir-ubuntu_2004_x86_64:v0.27 通过联系昆仑芯厂商技术支持可获取

使用说明

快速镜像测试

对funasr的测试需要在以上构造好的镜像容器内测试测试步骤

  1. 本项目中附带上了示例测试数据,音频文件为lei-jun-test.wav,音频的识别准确内容文件为lei-jun.txt用户需要准备好相应的ASR模型路径本例中假设我们已经下载好了SenseVoiceSmall模型存放于/model/SenseVoiceSmall
  2. 在本项目路径下执行以下快速测试命令
docker run -it \
    --security-opt=seccomp=unconfined --cap-add=SYS_PTRACE --cap-add=SYS_ADMIN --device /dev/fuse \
    --shm-size=32g --ulimit=memlock=-1 --ulimit=nofile=120000 --ulimit=stack=67108864 \
    --device=/dev/xpu0:/dev/xpu0 --device=/dev/xpuctrl:/dev/xpuctrl \
    -v $PWD:/tmp/workspace \
    -v /model:/model \
    -e MODEL_DIR=/model/SenseVoiceSmall \
    -e TEST_FILE=lei-jun-test.wav \
    -e ANSWER_FILE=lei-jun.txt \
    -e RESULT_FILE=result.json \
    --cpus=4 --memory=16g \
    <your_image>

上述测试指令成功运行将会在terminal中看到对测试音频的识别结果运行时间以及1-cer效果指标并且当前文件下会生成一个result.json文件记录刚才的测试结果

定制化手动运行

用户可使用类似上述的docker run指令以交互形式进入镜像中主要的测试代码为test_funasr.py,用户可自行修改代码中需要测试的模型路径、测试文件路径以及调用funASR逻辑

昆仑芯R200-8F模型适配情况

我们在昆仑芯R200-8F上针对funASR部分进行了所有大类的适配测试方式为在Nvidia A100环境下和昆仑芯R200-8F加速卡上对同一段长音频进行语音识别任务获取运行时间1-cer指标。运行时都只使用一张显卡

模型大类 模型地址 A100运行时间(秒) 昆仑芯R200-8F运行时间(秒) A100 1-cer 昆仑芯R200-8F 1-cer 备注
sense_voice https://www.modelscope.cn/models/iic/SenseVoiceSmall 1.3792 2.2876 0.980033 0.980033
whisper https://www.modelscope.cn/models/iic/Whisper-large-v3 23.7654 62.3298 0.910150 0.910150
paraformer https://modelscope.cn/models/iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch 4.1229 7.7168 0.955075 0.955075 该部分的适配修改了一些funASR源码
conformer https://www.modelscope.cn/models/iic/speech_conformer_asr_nat-zh-cn-16k-aishell2-vocab5212-pytorch 97.5196 145.0522 0.349418 0.346090
uni_asr https://www.modelscope.cn/models/iic/speech_UniASR-large_asr_2pass-zh-cn-16k-common-vocab8358-tensorflow1-offline 97.3654 151.1122 0.717138 0.717138
Description
运行于【昆仑芯 R200】 系列算力卡的【语音识别】引擎,基于 transformer 架构,支持 SenseVoice、Whisper 等最新流行模型
Readme 1.4 GiB
Languages
Python 100%