add sample data and update README

This commit is contained in:
2025-08-26 15:25:11 +08:00
parent 5692ccdd44
commit c078407cb3
3 changed files with 8 additions and 6 deletions

View File

@@ -8,20 +8,21 @@ docker build -f ./Dockerfile.funasr-mr100 -t <your_image> .
## 使用说明 ## 使用说明
### 快速镜像测试 ### 快速镜像测试
对funasr的测试需要在以上构造好的镜像容器内测试测试步骤 对funasr的测试需要在以上构造好的镜像容器内测试测试步骤
1. 将需要测试的音频wav文件和相应的ground truth文件含有音频的正确内容文字的文本文件放置于当前文件夹并且准备好相应的ASR模型路径 1. 本项目中附带上了示例测试数据,音频文件为`lei-jun-test.wav`,音频的识别准确内容文件为`lei-jun.txt`用户需要准备好相应的ASR模型路径本例中假设我们已经下载好了SenseVoiceSmall模型存放于/model/SenseVoiceSmall
2. 快速测试命令 2. 在本项目路径下执行以下快速测试命令
```shell ```shell
docker run -it \ docker run -it \
-v /usr/src:/usr/src \ -v /usr/src:/usr/src \
-v /lib/modules:/lib/modules --device=/dev/iluvatar0:/dev/iluvatar0 \ -v /lib/modules:/lib/modules --device=/dev/iluvatar0:/dev/iluvatar0 \
-v $PWD:/tmp/workspace \ -v $PWD:/tmp/workspace \
-v <host_model_dir>:<model_dir> \ -v /mnt/SenseVoiceSmall:/model \
-e MODEL_DIR=<model_dir> \ -e MODEL_DIR=/model \
-e TEST_FILE=<test_file> \ -e TEST_FILE=lei-jun-test.wav \
-e ANSWER_FILE=<ground_truth> \ -e ANSWER_FILE=lei-jun.txt \
--cpus=4 --memory=16g \ --cpus=4 --memory=16g \
<your_image> <your_image>
``` ```
上述测试指令成功运行将会在terminal中看到对测试音频的识别结果运行时间以及1-cer效果指标
### 定制化手动运行 ### 定制化手动运行

BIN
lei-jun-test.wav Normal file

Binary file not shown.

1
lei-jun.txt Normal file
View File

@@ -0,0 +1 @@
朋友们晚上好欢迎大家来参加今天晚上的活动谢谢大家。这是我第四次办年度演讲前三次呢因为疫情的原因都在小米科技园内举办。现场呢人很少。这是第四次我们仔细想了想我们还是想办一个比较大的聚会。然后呢让我们的新朋友老朋友一起聚一聚。今天的话呢我们就在北京的国家会议中心呢举办了这么一个活动。现场呢来了很多人大概有3500人。还有很多很多的朋友呢通过观看直播的方式来参与。再一次呢对大家的参加表示感谢谢谢大家。两个月前我参加了今年武汉大学的毕业典礼。今年呢是武汉大学建校130周年作为校友被母校邀请在毕业典礼上致辞这对我来说是至高无上的荣誉。站在讲台的那一刻面对全校师生关于武大的所有的记忆一下子涌现在脑海里。今天呢我就先和大家聊聊武大往事。那还是36年前1987年我呢考上了武汉大学的计算机系。在武汉大学的图书馆里看了一本书《硅谷之火》建立了我一生的梦想。看完书以后热血沸腾激动得睡不着觉。我还记得那天晚上星光很亮。我就在武大的操场上就是屏幕上这个操场走了一圈又一圈走了整整一个晚上。我心里有团火我也想办一个伟大的公司就是这样梦想之火在我心里彻底点燃了。但是一个大一的新生但是一个大一的新生一个从县城里出来的年轻人什么也不会什么也没有就想创办一家伟大的公司这不就是天方夜谭吗这么离谱的一个梦想该如何实现呢那天晚上我想了一整晚上说实话越想越糊涂完全理不清头绪后来我在想哎干脆别想了把书念好是正事所以呢我就下定决心认认真真读书那么我怎么能够把书读得不同凡响呢