昆仑芯 R200-8F 语音合成
该模型测试框架在昆仑芯R200-8F加速卡上,适配了Piper模型,将语音信号转换为文本。
如何使用语音合成模型测试框架
代码实现了一个接收音频数据并返回识别文本的语音识别 HTTP 服务,将该 HTTP 服务重新打包成 docker 镜像,通过 k8s 集群sut容器去请求这个 HTTP 服务。
昆仑芯R200-8F上语音合成模型运行测试结果
在昆仑芯R200-8F上对部分语音合成模型进行适配,测试方式为在 Nvidia A100 和 昆仑芯R200-8F 加速卡上对同一段text进行语音合成任务,获取运行时间
| 模型名称 | 模型类型 | 适配状态 | 昆仑芯R200-8F运行时间/s | Nvidia A100运行时间/s |
|---|---|---|---|---|
| piper | - | 成功 | 1.2 | 1.7 |
Description
运行于【昆仑芯 R200】系列算力卡的【语音合成】引擎,基于 transformer 和 diffusion 架构,支持 GPT-SoVITS、F5-TTS 等最新流行模型
Languages
C++
72.4%
Python
19.2%
Jupyter Notebook
7.6%
CMake
0.3%
Shell
0.2%
Other
0.2%