2025-09-22 22:43:34 +08:00
2025-09-22 22:43:34 +08:00
2025-09-12 12:19:17 +08:00

昆仑芯 R200-8F 语音合成

该模型测试框架在昆仑芯R200-8F加速卡上适配了Piper模型将语音信号转换为文本。

如何使用语音合成模型测试框架

代码实现了一个接收音频数据并返回识别文本的语音识别 HTTP 服务,将该 HTTP 服务重新打包成 docker 镜像,通过 k8s 集群sut容器去请求这个 HTTP 服务。

昆仑芯R200-8F上语音合成模型运行测试结果

在昆仑芯R200-8F上对部分语音合成模型进行适配测试方式为在 Nvidia A100 和 昆仑芯R200-8F 加速卡上对同一段text进行语音合成任务获取运行时间

模型名称 模型类型 适配状态 昆仑芯R200-8F运行时间/s Nvidia A100运行时间/s
piper - 成功 1.2 1.7
Description
运行于【昆仑芯 R200】系列算力卡的【语音合成】引擎,基于 transformer 和 diffusion 架构,支持 GPT-SoVITS、F5-TTS 等最新流行模型
Readme 24 MiB
Languages
C++ 72.4%
Python 19.2%
Jupyter Notebook 7.6%
CMake 0.3%
Shell 0.2%
Other 0.2%