Fix releasing go packages (#476)

2023-12-09 00:07:52 +08:00
parent aef74c5125
commit cae0231f93
13 changed files with 261 additions and 301 deletions
--- a/go-api-examples/non-streaming-tts/main.go
+++ b/go-api-examples/non-streaming-tts/main.go
@@ -16,6 +16,7 @@ func main() {
 	flag.StringVar(&config.Model.Vits.Model, "vits-model", "", "Path to the vits ONNX model")
 	flag.StringVar(&config.Model.Vits.Lexicon, "vits-lexicon", "", "Path to lexicon.txt")
 	flag.StringVar(&config.Model.Vits.Tokens, "vits-tokens", "", "Path to tokens.txt")
+	flag.StringVar(&config.Model.Vits.DataDir, "vits-data-dir", "", "Path to espeak-ng-data")

 	flag.Float32Var(&config.Model.Vits.NoiseScale, "vits-noise-scale", 0.667, "noise_scale for VITS")
 	flag.Float32Var(&config.Model.Vits.NoiseScaleW, "vits-noise-scale-w", 0.8, "noise_scale_w for VITS")
@@ -24,6 +25,8 @@ func main() {
 	flag.IntVar(&config.Model.NumThreads, "num-threads", 1, "Number of threads for computing")
 	flag.IntVar(&config.Model.Debug, "debug", 0, "Whether to show debug message")
 	flag.StringVar(&config.Model.Provider, "provider", "cpu", "Provider to use")
+	flag.StringVar(&config.RuleFsts, "tts-rule-fsts", "", "Path to rule.fst")
+	flag.IntVar(&config.MaxNumSentences, "tts-max-num-sentences", 1, "Batch size")

 	flag.IntVar(&sid, "sid", 0, "Speaker ID. Used only for multi-speaker models")
 	flag.StringVar(&filename, "output-filename", "./generated.wav", "Filename to save the generated audio")
--- a/go-api-examples/non-streaming-tts/run-vits-piper-en_US-lessac-medium.sh
+++ b/go-api-examples/non-streaming-tts/run-vits-piper-en_US-lessac-medium.sh
@@ -0,0 +1,12 @@
+#!/usr/bin/env bash
+
+# please refer to
+# https://k2-fsa.github.io/sherpa/onnx/tts/pretrained_models/vits.html#en-us-lessac-medium-english-single-speaker
+# to download the model before you run this script
+
+./non-streaming-tts \
+  --vits-model=./vits-piper-en_US-lessac-medium/en_US-lessac-medium.onnx \
+  --vits-data-dir=./vits-piper-en_US-lessac-medium/espeak-ng-data \
+  --vits-tokens=./vits-piper-en_US-lessac-medium/tokens.txt \
+  --output-filename=./liliana-piper-en_US-lessac-medium.wav \
+  'liliana, the most beautiful and lovely assistant of our team!'
--- a/go-api-examples/non-streaming-tts/run-vits-zh-aishell3.sh
+++ b/go-api-examples/non-streaming-tts/run-vits-zh-aishell3.sh
@@ -9,8 +9,18 @@ for sid in 10 33 99; do
  --vits-model=./vits-zh-aishell3/vits-aishell3.onnx \
  --vits-lexicon=./vits-zh-aishell3/lexicon.txt \
  --vits-tokens=./vits-zh-aishell3/tokens.txt \
-  --sid=10 \
+  --sid=$sid \
  --debug=1 \
  --output-filename=./liliana-$sid.wav \
  "林美丽最美丽、最漂亮、最可爱！"
+
+./non-streaming-tts \
+  --vits-model=./vits-zh-aishell3/vits-aishell3.onnx \
+  --vits-lexicon=./vits-zh-aishell3/lexicon.txt \
+  --vits-tokens=./vits-zh-aishell3/tokens.txt \
+  --tts-rule-fsts=./vits-zh-aishell3/rule.fst \
+  --sid=$sid \
+  --debug=1 \
+  --output-filename=./numbers-$sid.wav \
+  "数字12345.6789怎么念"
 done