enginex-mr_series-sherpa-onnx/go-api-examples/non-streaming-tts/main.go

package main

import (
	sherpa "github.com/k2-fsa/sherpa-onnx-go/sherpa_onnx"
	flag "github.com/spf13/pflag"
	"log"
)

func main() {
	log.SetFlags(log.LstdFlags | log.Lmicroseconds)

	config := sherpa.OfflineTtsConfig{}
	sid := 0
	filename := "./generated.wav"

	flag.StringVar(&config.Model.Vits.Model, "vits-model", "", "Path to the vits ONNX model")
	flag.StringVar(&config.Model.Vits.Lexicon, "vits-lexicon", "", "Path to lexicon.txt")
	flag.StringVar(&config.Model.Vits.Tokens, "vits-tokens", "", "Path to tokens.txt")
	flag.StringVar(&config.Model.Vits.DataDir, "vits-data-dir", "", "Path to espeak-ng-data")
	flag.StringVar(&config.Model.Vits.DictDir, "vits-dict-dir", "", "Path to dict for jieba")

	flag.Float32Var(&config.Model.Vits.NoiseScale, "vits-noise-scale", 0.667, "noise_scale for VITS")
	flag.Float32Var(&config.Model.Vits.NoiseScaleW, "vits-noise-scale-w", 0.8, "noise_scale_w for VITS")
	flag.Float32Var(&config.Model.Vits.LengthScale, "vits-length-scale", 1.0, "length_scale for VITS. small -> faster in speech speed; large -> slower")

	flag.StringVar(&config.Model.Matcha.AcousticModel, "matcha-acoustic-model", "", "Path to the matcha acoustic model")
	flag.StringVar(&config.Model.Matcha.Vocoder, "matcha-vocoder", "", "Path to the matcha vocoder model")
	flag.StringVar(&config.Model.Matcha.Lexicon, "matcha-lexicon", "", "Path to lexicon.txt")
	flag.StringVar(&config.Model.Matcha.Tokens, "matcha-tokens", "", "Path to tokens.txt")
	flag.StringVar(&config.Model.Matcha.DataDir, "matcha-data-dir", "", "Path to espeak-ng-data")
	flag.StringVar(&config.Model.Matcha.DictDir, "matcha-dict-dir", "", "Path to dict for jieba")

	flag.Float32Var(&config.Model.Matcha.NoiseScale, "matcha-noise-scale", 0.667, "noise_scale for Matcha")
	flag.Float32Var(&config.Model.Matcha.LengthScale, "matcha-length-scale", 1.0, "length_scale for Matcha. small -> faster in speech speed; large -> slower")

	flag.StringVar(&config.Model.Kokoro.Model, "kokoro-model", "", "Path to the Kokoro ONNX model")
	flag.StringVar(&config.Model.Kokoro.Voices, "kokoro-voices", "", "Path to voices.bin for Kokoro")
	flag.StringVar(&config.Model.Kokoro.Tokens, "kokoro-tokens", "", "Path to tokens.txt for Kokoro")
	flag.StringVar(&config.Model.Kokoro.DataDir, "kokoro-data-dir", "", "Path to espeak-ng-data for Kokoro")
	flag.StringVar(&config.Model.Kokoro.DictDir, "kokoro-dict-dir", "", "Path to dict for Kokoro")
	flag.StringVar(&config.Model.Kokoro.Lexicon, "kokoro-lexicon", "", "Path to lexicon files for Kokoro")
	flag.Float32Var(&config.Model.Kokoro.LengthScale, "kokoro-length-scale", 1.0, "length_scale for Kokoro. small -> faster in speech speed; large -> slower")

	flag.IntVar(&config.Model.NumThreads, "num-threads", 1, "Number of threads for computing")
	flag.IntVar(&config.Model.Debug, "debug", 0, "Whether to show debug message")
	flag.StringVar(&config.Model.Provider, "provider", "cpu", "Provider to use")
	flag.StringVar(&config.RuleFsts, "tts-rule-fsts", "", "Path to rule.fst")
	flag.StringVar(&config.RuleFars, "tts-rule-fars", "", "Path to rule.far")
	flag.IntVar(&config.MaxNumSentences, "tts-max-num-sentences", 1, "Batch size")

	flag.IntVar(&sid, "sid", 0, "Speaker ID. Used only for multi-speaker models")
	flag.StringVar(&filename, "output-filename", "./generated.wav", "Filename to save the generated audio")

	flag.Parse()

	if len(flag.Args()) != 1 {
		log.Fatalf("Please provide the text to generate audios")
	}

	text := flag.Arg(0)

	log.Println("Input text:", text)
	log.Println("Speaker ID:", sid)
	log.Println("Output filename:", filename)

	log.Println("Initializing model (may take several seconds)")

	tts := sherpa.NewOfflineTts(&config)
	defer sherpa.DeleteOfflineTts(tts)

	log.Println("Model created!")

	log.Println("Start generating!")

	audio := tts.Generate(text, sid, 1.0)

	log.Println("Done!")

	ok := audio.Save(filename)
	if !ok {
		log.Fatalf("Failed to write", filename)
	}
}
Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00			`package main`

			`import (`
			`sherpa "github.com/k2-fsa/sherpa-onnx-go/sherpa_onnx"`
			`flag "github.com/spf13/pflag"`
			`"log"`
			`)`

			`func main() {`
			`log.SetFlags(log.LstdFlags \| log.Lmicroseconds)`

			`config := sherpa.OfflineTtsConfig{}`
			`sid := 0`
			`filename := "./generated.wav"`

			`flag.StringVar(&config.Model.Vits.Model, "vits-model", "", "Path to the vits ONNX model")`
			`flag.StringVar(&config.Model.Vits.Lexicon, "vits-lexicon", "", "Path to lexicon.txt")`
			`flag.StringVar(&config.Model.Vits.Tokens, "vits-tokens", "", "Path to tokens.txt")`
Fix releasing go packages (#476) 2023-12-09 00:07:52 +08:00			`flag.StringVar(&config.Model.Vits.DataDir, "vits-data-dir", "", "Path to espeak-ng-data")`
fix case (#2037) v should be V 2025-03-21 16:46:13 +08:00			`flag.StringVar(&config.Model.Vits.DictDir, "vits-dict-dir", "", "Path to dict for jieba")`
Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00
			`flag.Float32Var(&config.Model.Vits.NoiseScale, "vits-noise-scale", 0.667, "noise_scale for VITS")`
			`flag.Float32Var(&config.Model.Vits.NoiseScaleW, "vits-noise-scale-w", 0.8, "noise_scale_w for VITS")`
			`flag.Float32Var(&config.Model.Vits.LengthScale, "vits-length-scale", 1.0, "length_scale for VITS. small -> faster in speech speed; large -> slower")`

Add Go API for MatchaTTS models (#1685) 2025-01-06 08:03:03 +08:00			`flag.StringVar(&config.Model.Matcha.AcousticModel, "matcha-acoustic-model", "", "Path to the matcha acoustic model")`
			`flag.StringVar(&config.Model.Matcha.Vocoder, "matcha-vocoder", "", "Path to the matcha vocoder model")`
			`flag.StringVar(&config.Model.Matcha.Lexicon, "matcha-lexicon", "", "Path to lexicon.txt")`
			`flag.StringVar(&config.Model.Matcha.Tokens, "matcha-tokens", "", "Path to tokens.txt")`
			`flag.StringVar(&config.Model.Matcha.DataDir, "matcha-data-dir", "", "Path to espeak-ng-data")`
			`flag.StringVar(&config.Model.Matcha.DictDir, "matcha-dict-dir", "", "Path to dict for jieba")`

			`flag.Float32Var(&config.Model.Matcha.NoiseScale, "matcha-noise-scale", 0.667, "noise_scale for Matcha")`
			`flag.Float32Var(&config.Model.Matcha.LengthScale, "matcha-length-scale", 1.0, "length_scale for Matcha. small -> faster in speech speed; large -> slower")`

Add Go API for Kokoro TTS models (#1722) 2025-01-16 17:35:31 +08:00			`flag.StringVar(&config.Model.Kokoro.Model, "kokoro-model", "", "Path to the Kokoro ONNX model")`
			`flag.StringVar(&config.Model.Kokoro.Voices, "kokoro-voices", "", "Path to voices.bin for Kokoro")`
			`flag.StringVar(&config.Model.Kokoro.Tokens, "kokoro-tokens", "", "Path to tokens.txt for Kokoro")`
			`flag.StringVar(&config.Model.Kokoro.DataDir, "kokoro-data-dir", "", "Path to espeak-ng-data for Kokoro")`
Add Go API for Kokoro TTS 1.0 (#1804) 2025-02-07 15:18:02 +08:00			`flag.StringVar(&config.Model.Kokoro.DictDir, "kokoro-dict-dir", "", "Path to dict for Kokoro")`
			`flag.StringVar(&config.Model.Kokoro.Lexicon, "kokoro-lexicon", "", "Path to lexicon files for Kokoro")`
Add Go API for Kokoro TTS models (#1722) 2025-01-16 17:35:31 +08:00			`flag.Float32Var(&config.Model.Kokoro.LengthScale, "kokoro-length-scale", 1.0, "length_scale for Kokoro. small -> faster in speech speed; large -> slower")`

Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00			`flag.IntVar(&config.Model.NumThreads, "num-threads", 1, "Number of threads for computing")`
			`flag.IntVar(&config.Model.Debug, "debug", 0, "Whether to show debug message")`
			`flag.StringVar(&config.Model.Provider, "provider", "cpu", "Provider to use")`
Fix releasing go packages (#476) 2023-12-09 00:07:52 +08:00			`flag.StringVar(&config.RuleFsts, "tts-rule-fsts", "", "Path to rule.fst")`
Support heteronyms in Chinese TTS (#738) 2024-04-08 11:01:30 +08:00			`flag.StringVar(&config.RuleFars, "tts-rule-fars", "", "Path to rule.far")`
Fix releasing go packages (#476) 2023-12-09 00:07:52 +08:00			`flag.IntVar(&config.MaxNumSentences, "tts-max-num-sentences", 1, "Batch size")`
Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00
			`flag.IntVar(&sid, "sid", 0, "Speaker ID. Used only for multi-speaker models")`
			`flag.StringVar(&filename, "output-filename", "./generated.wav", "Filename to save the generated audio")`

			`flag.Parse()`

			`if len(flag.Args()) != 1 {`
			`log.Fatalf("Please provide the text to generate audios")`
			`}`

			`text := flag.Arg(0)`

			`log.Println("Input text:", text)`
			`log.Println("Speaker ID:", sid)`
			`log.Println("Output filename:", filename)`

			`log.Println("Initializing model (may take several seconds)")`

			`tts := sherpa.NewOfflineTts(&config)`
			`defer sherpa.DeleteOfflineTts(tts)`

			`log.Println("Model created!")`

			`log.Println("Start generating!")`

Add MFC TTS example on Windows (#378) 2023-10-21 00:13:07 +08:00			`audio := tts.Generate(text, sid, 1.0)`
Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00
			`log.Println("Done!")`

			`ok := audio.Save(filename)`
Add Golang API for VAD (#708) 2024-03-27 12:09:39 +08:00			`if !ok {`
Add Go API for TTS (#377) 2023-10-20 15:57:52 +08:00			`log.Fatalf("Failed to write", filename)`
			`}`
			`}`