Add TTS with VITS (#360)

2023-10-13 19:30:38 +08:00
parent 4771c9275c
commit 536d5804ba
17 changed files with 839 additions and 0 deletions
--- a/sherpa-onnx/csrc/offline-tts.h
+++ b/sherpa-onnx/csrc/offline-tts.h
@@ -0,0 +1,50 @@
+// sherpa-onnx/csrc/offline-tts.h
+//
+// Copyright (c)  2023  Xiaomi Corporation
+#ifndef SHERPA_ONNX_CSRC_OFFLINE_TTS_H_
+#define SHERPA_ONNX_CSRC_OFFLINE_TTS_H_
+
+#include <cstdint>
+#include <memory>
+#include <string>
+#include <vector>
+
+#include "sherpa-onnx/csrc/offline-tts-model-config.h"
+#include "sherpa-onnx/csrc/parse-options.h"
+
+namespace sherpa_onnx {
+
+struct OfflineTtsConfig {
+  OfflineTtsModelConfig model;
+
+  OfflineTtsConfig() = default;
+  explicit OfflineTtsConfig(const OfflineTtsModelConfig &model)
+      : model(model) {}
+
+  void Register(ParseOptions *po);
+  bool Validate() const;
+
+  std::string ToString() const;
+};
+
+struct GeneratedAudio {
+  std::vector<float> samples;
+  int32_t sample_rate;
+};
+
+class OfflineTtsImpl;
+
+class OfflineTts {
+ public:
+  ~OfflineTts();
+  explicit OfflineTts(const OfflineTtsConfig &config);
+  // @param text A string containing words separated by spaces
+  GeneratedAudio Generate(const std::string &text) const;
+
+ private:
+  std::unique_ptr<OfflineTtsImpl> impl_;
+};
+
+}  // namespace sherpa_onnx
+
+#endif  // SHERPA_ONNX_CSRC_OFFLINE_TTS_H_