Add Kotlin API for speech enhancement GTCRN models (#2008)

2025-03-16 10:41:01 +08:00
parent c972554ad1
commit ed8e6c9aed
8 changed files with 326 additions and 17 deletions
--- a/kotlin-api-examples/test_offline_speech_denoiser.kt
+++ b/kotlin-api-examples/test_offline_speech_denoiser.kt
@@ -0,0 +1,41 @@
+package com.k2fsa.sherpa.onnx
+// Please download test files in this script from
+// https://github.com/k2-fsa/sherpa-onnx/releases/tag/speech-enhancement-models
+
+fun main() {
+  test()
+}
+
+fun test() {
+  val denoiser  = createOfflineSpeechDenoiser()
+
+  val waveFilename = "./inp_16k.wav";
+
+  val objArray = WaveReader.readWaveFromFile(
+      filename = waveFilename,
+  )
+  val samples: FloatArray = objArray[0] as FloatArray
+  val sampleRate: Int = objArray[1] as Int
+
+  val denoised = denoiser.run(samples, sampleRate);
+  denoised.save(filename="./enhanced-16k.wav")
+  println("saved to ./enhanced-16k.wav")
+}
+
+fun createOfflineSpeechDenoiser(): OfflineSpeechDenoiser {
+  val config = OfflineSpeechDenoiserConfig(
+      model = OfflineSpeechDenoiserModelConfig(
+        gtcrn = OfflineSpeechDenoiserGtcrnModelConfig(
+          model = "./gtcrn_simple.onnx"
+        ),
+        provider = "cpu",
+        numThreads = 1,
+      ),
+  )
+
+  println(config)
+
+  return OfflineSpeechDenoiser(config = config)
+}
+
+