whisper-large-v3-turbo-russian

dvislobokov/whisper-large-v3-turbo-russian

Go to file

ModelHub XC 7e485fad59 初始化项目，由ModelHub XC社区提供模型

Model: dvislobokov/whisper-large-v3-turbo-russian
Source: Original Platform

2026-05-14 11:43:24 +08:00

runs/Dec17_15-05-58_Fibonacci

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

ggml-model.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

normalizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

preprocessor_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

training_args.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-14 11:43:24 +08:00

README.md

license, datasets, language, base_model, pipeline_tag, metrics, library_name, tags

license

datasets

language

base_model

pipeline_tag

metrics

library_name

This model whas trained with two A100 40 GB, 128 GB RAM and 2 x Xeon 48 Core 2.4 GHz

Time spent ~ 7 hours
Count of train dataset - 118k of audio samples from Mozilla Common Voice 17

Example of usage

from transformers import pipeline
import gradio as gr
import time

pipe = pipeline(
    model="dvislobokov/whisper-large-v3-turbo-russian",
    tokenizer="dvislobokov/whisper-large-v3-turbo-russian",
    task='automatic-speech-recognition',
    device='cpu'
)

def transcribe(audio):
    start = time.time()
    text = pipe(audio, return_timestamps=True)['text']
    print(time.time() - start)
    return text

iface = gr.Interface(
    fn=transcribe,
    inputs=gr.Audio(sources=['microphone', 'upload'], type='filepath'),
    outputs='text'
)

iface.launch(share=True)