初始化项目，由ModelHub XC社区提供模型

Model: KandirResearch/DarijaTTS-v0.1-500M Source: Original Platform
2026-05-13 21:35:39 +08:00
commit 0bf626d2f0
13 changed files with 207988 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,37 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text
 unsloth.Q8_0.gguf filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,89 @@
 ---
 library_name: transformers
 tags:
 - unsloth
 - trl
 - sft
 - tts
 license: apache-2.0
 language:
 - ary
 datasets:
 - KandirResearch/DarijaTTS-clean
 base_model:
 - OuteAI/OuteTTS-0.2-500M
 pipeline_tag: text-to-speech
 ---
 # Moroccan Darija TTS
 This is a text-to-speech (TTS) model for Moroccan Darija, fine-tuned from [OuteAI/OuteTTS-0.2-500M](https://huggingface.co/OuteAI/OuteTTS-0.2-500M) on the [KandirResearch/DarijaTTS-clean](https://huggingface.co/datasets/KandirResearch/DarijaTTS-clean) dataset.
 ## Model Details
 - **Base Model:** [OuteAI/OuteTTS-0.2-500M](https://huggingface.co/OuteAI/OuteTTS-0.2-500M)
 - **Dataset:** [KandirResearch/DarijaTTS-clean](https://huggingface.co/datasets/KandirResearch/DarijaTTS-clean)
 - **Training Method:** Fine-tuned using Unsloth's `SFTTrainer`
 - **Dataset Preparation:** Preprocessed following [OuteTTS training guide](https://github.com/edwko/OuteTTS/blob/main/examples/training/OuteTTS-0.3/train.md)
 - **Demo:** [Try it here](https://huggingface.co/spaces/Lyte/DarijaTTS-test)
 ## Usage
 > [!IMPORTANT]
 > **Compatibility Note**
 > Recent updates to `outetts` have introduced breaking changes. If you encounter the error:
 > `AttributeError: module 'outetts' has no attribute 'GGUFModelConfig_v2'`
 >
 > **Solution:** Please install a compatible version (0.3.3 or 0.3.2) to resolve this:
 > ```bash
 > pip install outetts==0.3.3
 > ```
 You can run the model using `outetts` as follows:
 Install `outetts` and `llama-cpp-python`:
 ```bash
 pip install outetts==0.3.3 llama-cpp-python huggingface_hub
 ````
 ```python
 import outetts
 from outetts.models.config import GenerationConfig
 from huggingface_hub import hf_hub_download
 model_path = hf_hub_download(
    repo_id="KandirResearch/DarijaTTS-v0.1-500M",
    filename="unsloth.Q8_0.gguf",
 )
 model_config = outetts.GGUFModelConfig_v2(
    model_path=model_path,
    tokenizer_path="KandirResearch/DarijaTTS-v0.1-500M",
 )
 interface = outetts.InterfaceGGUF(model_version="0.3", cfg=model_config)
 def tts(text, temperature=0.3, repetition_penalty=1.1):
    gen_cfg = GenerationConfig(
        text=text,
        temperature=temperature,
        repetition_penalty=repetition_penalty,
        max_length=4096,
    )
    output = interface.generate(config=gen_cfg)
    output_path = "output.wav"
    output.save(output_path)
    return output_path
 # Example usage
 audio_path = tts("السلام كيداير لاباس عليك؟")
 print(f"Generated audio saved at: {audio_path}")
 ```
 ## Training
 The model was fine-tuned using `Unsloth`'s `SFTTrainer`. The dataset was preprocessed following the [OuteTTS training guide](https://github.com/edwko/OuteTTS/blob/main/examples/training/OuteTTS-0.3/train.md). LoRA-based fine-tuning was applied to improve efficiency.
 # Support Me
 [](https://ko-fi.com/lyte)
 -----
 For any issues or improvements, feel free to open a discussion or PR\!
--- a/added_tokens.json
+++ b/added_tokens.json
--- a/config.json
+++ b/config.json
@@ -0,0 +1,29 @@
 {
  "architectures": [
    "Qwen2ForCausalLM"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "hidden_act": "silu",
  "hidden_size": 896,
  "initializer_range": 0.02,
  "intermediate_size": 4864,
  "max_position_embeddings": 32768,
  "max_window_layers": 24,
  "model_type": "qwen2",
  "num_attention_heads": 14,
  "num_hidden_layers": 24,
  "num_key_value_heads": 2,
  "rms_norm_eps": 1e-06,
  "rope_scaling": null,
  "rope_theta": 1000000.0,
  "sliding_window": null,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.46.2",
  "use_cache": true,
  "use_mrope": false,
  "use_sliding_window": false,
  "vocab_size": 157696
 }
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,7 @@
 {
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "max_length": 32768,
  "pad_token_id": 151643,
  "transformers_version": "4.49.0"
 }
--- a/merges.txt
+++ b/merges.txt
--- a/model.safetensors
+++ b/model.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:7b90a66c14f18a54cb8e82b13960510fc8d4ac935bbddc8decef62539e15d8cb
 size 998419456
--- a/pytorch_model.bin
+++ b/pytorch_model.bin
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:64f5d8239d404122e7574dd2ac878787f98f99af0f67c696b91e8ca7c7af0bf6
 size 998484818
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
--- a/tokenizer.json
+++ b/tokenizer.json
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:c78b9d9bf7452c5b619ed0e4d1fc50f59e8ccb46d1ca148fa378c7ed008d9744
 size 12367805
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
--- a/unsloth.Q8_0.gguf
+++ b/unsloth.Q8_0.gguf
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:239712dc9e590fb048779c609549ddfad3015faccc62c9c30eb053224ca898e4
 size 536666752
--- a/vocab.json
+++ b/vocab.json