From 44c07c9e5a425767991107a399a795f42ce7ac34 Mon Sep 17 00:00:00 2001 From: ModelHub XC Date: Tue, 26 May 2026 17:11:16 +0800 Subject: [PATCH] =?UTF-8?q?=E5=88=9D=E5=A7=8B=E5=8C=96=E9=A1=B9=E7=9B=AE?= =?UTF-8?q?=EF=BC=8C=E7=94=B1ModelHub=20XC=E7=A4=BE=E5=8C=BA=E6=8F=90?= =?UTF-8?q?=E4=BE=9B=E6=A8=A1=E5=9E=8B?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Model: Finisha-F-scratch/KLA-SLM-CODING Source: Original Platform --- .gitattributes | 36 +++++++++ LICENSE | 32 ++++++++ README.md | 53 ++++++++++++++ config.json | 27 +++++++ generation_config.json | 7 ++ model.safetensors | 3 + ...out.tfevents.1769192486.95ceceebcad8.379.0 | 3 + ...out.tfevents.1769192820.95ceceebcad8.379.1 | 3 + ...out.tfevents.1769192936.95ceceebcad8.379.2 | 3 + special_tokens_map.json | 30 ++++++++ tokenizer.json | 3 + tokenizer.model | 3 + tokenizer_config.json | 73 +++++++++++++++++++ training_args.bin | 3 + 14 files changed, 279 insertions(+) create mode 100644 .gitattributes create mode 100644 LICENSE create mode 100644 README.md create mode 100644 config.json create mode 100644 generation_config.json create mode 100644 model.safetensors create mode 100644 runs/Jan23_18-21-22_95ceceebcad8/events.out.tfevents.1769192486.95ceceebcad8.379.0 create mode 100644 runs/Jan23_18-26-59_95ceceebcad8/events.out.tfevents.1769192820.95ceceebcad8.379.1 create mode 100644 runs/Jan23_18-28-55_95ceceebcad8/events.out.tfevents.1769192936.95ceceebcad8.379.2 create mode 100644 special_tokens_map.json create mode 100644 tokenizer.json create mode 100644 tokenizer.model create mode 100644 tokenizer_config.json create mode 100644 training_args.bin diff --git a/.gitattributes b/.gitattributes new file mode 100644 index 0000000..52373fe --- /dev/null +++ b/.gitattributes @@ -0,0 +1,36 @@ +*.7z filter=lfs diff=lfs merge=lfs -text +*.arrow filter=lfs diff=lfs merge=lfs -text +*.bin filter=lfs diff=lfs merge=lfs -text +*.bz2 filter=lfs diff=lfs merge=lfs -text +*.ckpt filter=lfs diff=lfs merge=lfs -text +*.ftz filter=lfs diff=lfs merge=lfs -text +*.gz filter=lfs diff=lfs merge=lfs -text +*.h5 filter=lfs diff=lfs merge=lfs -text +*.joblib filter=lfs diff=lfs merge=lfs -text +*.lfs.* filter=lfs diff=lfs merge=lfs -text +*.mlmodel filter=lfs diff=lfs merge=lfs -text +*.model filter=lfs diff=lfs merge=lfs -text +*.msgpack filter=lfs diff=lfs merge=lfs -text +*.npy filter=lfs diff=lfs merge=lfs -text +*.npz filter=lfs diff=lfs merge=lfs -text +*.onnx filter=lfs diff=lfs merge=lfs -text +*.ot filter=lfs diff=lfs merge=lfs -text +*.parquet filter=lfs diff=lfs merge=lfs -text +*.pb filter=lfs diff=lfs merge=lfs -text +*.pickle filter=lfs diff=lfs merge=lfs -text +*.pkl filter=lfs diff=lfs merge=lfs -text +*.pt filter=lfs diff=lfs merge=lfs -text +*.pth filter=lfs diff=lfs merge=lfs -text +*.rar filter=lfs diff=lfs merge=lfs -text +*.safetensors filter=lfs diff=lfs merge=lfs -text +saved_model/**/* filter=lfs diff=lfs merge=lfs -text +*.tar.* filter=lfs diff=lfs merge=lfs -text +*.tar filter=lfs diff=lfs merge=lfs -text +*.tflite filter=lfs diff=lfs merge=lfs -text +*.tgz filter=lfs diff=lfs merge=lfs -text +*.wasm filter=lfs diff=lfs merge=lfs -text +*.xz filter=lfs diff=lfs merge=lfs -text +*.zip filter=lfs diff=lfs merge=lfs -text +*.zst filter=lfs diff=lfs merge=lfs -text +*tfevents* filter=lfs diff=lfs merge=lfs -text +tokenizer.json filter=lfs diff=lfs merge=lfs -text diff --git a/LICENSE b/LICENSE new file mode 100644 index 0000000..32dd809 --- /dev/null +++ b/LICENSE @@ -0,0 +1,32 @@ +**🩷 Gheya innov open source🩷** (GIOS-terme) + +selon les standards de LICENSE Gheya ci dessous. +vous vous engagez a accepter les conditions d'utilisation d'utilisation des modèles de la série gheya, +et de les utiliser pour de bons usages. + +respectez les termes ci dessous : + +1) Tout les modèles (Gheya), +appartiennent a Llm-clem (Clemylia), +vous n'avez pas le droit de vous approprié la priorité. + +2) Vous pouvez faire du fine-tuning, +autant que vous le souhaitez sur les modèles gheya. +et etes libre d'utiliser vos versions modifié +dans tout les cas d'usages que le souhaitez. +qu'ils soit commerciaux ou non. + +la seule règle : utilisez gheya dans de bons usages. +tout usage des modèles de base Gheya, qui nous semble déplacé , +et nous pourrons mettre en place des restrictions très sévères contre vous. + +cela implique : + +- pas de logiciels malveillants +- pas de nudité ou de pornographie +- pas d'autres usages ou fonctionnalités quelconque faisant tord a autrui. + +3) Vous devez toujours garder une copie de GIOS-terme en lien avec votre version modifié. + + +bonne utilisation ! \ No newline at end of file diff --git a/README.md b/README.md new file mode 100644 index 0000000..8f8ebe2 --- /dev/null +++ b/README.md @@ -0,0 +1,53 @@ +--- +library_name: transformers +tags: +- Code +model-index: +- name: KLA-SLM-coding + results: [] +license: other +language: +- en +pipeline_tag: text-generation +--- +# 💻 Documentation : KLA-SLM-CODING 💻 + +![KLa](http://www.image-heberg.fr/files/17692394453058009891.jpg) + +**KLA-SLM-CODING** est un Small Language Model (SLM) de la lignée **Finisha-LLM**. Contrairement aux modèles de masse, il a été extrait du vide et nourri exclusivement de **code pur**. Il ne simule pas la programmation, il génère la structure. + +--- + +## 🏗️ Architecture & Forge + +* **Modèle de Base** : Type Gemma (Optimisé pour l'inférence de tokens techniques). +* **Méthode** : 100% **Pre-trained From Scratch**. +* **Dataset** : Corpus de code dense (Zéro texte conversationnel parasite). +* **Vitesse** : Ultra-léger, conçu pour la complétion en temps réel dans les environnements de dev. + +--- + +## 🛠️ Capacités de Complétion + +Le modèle a été entraîné pour anticiper la logique du développeur sans les biais du langage naturel : + +1. **Prédiction de Blocs** : Complétion de fonctions, boucles et structures conditionnelles. +2. **Syntaxe Native** : Maîtrise des indentations et des séparateurs sans "hallucinations" textuelles. +3. **Logique de Flux** : Capable de suivre la trace des variables à travers le dataset de code. + +--- + +## 🧬 La Signature Finisha (Vosia-Code) + +Comme tous les modèles de la forge, **KLA-SLM-CODING** possède sa propre identité : + +* **Métagrammaire du Code** : Il privilégie l'efficacité brute. S'il y a une répétition structurelle, c'est pour renforcer la stabilité du script. +* **Zéro Lissage** : Le code est généré tel qu'il a été appris dans les datasets denses, sans politesse ni commentaires inutiles. + +--- + +## 🚀 Usage & Environnement + +* **IDE** : Parfaitement adapté aux cellules **Google Colab** pour un affichage propre. +* **Inférence** : Conçu pour tourner sur des architectures mobiles ou locales (Android/Termux). +* **Complétion** : Réagit instantanément aux premiers tokens de code pour proposer la suite logique. \ No newline at end of file diff --git a/config.json b/config.json new file mode 100644 index 0000000..d228dfc --- /dev/null +++ b/config.json @@ -0,0 +1,27 @@ +{ + "architectures": [ + "GemmaForCausalLM" + ], + "attention_bias": false, + "attention_dropout": 0.0, + "bos_token_id": 2, + "dtype": "float32", + "eos_token_id": 1, + "head_dim": 64, + "hidden_act": "gelu_pytorch_tanh", + "hidden_activation": null, + "hidden_size": 768, + "initializer_range": 0.02, + "intermediate_size": 3072, + "max_position_embeddings": 512, + "model_type": "gemma", + "num_attention_heads": 12, + "num_hidden_layers": 12, + "num_key_value_heads": 1, + "pad_token_id": 0, + "rms_norm_eps": 1e-06, + "rope_theta": 10000.0, + "transformers_version": "4.57.6", + "use_cache": true, + "vocab_size": 110417 +} diff --git a/generation_config.json b/generation_config.json new file mode 100644 index 0000000..4daf9ca --- /dev/null +++ b/generation_config.json @@ -0,0 +1,7 @@ +{ + "_from_model_config": true, + "bos_token_id": 2, + "eos_token_id": 1, + "pad_token_id": 0, + "transformers_version": "4.57.6" +} diff --git a/model.safetensors b/model.safetensors new file mode 100644 index 0000000..e5bab09 --- /dev/null +++ b/model.safetensors @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:b2eb99a632f850f669c8e96d89c883b9af77d3660ac57a802ef52b1057858173 +size 740370352 diff --git a/runs/Jan23_18-21-22_95ceceebcad8/events.out.tfevents.1769192486.95ceceebcad8.379.0 b/runs/Jan23_18-21-22_95ceceebcad8/events.out.tfevents.1769192486.95ceceebcad8.379.0 new file mode 100644 index 0000000..21b919f --- /dev/null +++ b/runs/Jan23_18-21-22_95ceceebcad8/events.out.tfevents.1769192486.95ceceebcad8.379.0 @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:a6945381970663a0636ceeb1425622da5c717e7da2f13543bada12b64cb040dc +size 5397 diff --git a/runs/Jan23_18-26-59_95ceceebcad8/events.out.tfevents.1769192820.95ceceebcad8.379.1 b/runs/Jan23_18-26-59_95ceceebcad8/events.out.tfevents.1769192820.95ceceebcad8.379.1 new file mode 100644 index 0000000..ac523c2 --- /dev/null +++ b/runs/Jan23_18-26-59_95ceceebcad8/events.out.tfevents.1769192820.95ceceebcad8.379.1 @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:adbf05912167553f7328dd63b5992c6e013623b979392866a099e545033c2bff +size 4983 diff --git a/runs/Jan23_18-28-55_95ceceebcad8/events.out.tfevents.1769192936.95ceceebcad8.379.2 b/runs/Jan23_18-28-55_95ceceebcad8/events.out.tfevents.1769192936.95ceceebcad8.379.2 new file mode 100644 index 0000000..7cb6927 --- /dev/null +++ b/runs/Jan23_18-28-55_95ceceebcad8/events.out.tfevents.1769192936.95ceceebcad8.379.2 @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:8830ede7230d344a47d734e3b4b0d76289647282f9018a4e6e12343ddcdf7df0 +size 42676 diff --git a/special_tokens_map.json b/special_tokens_map.json new file mode 100644 index 0000000..a782b2f --- /dev/null +++ b/special_tokens_map.json @@ -0,0 +1,30 @@ +{ + "bos_token": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false + }, + "eos_token": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false + }, + "pad_token": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false + }, + "unk_token": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false + } +} diff --git a/tokenizer.json b/tokenizer.json new file mode 100644 index 0000000..0a6fce6 --- /dev/null +++ b/tokenizer.json @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:805a26df1b41cad3b23e241ef725e8c53e581cc9d606a16064762cb9ac030ce1 +size 18207400 diff --git a/tokenizer.model b/tokenizer.model new file mode 100644 index 0000000..6d1acb0 --- /dev/null +++ b/tokenizer.model @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:96ae2fa7914aa1949ff587762f0bb2fb74ae7a96e56033eba3bd051cb822d672 +size 2084094 diff --git a/tokenizer_config.json b/tokenizer_config.json new file mode 100644 index 0000000..49a23b9 --- /dev/null +++ b/tokenizer_config.json @@ -0,0 +1,73 @@ +{ + "add_bos_token": true, + "add_eos_token": false, + "added_tokens_decoder": { + "0": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": true + }, + "1": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": true + }, + "2": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": true + }, + "3": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": true + }, + "4": { + "content": "", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": false + }, + "5": { + "content": "Question:", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": false + }, + "6": { + "content": "Réponse:", + "lstrip": false, + "normalized": false, + "rstrip": false, + "single_word": false, + "special": false + } + }, + "bos_token": "", + "clean_up_tokenization_spaces": false, + "eos_token": "", + "extra_special_tokens": {}, + "model_max_length": 1000000000000000019884624838656, + "pad_token": "", + "sp_model_kwargs": null, + "spaces_between_special_tokens": false, + "tokenizer_class": "GemmaTokenizer", + "unk_token": "", + "use_default_system_prompt": false +} diff --git a/training_args.bin b/training_args.bin new file mode 100644 index 0000000..d26fe85 --- /dev/null +++ b/training_args.bin @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:8da8bfd20dd2f280c0de44c03aa15c37adc80ad78fdaae538cd80a2671d606a8 +size 5841