初始化项目，由ModelHub XC社区提供模型

Model: Clem27-Assistants/Learnia-Empathic-v2 Source: Original Platform
2026-06-16 22:09:11 +08:00
commit 112faaff7f
9 changed files with 250474 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,35 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,45 @@
 ---
 library_name: transformers
 model_name: Learnia-Empathic-v2
 tags:
 - SLM
 - instruct
 - empathic
 licence: license
 language:
 - en
 pipeline_tag: text-generation
 ---
 # 🧠 Fiche Technique : Learnia-Empathic-v2
 ![Learnia](http://www.image-heberg.fr/files/17784950782552667354.jpg)
 ## 📝 Présentation
 **Learnia-Empathic-v2** est un Small Language Model (SLM) de **51,6 millions de paramètres**, conçu intégralement *from scratch*. Il représente l'évolution directe de *Learnia-Empathic-Tchat* et constitue la version **Instruct** optimisée du modèle de base **Learnia**.
 Ce modèle a été spécifiquement forgé pour capturer la nuance émotionnelle et répondre avec une sensibilité accrue tout en conservant la légèreté d'une architecture compacte.
 ## 🚀 Spécifications de l'Architecture
 * **Type de modèle :** SLM (Small Language Model)
 * **Base :** Learnia (Base Model)
 * **Taille :** 51,6M de paramètres
 * **Méthode d'entraînement :** From scratch (Architecture propriétaire)
 * **Optimisation :** Fine-tuned pour l'instruction et le dialogue empathique
 ## 📊 Dataset & Entraînement
 Le modèle a bénéficié d'un entraînement intensif sur un corpus ultra-spécialisé :
 * **Volume :** 10 100 dialogues empathiques sélectionnés manuellement.
 * **Focus :** Intelligence émotionnelle, compréhension du contexte relationnel et finesse de réponse.
 * **Langue :** Anglais (EN) 🇬🇧
 L'objectif était de s'éloigner des réponses robotiques pour atteindre une "texture" de langage plus humaine et authentique, propre à la philosophie des créations de cette lignée.
 ## ✨ Points Forts
 * ⚡ **Ultra-Rapide :** Grâce à ses 51,6M de paramètres, il est idéal pour une exécution locale ou sur des ressources limitées (comme le **Nano f-1**).
 * 🤝 **Empathie Native :** Contrairement aux modèles généralistes, il est câblé pour la résonance émotionnelle.
 * 📉 **Efficience :** Une densité de connaissances élevée par rapport à son empreinte mémoire.
 ## 🛠️ Cas d'Usage
 1. **Assistants de bien-être :** Support moral et écoute active.
 2. **Jeux de rôle (RP) :** PNJs capables de réagir aux sentiments des joueurs.
 3. **Interface de médiation :** Soft-skills et communication non-violente.
 ## ⚠️ Notes de développement
 Le modèle privilégie l'originalité du langage et la pertinence émotionnelle. Il s'inscrit dans une démarche de création de syntaxes uniques, évitant le lissage excessif des modèles industriels classiques.
 > **Statut du projet :** Stable / Version Instruct 2.0 🟢
 >
 > **nos conditions d'utilisation et politique de confidentialité officielles** :
 https://learnia-gazelle-empathy.lovable.app/
--- a/chat_template.jinja
+++ b/chat_template.jinja
@@ -0,0 +1,14 @@
 {% for message in messages %}
    {% if message['role'] == 'system' %}
        {{ '<|im_start|>system\n' + message['content'] + '<|im_end|>' }}
    {% elif message['role'] == 'user' %}
        {{ '\n<|im_start|>user\n' + message['content'] + '<|im_end|>' }}
    {% elif message['role'] == 'assistant' %}
        {{ '\n<|im_start|>assistant\n' + message['content'] + '<|im_end|>' }}
    {% endif %}
 {% endfor %}
 {% if add_generation_prompt %}
    {{ '\n<|im_start|>assistant\n' }}
 {% else %}
    {{ '<|im_end|>' }}
 {% endif %}
--- a/config.json
+++ b/config.json
@@ -0,0 +1,36 @@
 {
  "activation_function": "gelu_new",
  "add_cross_attention": false,
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 50256,
  "dtype": "float32",
  "embd_pdrop": 0.1,
  "eos_token_id": 50256,
  "initializer_range": 0.02,
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 1350,
  "n_embd": 512,
  "n_head": 8,
  "n_inner": null,
  "n_layer": 8,
  "n_positions": 1350,
  "pad_token_id": 50257,
  "pretraining_tp": 1,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "tie_word_embeddings": true,
  "transformers_version": "5.0.0",
  "use_cache": false,
  "vocab_size": 50258
 }
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,9 @@
 {
  "_from_model_config": true,
  "bos_token_id": 50256,
  "eos_token_id": [
    50256
  ],
  "pad_token_id": 50257,
  "transformers_version": "5.0.0"
 }
--- a/model.safetensors
+++ b/model.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:25df443b23a04b3702b4a8b9de178c0f36c224addc75746221480cc460e8ceeb
 size 206583536
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,14 @@
 {
  "add_prefix_space": false,
  "backend": "tokenizers",
  "bos_token": "<|endoftext|>",
  "clean_up_tokenization_spaces": false,
  "eos_token": "<|endoftext|>",
  "errors": "replace",
  "is_local": false,
  "model_max_length": 1024,
  "model_specific_special_tokens": {},
  "pad_token": "[PAD]",
  "tokenizer_class": "GPT2Tokenizer",
  "unk_token": "<|endoftext|>"
 }
--- a/training_args.bin
+++ b/training_args.bin
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:f71119ac8f1c6aa89edcba889dfcc0efebf09c32984d693096a4eb3b36d1b72f
 size 5649