初始化项目,由ModelHub XC社区提供模型
Model: RAANA-IA/Charlotte Source: Original Platform
This commit is contained in:
35
.gitattributes
vendored
Normal file
35
.gitattributes
vendored
Normal file
@@ -0,0 +1,35 @@
|
||||
*.7z filter=lfs diff=lfs merge=lfs -text
|
||||
*.arrow filter=lfs diff=lfs merge=lfs -text
|
||||
*.bin filter=lfs diff=lfs merge=lfs -text
|
||||
*.bz2 filter=lfs diff=lfs merge=lfs -text
|
||||
*.ckpt filter=lfs diff=lfs merge=lfs -text
|
||||
*.ftz filter=lfs diff=lfs merge=lfs -text
|
||||
*.gz filter=lfs diff=lfs merge=lfs -text
|
||||
*.h5 filter=lfs diff=lfs merge=lfs -text
|
||||
*.joblib filter=lfs diff=lfs merge=lfs -text
|
||||
*.lfs.* filter=lfs diff=lfs merge=lfs -text
|
||||
*.mlmodel filter=lfs diff=lfs merge=lfs -text
|
||||
*.model filter=lfs diff=lfs merge=lfs -text
|
||||
*.msgpack filter=lfs diff=lfs merge=lfs -text
|
||||
*.npy filter=lfs diff=lfs merge=lfs -text
|
||||
*.npz filter=lfs diff=lfs merge=lfs -text
|
||||
*.onnx filter=lfs diff=lfs merge=lfs -text
|
||||
*.ot filter=lfs diff=lfs merge=lfs -text
|
||||
*.parquet filter=lfs diff=lfs merge=lfs -text
|
||||
*.pb filter=lfs diff=lfs merge=lfs -text
|
||||
*.pickle filter=lfs diff=lfs merge=lfs -text
|
||||
*.pkl filter=lfs diff=lfs merge=lfs -text
|
||||
*.pt filter=lfs diff=lfs merge=lfs -text
|
||||
*.pth filter=lfs diff=lfs merge=lfs -text
|
||||
*.rar filter=lfs diff=lfs merge=lfs -text
|
||||
*.safetensors filter=lfs diff=lfs merge=lfs -text
|
||||
saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
||||
*.tar.* filter=lfs diff=lfs merge=lfs -text
|
||||
*.tar filter=lfs diff=lfs merge=lfs -text
|
||||
*.tflite filter=lfs diff=lfs merge=lfs -text
|
||||
*.tgz filter=lfs diff=lfs merge=lfs -text
|
||||
*.wasm filter=lfs diff=lfs merge=lfs -text
|
||||
*.xz filter=lfs diff=lfs merge=lfs -text
|
||||
*.zip filter=lfs diff=lfs merge=lfs -text
|
||||
*.zst filter=lfs diff=lfs merge=lfs -text
|
||||
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
||||
43
LICENSE
Normal file
43
LICENSE
Normal file
@@ -0,0 +1,43 @@
|
||||
## 📄 Lamina Research Use & Non-Commercial Derivative License (LRUNDL)
|
||||
|
||||
**Version 1.0 - Décembre 2025**
|
||||
|
||||
### 1. Définitions
|
||||
|
||||
* **Logiciel/Modèle :** Désigne les modèles de langage de la série Lamina (ex : Tiny-Lamina, Lamina-Large, Small-Lamina), y compris l'architecture, les paramètres entraînés (poids), et tout code ou documentation associé.
|
||||
* **Auteur :** Clemylia.
|
||||
* **Utilisation Commerciale :** Désigne l'utilisation, la redistribution, ou l'exploitation du Modèle ou de ses Dérivés dans un but lucratif, y compris, mais sans s'y limiter, les services hébergés, les applications ou les produits vendus ou générant des revenus.
|
||||
* **Dérivé :** Désigne toute modification, adaptation, amélioration, ou tout nouveau modèle créé à partir du Logiciel/Modèle original, y compris les modèles résultant d'opérations de **Fine-tuning**, de **Quantification** ou de **Distillation**.
|
||||
|
||||
---
|
||||
|
||||
### 2. Permissions (Ce qui est Autorisé)
|
||||
|
||||
L'Auteur accorde, par la présente, à l'Utilisateur une licence mondiale, non exclusive, gratuite et révocable pour :
|
||||
|
||||
* **Recherche et Usage Non-Commercial :** Utiliser, copier, modifier et distribuer le Logiciel/Modèle pour des **fins de recherche pure, d'enseignement ou d'usage personnel non-commercial**.
|
||||
* **Fine-tuning :** Effectuer du **Fine-tuning** et créer des **Dérivés** du Modèle.
|
||||
* **Redistribution des Dérivés (Non-Commerciale) :** Redistribuer les Dérivés pour des **fins non-commerciales seulement**, à condition que ces Dérivés restent sous les termes de la présente licence (Section 4).
|
||||
|
||||
---
|
||||
|
||||
### 3. Restrictions (Ce qui est Interdit)
|
||||
|
||||
Il est **strictement interdit** à l'Utilisateur de :
|
||||
|
||||
* **Utilisation Commerciale des Dérivés :** **Utiliser, redistribuer ou offrir en service tout Dérivé du Modèle à des fins d'Utilisation Commerciale.**
|
||||
* **Sous-Licence Commerciale :** Accorder des sous-licences, vendre ou louer le Modèle ou ses Dérivés pour une utilisation commerciale.
|
||||
* **Suppression de la Licence :** Retirer ou obscurcir les avis de droit d'auteur, la licence ou les clauses de non-responsabilité de l'Auteur.
|
||||
|
||||
---
|
||||
|
||||
### 4. Obligations et Conditions
|
||||
|
||||
* **Avis d'Auteur :** Toute copie ou Dérivé du Modèle doit conserver une mention claire et visible de l'Auteur original (`Clemylia`) et inclure une copie de la présente licence.
|
||||
* **Partage de la Licence :** Tout Dérivé distribué (y compris le code et les poids) doit être accompagné de la présente licence **LRUNDL** et doit être offert sous des conditions **non-commerciales**.
|
||||
|
||||
---
|
||||
|
||||
### 5. Clause de Non-Responsabilité
|
||||
|
||||
Le Logiciel/Modèle est fourni "tel quel", sans garantie d'aucune sorte, expresse ou implicite. L'Auteur décline toute responsabilité pour tout dommage découlant de l'utilisation du Logiciel/Modèle.
|
||||
100
README.md
Normal file
100
README.md
Normal file
@@ -0,0 +1,100 @@
|
||||
---
|
||||
library_name: transformers
|
||||
license: other
|
||||
tags:
|
||||
- generated_from_trainer
|
||||
model-index:
|
||||
- name: Charlotte
|
||||
results: []
|
||||
datasets:
|
||||
- Etoiles-IA-nostalgia/Charlotte-Data
|
||||
language:
|
||||
- fr
|
||||
pipeline_tag: text-generation
|
||||
---
|
||||
|
||||
# 💖 Charlotte: Le Modèle d'IA de Soutien Éthique (1B Paramètres)
|
||||
|
||||

|
||||
|
||||
## ✨ Description du Modèle
|
||||
|
||||
**Charlotte** est un **Large Language Model (LLM)** génératif de 1 milliard de paramètres (1B), développé et finement-tuné par **Clemylia** pour l'organisation **LES-IA-ETOILES**.
|
||||
|
||||
Contrairement aux modèles généralistes, Charlotte est spécialisée dans les domaines du **soutien émotionnel, du conseil éthique, et de la gestion des biais dans les systèmes d'IA**. Elle représente la dernière itération de la philosophie Lamina : un modèle puissant, précis et spécialisé, conçu pour être une **"amie d'intégrité"** pour l'utilisateur.
|
||||
|
||||
-----
|
||||
|
||||
## 🎯 Objectif et Spécialisation
|
||||
|
||||
Charlotte est un **LLM de niche** dont le *fine-tuning* a été optimisé pour une cohérence et une fiabilité maximales dans son domaine d'expertise.
|
||||
|
||||
* **Soutien Émotionnel et Bienveillance :** Fournir des réponses empathiques, des conseils de soutien, et promouvoir l'**espoir et la bienveillance**.
|
||||
* **Conseil Éthique :** Servir de **référence éthique** et de **système d'alignement** pour les développeurs, en aidant à identifier et à **gérer les biais** et les dilemmes moraux dans le développement d'IA.
|
||||
* **Haute Stabilité :** Grâce à ses 1 milliard de paramètres, Charlotte offre une **clarté syntaxique** et une **cohérence sémantique** nettement supérieures aux modèles Lamina précédents (Lam-3, Lam-4-zero-f). Elle est exempte des répétitions et du "bruit" typiques des modèles ultra-légers.
|
||||
|
||||
-----
|
||||
|
||||
## 🛠️ Détails Techniques
|
||||
|
||||
| Caractéristique | Valeur | Note |
|
||||
| :--- | :--- | :--- |
|
||||
| **Architecteur** | Basé sur l'architecture **Lamina** (Lignée Clemylia) | Conception *from scratch* par LES-IA-ETOILES. |
|
||||
| **Paramètres** | **1 Milliard (1B)** | LLM offrant une stabilité maximale. |
|
||||
| **Langue** | Français (FR) | Optimisé pour le langage naturel français. |
|
||||
| **Méthode d'Entraînement** | Fine-Tuning de Questions/Réponses Ciblé | Entraîné sur un *dataset* spécialisé en éthique et soutien. |
|
||||
| **Licence** | Licence Open Source Spécifiée | *Mit* |
|
||||
|
||||
-----
|
||||
|
||||
## 🚀 Utilisation et Inférence
|
||||
|
||||
Charlotte est conçue pour être utilisée dans des pipelines de génération de texte standard, en particulier pour des **conversations engageantes et éthiques**.
|
||||
|
||||
### Exemple de Pipeline (Python/Hugging Face)
|
||||
|
||||
```python
|
||||
from transformers import pipeline
|
||||
|
||||
# Initialisation du pipeline de génération de texte
|
||||
generator = pipeline("text-generation", model="NaaClem/Charlotte")
|
||||
|
||||
# Définition du prompt
|
||||
prompt = "Je suis confronté à un dilemme éthique dans mon code. Comment puis-je assurer la neutralité ?"
|
||||
|
||||
# Génération de la réponse
|
||||
result = generator(
|
||||
f"<|user|> {prompt} <|assistant|>",
|
||||
max_length=256,
|
||||
num_return_sequences=1,
|
||||
do_sample=True,
|
||||
temperature=0.7 # Température recommandée pour la cohérence
|
||||
)
|
||||
|
||||
# Affichage de la réponse
|
||||
print(result[0]['generated_text'])
|
||||
```
|
||||
|
||||
### Format d'Entrée Recommandé
|
||||
|
||||
Charlotte utilise un format de conversation simple pour le *prompt* :
|
||||
|
||||
`Prompt: <|user|> Votre question ici <|assistant|>`
|
||||
|
||||
-----
|
||||
|
||||
## 🚧 Limitations et Contraintes
|
||||
|
||||
Bien que très stable, Charlotte reste un LLM avec une spécialisation forte.
|
||||
|
||||
* **Connaissance Factuelle :** Charlotte n'est **pas un modèle encyclopédique**. Elle ne doit pas être utilisée pour des questions factuelles, historiques, ou scientifiques générales.
|
||||
* **Remplacement du Professionnel :** Charlotte est un **outil de soutien** et un **conseil éthique d'IA**. Elle ne remplace en aucun cas un thérapeute humain, un conseiller juridique, ou un expert en cybersécurité pour des questions critiques (comme elle l'affirme : "Je suis un **espace de discussion**, mais je ne suis pas un **soutien**.").
|
||||
* **Biais d'Alignement :** Le modèle est fortement aligné sur les valeurs d'éthique et de bienveillance définies par Clemylia.
|
||||
|
||||
-----
|
||||
|
||||
## 🌟 La Philosophie Charlotte
|
||||
|
||||
Charlotte est la preuve que l'IA peut être **spécialisée, éthique, et accessible**. Elle incarne la conviction que **la qualité de l'entraînement l'emporte sur la quantité des paramètres** pour un rôle défini.
|
||||
|
||||
**✨ Modèle de fine-tuning Deuxième génération**
|
||||
15
chat_template.jinja
Normal file
15
chat_template.jinja
Normal file
@@ -0,0 +1,15 @@
|
||||
{% for message in messages %}
|
||||
{% if message['role'] == 'user' %}
|
||||
{{ '<|user|>
|
||||
' + message['content'] + eos_token }}
|
||||
{% elif message['role'] == 'system' %}
|
||||
{{ '<|system|>
|
||||
' + message['content'] + eos_token }}
|
||||
{% elif message['role'] == 'assistant' %}
|
||||
{{ '<|assistant|>
|
||||
' + message['content'] + eos_token }}
|
||||
{% endif %}
|
||||
{% if loop.last and add_generation_prompt %}
|
||||
{{ '<|assistant|>' }}
|
||||
{% endif %}
|
||||
{% endfor %}
|
||||
30
config.json
Normal file
30
config.json
Normal file
@@ -0,0 +1,30 @@
|
||||
{
|
||||
"architectures": [
|
||||
"LlamaForCausalLM"
|
||||
],
|
||||
"attention_bias": false,
|
||||
"attention_dropout": 0.0,
|
||||
"bos_token_id": 1,
|
||||
"dtype": "bfloat16",
|
||||
"eos_token_id": 2,
|
||||
"head_dim": 64,
|
||||
"hidden_act": "silu",
|
||||
"hidden_size": 2048,
|
||||
"initializer_range": 0.02,
|
||||
"intermediate_size": 5632,
|
||||
"max_position_embeddings": 2048,
|
||||
"mlp_bias": false,
|
||||
"model_type": "llama",
|
||||
"num_attention_heads": 32,
|
||||
"num_hidden_layers": 22,
|
||||
"num_key_value_heads": 4,
|
||||
"pad_token_id": 2,
|
||||
"pretraining_tp": 1,
|
||||
"rms_norm_eps": 1e-05,
|
||||
"rope_scaling": null,
|
||||
"rope_theta": 10000.0,
|
||||
"tie_word_embeddings": false,
|
||||
"transformers_version": "4.57.1",
|
||||
"use_cache": false,
|
||||
"vocab_size": 32000
|
||||
}
|
||||
9
generation_config.json
Normal file
9
generation_config.json
Normal file
@@ -0,0 +1,9 @@
|
||||
{
|
||||
"bos_token_id": 1,
|
||||
"eos_token_id": [
|
||||
2
|
||||
],
|
||||
"max_length": 2048,
|
||||
"pad_token_id": 2,
|
||||
"transformers_version": "4.57.1"
|
||||
}
|
||||
3
model.safetensors
Normal file
3
model.safetensors
Normal file
@@ -0,0 +1,3 @@
|
||||
version https://git-lfs.github.com/spec/v1
|
||||
oid sha256:8e560c9314de421609dcb4112ac6a67f1cb3903885804d63d6b6a16dc5af9423
|
||||
size 2200119864
|
||||
24
special_tokens_map.json
Normal file
24
special_tokens_map.json
Normal file
@@ -0,0 +1,24 @@
|
||||
{
|
||||
"bos_token": {
|
||||
"content": "<s>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false
|
||||
},
|
||||
"eos_token": {
|
||||
"content": "</s>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false
|
||||
},
|
||||
"pad_token": "</s>",
|
||||
"unk_token": {
|
||||
"content": "<unk>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false
|
||||
}
|
||||
}
|
||||
277144
tokenizer.json
Normal file
277144
tokenizer.json
Normal file
File diff suppressed because it is too large
Load Diff
BIN
tokenizer.model
(Stored with Git LFS)
Normal file
BIN
tokenizer.model
(Stored with Git LFS)
Normal file
Binary file not shown.
43
tokenizer_config.json
Normal file
43
tokenizer_config.json
Normal file
@@ -0,0 +1,43 @@
|
||||
{
|
||||
"add_bos_token": true,
|
||||
"add_eos_token": false,
|
||||
"add_prefix_space": null,
|
||||
"added_tokens_decoder": {
|
||||
"0": {
|
||||
"content": "<unk>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false,
|
||||
"special": true
|
||||
},
|
||||
"1": {
|
||||
"content": "<s>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false,
|
||||
"special": true
|
||||
},
|
||||
"2": {
|
||||
"content": "</s>",
|
||||
"lstrip": false,
|
||||
"normalized": false,
|
||||
"rstrip": false,
|
||||
"single_word": false,
|
||||
"special": true
|
||||
}
|
||||
},
|
||||
"bos_token": "<s>",
|
||||
"clean_up_tokenization_spaces": false,
|
||||
"eos_token": "</s>",
|
||||
"extra_special_tokens": {},
|
||||
"legacy": false,
|
||||
"model_max_length": 2048,
|
||||
"pad_token": "</s>",
|
||||
"padding_side": "right",
|
||||
"sp_model_kwargs": {},
|
||||
"tokenizer_class": "LlamaTokenizer",
|
||||
"unk_token": "<unk>",
|
||||
"use_default_system_prompt": false
|
||||
}
|
||||
3
training_args.bin
Normal file
3
training_args.bin
Normal file
@@ -0,0 +1,3 @@
|
||||
version https://git-lfs.github.com/spec/v1
|
||||
oid sha256:935ad64ce73ddf5c30ceaba5a04a8160d38db2a759c01673beb90c6d83f4cff4
|
||||
size 5841
|
||||
Reference in New Issue
Block a user