初始化项目,由ModelHub XC社区提供模型
Model: HattoriHanzo1/Cerberus-4B-GGUF Source: Original Platform
This commit is contained in:
112
README.md
Normal file
112
README.md
Normal file
@@ -0,0 +1,112 @@
|
||||
---
|
||||
language:
|
||||
- pl
|
||||
- en
|
||||
license: apache-2.0
|
||||
base_model: Qwen/Qwen3-4B
|
||||
tags:
|
||||
- polish
|
||||
- chain-of-thought
|
||||
- reasoning
|
||||
- unsloth
|
||||
- llama-cpp
|
||||
- gguf
|
||||
- text-generation
|
||||
- qwen3
|
||||
- finetuned
|
||||
pipeline_tag: text-generation
|
||||
---
|
||||
|
||||
<p align="center">
|
||||
<img src="https://cdn-uploads.huggingface.co/production/uploads/68d1c6c3ea1c2d4e3c3df3f6/mMATq6mOBrzP5czbr5lSr.png" alt="Cerberus-4B" width="800"/>
|
||||
</p>
|
||||
<p align="center">
|
||||
<em><strong><font size="8" color="red">Cerberus-4B</font></strong></em>
|
||||
<br>
|
||||
<a href="https://www.youtube.com/shorts/lTOMZEDjEC4">
|
||||
<em><strong>Cerberus non dormit — veritas sine pretio non datur...</strong></em>
|
||||
</a>
|
||||
</p>
|
||||
|
||||
## Κέρβερος — ὁ φύλαξ τῆς ἀληθείας
|
||||
*Cerber — strażnik prawdy*
|
||||
Cerberus-4B to model językowy z natywnym wsparciem Chain-of-Thought, wykuty w treningu na starannie wyselekcjonowanych danych. Jak jego mityczny imiennik — nie przepuści byle czego. Każda odpowiedź poprzedzona jest rozumowaniem.
|
||||
|
||||
## ⚔️ Geneza
|
||||
Nikt nie rodzi się strażnikiem. Cerberus przeszedł przez wszystkie poziomy :
|
||||
|
||||
| Faza | LR | Scheduler | Kroki | Cel |
|
||||
|------|-----|-----------|-------|-----|
|
||||
| I | 2e-4 | linear | 1500 | Wstępne opanowanie formatu CoT |
|
||||
| II | 3e-5 | constant | 1500 | Konsolidacja wiedzy i rozumowania |
|
||||
| III | 1e-5 | cosine | 1500 | Szlif — precyzja i głębia |
|
||||
| IV | humanistyczny | constant | 1500 | Dusza — język, finezja, polot |
|
||||
|
||||
Baza: **Qwen3-4B** z natywnym tokenem `<think>` — architektura stworzona do rozumowania.
|
||||
|
||||
## 🧠 Czym jest Cerberus?
|
||||
|
||||
- **Polski model CoT** — myśli po polsku, rozumuje po polsku, odpowiada po polsku — ale dychy na piwo Ci nie pożyczy 🍺
|
||||
- **Chain-of-Thought** — każda odpowiedź zawiera jawny proces myślowy w bloku `<think>`
|
||||
- **Wiedza ogólna + humanistyka** — nauki ścisłe, historia, filozofia, sztuka
|
||||
- **Wykształcony na destylowanych danych** — nie ilość, lecz jakość
|
||||
---
|
||||
## 💬 Format promptowania
|
||||
|
||||
```
|
||||
<|im_start|>user
|
||||
Twoje pytanie tutaj<|im_end|>
|
||||
<|im_start|>assistant
|
||||
<think>
|
||||
...rozumowanie modelu...
|
||||
</think>
|
||||
Odpowiedź
|
||||
```
|
||||
## 📦 Dostępne kwantyzacje
|
||||
|
||||
| Plik | Rozmiar | Zastosowanie |
|
||||
|------|---------|--------------|
|
||||
| Cerberus-4b.F16.gguf | ~8.0 GB | Referencyjna, pełna precyzja |
|
||||
| Cerberus-4b.Q8_0.gguf | ~4.3 GB | Wysoka jakość |
|
||||
| Cerberus-4b.Q6_K.gguf | ~3.3 GB | Zalecana — jakość vs rozmiar |
|
||||
| Cerberus-4b.Q5_K_M.gguf | ~2.9 GB | Dobry balans |
|
||||
| Cerberus-4b.Q5_K_S.gguf | ~2.7 GB | Szybsza wersja Q5 |
|
||||
| Cerberus-4b.Q4_K_M.gguf | ~2.5 GB | Codzienny użytek |
|
||||
| Cerberus-4b.Q4_K_S.gguf | ~2.4 GB | Lekka wersja Q4 |
|
||||
| Cerberus-4b.IQ4_XS.gguf | ~2.2 GB | Minimalistyczna |
|
||||
| Cerberus-4b.Q3_K_M.gguf | ~1.9 GB | Urządzenia mobilne |
|
||||
|
||||
## 🔧 Uruchomienie (llama.cpp)
|
||||
```bash
|
||||
llama-cli \
|
||||
-m Cerberus-4b.Q6_K.gguf \
|
||||
-p "<|im_start|>user\nCzym jest absurd według Camusa?<|im_end|>\n<|im_start|>assistant\n" \
|
||||
-n 512 \
|
||||
--temp 0.7 \
|
||||
--repeat-penalty 1.1
|
||||
```
|
||||
## 🖥️ Wymagania sprzętowe
|
||||
| Kwantyzacja | Min. VRAM / RAM |
|
||||
|-------------|----------------|
|
||||
| Q4_K_M | 4 GB |
|
||||
| Q6_K | 6 GB |
|
||||
| Q8_0 | 8 GB |
|
||||
| F16 | 16 GB |
|
||||
|
||||
## 📊 Dane treningowe
|
||||
|
||||
- **Polski CoT** — wiedza ogólna, nauki ścisłe, lingwistyka, filozofia (25k rekordów)
|
||||
- **Polski instruct** — ogólny instruct po polsku (13k rekordów)
|
||||
- **Humanistyczny szlif** — sztuka, filozofia, finezja językowa (7k rekordów)
|
||||
|
||||
## ⚠️ Ograniczenia
|
||||
- Model trenowany głównie na języku polskim — angielski działa ale nie jest priorytetem
|
||||
- Wiedza ograniczona do danych treningowych modelu bazowego (Qwen3-4B)
|
||||
- Nie zastępuje profesjonalnej porady medycznej, prawnej ani finansowej
|
||||
|
||||
|
||||
<p align="center">
|
||||
<em><font size="8"><strong> Τότε ἐν τῇ σκιᾷ μαχούμεθα </strong></font></em>
|
||||
<br>
|
||||
<em><font size="2" color="silver"><em></em>HattoriHanzo1 — Authentic Shinobi Tech ...</font></em>
|
||||
</p>
|
||||
Reference in New Issue
Block a user