113 lines
3.8 KiB
Markdown
113 lines
3.8 KiB
Markdown
|
|
---
|
||
|
|
language:
|
||
|
|
- pl
|
||
|
|
- en
|
||
|
|
license: apache-2.0
|
||
|
|
base_model: Qwen/Qwen3-4B
|
||
|
|
tags:
|
||
|
|
- polish
|
||
|
|
- chain-of-thought
|
||
|
|
- reasoning
|
||
|
|
- unsloth
|
||
|
|
- llama-cpp
|
||
|
|
- gguf
|
||
|
|
- text-generation
|
||
|
|
- qwen3
|
||
|
|
- finetuned
|
||
|
|
pipeline_tag: text-generation
|
||
|
|
---
|
||
|
|
|
||
|
|
<p align="center">
|
||
|
|
<img src="https://cdn-uploads.huggingface.co/production/uploads/68d1c6c3ea1c2d4e3c3df3f6/mMATq6mOBrzP5czbr5lSr.png" alt="Cerberus-4B" width="800"/>
|
||
|
|
</p>
|
||
|
|
<p align="center">
|
||
|
|
<em><strong><font size="8" color="red">Cerberus-4B</font></strong></em>
|
||
|
|
<br>
|
||
|
|
<a href="https://www.youtube.com/shorts/lTOMZEDjEC4">
|
||
|
|
<em><strong>Cerberus non dormit — veritas sine pretio non datur...</strong></em>
|
||
|
|
</a>
|
||
|
|
</p>
|
||
|
|
|
||
|
|
## Κέρβερος — ὁ φύλαξ τῆς ἀληθείας
|
||
|
|
*Cerber — strażnik prawdy*
|
||
|
|
Cerberus-4B to model językowy z natywnym wsparciem Chain-of-Thought, wykuty w treningu na starannie wyselekcjonowanych danych. Jak jego mityczny imiennik — nie przepuści byle czego. Każda odpowiedź poprzedzona jest rozumowaniem.
|
||
|
|
|
||
|
|
## ⚔️ Geneza
|
||
|
|
Nikt nie rodzi się strażnikiem. Cerberus przeszedł przez wszystkie poziomy :
|
||
|
|
|
||
|
|
| Faza | LR | Scheduler | Kroki | Cel |
|
||
|
|
|------|-----|-----------|-------|-----|
|
||
|
|
| I | 2e-4 | linear | 1500 | Wstępne opanowanie formatu CoT |
|
||
|
|
| II | 3e-5 | constant | 1500 | Konsolidacja wiedzy i rozumowania |
|
||
|
|
| III | 1e-5 | cosine | 1500 | Szlif — precyzja i głębia |
|
||
|
|
| IV | humanistyczny | constant | 1500 | Dusza — język, finezja, polot |
|
||
|
|
|
||
|
|
Baza: **Qwen3-4B** z natywnym tokenem `<think>` — architektura stworzona do rozumowania.
|
||
|
|
|
||
|
|
## 🧠 Czym jest Cerberus?
|
||
|
|
|
||
|
|
- **Polski model CoT** — myśli po polsku, rozumuje po polsku, odpowiada po polsku — ale dychy na piwo Ci nie pożyczy 🍺
|
||
|
|
- **Chain-of-Thought** — każda odpowiedź zawiera jawny proces myślowy w bloku `<think>`
|
||
|
|
- **Wiedza ogólna + humanistyka** — nauki ścisłe, historia, filozofia, sztuka
|
||
|
|
- **Wykształcony na destylowanych danych** — nie ilość, lecz jakość
|
||
|
|
---
|
||
|
|
## 💬 Format promptowania
|
||
|
|
|
||
|
|
```
|
||
|
|
<|im_start|>user
|
||
|
|
Twoje pytanie tutaj<|im_end|>
|
||
|
|
<|im_start|>assistant
|
||
|
|
<think>
|
||
|
|
...rozumowanie modelu...
|
||
|
|
</think>
|
||
|
|
Odpowiedź
|
||
|
|
```
|
||
|
|
## 📦 Dostępne kwantyzacje
|
||
|
|
|
||
|
|
| Plik | Rozmiar | Zastosowanie |
|
||
|
|
|------|---------|--------------|
|
||
|
|
| Cerberus-4b.F16.gguf | ~8.0 GB | Referencyjna, pełna precyzja |
|
||
|
|
| Cerberus-4b.Q8_0.gguf | ~4.3 GB | Wysoka jakość |
|
||
|
|
| Cerberus-4b.Q6_K.gguf | ~3.3 GB | Zalecana — jakość vs rozmiar |
|
||
|
|
| Cerberus-4b.Q5_K_M.gguf | ~2.9 GB | Dobry balans |
|
||
|
|
| Cerberus-4b.Q5_K_S.gguf | ~2.7 GB | Szybsza wersja Q5 |
|
||
|
|
| Cerberus-4b.Q4_K_M.gguf | ~2.5 GB | Codzienny użytek |
|
||
|
|
| Cerberus-4b.Q4_K_S.gguf | ~2.4 GB | Lekka wersja Q4 |
|
||
|
|
| Cerberus-4b.IQ4_XS.gguf | ~2.2 GB | Minimalistyczna |
|
||
|
|
| Cerberus-4b.Q3_K_M.gguf | ~1.9 GB | Urządzenia mobilne |
|
||
|
|
|
||
|
|
## 🔧 Uruchomienie (llama.cpp)
|
||
|
|
```bash
|
||
|
|
llama-cli \
|
||
|
|
-m Cerberus-4b.Q6_K.gguf \
|
||
|
|
-p "<|im_start|>user\nCzym jest absurd według Camusa?<|im_end|>\n<|im_start|>assistant\n" \
|
||
|
|
-n 512 \
|
||
|
|
--temp 0.7 \
|
||
|
|
--repeat-penalty 1.1
|
||
|
|
```
|
||
|
|
## 🖥️ Wymagania sprzętowe
|
||
|
|
| Kwantyzacja | Min. VRAM / RAM |
|
||
|
|
|-------------|----------------|
|
||
|
|
| Q4_K_M | 4 GB |
|
||
|
|
| Q6_K | 6 GB |
|
||
|
|
| Q8_0 | 8 GB |
|
||
|
|
| F16 | 16 GB |
|
||
|
|
|
||
|
|
## 📊 Dane treningowe
|
||
|
|
|
||
|
|
- **Polski CoT** — wiedza ogólna, nauki ścisłe, lingwistyka, filozofia (25k rekordów)
|
||
|
|
- **Polski instruct** — ogólny instruct po polsku (13k rekordów)
|
||
|
|
- **Humanistyczny szlif** — sztuka, filozofia, finezja językowa (7k rekordów)
|
||
|
|
|
||
|
|
## ⚠️ Ograniczenia
|
||
|
|
- Model trenowany głównie na języku polskim — angielski działa ale nie jest priorytetem
|
||
|
|
- Wiedza ograniczona do danych treningowych modelu bazowego (Qwen3-4B)
|
||
|
|
- Nie zastępuje profesjonalnej porady medycznej, prawnej ani finansowej
|
||
|
|
|
||
|
|
|
||
|
|
<p align="center">
|
||
|
|
<em><font size="8"><strong> Τότε ἐν τῇ σκιᾷ μαχούμεθα </strong></font></em>
|
||
|
|
<br>
|
||
|
|
<em><font size="2" color="silver"><em></em>HattoriHanzo1 — Authentic Shinobi Tech ...</font></em>
|
||
|
|
</p>
|