初始化项目,由ModelHub XC社区提供模型
Model: HattoriHanzo1/Cerberus-4B-GGUF Source: Original Platform
This commit is contained in:
44
.gitattributes
vendored
Normal file
44
.gitattributes
vendored
Normal file
@@ -0,0 +1,44 @@
|
|||||||
|
*.7z filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.arrow filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.bin filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.bz2 filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.ckpt filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.ftz filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.gz filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.h5 filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.joblib filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.lfs.* filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.mlmodel filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.model filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.msgpack filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.npy filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.npz filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.onnx filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.ot filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.parquet filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.pb filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.pickle filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.pkl filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.pt filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.pth filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.rar filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.safetensors filter=lfs diff=lfs merge=lfs -text
|
||||||
|
saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.tar.* filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.tar filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.tflite filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.tgz filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.wasm filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.xz filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.zip filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*.zst filter=lfs diff=lfs merge=lfs -text
|
||||||
|
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.F16.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q8_0.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
|
Cerberus-4b.IQ4_XS.gguf filter=lfs diff=lfs merge=lfs -text
|
||||||
3
Cerberus-4b.F16.gguf
Normal file
3
Cerberus-4b.F16.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:6f0402a35d3930612e678646c67012414e03ae9c2e879ec16cf692618952449e
|
||||||
|
size 8051285248
|
||||||
3
Cerberus-4b.IQ4_XS.gguf
Normal file
3
Cerberus-4b.IQ4_XS.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:1ee6bc5e219dbe43e5751f26b8585f1ca2ec8033bfe6cb9a80ba6006101b2fbe
|
||||||
|
size 2286316288
|
||||||
3
Cerberus-4b.Q3_K_M.gguf
Normal file
3
Cerberus-4b.Q3_K_M.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:1b2e30144f4c81d20bc687de39f9c1de660bd98dc0692dc2db0b813cbd7c2d1e
|
||||||
|
size 2075618048
|
||||||
3
Cerberus-4b.Q4_K_M.gguf
Normal file
3
Cerberus-4b.Q4_K_M.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:4a92081da7d374d4c3f9318e2dd6cab2f0b1ed8bb675f76be9bdfefcad5e6d73
|
||||||
|
size 2497280768
|
||||||
3
Cerberus-4b.Q4_K_S.gguf
Normal file
3
Cerberus-4b.Q4_K_S.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:76c2048142d12dcc373fa970fe65b8f84b3c5b7def05f40e1f76a560cf699058
|
||||||
|
size 2383309568
|
||||||
3
Cerberus-4b.Q5_K_M.gguf
Normal file
3
Cerberus-4b.Q5_K_M.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:874b28e8ce55fc88c0432e491fd8ee8fd7179c1e7a5df1ee35fda7c1444cf50e
|
||||||
|
size 2889513728
|
||||||
3
Cerberus-4b.Q5_K_S.gguf
Normal file
3
Cerberus-4b.Q5_K_S.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:26c0ef4d6dabfd1294fb6edebc3047ea8f2589b36be58bf8edf01ba88b77d9d8
|
||||||
|
size 2823711488
|
||||||
3
Cerberus-4b.Q6_K.gguf
Normal file
3
Cerberus-4b.Q6_K.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:a9859c9929a4637b64e9fb40ed8593037ef837558bd147bd09b25e58bef135fa
|
||||||
|
size 3306261248
|
||||||
3
Cerberus-4b.Q8_0.gguf
Normal file
3
Cerberus-4b.Q8_0.gguf
Normal file
@@ -0,0 +1,3 @@
|
|||||||
|
version https://git-lfs.github.com/spec/v1
|
||||||
|
oid sha256:6d04e48699966c207aefc14ad359ffe42d6eeed6118cb174c18a9515270a9a7a
|
||||||
|
size 4280405248
|
||||||
112
README.md
Normal file
112
README.md
Normal file
@@ -0,0 +1,112 @@
|
|||||||
|
---
|
||||||
|
language:
|
||||||
|
- pl
|
||||||
|
- en
|
||||||
|
license: apache-2.0
|
||||||
|
base_model: Qwen/Qwen3-4B
|
||||||
|
tags:
|
||||||
|
- polish
|
||||||
|
- chain-of-thought
|
||||||
|
- reasoning
|
||||||
|
- unsloth
|
||||||
|
- llama-cpp
|
||||||
|
- gguf
|
||||||
|
- text-generation
|
||||||
|
- qwen3
|
||||||
|
- finetuned
|
||||||
|
pipeline_tag: text-generation
|
||||||
|
---
|
||||||
|
|
||||||
|
<p align="center">
|
||||||
|
<img src="https://cdn-uploads.huggingface.co/production/uploads/68d1c6c3ea1c2d4e3c3df3f6/mMATq6mOBrzP5czbr5lSr.png" alt="Cerberus-4B" width="800"/>
|
||||||
|
</p>
|
||||||
|
<p align="center">
|
||||||
|
<em><strong><font size="8" color="red">Cerberus-4B</font></strong></em>
|
||||||
|
<br>
|
||||||
|
<a href="https://www.youtube.com/shorts/lTOMZEDjEC4">
|
||||||
|
<em><strong>Cerberus non dormit — veritas sine pretio non datur...</strong></em>
|
||||||
|
</a>
|
||||||
|
</p>
|
||||||
|
|
||||||
|
## Κέρβερος — ὁ φύλαξ τῆς ἀληθείας
|
||||||
|
*Cerber — strażnik prawdy*
|
||||||
|
Cerberus-4B to model językowy z natywnym wsparciem Chain-of-Thought, wykuty w treningu na starannie wyselekcjonowanych danych. Jak jego mityczny imiennik — nie przepuści byle czego. Każda odpowiedź poprzedzona jest rozumowaniem.
|
||||||
|
|
||||||
|
## ⚔️ Geneza
|
||||||
|
Nikt nie rodzi się strażnikiem. Cerberus przeszedł przez wszystkie poziomy :
|
||||||
|
|
||||||
|
| Faza | LR | Scheduler | Kroki | Cel |
|
||||||
|
|------|-----|-----------|-------|-----|
|
||||||
|
| I | 2e-4 | linear | 1500 | Wstępne opanowanie formatu CoT |
|
||||||
|
| II | 3e-5 | constant | 1500 | Konsolidacja wiedzy i rozumowania |
|
||||||
|
| III | 1e-5 | cosine | 1500 | Szlif — precyzja i głębia |
|
||||||
|
| IV | humanistyczny | constant | 1500 | Dusza — język, finezja, polot |
|
||||||
|
|
||||||
|
Baza: **Qwen3-4B** z natywnym tokenem `<think>` — architektura stworzona do rozumowania.
|
||||||
|
|
||||||
|
## 🧠 Czym jest Cerberus?
|
||||||
|
|
||||||
|
- **Polski model CoT** — myśli po polsku, rozumuje po polsku, odpowiada po polsku — ale dychy na piwo Ci nie pożyczy 🍺
|
||||||
|
- **Chain-of-Thought** — każda odpowiedź zawiera jawny proces myślowy w bloku `<think>`
|
||||||
|
- **Wiedza ogólna + humanistyka** — nauki ścisłe, historia, filozofia, sztuka
|
||||||
|
- **Wykształcony na destylowanych danych** — nie ilość, lecz jakość
|
||||||
|
---
|
||||||
|
## 💬 Format promptowania
|
||||||
|
|
||||||
|
```
|
||||||
|
<|im_start|>user
|
||||||
|
Twoje pytanie tutaj<|im_end|>
|
||||||
|
<|im_start|>assistant
|
||||||
|
<think>
|
||||||
|
...rozumowanie modelu...
|
||||||
|
</think>
|
||||||
|
Odpowiedź
|
||||||
|
```
|
||||||
|
## 📦 Dostępne kwantyzacje
|
||||||
|
|
||||||
|
| Plik | Rozmiar | Zastosowanie |
|
||||||
|
|------|---------|--------------|
|
||||||
|
| Cerberus-4b.F16.gguf | ~8.0 GB | Referencyjna, pełna precyzja |
|
||||||
|
| Cerberus-4b.Q8_0.gguf | ~4.3 GB | Wysoka jakość |
|
||||||
|
| Cerberus-4b.Q6_K.gguf | ~3.3 GB | Zalecana — jakość vs rozmiar |
|
||||||
|
| Cerberus-4b.Q5_K_M.gguf | ~2.9 GB | Dobry balans |
|
||||||
|
| Cerberus-4b.Q5_K_S.gguf | ~2.7 GB | Szybsza wersja Q5 |
|
||||||
|
| Cerberus-4b.Q4_K_M.gguf | ~2.5 GB | Codzienny użytek |
|
||||||
|
| Cerberus-4b.Q4_K_S.gguf | ~2.4 GB | Lekka wersja Q4 |
|
||||||
|
| Cerberus-4b.IQ4_XS.gguf | ~2.2 GB | Minimalistyczna |
|
||||||
|
| Cerberus-4b.Q3_K_M.gguf | ~1.9 GB | Urządzenia mobilne |
|
||||||
|
|
||||||
|
## 🔧 Uruchomienie (llama.cpp)
|
||||||
|
```bash
|
||||||
|
llama-cli \
|
||||||
|
-m Cerberus-4b.Q6_K.gguf \
|
||||||
|
-p "<|im_start|>user\nCzym jest absurd według Camusa?<|im_end|>\n<|im_start|>assistant\n" \
|
||||||
|
-n 512 \
|
||||||
|
--temp 0.7 \
|
||||||
|
--repeat-penalty 1.1
|
||||||
|
```
|
||||||
|
## 🖥️ Wymagania sprzętowe
|
||||||
|
| Kwantyzacja | Min. VRAM / RAM |
|
||||||
|
|-------------|----------------|
|
||||||
|
| Q4_K_M | 4 GB |
|
||||||
|
| Q6_K | 6 GB |
|
||||||
|
| Q8_0 | 8 GB |
|
||||||
|
| F16 | 16 GB |
|
||||||
|
|
||||||
|
## 📊 Dane treningowe
|
||||||
|
|
||||||
|
- **Polski CoT** — wiedza ogólna, nauki ścisłe, lingwistyka, filozofia (25k rekordów)
|
||||||
|
- **Polski instruct** — ogólny instruct po polsku (13k rekordów)
|
||||||
|
- **Humanistyczny szlif** — sztuka, filozofia, finezja językowa (7k rekordów)
|
||||||
|
|
||||||
|
## ⚠️ Ograniczenia
|
||||||
|
- Model trenowany głównie na języku polskim — angielski działa ale nie jest priorytetem
|
||||||
|
- Wiedza ograniczona do danych treningowych modelu bazowego (Qwen3-4B)
|
||||||
|
- Nie zastępuje profesjonalnej porady medycznej, prawnej ani finansowej
|
||||||
|
|
||||||
|
|
||||||
|
<p align="center">
|
||||||
|
<em><font size="8"><strong> Τότε ἐν τῇ σκιᾷ μαχούμεθα </strong></font></em>
|
||||||
|
<br>
|
||||||
|
<em><font size="2" color="silver"><em></em>HattoriHanzo1 — Authentic Shinobi Tech ...</font></em>
|
||||||
|
</p>
|
||||||
Reference in New Issue
Block a user