From fc877d52c739a14f362db1a5f5b2cccbce9b59ce Mon Sep 17 00:00:00 2001 From: ModelHub XC Date: Wed, 6 May 2026 08:51:45 +0800 Subject: [PATCH] =?UTF-8?q?=E5=88=9D=E5=A7=8B=E5=8C=96=E9=A1=B9=E7=9B=AE?= =?UTF-8?q?=EF=BC=8C=E7=94=B1ModelHub=20XC=E7=A4=BE=E5=8C=BA=E6=8F=90?= =?UTF-8?q?=E4=BE=9B=E6=A8=A1=E5=9E=8B?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Model: HattoriHanzo1/Cerberus-4B-GGUF Source: Original Platform --- .gitattributes | 44 ++++++++++++++++ Cerberus-4b.F16.gguf | 3 ++ Cerberus-4b.IQ4_XS.gguf | 3 ++ Cerberus-4b.Q3_K_M.gguf | 3 ++ Cerberus-4b.Q4_K_M.gguf | 3 ++ Cerberus-4b.Q4_K_S.gguf | 3 ++ Cerberus-4b.Q5_K_M.gguf | 3 ++ Cerberus-4b.Q5_K_S.gguf | 3 ++ Cerberus-4b.Q6_K.gguf | 3 ++ Cerberus-4b.Q8_0.gguf | 3 ++ README.md | 112 ++++++++++++++++++++++++++++++++++++++++ 11 files changed, 183 insertions(+) create mode 100644 .gitattributes create mode 100644 Cerberus-4b.F16.gguf create mode 100644 Cerberus-4b.IQ4_XS.gguf create mode 100644 Cerberus-4b.Q3_K_M.gguf create mode 100644 Cerberus-4b.Q4_K_M.gguf create mode 100644 Cerberus-4b.Q4_K_S.gguf create mode 100644 Cerberus-4b.Q5_K_M.gguf create mode 100644 Cerberus-4b.Q5_K_S.gguf create mode 100644 Cerberus-4b.Q6_K.gguf create mode 100644 Cerberus-4b.Q8_0.gguf create mode 100644 README.md diff --git a/.gitattributes b/.gitattributes new file mode 100644 index 0000000..253b267 --- /dev/null +++ b/.gitattributes @@ -0,0 +1,44 @@ +*.7z filter=lfs diff=lfs merge=lfs -text +*.arrow filter=lfs diff=lfs merge=lfs -text +*.bin filter=lfs diff=lfs merge=lfs -text +*.bz2 filter=lfs diff=lfs merge=lfs -text +*.ckpt filter=lfs diff=lfs merge=lfs -text +*.ftz filter=lfs diff=lfs merge=lfs -text +*.gz filter=lfs diff=lfs merge=lfs -text +*.h5 filter=lfs diff=lfs merge=lfs -text +*.joblib filter=lfs diff=lfs merge=lfs -text +*.lfs.* filter=lfs diff=lfs merge=lfs -text +*.mlmodel filter=lfs diff=lfs merge=lfs -text +*.model filter=lfs diff=lfs merge=lfs -text +*.msgpack filter=lfs diff=lfs merge=lfs -text +*.npy filter=lfs diff=lfs merge=lfs -text +*.npz filter=lfs diff=lfs merge=lfs -text +*.onnx filter=lfs diff=lfs merge=lfs -text +*.ot filter=lfs diff=lfs merge=lfs -text +*.parquet filter=lfs diff=lfs merge=lfs -text +*.pb filter=lfs diff=lfs merge=lfs -text +*.pickle filter=lfs diff=lfs merge=lfs -text +*.pkl filter=lfs diff=lfs merge=lfs -text +*.pt filter=lfs diff=lfs merge=lfs -text +*.pth filter=lfs diff=lfs merge=lfs -text +*.rar filter=lfs diff=lfs merge=lfs -text +*.safetensors filter=lfs diff=lfs merge=lfs -text +saved_model/**/* filter=lfs diff=lfs merge=lfs -text +*.tar.* filter=lfs diff=lfs merge=lfs -text +*.tar filter=lfs diff=lfs merge=lfs -text +*.tflite filter=lfs diff=lfs merge=lfs -text +*.tgz filter=lfs diff=lfs merge=lfs -text +*.wasm filter=lfs diff=lfs merge=lfs -text +*.xz filter=lfs diff=lfs merge=lfs -text +*.zip filter=lfs diff=lfs merge=lfs -text +*.zst filter=lfs diff=lfs merge=lfs -text +*tfevents* filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.F16.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q8_0.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q6_K.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text +Cerberus-4b.IQ4_XS.gguf filter=lfs diff=lfs merge=lfs -text diff --git a/Cerberus-4b.F16.gguf b/Cerberus-4b.F16.gguf new file mode 100644 index 0000000..9451559 --- /dev/null +++ b/Cerberus-4b.F16.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:6f0402a35d3930612e678646c67012414e03ae9c2e879ec16cf692618952449e +size 8051285248 diff --git a/Cerberus-4b.IQ4_XS.gguf b/Cerberus-4b.IQ4_XS.gguf new file mode 100644 index 0000000..374ffd3 --- /dev/null +++ b/Cerberus-4b.IQ4_XS.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:1ee6bc5e219dbe43e5751f26b8585f1ca2ec8033bfe6cb9a80ba6006101b2fbe +size 2286316288 diff --git a/Cerberus-4b.Q3_K_M.gguf b/Cerberus-4b.Q3_K_M.gguf new file mode 100644 index 0000000..35e0515 --- /dev/null +++ b/Cerberus-4b.Q3_K_M.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:1b2e30144f4c81d20bc687de39f9c1de660bd98dc0692dc2db0b813cbd7c2d1e +size 2075618048 diff --git a/Cerberus-4b.Q4_K_M.gguf b/Cerberus-4b.Q4_K_M.gguf new file mode 100644 index 0000000..af87961 --- /dev/null +++ b/Cerberus-4b.Q4_K_M.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:4a92081da7d374d4c3f9318e2dd6cab2f0b1ed8bb675f76be9bdfefcad5e6d73 +size 2497280768 diff --git a/Cerberus-4b.Q4_K_S.gguf b/Cerberus-4b.Q4_K_S.gguf new file mode 100644 index 0000000..6b99aa8 --- /dev/null +++ b/Cerberus-4b.Q4_K_S.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:76c2048142d12dcc373fa970fe65b8f84b3c5b7def05f40e1f76a560cf699058 +size 2383309568 diff --git a/Cerberus-4b.Q5_K_M.gguf b/Cerberus-4b.Q5_K_M.gguf new file mode 100644 index 0000000..1b594d2 --- /dev/null +++ b/Cerberus-4b.Q5_K_M.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:874b28e8ce55fc88c0432e491fd8ee8fd7179c1e7a5df1ee35fda7c1444cf50e +size 2889513728 diff --git a/Cerberus-4b.Q5_K_S.gguf b/Cerberus-4b.Q5_K_S.gguf new file mode 100644 index 0000000..a4f0c2c --- /dev/null +++ b/Cerberus-4b.Q5_K_S.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:26c0ef4d6dabfd1294fb6edebc3047ea8f2589b36be58bf8edf01ba88b77d9d8 +size 2823711488 diff --git a/Cerberus-4b.Q6_K.gguf b/Cerberus-4b.Q6_K.gguf new file mode 100644 index 0000000..14e0b29 --- /dev/null +++ b/Cerberus-4b.Q6_K.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:a9859c9929a4637b64e9fb40ed8593037ef837558bd147bd09b25e58bef135fa +size 3306261248 diff --git a/Cerberus-4b.Q8_0.gguf b/Cerberus-4b.Q8_0.gguf new file mode 100644 index 0000000..1ffb1b1 --- /dev/null +++ b/Cerberus-4b.Q8_0.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:6d04e48699966c207aefc14ad359ffe42d6eeed6118cb174c18a9515270a9a7a +size 4280405248 diff --git a/README.md b/README.md new file mode 100644 index 0000000..7b05b42 --- /dev/null +++ b/README.md @@ -0,0 +1,112 @@ +--- +language: + - pl + - en +license: apache-2.0 +base_model: Qwen/Qwen3-4B +tags: + - polish + - chain-of-thought + - reasoning + - unsloth + - llama-cpp + - gguf + - text-generation + - qwen3 + - finetuned +pipeline_tag: text-generation +--- + +

+ Cerberus-4B +

+

+ Cerberus-4B +
+ + Cerberus non dormit — veritas sine pretio non datur... + +

+ +## Κέρβερος — ὁ φύλαξ τῆς ἀληθείας +*Cerber — strażnik prawdy* +Cerberus-4B to model językowy z natywnym wsparciem Chain-of-Thought, wykuty w treningu na starannie wyselekcjonowanych danych. Jak jego mityczny imiennik — nie przepuści byle czego. Każda odpowiedź poprzedzona jest rozumowaniem. + +## ⚔️ Geneza +Nikt nie rodzi się strażnikiem. Cerberus przeszedł przez wszystkie poziomy : + +| Faza | LR | Scheduler | Kroki | Cel | +|------|-----|-----------|-------|-----| +| I | 2e-4 | linear | 1500 | Wstępne opanowanie formatu CoT | +| II | 3e-5 | constant | 1500 | Konsolidacja wiedzy i rozumowania | +| III | 1e-5 | cosine | 1500 | Szlif — precyzja i głębia | +| IV | humanistyczny | constant | 1500 | Dusza — język, finezja, polot | + +Baza: **Qwen3-4B** z natywnym tokenem `` — architektura stworzona do rozumowania. + +## 🧠 Czym jest Cerberus? + +- **Polski model CoT** — myśli po polsku, rozumuje po polsku, odpowiada po polsku — ale dychy na piwo Ci nie pożyczy 🍺 +- **Chain-of-Thought** — każda odpowiedź zawiera jawny proces myślowy w bloku `` +- **Wiedza ogólna + humanistyka** — nauki ścisłe, historia, filozofia, sztuka +- **Wykształcony na destylowanych danych** — nie ilość, lecz jakość +--- +## 💬 Format promptowania + +``` +<|im_start|>user +Twoje pytanie tutaj<|im_end|> +<|im_start|>assistant + +...rozumowanie modelu... + +Odpowiedź +``` +## 📦 Dostępne kwantyzacje + +| Plik | Rozmiar | Zastosowanie | +|------|---------|--------------| +| Cerberus-4b.F16.gguf | ~8.0 GB | Referencyjna, pełna precyzja | +| Cerberus-4b.Q8_0.gguf | ~4.3 GB | Wysoka jakość | +| Cerberus-4b.Q6_K.gguf | ~3.3 GB | Zalecana — jakość vs rozmiar | +| Cerberus-4b.Q5_K_M.gguf | ~2.9 GB | Dobry balans | +| Cerberus-4b.Q5_K_S.gguf | ~2.7 GB | Szybsza wersja Q5 | +| Cerberus-4b.Q4_K_M.gguf | ~2.5 GB | Codzienny użytek | +| Cerberus-4b.Q4_K_S.gguf | ~2.4 GB | Lekka wersja Q4 | +| Cerberus-4b.IQ4_XS.gguf | ~2.2 GB | Minimalistyczna | +| Cerberus-4b.Q3_K_M.gguf | ~1.9 GB | Urządzenia mobilne | + +## 🔧 Uruchomienie (llama.cpp) +```bash +llama-cli \ + -m Cerberus-4b.Q6_K.gguf \ + -p "<|im_start|>user\nCzym jest absurd według Camusa?<|im_end|>\n<|im_start|>assistant\n" \ + -n 512 \ + --temp 0.7 \ + --repeat-penalty 1.1 +``` +## 🖥️ Wymagania sprzętowe +| Kwantyzacja | Min. VRAM / RAM | +|-------------|----------------| +| Q4_K_M | 4 GB | +| Q6_K | 6 GB | +| Q8_0 | 8 GB | +| F16 | 16 GB | + +## 📊 Dane treningowe + +- **Polski CoT** — wiedza ogólna, nauki ścisłe, lingwistyka, filozofia (25k rekordów) +- **Polski instruct** — ogólny instruct po polsku (13k rekordów) +- **Humanistyczny szlif** — sztuka, filozofia, finezja językowa (7k rekordów) + +## ⚠️ Ograniczenia +- Model trenowany głównie na języku polskim — angielski działa ale nie jest priorytetem +- Wiedza ograniczona do danych treningowych modelu bazowego (Qwen3-4B) +- Nie zastępuje profesjonalnej porady medycznej, prawnej ani finansowej + + +

+ Τότε ἐν τῇ σκιᾷ μαχούμεθα +
+ HattoriHanzo1 — Authentic Shinobi Tech ... +