初始化项目，由ModelHub XC社区提供模型

Model: ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF Source: Original Platform
2026-04-26 13:22:15 +08:00
commit f759f6b186
15 changed files with 168 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,36 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gguf filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/22
+++ b/22
@@ -0,0 +1,22 @@
+
+ MIT License
+
+Copyright (c) 2025 Hayk Grigorian 
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.
--- a/README.md
+++ b/README.md
@@ -0,0 +1,74 @@
+---
+base_model: haykgrigorian/TimeCapsuleLLM-v2-llama-1.2B
+language:
+- en
+library_name: transformers
+license: mit
+datasets:
+- postgrammar/london-llm-1800
+quantized_by: ncky
+tags:
+- text-generation-inference
+- transformers
+- llama
+- gguf
+- historical
+---
+## About
+
+static and imatrix-assisted GGUF quants of https://huggingface.co/haykgrigorian/TimeCapsuleLLM-v2-llama-1.2B.
+
+Generated with `llama.cpp` build `8044` (`91ea5d67f`).
+
+`IQ4_XS` was quantized with an imatrix generated on 19th-century public-domain English text.
+
+Note: this model has FFN dimensions (`5504`) not divisible by `256`, so `llama.cpp` applied fallback quantization to 22 tensors for K/IQ quant types.
+
+## Base Model Info (from original model card)
+
+Source: https://huggingface.co/haykgrigorian/TimeCapsuleLLM-v2-llama-1.2B
+
+| Detail | Value |
+| :--- | :--- |
+| Model Architecture | LlamaForCausalLM (decoder-only transformer) |
+| Parameter Count | ~1.22B |
+| Training Type | Trained from scratch (random initialization) |
+| Tokenizer | Custom BPE, vocab size 32,000 |
+| Sequence Length | 2048 |
+| Attention Type | Grouped Query Attention (16 Q heads / 8 KV heads) |
+| Hidden Size | 2048 |
+| Intermediate Size | 5504 |
+| Layers | 22 |
+
+Training details reported by the source model card:
+- Final training loss: 3.3951
+- Start training loss: 10.7932
+- Training steps: 182,000
+- Epochs: 0.4997
+- Training time: 117h 51m
+- Reported training cost: $340.97 on an H100 SXM (RunPod)
+
+## Usage
+
+If you are unsure how to use GGUF files, refer to one of [TheBloke's
+READMEs](https://huggingface.co/TheBloke/KafkaLM-70B-German-V0.1-GGUF) for
+more details.
+
+## Provided Quants
+
+(sorted by size, not necessarily quality)
+
+| Link | Type | Size/GB | Notes |
+|:-----|:-----|--------:|:------|
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q2_K.gguf) | Q2_K | 0.5 | smallest |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_S.gguf) | Q3_K_S | 0.6 | low VRAM |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_M.gguf) | Q3_K_M | 0.6 | balanced low size |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_L.gguf) | Q3_K_L | 0.6 | better than Q3_K_M |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.IQ4_XS.gguf) | IQ4_XS | 0.6 | imatrix, recommended at this size |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_S.gguf) | Q4_K_S | 0.7 | fast, recommended |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_M.gguf) | Q4_K_M | 0.7 | fast, recommended |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_S.gguf) | Q5_K_S | 0.8 | higher quality |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_M.gguf) | Q5_K_M | 0.9 | higher quality |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q6_K.gguf) | Q6_K | 1.0 | very good quality |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.Q8_0.gguf) | Q8_0 | 1.2 | fast, best quality |
+| [GGUF](https://huggingface.co/ncky/TimeCapsuleLLM-v2-llama-1.2B-GGUF/resolve/main/TimeCapsuleLLM-v2-llama-1.2B.f16.gguf) | f16 | 2.3 | 16 bpw, overkill |
--- a/TimeCapsuleLLM-v2-llama-1.2B.IQ4_XS.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.IQ4_XS.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:d05c21b73302c793309c70ff73ba15dd2ebf07a762afb954229f724067d26564
+size 640110144
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q2_K.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q2_K.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:5b36c18295248f6304319eef6e2537df004d6141b0821ec97761a21e9ab83a4b
+size 483880256
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_L.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_L.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:07288a61b20f4577d9964a3c66c35c1a77e5c9d0319bdf7d7dcab8704fe6e88a
+size 637148480
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_M.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_M.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:fbe04bb34267f0f5d921b586f8e12590044aa6a0e0aa2db19fc5da46ca817b70
+size 605576512
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_S.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q3_K_S.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:3f73f828eabf9f003e57febb49e6904dd4226e04492c1fe2250d49769057ce96
+size 554966336
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_M.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_M.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:27edbf86d3992f5f90b219536f7459bcaba367f8c8e1648525c2d391b6a24b02
+size 744983872
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_S.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q4_K_S.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:fdb72343232ff405728226b59e8ca73e69a04e88cb71535cb140ee0a658b6b20
+size 699764032
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_M.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_M.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:8cc2a0f1ded7d8034d4ce5767823e45e5f47445388042620171ba9e1e51d28ca
+size 855608640
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_S.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q5_K_S.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:61b5552f2fc3a56bf531a02373d3ecf5bacf5b59359bb8b8f5be0db6d9b3647a
+size 817597760
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q6_K.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q6_K.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:7ac40f9e341ee003e14a564b2ce53988c7e0dd494af1edb6c406344fff54a939
+size 1006435648
--- a/TimeCapsuleLLM-v2-llama-1.2B.Q8_0.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.Q8_0.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:a100a4b1c5fc71f3bab18c3d84c44ea35ce0fbce488c58ca151a18b190298fb1
+size 1225342272
--- a/TimeCapsuleLLM-v2-llama-1.2B.f16.gguf
+++ b/TimeCapsuleLLM-v2-llama-1.2B.f16.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:637ed650b1cb44dcc5cdbb12119e2fba1923a348550af759b2c7517a9c445989
+size 2305211712