初始化项目，由ModelHub XC社区提供模型

Model: Lewdiculous/Erosumika-7B-v2-GGUF-IQ-Imatrix Source: Original Platform
2026-05-16 11:18:47 +08:00
commit 7cee579aad
15 changed files with 2514 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,47 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-F16.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-IQ3_M-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-IQ3_S-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-IQ3_XXS-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-IQ4_XS-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q4_K_M-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q4_K_S-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q5_K_M-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q5_K_S-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q6_K-imat.gguf filter=lfs diff=lfs merge=lfs -text
+Erosumika-7B-v2-Q8_0-imat.gguf filter=lfs diff=lfs merge=lfs -text
+imatrix.dat filter=lfs diff=lfs merge=lfs -text
--- a/Erosumika-7B-v2-F16.gguf
+++ b/Erosumika-7B-v2-F16.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:364f31375bbb6fc153e436b1fbb5cb702ccd7af7500b9ab15743bf7effe420bf
+size 14484731616
--- a/Erosumika-7B-v2-IQ3_M-imat.gguf
+++ b/Erosumika-7B-v2-IQ3_M-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:ed7601a8da76c0e5bf00dd851f17e576fb05004f42dd4ab290c47d4d49d146b3
+size 3284891392
--- a/Erosumika-7B-v2-IQ3_S-imat.gguf
+++ b/Erosumika-7B-v2-IQ3_S-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:169078dc83c7a470ab763966744281ec80aa879de4c159ed921899878d5bf2f3
+size 3182393088
--- a/Erosumika-7B-v2-IQ3_XXS-imat.gguf
+++ b/Erosumika-7B-v2-IQ3_XXS-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:931baa1465af8d9a5ef4e6947078208bfe2a94d245e198582a824716f7ba453c
+size 2827343616
--- a/Erosumika-7B-v2-IQ4_XS-imat.gguf
+++ b/Erosumika-7B-v2-IQ4_XS-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:f0e80eb8f2a96cb553c4857e20379b01aa889d79f35b6c9fd3e6acee7c145b11
+size 3907688192
--- a/Erosumika-7B-v2-Q4_K_M-imat.gguf
+++ b/Erosumika-7B-v2-Q4_K_M-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:ff4af1c659353ad1db49554730b43d20b59a92fb86f0b0162743f182811c2446
+size 4368439040
--- a/Erosumika-7B-v2-Q4_K_S-imat.gguf
+++ b/Erosumika-7B-v2-Q4_K_S-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:50429ff0ab74a85707a0201e113d134a783dcba431d77be576a0b847fc39bcfa
+size 4140373760
--- a/Erosumika-7B-v2-Q5_K_M-imat.gguf
+++ b/Erosumika-7B-v2-Q5_K_M-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:2ae9d23e45013a661356d39710f64f6d08f4385eb020bea8b7c04f1e7e00ba1d
+size 5131409152
--- a/Erosumika-7B-v2-Q5_K_S-imat.gguf
+++ b/Erosumika-7B-v2-Q5_K_S-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:340543c7b07c5ef1205a99b79bcf25ab3bad0d839132bd285145aac2047065b8
+size 4997715712
--- a/Erosumika-7B-v2-Q6_K-imat.gguf
+++ b/Erosumika-7B-v2-Q6_K-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:38204892e4f2d197c58fbd5733eff9dfe83d26145641cc28c58bd724a6961d42
+size 5942064896
--- a/Erosumika-7B-v2-Q8_0-imat.gguf
+++ b/Erosumika-7B-v2-Q8_0-imat.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:3b15fb890018d138d293c2ef15e6e2fa00c26a47c39bc04060cf51a6bfd81fd6
+size 7695857408
--- a/README.md
+++ b/README.md
@@ -0,0 +1,85 @@
+---
+language:
+- en
+pipeline_tag: text-generation
+tags:
+- text-generation-inference
+- instruct
+- conversational
+- roleplay
+- sillytavern
+- gguf
+- anime
+- quantized
+- mistral
+license: cc-by-4.0
+---
+
+# **THIS VERSION IS NOW DEPRECATED. USE V3-0.2. V2 HAS PROBLEMS WITH ALIGNMENT AND THE NEW VERSION IS A SUBSTANTIAL IMPROVMENT!**
+
+This repository hosts deprecated GGUF-IQ-Imatrix quants for [localfultonextractor/Erosumika-7B-v2](https://huggingface.co/localfultonextractor/Erosumika-7B-v2).
+
+*"Better, smarter erosexika!!"*
+
+[Quantized as per user request.](https://huggingface.co/Lewdiculous/Model-Requests/discussions/19)
+
+Quants:
+```python
+    quantization_options = [
+        "Q4_K_M", "Q4_K_S", "IQ4_XS", "Q5_K_M", "Q5_K_S",
+        "Q6_K", "Q8_0", "IQ3_M", "IQ3_S", "IQ3_XXS"
+    ]
+```
+
+**What does "Imatrix" mean?**
+
+It stands for **Importance Matrix**, a technique used to improve the quality of quantized models.
+The **Imatrix** is calculated based on calibration data, and it helps determine the importance of different model activations during the quantization process.
+The idea is to preserve the most important information during quantization, which can help reduce the loss of model performance, especially when the calibration data is diverse.
+[[1]](https://github.com/ggerganov/llama.cpp/discussions/5006) [[2]](https://github.com/ggerganov/llama.cpp/discussions/5263#discussioncomment-8395384)
+
+For imatrix data generation, kalomaze's `groups_merged.txt` with added roleplay chats was used, you can find it [here](https://huggingface.co/Lewdiculous/Datura_7B-GGUF-Imatrix/blob/main/imatrix-with-rp-format-data.txt). This was just to add a bit more diversity to the data.
+
+**Steps:**
+
+```
+Base⇢ GGUF(F16)⇢ Imatrix-Data(F16)⇢ GGUF(Imatrix-Quants)
+```
+*Using the latest llama.cpp at the time.*
+
+# Original model information:
+
+<h1 style="text-align: center">Erosumika-7B-v2</h1>
+
+![image/gif](https://cdn-uploads.huggingface.co/production/uploads/65d4cf2693a0a3744a27536c/jkrt-bDxaI9Z-V-9fBTbx.gif)
+
+## Model Details
+A DARE TIES merge between Nitral's [Kunocchini-7b](https://huggingface.co/Nitral-AI/Kunocchini-7b-128k-test), Epiculous' [Mika-7B](https://huggingface.co/Epiculous/Mika-7B) and my [FlatErosAlpha](https://huggingface.co/localfultonextractor/FlatErosAlpha), a flattened(in order to keep the vocab size 32000) version of tavtav's [eros-7B-ALPHA](https://huggingface.co/tavtav/eros-7B-ALPHA). In my brief testing, v2 is a significant improvement over the original Erosumika; I guess it won the DARE TIES lottery. Alpaca and Mistral seem to work best. Chat-ML might also work but I expect it to never end generations. Anything goes! 
+
+Due to it being an experimental model, there are some quirks...
+
+- Rare occasion to misspell words
+- Very rare occasion to have random formatting artifact at the end of generations
+
+[GGUF quants](https://huggingface.co/localfultonextractor/Erosumika-7B-v2-GGUF)
+
+## Limitations and biases
+The intended use-case for this model is fictional writing for entertainment purposes. Any other sort of usage is out of scope. 
+It may produce socially unacceptable or undesirable text, even if the prompt itself does not include anything explicitly offensive. Outputs might often be factually wrong or misleading.
+
+
+```yaml
+base_model: localfultonextractor/FlatErosAlpha
+models:
+  - model: localfultonextractor/FlatErosAlpha
+  - model: Epiculous/Mika-7B
+    parameters:
+      density: 0.5
+      weight: 0.25
+  - model: Nitral-AI/Kunocchini-7b
+    parameters:
+      density: 0.5
+      weight: 0.75
+merge_method: dare_ties
+dtype: bfloat16
+```
--- a/imatrix-with-rp-data.txt
+++ b/imatrix-with-rp-data.txt
--- a/imatrix.dat
+++ b/imatrix.dat
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:dd86ff91a511460dd671779b92f0e5bb818f21317fecc931cb7203f8aa289b1c
+size 4988126