初始化项目,由ModelHub XC社区提供模型

Model: lucianosb/sabia-7b-GGUF
Source: Original Platform
This commit is contained in:
ModelHub XC
2026-05-16 20:30:20 +08:00
commit 951cc8b409
7 changed files with 141 additions and 0 deletions

45
.gitattributes vendored Normal file
View File

@@ -0,0 +1,45 @@
*.7z filter=lfs diff=lfs merge=lfs -text
*.arrow filter=lfs diff=lfs merge=lfs -text
*.bin filter=lfs diff=lfs merge=lfs -text
*.bz2 filter=lfs diff=lfs merge=lfs -text
*.ckpt filter=lfs diff=lfs merge=lfs -text
*.ftz filter=lfs diff=lfs merge=lfs -text
*.gz filter=lfs diff=lfs merge=lfs -text
*.h5 filter=lfs diff=lfs merge=lfs -text
*.joblib filter=lfs diff=lfs merge=lfs -text
*.lfs.* filter=lfs diff=lfs merge=lfs -text
*.mlmodel filter=lfs diff=lfs merge=lfs -text
*.model filter=lfs diff=lfs merge=lfs -text
*.msgpack filter=lfs diff=lfs merge=lfs -text
*.npy filter=lfs diff=lfs merge=lfs -text
*.npz filter=lfs diff=lfs merge=lfs -text
*.onnx filter=lfs diff=lfs merge=lfs -text
*.ot filter=lfs diff=lfs merge=lfs -text
*.parquet filter=lfs diff=lfs merge=lfs -text
*.pb filter=lfs diff=lfs merge=lfs -text
*.pickle filter=lfs diff=lfs merge=lfs -text
*.pkl filter=lfs diff=lfs merge=lfs -text
*.pt filter=lfs diff=lfs merge=lfs -text
*.pth filter=lfs diff=lfs merge=lfs -text
*.rar filter=lfs diff=lfs merge=lfs -text
*.safetensors filter=lfs diff=lfs merge=lfs -text
saved_model/**/* filter=lfs diff=lfs merge=lfs -text
*.tar.* filter=lfs diff=lfs merge=lfs -text
*.tar filter=lfs diff=lfs merge=lfs -text
*.tflite filter=lfs diff=lfs merge=lfs -text
*.tgz filter=lfs diff=lfs merge=lfs -text
*.wasm filter=lfs diff=lfs merge=lfs -text
*.xz filter=lfs diff=lfs merge=lfs -text
*.zip filter=lfs diff=lfs merge=lfs -text
*.zst filter=lfs diff=lfs merge=lfs -text
*tfevents* filter=lfs diff=lfs merge=lfs -text
ggml-sabia7b-q4_0.gguf filter=lfs diff=lfs merge=lfs -text
ggml-sabia7b-q4_1.gguf filter=lfs diff=lfs merge=lfs -text
ggml-sabia7b-q5_0.gguf filter=lfs diff=lfs merge=lfs -text
ggml-sabia7b-q5_1.gguf filter=lfs diff=lfs merge=lfs -text
ggml-sabia7b-q8_0.gguf filter=lfs diff=lfs merge=lfs -text
sabia7b-q4_0.gguf filter=lfs diff=lfs merge=lfs -text
sabia7b-q4_1.gguf filter=lfs diff=lfs merge=lfs -text
sabia7b-q5_0.gguf filter=lfs diff=lfs merge=lfs -text
sabia7b-q5_1.gguf filter=lfs diff=lfs merge=lfs -text
sabia7b-q8_0.gguf filter=lfs diff=lfs merge=lfs -text

81
README.md Normal file
View File

@@ -0,0 +1,81 @@
---
inference: false
language:
- pt
model_creator: Maritaca AI
model_link: https://huggingface.co/maritaca-ai/sabia-7b
model_name: Sabia 7B
model_type: llama
quantized_by: lucianosb
pipeline_tag: text-generation
---
# Sabiá 7B - GGUF
- Criador do Modelo: [Maritaca AI](https://huggingface.co/maritaca-ai/)
- Modelo Original: [Sabiá 7B](https://huggingface.co/maritaca-ai/sabia-7b)
- Artigo: [Sabiá: Portuguese Large Language Models](https://arxiv.org/pdf/2304.07880.pdf)
- Licença: É a mesma do modelo LLaMA-1's, restrigindo o uso do modelo apenas para fins de pesquisa acadêmica.
Os modelos Sabiá foram otimizados com language modeling objective, mas não foram treinados para seguir instruções (instruction tuning). Ou seja, eles não são chatbots. Eles funcionam bem em tarefas few-shot: você passa exemplos de entrada e saída, seguidos por um novo exemplo de entrada, daí o modelo gera o texto complementar (a resposta).
## Arquivos Incluídos
| Nome | Método Quant | Bits | Tamanho | Desc |
| ---- | ---- | ---- | ---- | ----- |
| [sabia7b-q4_0.gguf](https://huggingface.co/lucianosb/sabia-7b-GGUF/blob/main/sabia7b-q4_0.gguf) | q4_0 | 4 | 3.83 GB | Quantização em 4-bit. |
| [sabia7b-q4_1.gguf](https://huggingface.co/lucianosb/sabia-7b-GGUF/blob/main/sabia7b-q4_1.gguf) | q4_1 | 4 | 4.24 GB | Quantização em 4-bit. Acurácia maior que q4_0 mas não tão boa quanto q5_0. Inferência mais rápida que os modelos q5. |
| [sabia7b-q5_0.gguf](https://huggingface.co/lucianosb/sabia-7b-GGUF/blob/main/sabia7b-q5_0.gguf) | q5_0 | 5 | 4.65 GB | Quantização em 5-bit. Melhor acurácia, maior uso de recursos, inferência mais lenta. |
| [sabia7b-q5_1.gguf](https://huggingface.co/lucianosb/sabia-7b-GGUF/blob/main/sabia7b-q5_1.gguf) | q5_1 | 5 | 5.06 GB | Quantização em 5-bit. Ainda Melhor acurácia, maior uso de recursos, inferência mais lenta. |
| [sabia7b-q8_0.gguf](https://huggingface.co/lucianosb/sabia-7b-GGUF/blob/main/sabia7b-q8_0.gguf) | q8_0 | 8 | 7.16 GB | Quantização em 8-bit. Quase indistinguível do float16. Usa muitos recursos e é mais lento. |
**Observação**: os valores de RAM acima não pressupõem descarregamento de GPU. Se as camadas forem descarregadas para a GPU, isso reduzirá o uso de RAM e usará VRAM.
## Como executar com `llama.cpp`
Usei o seguinte comando. Para melhores resultados forneça exemplos de resultados esperados. Exemplo:
> Classifique a string abaixo em uma ou mais das seguintes classes: A, B, C ou D.
>
> String: <string 1>
>
> Classes: B, D
>
> String: <string 2>
>
> Classes:
```
./main -m ./models/sabia-7b/sabia7b-q5_1.gguf --color --temp 0.5 -n 256 -p "### Instrução: {comando} ### Resposta:"
```
Para compreender os parâmetros, veja [a documentação do llama.cpp](https://github.com/ggerganov/llama.cpp/blob/master/examples/main/README.md)
Experimente gratuitamente no Google Colab: [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lucianosb/sabia-notebooks/blob/main/sabia_7b_llamacpp_5_1.ipynb)
## Sobre o formato GGUF
GGUF é um novo formato introduzido pela equipe llama.cpp em 21 de agosto de 2023. É um substituto para o GGML, que não é mais suportado pelo llama.cpp.
O principal benefício do GGUF é que ele é um formato extensível e à prova de futuro que armazena mais informações sobre o modelo como metadados. Ele também inclui código de tokenização significativamente melhorado, incluindo pela primeira vez suporte total para tokens especiais. Isso deve melhorar o desempenho, especialmente com modelos que usam novos tokens especiais e implementam modelos de prompt personalizados.
Aqui está uma lista de clientes e bibliotecas que são conhecidos por suportar GGUF:
- [llama.cpp](https://github.com/ggerganov/llama.cpp).
- [ollama](https://ollama.ai/) - servidor com interfaces REST e CLI
- [text-generation-webui](https://github.com/oobabooga/text-generation-webui), a interface web mais amplamente utilizada. Suporta GGUF com aceleração GPU via backend ctransformers - backend llama-cpp-python deve funcionar em breve também.
- [KoboldCpp](https://github.com/LostRuins/koboldcpp), agora suporta GGUF a partir da versão 1.41! Uma poderosa interface web GGML, com aceleração total da GPU. Especialmente bom para contar histórias.
- [LM Studio](https://lmstudio.ai), versão 0.2.2 e posteriores suportam GGUF. Uma GUI local totalmente equipada com aceleração GPU em ambos Windows (NVidia e AMD) e macOS.
- [LoLLMS Web UI](https://github.com/ParisNeo/lollms-webui), agora deve funcionar, escolha o backend c_transformers. Uma ótima interface web com muitos recursos interessantes. Suporta aceleração GPU CUDA.
- [ctransformers](https://github.com/marella/ctransformers), agora suporta GGUF a partir da versão 0.2.24! Uma biblioteca Python com aceleração GPU, suporte LangChain e servidor AI compatível com OpenAI.
- [llama-cpp-python](https://github.com/abetlen/llama-cpp-python), suporta GGUF a partir da versão 0.1.79. Uma biblioteca Python com aceleração GPU, suporte LangChain e servidor API compatível com OpenAI.
- [candle](https://github.com/huggingface/candle), adicionou suporte GGUF em 22 de agosto. Candle é um framework ML Rust com foco em desempenho, incluindo suporte GPU e facilidade de uso.
- [LocalAI](https://github.com/go-skynet/LocalAI), adicionou suporte GGUF em 23 de agosto. LocalAI provê uma API Rest para modelos LLM e de geração de imagens.
## Template
````
### Instrução:
{prompt}
### Resposta:
````

3
sabia7b-q4_0.gguf Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:389738e2fed97f92402173c12ead743e361522c0f7c9d7762a68a700e4a19ff0
size 3825807040

3
sabia7b-q4_1.gguf Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:8a696d0171e0cf2e99dd61a29520298ddc04a60849364dc185b894a810ca988d
size 4238749376

3
sabia7b-q5_0.gguf Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:385496eb5ef37ef973f100ba5ebfdf94a3977c113e764dde73978a2396eb9fa5
size 4651691712

3
sabia7b-q5_1.gguf Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:fff3b4b0572021cd5ced14abdf2904dd8b319a9b7bc4d3ddc4134de9ffb79350
size 5064634048

3
sabia7b-q8_0.gguf Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:1230de55d3d843e1d396319934626191ac1b8751ba00093187dc496a62dbcb0c
size 7161089728