Go to file

ModelHub XC edeacb1afa 初始化项目，由ModelHub XC社区提供模型

Model: Fizzarolli/sappha-2b-v3
Source: Original Platform

2026-04-23 02:22:34 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

model-00001-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

model-00002-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

model-00003-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-04-23 02:22:34 +08:00

README.md

datasets, license

datasets

license

Open-Orca/SlimOrca-Dedup

jondurbin/airoboros-3.2

gemma

sappha-2b-v3

a slightly less experimental qlora instruct finetune of the gemma-2b base model. trained with unsloth.

benchmarks

	gemma-2b-it	sappha-2b-v3	dolphin-2.8-gemma-2b
MMLU (five-shot)	36.98	38.02	37.89
HellaSwag (zero-shot)	49.22	51.70	47.79
PIQA (one-shot)	75.08	75.46	71.16
TruthfulQA (zero-shot)	37.51	31.65	37.15

prompt format

basic chatml:

<|im_start|>system
You are a useful and helpful AI assistant.<|im_end|>
<|im_start|>user
what are LLMs?<|im_end|>
<|im_start|>assistant
LLMs, or Large Language Models, are advanced artificial intelligence systems that can perform tasks similar to human language. They are trained on vast amounts of data and can understand and respond to human queries. LLMs are often used in various applications, such as language translation, text generation, and question answering.<|im_end|>

quants

gguf: https://huggingface.co/Fizzarolli/sappha-2b-v3-GGUF

what happened to v2?

it was a private failure :)