Model: wandb/gemma-7b-zephyr-sft Source: Original Platform
license, library_name, datasets, base_model, license_name, license_link, model-index
| license | library_name | datasets | base_model | license_name | license_link | model-index | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| other | transformers |
|
google/gemma-7b | gemma-terms-of-use | https://ai.google.dev/gemma/terms |
|
Gemma 7B Zephyr SFT
The Zephyr SFT recipe applied on top of Gemma 7B
Model description
- Model type: A 8.5B parameter GPT-like model fine-tuned on a mix of publicly available, synthetic datasets.
- Language(s) (NLP): Primarily English
- Finetuned from model: google/gemma-7b
Recipe
We trained using the alignment handbook recipe and logging to W&B
Visit the W&B workspace here
License
This model has the same license as the original Gemma model collection
Compute provided by Lambda Labs - 8xA100 80GB node
Open LLM Leaderboard Evaluation Results
Detailed results can be found here
| Metric | Value |
|---|---|
| Avg. | 61.64 |
| AI2 Reasoning Challenge (25-Shot) | 61.43 |
| HellaSwag (10-Shot) | 80.73 |
| MMLU (5-Shot) | 60.33 |
| TruthfulQA (0-shot) | 43.35 |
| Winogrande (5-shot) | 74.19 |
| GSM8k (5-shot) | 49.81 |
Description