Model: KnutJaegersberg/Qwen-1_8B-Chat-llama Source: Original Platform
license, license_name, license_link, model-index
| license | license_name | license_link | model-index | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| other | qwen | LICENSE |
|
Their non-commercial research license applies.
I used this script to make the model and used the tokenizer of CausalLM, as suggested in the comments of the script.
https://github.com/hiyouga/LLaMA-Factory/blob/main/tests/llamafy_qwen.py
Open LLM Leaderboard Evaluation Results
Detailed results can be found here
| Metric | Value |
|---|---|
| Avg. | 42.94 |
| AI2 Reasoning Challenge (25-Shot) | 36.95 |
| HellaSwag (10-Shot) | 54.34 |
| MMLU (5-Shot) | 44.55 |
| TruthfulQA (0-shot) | 43.70 |
| Winogrande (5-shot) | 58.88 |
| GSM8k (5-shot) | 19.26 |
Description
Languages
Text
100%