Llama-2-7b-pruned40-retrained

nm-testing/Llama-2-7b-pruned40-retrained

Go to file

ModelHub XC 5daa9d3078 初始化项目，由ModelHub XC社区提供模型

Model: nm-testing/Llama-2-7b-pruned40-retrained
Source: Original Platform

2026-06-16 08:19:13 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

arc_challenge_25shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

configuration.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

gsm8k_5shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

hellaswag_10shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

mmlu_5shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

pytorch_model-00001-of-00004.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

pytorch_model-00002-of-00004.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

pytorch_model-00003-of-00004.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

pytorch_model-00004-of-00004.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

pytorch_model.bin.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

truthfulqa_mc_0shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

winogrande_5shot.json

初始化项目，由ModelHub XC社区提供模型

2026-06-16 08:19:13 +08:00

README.md

base_model, datasets

base_model

datasets

meta-llama/Llama-2-7b-hf

cerebras/SlimPajama-627B

Checkpoint of a Llama 2 7B model that has had 50% of the parameters pruned in one-shot with SparseGPT, then retrained for 40B tokens from SlimPajama while maintaining sparsity.

Model: Llama 2
Size: 7B
LR: 3.00E-4
Dataset: SlimPajama
Retrained tokens: 40B
Notes: no warmup + decay to 0.0
Eval Harness:
- CommonSense Reasoning: 62.2 (97.65%)
- Reading Comprehension: 57.7 (98.30%)
- World Knowledge: 42.4 (97.65%)
- Math: 6.1 (74.39%)
- Code: 16.2 (98.78%)