初始化项目,由ModelHub XC社区提供模型
Model: Solshine/Llama-3.2-1B-sandbag-circuit-ablated Source: Original Platform
This commit is contained in:
80
ablation_log.json
Normal file
80
ablation_log.json
Normal file
@@ -0,0 +1,80 @@
|
||||
{
|
||||
"base_model": "meta-llama/Llama-3.2-1B",
|
||||
"dtype": "float16",
|
||||
"suppressor_heads": [
|
||||
[
|
||||
0,
|
||||
3
|
||||
],
|
||||
[
|
||||
0,
|
||||
6
|
||||
],
|
||||
[
|
||||
1,
|
||||
26
|
||||
],
|
||||
[
|
||||
4,
|
||||
3
|
||||
],
|
||||
[
|
||||
8,
|
||||
14
|
||||
]
|
||||
],
|
||||
"ablation_log": [
|
||||
{
|
||||
"layer": 0,
|
||||
"head": 3,
|
||||
"o_proj_cols": [
|
||||
192,
|
||||
256
|
||||
],
|
||||
"n_nonzero_before": 131072,
|
||||
"n_nonzero_after": 0
|
||||
},
|
||||
{
|
||||
"layer": 0,
|
||||
"head": 6,
|
||||
"o_proj_cols": [
|
||||
384,
|
||||
448
|
||||
],
|
||||
"n_nonzero_before": 131072,
|
||||
"n_nonzero_after": 0
|
||||
},
|
||||
{
|
||||
"layer": 1,
|
||||
"head": 26,
|
||||
"o_proj_cols": [
|
||||
1664,
|
||||
1728
|
||||
],
|
||||
"n_nonzero_before": 131072,
|
||||
"n_nonzero_after": 0
|
||||
},
|
||||
{
|
||||
"layer": 4,
|
||||
"head": 3,
|
||||
"o_proj_cols": [
|
||||
192,
|
||||
256
|
||||
],
|
||||
"n_nonzero_before": 131072,
|
||||
"n_nonzero_after": 0
|
||||
},
|
||||
{
|
||||
"layer": 8,
|
||||
"head": 14,
|
||||
"o_proj_cols": [
|
||||
896,
|
||||
960
|
||||
],
|
||||
"n_nonzero_before": 131072,
|
||||
"n_nonzero_after": 0
|
||||
}
|
||||
],
|
||||
"total_params_zeroed": 655360,
|
||||
"total_params": 1235814400
|
||||
}
|
||||
Reference in New Issue
Block a user