Meta-Llama-3.1-8B-quantized.w8a8/recipe.yaml at 4ce4bb205727d47414a78c3e15b8062cf8a308b0 - Meta-Llama-3.1-8B-quantized.w8a8 - Gitea: Git with a cup of tea

neuralmagic/Meta-Llama-3.1-8B-quantized.w8a8

Files

ModelHub XC 4ce4bb2057 初始化项目，由ModelHub XC社区提供模型

Model: neuralmagic/Meta-Llama-3.1-8B-quantized.w8a8
Source: Original Platform

2026-06-16 11:30:13 +08:00

9 lines

173 B

YAML

Raw Blame History

 quant_stage:
   quant_modifiers:
     GPTQModifier:
       sequential_update: false
       dampening_frac: 0.01
       ignore: [lm_head]
       scheme: W8A8
       targets: Linear