初始化项目，由ModelHub XC社区提供模型

Model: curiousmind147/microsoft-phi-4-AWQ-4bit-GEMM Source: Original Platform
2026-04-12 08:42:04 +08:00
commit 88399a2afa
12 changed files with 602845 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,35 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,110 @@
 ---
 license: mit
 language:
 - en
 base_model:
 - microsoft/phi-4
 tags:
 - 4bit
 - transformers
 - autoawq
 - vllm
 - 12gb-vram
 ---
 # Microsoft Phi-4 4-bit AWQ Quantized Model (GEMM)
 This is a **4-bit AutoAWQ quantized version** of [Microsoft's Phi-4](https://huggingface.co/microsoft/phi-4).  
 It is optimized for **fast inference** using **vLLM** with minimal loss in accuracy.
 ---
 ## 🚀 Model Details
 - **Base Model:** [microsoft/phi-4](https://huggingface.co/microsoft/phi-4)
 - **Quantization:** **4-bit AWQ**
 - **Quantization Method:** **AutoAWQ (Activation-Aware Quantization)**
 - **Group Size:** 128
 - **AWQ Version:** GEMM Optimized
 - **Intended Use:** **Low VRAM inference on consumer GPUs**
 - **VRAM Requirements:** ✅ **8GB+ (Recommended)**
 - **Compatibility:** ✅ **vLLM, Hugging Face Transformers (w/ AWQ support)**
 ---
 ## 📌 How to Use in vLLM
 You can load this model directly in **vLLM** for efficient inference:
 ```bash
 vllm serve "curiousmind147/microsoft-phi-4-AWQ-4bit-GEMM"
 ```
 Then, test it using `cURL`:
 ```bash
 curl -X POST "http://localhost:8000/generate" \
    -H "Content-Type: application/json" \
    -d '{"prompt": "Explain quantum mechanics in simple terms.", "max_tokens": 100}'
 ```
 ---
 ## 📌 How to Use in Python (`transformers` + AWQ)
 To use this model with **Hugging Face Transformers**:
 ```python
 from awq import AutoAWQForCausalLM
 from transformers import AutoTokenizer
 model_path = "curiousmind147/microsoft-phi-4-AWQ-4bit-GEMM"
 model = AutoAWQForCausalLM.from_pretrained(model_path)
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 inputs = tokenizer("What is the meaning of life?", return_tensors="pt")
 output = model.generate(**inputs, max_new_tokens=100)
 print(tokenizer.decode(output[0], skip_special_tokens=True))
 ```
 ---
 ## 📌 Quantization Details
 This model was quantized using **AutoAWQ** with the following parameters:
 - **Bits:** 4-bit quantization
 - **Zero-Point Quantization:** Enabled (`zero_point=True`)
 - **Group Size:** 128 (`q_group_size=128`)
 - **Quantization Version:** `GEMM`
 - **Method Used:** [AutoAWQ](https://github.com/casper-hansen/AutoAWQ)
 ---
 ## 📌 VRAM Requirements
 | Model Size  | **FP16 (No Quant)** | **AWQ 4-bit Quantized** |
 |------------|-------------------|-------------------------|
 | **Phi-4 14B** | ❌ Requires **>20GB VRAM** | ✅ **8GB-12GB VRAM** |
 AWQ significantly **reduces VRAM requirements**, making it **possible to run 14B models on consumer GPUs**. 🚀
 ---
 ## 📌 License & Credits
 - **Base Model:** [Microsoft Phi-4](https://huggingface.co/microsoft/phi-4)
 - **Quantized by:** [curiousmind147](https://huggingface.co/curiousmind147)
 - **License:** Same as the base model (Microsoft)
 - **Credits:** This model is based on Microsoft's Phi-4 and was optimized using AutoAWQ.
 ---
 ## 📌 Acknowledgments
 Special thanks to:
 - **Microsoft** for creating [Phi-4](https://huggingface.co/microsoft/phi-4).
 - **Casper Hansen** for developing [AutoAWQ](https://github.com/casper-hansen/AutoAWQ).
 - **The vLLM team** for making fast inference possible.
 ---
 ## 🚀 Enjoy Efficient Phi-4 Inference!
 If you find this useful, **give it a ⭐ on Hugging Face!** 🎯
--- a/config.json
+++ b/config.json
@@ -0,0 +1,41 @@
 {
  "_name_or_path": "/home/nam/.cache/huggingface/hub/models--microsoft--phi-4/snapshots/f957856cd926f9d681b14153374d755dd97e45ed",
  "architectures": [
    "Phi3ForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "auto_map": {},
  "bos_token_id": 100257,
  "embd_pdrop": 0.0,
  "eos_token_id": 100257,
  "hidden_act": "silu",
  "hidden_size": 5120,
  "initializer_range": 0.02,
  "intermediate_size": 17920,
  "max_position_embeddings": 16384,
  "model_type": "phi3",
  "num_attention_heads": 40,
  "num_hidden_layers": 40,
  "num_key_value_heads": 10,
  "original_max_position_embeddings": 16384,
  "pad_token_id": 100257,
  "quantization_config": {
    "bits": 4,
    "group_size": 128,
    "modules_to_not_convert": null,
    "quant_method": "awq",
    "version": "gemm",
    "zero_point": true
  },
  "resid_pdrop": 0.0,
  "rms_norm_eps": 1e-05,
  "rope_scaling": null,
  "rope_theta": 250000,
  "sliding_window": null,
  "tie_word_embeddings": false,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.47.1",
  "use_cache": false,
  "vocab_size": 100352
 }
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,10 @@
 {
  "_from_model_config": true,
  "bos_token_id": 100257,
  "do_sample": true,
  "eos_token_id": [
    100257,
    100265
  ],
  "transformers_version": "4.47.1"
 }
--- a/merges.txt
+++ b/merges.txt
--- a/model-00001-of-00002.safetensors
+++ b/model-00001-of-00002.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:743be13353db12a57c7b812ef2434ee77beafe49b4d5926d416d9eb882853458
 size 4957230488
--- a/model-00002-of-00002.safetensors
+++ b/model-00002-of-00002.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:e474bffddc6925bfe353f8da9704b737bb28d4e4e1f7f585155da32f6895e2e6
 size 4180856752
--- a/model.safetensors.index.json
+++ b/model.safetensors.index.json
@@ -0,0 +1,570 @@
 {
  "metadata": {
    "total_size": 9138022400
  },
  "weight_map": {
    "model.embed_tokens.weight": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.0.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.0.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.1.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.1.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.1.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.2.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.2.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.2.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.3.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.3.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.3.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.4.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.4.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.4.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.5.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.5.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.5.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.6.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.6.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.6.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.7.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.7.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.7.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.8.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.8.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.8.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.9.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.9.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.9.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.10.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.10.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.10.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.11.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.11.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.11.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.11.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.12.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.12.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.12.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.12.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.13.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.13.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.13.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.13.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.14.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.14.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.14.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.14.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.15.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.15.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.15.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.15.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.16.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.16.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.16.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.16.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.17.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.17.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.17.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.17.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.18.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.18.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.18.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.18.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.19.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.19.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.19.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.19.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.20.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.20.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.20.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.20.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.21.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.gate_up_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.gate_up_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.gate_up_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.down_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.down_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.21.mlp.down_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.21.input_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.21.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.o_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.o_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.o_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.qkv_proj.qweight": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.qkv_proj.qzeros": "model-00001-of-00002.safetensors",
    "model.layers.22.self_attn.qkv_proj.scales": "model-00001-of-00002.safetensors",
    "model.layers.22.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.22.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.22.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.22.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.22.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.22.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.22.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.23.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.23.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.23.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.23.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.24.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.24.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.24.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.24.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.25.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.25.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.25.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.25.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.26.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.26.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.26.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.26.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.27.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.27.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.27.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.27.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.28.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.28.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.28.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.28.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.29.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.29.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.29.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.29.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.30.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.30.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.30.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.30.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.31.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.31.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.31.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.31.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.32.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.32.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.32.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.32.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.33.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.33.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.33.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.33.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.34.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.34.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.34.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.34.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.35.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.35.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.35.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.35.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.36.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.36.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.36.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.36.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.37.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.37.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.37.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.37.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.38.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.38.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.38.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.38.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.o_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.o_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.o_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.qkv_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.qkv_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.39.self_attn.qkv_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.gate_up_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.gate_up_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.gate_up_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.down_proj.qweight": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.down_proj.qzeros": "model-00002-of-00002.safetensors",
    "model.layers.39.mlp.down_proj.scales": "model-00002-of-00002.safetensors",
    "model.layers.39.input_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.layers.39.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
    "model.norm.weight": "model-00002-of-00002.safetensors",
    "lm_head.weight": "model-00002-of-00002.safetensors"
  }
 }
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,24 @@
 {
  "bos_token": {
    "content": "<|endoftext|>",
    "lstrip": true,
    "normalized": false,
    "rstrip": true,
    "single_word": false
  },
  "eos_token": {
    "content": "<|endoftext|>",
    "lstrip": true,
    "normalized": false,
    "rstrip": true,
    "single_word": false
  },
  "pad_token": {
    "content": "<|endoftext|>",
    "lstrip": true,
    "normalized": false,
    "rstrip": true,
    "single_word": false
  },
  "unk_token": "<|endoftext|>"
 }
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,783 @@
 {
  "add_prefix_space": false,
  "added_tokens_decoder": {
    "100256": {
      "content": "<|dummy_0|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100257": {
      "content": "<|endoftext|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100258": {
      "content": "<|fim_prefix|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100259": {
      "content": "<|fim_middle|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100260": {
      "content": "<|fim_suffix|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100261": {
      "content": "<|dummy_1|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100262": {
      "content": "<|dummy_2|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100263": {
      "content": "<|dummy_3|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100264": {
      "content": "<|im_start|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100265": {
      "content": "<|im_end|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100266": {
      "content": "<|im_sep|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100267": {
      "content": "<|dummy_4|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100268": {
      "content": "<|dummy_5|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100269": {
      "content": "<|dummy_6|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100270": {
      "content": "<|dummy_7|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100271": {
      "content": "<|dummy_8|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100272": {
      "content": "<|dummy_9|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100273": {
      "content": "<|dummy_10|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100274": {
      "content": "<|dummy_11|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100275": {
      "content": "<|dummy_12|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100276": {
      "content": "<|endofprompt|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100277": {
      "content": "<|dummy_13|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100278": {
      "content": "<|dummy_14|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100279": {
      "content": "<|dummy_15|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100280": {
      "content": "<|dummy_16|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100281": {
      "content": "<|dummy_17|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100282": {
      "content": "<|dummy_18|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100283": {
      "content": "<|dummy_19|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100284": {
      "content": "<|dummy_20|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100285": {
      "content": "<|dummy_21|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100286": {
      "content": "<|dummy_22|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100287": {
      "content": "<|dummy_23|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100288": {
      "content": "<|dummy_24|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100289": {
      "content": "<|dummy_25|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100290": {
      "content": "<|dummy_26|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100291": {
      "content": "<|dummy_27|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100292": {
      "content": "<|dummy_28|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100293": {
      "content": "<|dummy_29|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100294": {
      "content": "<|dummy_30|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100295": {
      "content": "<|dummy_31|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100296": {
      "content": "<|dummy_32|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100297": {
      "content": "<|dummy_33|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100298": {
      "content": "<|dummy_34|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100299": {
      "content": "<|dummy_35|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100300": {
      "content": "<|dummy_36|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100301": {
      "content": "<|dummy_37|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100302": {
      "content": "<|dummy_38|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100303": {
      "content": "<|dummy_39|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100304": {
      "content": "<|dummy_40|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100305": {
      "content": "<|dummy_41|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100306": {
      "content": "<|dummy_42|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100307": {
      "content": "<|dummy_43|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100308": {
      "content": "<|dummy_44|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100309": {
      "content": "<|dummy_45|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100310": {
      "content": "<|dummy_46|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100311": {
      "content": "<|dummy_47|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100312": {
      "content": "<|dummy_48|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100313": {
      "content": "<|dummy_49|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100314": {
      "content": "<|dummy_50|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100315": {
      "content": "<|dummy_51|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100316": {
      "content": "<|dummy_52|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100317": {
      "content": "<|dummy_53|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100318": {
      "content": "<|dummy_54|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100319": {
      "content": "<|dummy_55|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100320": {
      "content": "<|dummy_56|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100321": {
      "content": "<|dummy_57|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100322": {
      "content": "<|dummy_58|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100323": {
      "content": "<|dummy_59|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100324": {
      "content": "<|dummy_60|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100325": {
      "content": "<|dummy_61|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100326": {
      "content": "<|dummy_62|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100327": {
      "content": "<|dummy_63|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100328": {
      "content": "<|dummy_64|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100329": {
      "content": "<|dummy_65|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100330": {
      "content": "<|dummy_66|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100331": {
      "content": "<|dummy_67|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100332": {
      "content": "<|dummy_68|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100333": {
      "content": "<|dummy_69|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100334": {
      "content": "<|dummy_70|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100335": {
      "content": "<|dummy_71|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100336": {
      "content": "<|dummy_72|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100337": {
      "content": "<|dummy_73|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100338": {
      "content": "<|dummy_74|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100339": {
      "content": "<|dummy_75|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100340": {
      "content": "<|dummy_76|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100341": {
      "content": "<|dummy_77|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100342": {
      "content": "<|dummy_78|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100343": {
      "content": "<|dummy_79|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100344": {
      "content": "<|dummy_80|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100345": {
      "content": "<|dummy_81|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100346": {
      "content": "<|dummy_82|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100347": {
      "content": "<|dummy_83|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100348": {
      "content": "<|dummy_84|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100349": {
      "content": "<|dummy_85|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100350": {
      "content": "<|dummy_86|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    },
    "100351": {
      "content": "<|dummy_87|>",
      "lstrip": true,
      "normalized": false,
      "rstrip": true,
      "single_word": false,
      "special": true
    }
  },
  "bos_token": "<|endoftext|>",
  "chat_template": "{% for message in messages %}{% if (message['role'] == 'system') %}{{'<|im_start|>system<|im_sep|>' + message['content'] + '<|im_end|>'}}{% elif (message['role'] == 'user') %}{{'<|im_start|>user<|im_sep|>' + message['content'] + '<|im_end|><|im_start|>assistant<|im_sep|>'}}{% elif (message['role'] == 'assistant') %}{{message['content'] + '<|im_end|>'}}{% endif %}{% endfor %}",
  "clean_up_tokenization_spaces": false,
  "eos_token": "<|endoftext|>",
  "extra_special_tokens": {},
  "model_max_length": 16384,
  "pad_token": "<|endoftext|>",
  "tokenizer_class": "GPT2Tokenizer",
  "truncation": true,
  "unk_token": "<|endoftext|>"
 }
--- a/vocab.json
+++ b/vocab.json