初始化项目，由ModelHub XC社区提供模型

Model: PetroGPT/Breeze-Petro-7B-Instruct-v1 Source: Original Platform
2026-04-24 21:13:05 +08:00
commit 4842a0f772
17 changed files with 141228 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,35 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,84 @@
 ---
 library_name: transformers
 tags:
 - chemistry
 - code
 - text-generation-inference
 license: apache-2.0
 language:
 - en
 - zh
 metrics:
 - accuracy
 - code_eval
 ---
 # Breeze-Petro-7B-Instruct-v1
 - Model creator: [MediaTek Research](https://huggingface.co/MediaTek-Research)
 - Original model: [MediaTek-Research/Breeze-7B-Instruct-v1_0](https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v1_0)
 ### Model Description
 This is a model fine-tuned based on Breeze-7B-Instruct-v1_0.
 The training set is mainly based on chemical knowledge and procedural knowledge. Supplement knowledge about the petroleum industry.
 - **Developed by:** RebeccaChou
 - **License:** apache-2.0
 - **Finetuned from model :** [MediaTek-Research/Breeze-7B-Instruct-v1_0
 - **Language(s) (NLP):** [English.繁體中文]
 # 📖 Table of Contents
 1.[Open LLM Leaderboard](#🏆-open-llm-leaderboard)
    - ARC
    - HellaSwag
    - MMLU
    - TruthfulQA
    - Winogrande
    - GSM8K
 3. [EvalPlus Leaderboard](#⚡-evalplus-leaderboard)
    - HumanEval
    - HumanEval_Plus
    - MBPP
    - MBPP_Plus
 4. [Prompt Format](#⚗️-prompt-format)
 5. [Quantized Models](#🛠️-quantized-models)
 6. [Gratitude](#🙏-gratitude)
 ## 🏆 Open LLM Leaderboard
 WestSeverus-7B-DPO-v2 is one of the top 7B model in Open LLM Leaderboard and it outperforms on TruthfulQA and GSM8K.
 |             Metric              |Value|
 |---------------------------------|----:|
 |Avg.                             |59.32|
 |AI2 Reasoning Challenge (25-Shot)|58.87|
 |HellaSwag (10-Shot)              |79.17|
 |MMLU (5-Shot)                    |56.62|
 |TruthfulQA (0-shot)              |46.36|
 |Winogrande (5-shot)              |73.64|
 |GSM8k (5-shot)                   |41.24|
 Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_Rebecca19990101__Breeze-Petro-7B-Instruct-v1)
 ## ⚡ EvalPlus Leaderboard
 | Model | HumanEval | HumanEval_Plus| MBPP | MBPP_Plus |
 |---|---:|---:|---:|---:|
 | phi-2-2.7B |48.2|43.3|61.9|51.4|
 | |  |  | | |
 | SOLAR-10.7B-Instruct-v1.0 |  42.1   |  34.3    |   42.9  |  34.6   |
 | CodeLlama-7B| 37.8| 34.1 | 57.6 |45.4 |
 ## 🛠️ Quantized Models 
 * **GGUF** https://huggingface.co/Rebecca19990101/breeze-petro-7b-instruct-v1-q4_k_m.gguf/tree/main
 ## Training Details
 ### Training Data
 - **Dataset:** Rebecca19990101/petro-dataset-v2
--- a/added_tokens.json
+++ b/added_tokens.json
@@ -0,0 +1,4 @@
 {
  "<EOD>": 61873,
  "<PAD>": 61874
 }
--- a/config.json
+++ b/config.json
@@ -0,0 +1,28 @@
 {
  "_name_or_path": "MediaTek-Research/Breeze-7B-Instruct-v1_0",
  "architectures": [
    "MistralForCausalLM"
  ],
  "attention_dropout": 0.0,
  "bos_token_id": 1,
  "eos_token_id": 2,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 14336,
  "max_position_embeddings": 32768,
  "model_type": "mistral",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "num_key_value_heads": 8,
  "output_router_logits": true,
  "pretraining_tp": 1,
  "rms_norm_eps": 1e-05,
  "rope_theta": 10000.0,
  "sliding_window": 4096,
  "tie_word_embeddings": false,
  "torch_dtype": "float32",
  "transformers_version": "4.41.0.dev0",
  "use_cache": false,
  "vocab_size": 61952
 }
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,6 @@
 {
  "_from_model_config": true,
  "bos_token_id": 1,
  "eos_token_id": 2,
  "transformers_version": "4.41.0.dev0"
 }
--- a/model-00001-of-00007.safetensors
+++ b/model-00001-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:eef7e7806ed9d243797e0f01c9235a82e8e11048cef12d2f3d2c83cec38264ff
 size 4907471600
--- a/model-00002-of-00007.safetensors
+++ b/model-00002-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:ff7d572364ca38e883c487eaaecb04f073c83af025e5b2ce5dd2f89ce1c04cf0
 size 4999813072
--- a/model-00003-of-00007.safetensors
+++ b/model-00003-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:57dabfc274403d14b4d60efe27214175a01483b2eae8d459a7748fd01c538494
 size 4832007496
--- a/model-00004-of-00007.safetensors
+++ b/model-00004-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:3072cbd1fa00c441bfb0fd23b34f146c535bbb9f67cbcf3d0a7bf407786428fd
 size 4999813120
--- a/model-00005-of-00007.safetensors
+++ b/model-00005-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:14311bea776202d0afed6e34870278f2ef31d065447debb4a4e88660b95b9c46
 size 4999813128
--- a/model-00006-of-00007.safetensors
+++ b/model-00006-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:0416a128e3f1d1fc5619d7f237f7c0257f66a1ae9a35a5166ac0055c1d74c535
 size 4194489072
--- a/model-00007-of-00007.safetensors
+++ b/model-00007-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:fdaa81222eccf45ec0a1e9c6bf953dc4ca9b6702986448e147e07887928ec6e5
 size 1015021696
--- a/model.safetensors.index.json
+++ b/model.safetensors.index.json
@@ -0,0 +1,298 @@
 {
  "metadata": {
    "total_size": 29948395520
  },
  "weight_map": {
    "lm_head.weight": "model-00007-of-00007.safetensors",
    "model.embed_tokens.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.10.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.10.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.10.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.10.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.11.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.16.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.2.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.20.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.22.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.27.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.27.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.27.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.27.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.28.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.3.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.30.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.4.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.4.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.5.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.norm.weight": "model-00006-of-00007.safetensors"
  }
 }
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,30 @@
 {
  "bos_token": {
    "content": "<s>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  },
  "eos_token": {
    "content": "</s>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  },
  "pad_token": {
    "content": "</s>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  },
  "unk_token": {
    "content": "<unk>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  }
 }
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer.model
+++ b/tokenizer.model
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:9298e56c094f0d30431b0e52ad53287f0cadc99ac8ca17cc2144b0eb4753f130
 size 911034
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,60 @@
 {
  "add_bos_token": true,
  "add_eos_token": false,
  "add_prefix_space": true,
  "added_tokens_decoder": {
    "0": {
      "content": "<unk>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "1": {
      "content": "<s>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "2": {
      "content": "</s>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "61873": {
      "content": "<EOD>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "61874": {
      "content": "<PAD>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    }
  },
  "bos_token": "<s>",
  "chat_template": "{% if not add_generation_prompt is defined %}{% set add_generation_prompt = false %}{% endif %}{% if messages[0]['role'] == 'system' %}{% set loop_messages = messages[1:] %}{% set system_message = messages[0]['content'].strip() %}{% else %}{% set loop_messages = messages %}{% set system_message = 'You are a helpful AI assistant built by MediaTek Research. The user you are helping speaks Traditional Chinese and comes from Taiwan.' %}{% endif %}{{ bos_token }} {{ system_message }} {% for message in loop_messages %}{% if (message['role'] == 'user') != (loop.index0 % 2 == 0) %}{{ raise_exception('Conversation roles must alternate user/assistant/user/assistant/... or system/user/assistant/user/assistant/...') }}{% endif %}{% if message['role'] == 'user' %}{{ ' [INST] ' + message['content'] + ' [/INST] ' }}{% elif message['role'] == 'assistant' %}{{ message['content'] }}{% else %}{{ raise_exception('Only user and assistant roles are supported!') }}{% endif %}{% endfor %}",
  "clean_up_tokenization_spaces": false,
  "eos_token": "</s>",
  "legacy": true,
  "model_max_length": 1000000000000000019884624838656,
  "pad_token": "</s>",
  "sp_model_kwargs": {},
  "spaces_between_special_tokens": false,
  "tokenizer_class": "LlamaTokenizer",
  "unk_token": "<unk>",
  "use_default_system_prompt": false,
  "use_fast": true
 }