初始化项目，由ModelHub XC社区提供模型

Model: DevQuasar/llama3_8b_chat_brainstorm Source: Original Platform
2026-05-20 05:26:21 +08:00
commit b0a357d66b
16 changed files with 2559 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,49 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bin.* filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *.tfevents* filter=lfs diff=lfs merge=lfs -text
 *.db* filter=lfs diff=lfs merge=lfs -text
 *.ark* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.gguf* filter=lfs diff=lfs merge=lfs -text
 *.ggml filter=lfs diff=lfs merge=lfs -text
 *.llamafile* filter=lfs diff=lfs merge=lfs -text
 *.pt2 filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,73 @@
 ---
 license: llama3
 datasets:
 - DevQuasar/brainstorm_vicuna_1k
 base_model: meta-llama/Meta-Llama-3-8B
 pipeline_tag: text-generation
 model_context_window: 8192
 ---
 [<img src="https://raw.githubusercontent.com/csabakecskemeti/devquasar/main/dq_logo_black-transparent.png" width="200"/>](https://devquasar.com)
 'Make knowledge free for everyone'
 <a href='https://ko-fi.com/L4L416YX7C' target='_blank'><img height='36' style='border:0px;height:36px;' src='https://storage.ko-fi.com/cdn/kofi6.png?v=6' border='0' alt='Buy Me a Coffee at ko-fi.com' /></a>
 # Brainstorm
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/64e6d37e02dee9bcb9d9fa18/F2SHRg-GKiM4oJNlpEsjQ.png)
 # Model intention
 Brainstorm facilitates idea exploration through interaction with a Language Model (LLM). 
 Rather than providing direct answers, the model engages in a dialogue with users, offering 
 probing questions aimed at fostering deeper contemplation and consideration of various 
 facets of their ideas.
 ## Examples
 ### Inference code
 https://github.com/csabakecskemeti/ai_utils/blob/main/brainstorm_inference.py
 #### Usage
 `python brainstorm_inference.py DevQuasar/llama3_8b_chat_brainstorm`
 ### Example generations
 [USER] (Ctrl+C to exit):
 Today I'm gonna buy all healthy product at the grocery store.
 [CHAT]:
 What kind of healthy products are you thinking of buying?
 [USER] (Ctrl+C to exit):
 Mainly vegetables, and some lean white meet like fish and chicken
 [CHAT]:
 Have you considered organic produce for your veggies?
 ---------------------
 [USER] (Ctrl+C to exit):
 I'm thinking to invest in a franchise to get a new source of income.
 [CHAT]: 
 That's an interesting idea! What kind of franchises are you considering?
 [USER] (Ctrl+C to exit):
 Something that is a small upfront cost, not sure what would be a great choice.
 [CHAT]: 
 Have you considered food-related franchises like pizza or ice cream shops? They often have low startup costs.
 [USER] (Ctrl+C to exit):
 But that risky due to publich healt requirements
 [CHAT]: 
 You're right, there are some regulations to consider. How would you plan to mitigate those risks?
 [USER] (Ctrl+C to exit):
 I guess do some other non food related franchise
 [CHAT]: 
 What about a business service franchise like janitorial or landscaping services? Those might have lower regulatory burdens.
 I'm doing this to 'Make knowledge free for everyone', using my personal time and resources.
 If you want to support my efforts please visit my ko-fi page: https://ko-fi.com/devquasar
 Also feel free to visit my website https://devquasar.com/
--- a/config.json
+++ b/config.json
@@ -0,0 +1,28 @@
 {
  "_name_or_path": "meta-llama/Meta-Llama-3-8B",
  "architectures": [
    "LlamaForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 14336,
  "max_position_embeddings": 8192,
  "model_type": "llama",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "num_key_value_heads": 8,
  "pretraining_tp": 1,
  "rms_norm_eps": 1e-05,
  "rope_scaling": null,
  "rope_theta": 500000.0,
  "tie_word_embeddings": false,
  "torch_dtype": "float32",
  "transformers_version": "4.40.1",
  "use_cache": true,
  "vocab_size": 128256
 }
--- a/configuration.json
+++ b/configuration.json
@@ -0,0 +1 @@
 {"framework": "pytorch", "task": "text-generation", "allow_remote": true}
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,9 @@
 {
  "bos_token_id": 128000,
  "do_sample": true,
  "eos_token_id": 128001,
  "max_length": 4096,
  "temperature": 0.6,
  "top_p": 0.9,
  "transformers_version": "4.40.1"
 }
--- a/model-00001-of-00007.safetensors
+++ b/model-00001-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:fe8fa356bc98406043a10c6d9e7cc4054b8a5328515339e6ba38728d3161fb2e
 size 4886466168
--- a/model-00002-of-00007.safetensors
+++ b/model-00002-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:209d8b5c7f0bc57343447f20bb1c03ef7aa463800df7db6bcdb4b0f52eed4c09
 size 4832007448
--- a/model-00003-of-00007.safetensors
+++ b/model-00003-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:094c751c8038a58fee46d59d43761ca5cd451464bc20e800be00b8136844a504
 size 4999813112
--- a/model-00004-of-00007.safetensors
+++ b/model-00004-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:64fdc2d781c3e991d78e3f6b28efbbef94aefde3651fa111f0b5eadbb062ef13
 size 4999813128
--- a/model-00005-of-00007.safetensors
+++ b/model-00005-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:063ceab16d0e5fb34f02f26c299a4d35dc01c5f20698d441b238ad996529be99
 size 4832007496
--- a/model-00006-of-00007.safetensors
+++ b/model-00006-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:66cdc0389df30a6c9b0b1f4d1c2cf5b1f463534f10654699295b17b9d9afba6c
 size 4999813120
--- a/model-00007-of-00007.safetensors
+++ b/model-00007-of-00007.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:552e3796e9e0c8399eafa062a6fbf167b4f763b4e6737cb78466bc8611816353
 size 2571158184
--- a/model.safetensors.index.json
+++ b/model.safetensors.index.json
@@ -0,0 +1,298 @@
 {
  "metadata": {
    "total_size": 32121044992
  },
  "weight_map": {
    "lm_head.weight": "model-00007-of-00007.safetensors",
    "model.embed_tokens.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.10.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.10.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.11.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.12.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.13.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.14.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.14.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.14.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.14.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.14.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.15.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.15.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.16.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.17.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.18.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.input_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.down_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.gate_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.mlp.up_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.post_attention_layernorm.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.19.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.2.input_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.20.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.20.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.20.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.20.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.20.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.20.self_attn.k_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.o_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.q_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.20.self_attn.v_proj.weight": "model-00004-of-00007.safetensors",
    "model.layers.21.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.21.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.22.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.23.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.input_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.down_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.post_attention_layernorm.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.24.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.25.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.25.mlp.gate_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.mlp.up_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.25.self_attn.k_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.o_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.q_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.25.self_attn.v_proj.weight": "model-00005-of-00007.safetensors",
    "model.layers.26.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.26.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.27.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.28.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.29.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.3.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.3.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.3.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.3.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.3.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00007.safetensors",
    "model.layers.30.input_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.down_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.mlp.up_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.post_attention_layernorm.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.30.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.input_layernorm.weight": "model-00007-of-00007.safetensors",
    "model.layers.31.mlp.down_proj.weight": "model-00007-of-00007.safetensors",
    "model.layers.31.mlp.gate_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.mlp.up_proj.weight": "model-00007-of-00007.safetensors",
    "model.layers.31.post_attention_layernorm.weight": "model-00007-of-00007.safetensors",
    "model.layers.31.self_attn.k_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.o_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.q_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.31.self_attn.v_proj.weight": "model-00006-of-00007.safetensors",
    "model.layers.4.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.4.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.5.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.6.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.input_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.down_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.post_attention_layernorm.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.7.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.8.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.8.mlp.gate_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.mlp.up_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.8.self_attn.k_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.o_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.q_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.8.self_attn.v_proj.weight": "model-00002-of-00007.safetensors",
    "model.layers.9.input_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.mlp.down_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.mlp.gate_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.mlp.up_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.post_attention_layernorm.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.self_attn.k_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.self_attn.o_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.self_attn.q_proj.weight": "model-00003-of-00007.safetensors",
    "model.layers.9.self_attn.v_proj.weight": "model-00003-of-00007.safetensors",
    "model.norm.weight": "model-00007-of-00007.safetensors"
  }
 }
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,16 @@
 {
  "bos_token": {
    "content": "<|begin_of_text|>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  },
  "eos_token": {
    "content": "<|end_of_text|>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  }
 }
--- a/tokenizer.json
+++ b/tokenizer.json
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:e134af98b985517b4f068e3755ae90d4e9cd2d45d328325dc503f1c6b2d06cc7
 size 9085698
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
		`@@ -0,0 +1 @@`
							`{"framework": "pytorch", "task": "text-generation", "allow_remote": true}`