初始化项目，由ModelHub XC社区提供模型

Model: FlagRelease/Qwen3-4B-FlagOS-cambricon Source: Original Platform
2026-05-08 02:05:53 +08:00
commit c2f313bb96
17 changed files with 910 additions and 0 deletions
--- a/.DS_Store
+++ b/.DS_Store
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,51 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bin.* filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *.tfevents* filter=lfs diff=lfs merge=lfs -text
 *.db* filter=lfs diff=lfs merge=lfs -text
 *.ark* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.gguf* filter=lfs diff=lfs merge=lfs -text
 *.ggml filter=lfs diff=lfs merge=lfs -text
 *.llamafile* filter=lfs diff=lfs merge=lfs -text
 *.pt2 filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 merges.txt filter=lfs diff=lfs merge=lfs -text
 tokenizer.json filter=lfs diff=lfs merge=lfs -text
 vocab.json filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,94 @@
 # Introduction
 Qwen3-4B-FlagOS-cambricon  provides an all-in-one deployment solution, enabling execution of Qwen3-4B on cambricon GPUs. As the first-generation release for the cambricon-MLU590, this package delivers two key features:
 1. Comprehensive Integration:
   - Integrated with FlagScale (https://github.com/FlagOpen/FlagScale).
   - Open-source inference execution code, preconfigured with all necessary software and hardware settings.
   - Pre-built Docker image for rapid deployment on cambricon-MLU590.
 2. Consistency Validation:
   - Evaluation tests verifying consistency of results between the official and ours.
 # Technical Summary
 ## Serving Engine
 We use FlagScale as the serving engine to improve the portability of distributed inference.
 FlagScale is an end-to-end framework for large models across multiple chips, maximizing computational resource efficiency while ensuring model effectiveness. It ensures both ease of use and high performance for users when deploying models across different chip architectures:
 - One-Click Service Deployment: FlagScale provides a unified and simple command execution mechanism, allowing users to fast deploy services seamlessly across various hardware platforms using the same command. This significantly reduces the entry barrier and enhances user experience.
 - Automated Deployment Optimization: FlagScale automatically optimizes distributed parallel strategies based on the computational capabilities of different AI chips, ensuring optimal resource allocation and efficient utilization, thereby improving overall deployment performance.
 - Automatic Operator Library Switching: Leveraging FlagScale's unified Runner mechanism and deep integration with FlagGems, users can seamlessly switch to the FlagGems operator library for inference by simply adding environment variables in the configuration file.
 ## Triton Support
 We validate the execution of Qwen3-4B model with a Triton-based operator library as a PyTorch alternative.
 We use a variety of Triton-implemented operation kernels  to run the Qwen3-4B model. These kernels come from two main sources:
 - Most Triton kernels are provided by FlagGems (https://github.com/FlagOpen/FlagGems). You can enable FlagGems kernels by setting the environment variable USE_FLAGGEMS. 
 - Also included are Triton kernels from vLLM, such as fused MoE.
 # Evaluation Results
 ## Benchmark Result 
 | Metrics   | Qwen3-4B-H100-CUDA | Qwen3-4B-FlagOS-cambricon |
 | --------- | ------------------ | ------------------------- |
 | LIVEBENCH | 0.501              | 0.527                     |
 | AIME      | 0.700              | 0.733                     |
 | GPQA      | 0.410              | 0.430                     |
 | MMLU      | 0.669              | 0.668                     |
 | MUSR      | 0.590              | 0.620                     |
 | TheoremQA | 0.077              | 0.085                     |
 # How to Run Locally
 ## 📌 Getting Started
 ### Download the FlagOS image
 As requested by Cambricon, the Docker image and model files must be requested via email. Please contact ecosystem@cambricon.com and include your organization name, contact person, contact information, equipment source, and specific requirements.
 ```bash
 docker pull <IMAGE>
 ```
 ### Download open-source weights
 ```bash
 pip install modelscope
 modelscope download --model Qwen/Qwen3-4B --local_dir /share/Qwen3-4B
 ```
 ### Start the inference service
 ```bash
 docker run -d --name flagos -e DISPLAY=$DISPLAY --net=host --pid=host --ipc=host -v /tmp/.X11-unix:/tmp/.X11-unix --privileged -v /share/project/shihonghao/host02:/share -v /home:/home -v /mnt/:/mnt/ -v /data/:/data/ -v /opt/data/:/opt/data/ -v /usr/bin/cnmon:/usr/bin/cnmon <IMAGE> sleep infinity
 docker exec -it flagos bash
 ```
 ### Serve
 ```bash
 flagscale serve qwen3
 ```
 # Contributing
 We warmly welcome global developers to join us:
 1. Submit Issues to report problems
 2. Create Pull Requests to contribute code
 3. Improve technical documentation
 4. Expand hardware adaptation support
 # License
 本模型的权重来源于Qwen/Qwen3-4B，以apache2.0协议https://www.apache.org/licenses/LICENSE-2.0.txt开源。
--- a/added_tokens.json
+++ b/added_tokens.json
@@ -0,0 +1,28 @@
 {
  "</think>": 151668,
  "</tool_call>": 151658,
  "</tool_response>": 151666,
  "<think>": 151667,
  "<tool_call>": 151657,
  "<tool_response>": 151665,
  "<|box_end|>": 151649,
  "<|box_start|>": 151648,
  "<|endoftext|>": 151643,
  "<|file_sep|>": 151664,
  "<|fim_middle|>": 151660,
  "<|fim_pad|>": 151662,
  "<|fim_prefix|>": 151659,
  "<|fim_suffix|>": 151661,
  "<|im_end|>": 151645,
  "<|im_start|>": 151644,
  "<|image_pad|>": 151655,
  "<|object_ref_end|>": 151647,
  "<|object_ref_start|>": 151646,
  "<|quad_end|>": 151651,
  "<|quad_start|>": 151650,
  "<|repo_name|>": 151663,
  "<|video_pad|>": 151656,
  "<|vision_end|>": 151653,
  "<|vision_pad|>": 151654,
  "<|vision_start|>": 151652
 }
--- a/config.json
+++ b/config.json
@@ -0,0 +1,30 @@
 {
  "architectures": [
    "Qwen3ForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "bos_token_id": 151643,
  "eos_token_id": 151645,
  "head_dim": 128,
  "hidden_act": "silu",
  "hidden_size": 2560,
  "initializer_range": 0.02,
  "intermediate_size": 9728,
  "max_position_embeddings": 40960,
  "max_window_layers": 36,
  "model_type": "qwen3",
  "num_attention_heads": 32,
  "num_hidden_layers": 36,
  "num_key_value_heads": 8,
  "rms_norm_eps": 1e-06,
  "rope_scaling": null,
  "rope_theta": 1000000,
  "sliding_window": null,
  "tie_word_embeddings": true,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.51.0",
  "use_cache": true,
  "use_sliding_window": false,
  "vocab_size": 151936
 }
--- a/configuration.json
+++ b/configuration.json
@@ -0,0 +1 @@
 {"framework":"Pytorch","task":"text-generation"}
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,13 @@
 {
    "bos_token_id": 151643,
    "do_sample": true,
    "eos_token_id": [
        151645,
        151643
    ],
    "pad_token_id": 151643,
    "temperature": 0.6,
    "top_k": 20,
    "top_p": 0.95,
    "transformers_version": "4.51.0"
 }
--- a/image_.jpeg
+++ b/image_.jpeg
--- a/merges.txt
+++ b/merges.txt
--- a/model-00001-of-00003.safetensors
+++ b/model-00001-of-00003.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:328a91d3122359d5547f9d79521205bc0a46e1f79a792dfe650e99fc2d651223
 size 3957900840
--- a/model-00002-of-00003.safetensors
+++ b/model-00002-of-00003.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:6cd087b316306a68c562436b5492edbcf6e16c6dba3a1308279caa5a58e21ca5
 size 3987450520
--- a/model-00003-of-00003.safetensors
+++ b/model-00003-of-00003.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:e4bf436957184f4eeb86a80e9db394503f1f56446b2e6b7edeac5b81470f4ca1
 size 99630640
--- a/model.safetensors.index.json
+++ b/model.safetensors.index.json
@@ -0,0 +1,405 @@
 {
  "metadata": {
    "total_size": 8044936192
  },
  "weight_map": {
    "model.embed_tokens.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.10.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.11.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.12.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.13.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.14.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.15.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.15.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.15.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.17.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.20.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.21.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.23.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.24.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.25.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.26.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.27.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.28.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.29.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.3.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.30.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.30.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.31.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.32.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.33.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.input_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.34.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.input_layernorm.weight": "model-00003-of-00003.safetensors",
    "model.layers.35.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
    "model.layers.35.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
    "model.layers.35.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
    "model.layers.35.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.35.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
    "model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.7.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.8.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.input_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
    "model.layers.9.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
    "model.norm.weight": "model-00003-of-00003.safetensors"
  }
 }
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,31 @@
 {
  "additional_special_tokens": [
    "<|im_start|>",
    "<|im_end|>",
    "<|object_ref_start|>",
    "<|object_ref_end|>",
    "<|box_start|>",
    "<|box_end|>",
    "<|quad_start|>",
    "<|quad_end|>",
    "<|vision_start|>",
    "<|vision_end|>",
    "<|vision_pad|>",
    "<|image_pad|>",
    "<|video_pad|>"
  ],
  "eos_token": {
    "content": "<|im_end|>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  },
  "pad_token": {
    "content": "<|endoftext|>",
    "lstrip": false,
    "normalized": false,
    "rstrip": false,
    "single_word": false
  }
 }
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,239 @@
 {
  "add_bos_token": false,
  "add_prefix_space": false,
  "added_tokens_decoder": {
    "151643": {
      "content": "<|endoftext|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151644": {
      "content": "<|im_start|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151645": {
      "content": "<|im_end|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151646": {
      "content": "<|object_ref_start|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151647": {
      "content": "<|object_ref_end|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151648": {
      "content": "<|box_start|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151649": {
      "content": "<|box_end|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151650": {
      "content": "<|quad_start|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151651": {
      "content": "<|quad_end|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151652": {
      "content": "<|vision_start|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151653": {
      "content": "<|vision_end|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151654": {
      "content": "<|vision_pad|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151655": {
      "content": "<|image_pad|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151656": {
      "content": "<|video_pad|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": true
    },
    "151657": {
      "content": "<tool_call>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151658": {
      "content": "</tool_call>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151659": {
      "content": "<|fim_prefix|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151660": {
      "content": "<|fim_middle|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151661": {
      "content": "<|fim_suffix|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151662": {
      "content": "<|fim_pad|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151663": {
      "content": "<|repo_name|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151664": {
      "content": "<|file_sep|>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151665": {
      "content": "<tool_response>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151666": {
      "content": "</tool_response>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151667": {
      "content": "<think>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    },
    "151668": {
      "content": "</think>",
      "lstrip": false,
      "normalized": false,
      "rstrip": false,
      "single_word": false,
      "special": false
    }
  },
  "additional_special_tokens": [
    "<|im_start|>",
    "<|im_end|>",
    "<|object_ref_start|>",
    "<|object_ref_end|>",
    "<|box_start|>",
    "<|box_end|>",
    "<|quad_start|>",
    "<|quad_end|>",
    "<|vision_start|>",
    "<|vision_end|>",
    "<|vision_pad|>",
    "<|image_pad|>",
    "<|video_pad|>"
  ],
  "bos_token": null,
  "chat_template": "{%- if tools %}\n    {{- '<|im_start|>system\\n' }}\n    {%- if messages[0].role == 'system' %}\n        {{- messages[0].content + '\\n\\n' }}\n    {%- endif %}\n    {{- \"# Tools\\n\\nYou may call one or more functions to assist with the user query.\\n\\nYou are provided with function signatures within <tools></tools> XML tags:\\n<tools>\" }}\n    {%- for tool in tools %}\n        {{- \"\\n\" }}\n        {{- tool | tojson }}\n    {%- endfor %}\n    {{- \"\\n</tools>\\n\\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\\n<tool_call>\\n{\\\"name\\\": <function-name>, \\\"arguments\\\": <args-json-object>}\\n</tool_call><|im_end|>\\n\" }}\n{%- else %}\n    {%- if messages[0].role == 'system' %}\n        {{- '<|im_start|>system\\n' + messages[0].content + '<|im_end|>\\n' }}\n    {%- endif %}\n{%- endif %}\n{%- set ns = namespace(multi_step_tool=true, last_query_index=messages|length - 1) %}\n{%- for message in messages[::-1] %}\n    {%- set index = (messages|length - 1) - loop.index0 %}\n    {%- if ns.multi_step_tool and message.role == \"user\" and not(message.content.startswith('<tool_response>') and message.content.endswith('</tool_response>')) %}\n        {%- set ns.multi_step_tool = false %}\n        {%- set ns.last_query_index = index %}\n    {%- endif %}\n{%- endfor %}\n{%- for message in messages %}\n    {%- if (message.role == \"user\") or (message.role == \"system\" and not loop.first) %}\n        {{- '<|im_start|>' + message.role + '\\n' + message.content + '<|im_end|>' + '\\n' }}\n    {%- elif message.role == \"assistant\" %}\n        {%- set content = message.content %}\n        {%- set reasoning_content = '' %}\n        {%- if message.reasoning_content is defined and message.reasoning_content is not none %}\n            {%- set reasoning_content = message.reasoning_content %}\n        {%- else %}\n            {%- if '</think>' in message.content %}\n                {%- set content = message.content.split('</think>')[-1].lstrip('\\n') %}\n                {%- set reasoning_content = message.content.split('</think>')[0].rstrip('\\n').split('<think>')[-1].lstrip('\\n') %}\n            {%- endif %}\n        {%- endif %}\n        {%- if loop.index0 > ns.last_query_index %}\n            {%- if loop.last or (not loop.last and reasoning_content) %}\n                {{- '<|im_start|>' + message.role + '\\n<think>\\n' + reasoning_content.strip('\\n') + '\\n</think>\\n\\n' + content.lstrip('\\n') }}\n            {%- else %}\n                {{- '<|im_start|>' + message.role + '\\n' + content }}\n            {%- endif %}\n        {%- else %}\n            {{- '<|im_start|>' + message.role + '\\n' + content }}\n        {%- endif %}\n        {%- if message.tool_calls %}\n            {%- for tool_call in message.tool_calls %}\n                {%- if (loop.first and content) or (not loop.first) %}\n                    {{- '\\n' }}\n                {%- endif %}\n                {%- if tool_call.function %}\n                    {%- set tool_call = tool_call.function %}\n                {%- endif %}\n                {{- '<tool_call>\\n{\"name\": \"' }}\n                {{- tool_call.name }}\n                {{- '\", \"arguments\": ' }}\n                {%- if tool_call.arguments is string %}\n                    {{- tool_call.arguments }}\n                {%- else %}\n                    {{- tool_call.arguments | tojson }}\n                {%- endif %}\n                {{- '}\\n</tool_call>' }}\n            {%- endfor %}\n        {%- endif %}\n        {{- '<|im_end|>\\n' }}\n    {%- elif message.role == \"tool\" %}\n        {%- if loop.first or (messages[loop.index0 - 1].role != \"tool\") %}\n            {{- '<|im_start|>user' }}\n        {%- endif %}\n        {{- '\\n<tool_response>\\n' }}\n        {{- message.content }}\n        {{- '\\n</tool_response>' }}\n        {%- if loop.last or (messages[loop.index0 + 1].role != \"tool\") %}\n            {{- '<|im_end|>\\n' }}\n        {%- endif %}\n    {%- endif %}\n{%- endfor %}\n{%- if add_generation_prompt %}\n    {{- '<|im_start|>assistant\\n' }}\n    {%- if enable_thinking is defined and enable_thinking is false %}\n        {{- '<think>\\n\\n</think>\\n\\n' }}\n    {%- endif %}\n{%- endif %}",
  "clean_up_tokenization_spaces": false,
  "eos_token": "<|im_end|>",
  "errors": "replace",
  "model_max_length": 131072,
  "pad_token": "<|endoftext|>",
  "split_special_tokens": false,
  "tokenizer_class": "Qwen2Tokenizer",
  "unk_token": null
 }
--- a/vocab.json
+++ b/vocab.json
		`@@ -0,0 +1 @@`
							`{"framework":"Pytorch","task":"text-generation"}`