初始化项目，由ModelHub XC社区提供模型

Model: inclusionAI/Ling-Coder-lite-base Source: Original Platform
2026-04-11 11:13:56 +08:00
commit 72cabdfa4a
20 changed files with 261722 additions and 0 deletions
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,23 @@
+{
+    "add_bos_token": false,
+    "add_eos_token": false,
+    "additional_special_tokens": [
+        "<|fim_begin|>",
+        "<|fim_hole|>",
+        "<|fim_end|>",
+        "<|fim_pad|>",
+        "<|repo_name|>",
+        "<|file_sep|>"
+    ],
+    "bos_token": "<|startoftext|>",
+    "clean_up_tokenization_spaces": false,
+    "cls_token": "[CLS]",
+    "eos_token": "<|endoftext|>",
+    "gmask_token": "[gMASK]",
+    "merges_file": null,
+    "model_max_length": 1000000000000000019884624838656,
+    "tokenizer_class": "PreTrainedTokenizerFast",
+    "vocab_file": null,
+    "pad_token": "<|endoftext|>",
+    "fast_tokenizer": true
+}