初始化项目，由ModelHub XC社区提供模型

Model: ryukin164/LFM2.5-1.2B-Q4-JP Source: Original Platform
2026-04-21 09:15:06 +08:00
commit 9badc5a358
10 changed files with 328139 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,36 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+LFM-Business-Perfect-Q4.gguf filter=lfs diff=lfs merge=lfs -text
--- a/LFM-Business-Perfect-Q4.gguf
+++ b/LFM-Business-Perfect-Q4.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:142617f1448634f7ea4125d8eec4de1367d81ffadc42101ea553ac7952a64037
+size 730894720
--- a/README.md
+++ b/README.md
@@ -0,0 +1,41 @@
+---
+license: apache-2.0
+language:
+- ja
+- en
+base_model: LiquidAI/LFM2.5-1.2B-JP
+tags:
+- liquid
+- lfm
+- gguf
+- quantization
+- business
+- expert
+library_name: gguf
+pipeline_tag: text-generation
+---
+
+# LFM 2.5 1.2B ビジネス専門家 (Q4_K_M GGUF)
+
+## 📌 モデル概要
+本プロジェクトは、[LiquidAI/LFM2.5-1.2B-JP](https://huggingface.co/LiquidAI/LFM2.5-1.2B-JP) をベースとした、**ビジネスシーン、専門的なコンサルティング、および論理的推論**に特化した量子化済みモデルです。
+
+最新の `llama.cpp` を使用し、**Q4_K_M** 形式で量子化を行いました。731MB という極めて軽量なサイズながら、高い推論能力を維持しています。
+
+* **アーキテクチャ:** LFM (Liquid Foundation Model) - 線形回帰と畳み込みを組み合わせた非 Transformer 構造。
+* **パラメータ数:** 1.2B
+* **量子化形式:** GGUF (Q4_K_M)
+* **ファイルサイズ:** 731 MB
+* **主な用途:** モバイルデバイスでの実行、低スペックサーバー、ビジネス対話エージェント。
+
+## 🚀 使い方
+
+### 1. llama.cpp で実行
+```bash
+./llama-cli -m LFM-Business-Perfect-Q4.gguf -n 512 --prompt "<|im_start|>user\n新規事業のキャッシュフローを最適化する方法を教えてください。<|im_end|>\n<|im_start|>assistant\n"
+2. Python (llama-cpp-python) で実行Pythonfrom llama_cpp import Llama
+
+llm = Llama(model_path="./LFM-Business-Perfect-Q4.gguf", n_ctx=2048)
+output = llm("<|im_start|>user\nビジネスプランの添削をお願いします。<|im_end|>\n<|im_start|>assistant\n", max_tokens=512)
+print(output["choices"][0]["text"])
+🛠 量子化の詳細Q4_K_M 量子化により、モデルの知能指数を最大限に保持しつつ、メモリ消費を大幅に削減しました。1.2B クラスのモデルにおいて、CPU 環境での実行に最も適したバランスです。項目詳細オリジナルサイズ~2.5 GB量子化後サイズ731 MB推奨 RAM2GB 以上⚠️ 免責事項このモデルは学習および研究目的で公開されています。生成される回答はアルゴリズムによるものであり、正確性や法的効力を保証するものではありません。実際のビジネス判断に際しては、専門家にご相談ください。🤝 謝辞優れたベースモデルをオープンソースとして公開してくださった Liquid AI チームに深く感謝いたします。
--- a/chat_template.jinja
+++ b/chat_template.jinja
@@ -0,0 +1,45 @@
+{{- bos_token -}}
+{%- set keep_past_thinking = keep_past_thinking | default(false) -%}
+{%- set ns = namespace(system_prompt="") -%}
+{%- if messages[0]["role"] == "system" -%}
+    {%- set ns.system_prompt = messages[0]["content"] -%}
+    {%- set messages = messages[1:] -%}
+{%- endif -%}
+{%- if tools -%}
+    {%- set ns.system_prompt = ns.system_prompt + ("\n" if ns.system_prompt else "") + "List of tools: [" -%}
+    {%- for tool in tools -%}
+        {%- if tool is not string -%}
+            {%- set tool = tool | tojson -%}
+        {%- endif -%}
+        {%- set ns.system_prompt = ns.system_prompt + tool -%}
+        {%- if not loop.last -%}
+            {%- set ns.system_prompt = ns.system_prompt + ", " -%}
+        {%- endif -%}
+    {%- endfor -%}
+    {%- set ns.system_prompt = ns.system_prompt + "]" -%}
+{%- endif -%}
+{%- if ns.system_prompt -%}
+    {{- "<|im_start|>system\n" + ns.system_prompt + "<|im_end|>\n" -}}
+{%- endif -%}
+{%- set ns.last_assistant_index = -1 -%}
+{%- for message in messages -%}
+    {%- if message["role"] == "assistant" -%}
+        {%- set ns.last_assistant_index = loop.index0 -%}
+    {%- endif -%}
+{%- endfor -%}
+{%- for message in messages -%}
+    {{- "<|im_start|>" + message["role"] + "\n" -}}
+    {%- set content = message["content"] -%}
+    {%- if content is not string -%}
+        {%- set content = content | tojson -%}
+    {%- endif -%}
+    {%- if message["role"] == "assistant" and not keep_past_thinking and loop.index0 != ns.last_assistant_index -%}
+        {%- if "</think>" in content -%}
+            {%- set content = content.split("</think>")[-1] | trim -%}
+        {%- endif -%}
+    {%- endif -%}
+    {{- content + "<|im_end|>\n" -}}
+{%- endfor -%}
+{%- if add_generation_prompt -%}
+    {{- "<|im_start|>assistant\n" -}}
+{%- endif -%}
--- a/config.json
+++ b/config.json
@@ -0,0 +1,57 @@
+{
+  "architectures": [
+    "Lfm2ForCausalLM"
+  ],
+  "block_auto_adjust_ff_dim": true,
+  "block_dim": 2048,
+  "block_ff_dim": 12288,
+  "block_ffn_dim_multiplier": 1.0,
+  "block_mlp_init_scale": 1.0,
+  "block_multiple_of": 256,
+  "block_norm_eps": 1e-05,
+  "block_out_init_scale": 1.0,
+  "block_use_swiglu": true,
+  "block_use_xavier_init": true,
+  "bos_token_id": 1,
+  "conv_L_cache": 3,
+  "conv_bias": false,
+  "conv_dim": 2048,
+  "conv_use_xavier_init": true,
+  "dtype": "float16",
+  "eos_token_id": 7,
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 12288,
+  "layer_types": [
+    "conv",
+    "conv",
+    "full_attention",
+    "conv",
+    "conv",
+    "full_attention",
+    "conv",
+    "conv",
+    "full_attention",
+    "conv",
+    "full_attention",
+    "conv",
+    "full_attention",
+    "conv",
+    "full_attention",
+    "conv"
+  ],
+  "max_position_embeddings": 128000,
+  "model_type": "lfm2",
+  "norm_eps": 1e-05,
+  "num_attention_heads": 32,
+  "num_heads": 32,
+  "num_hidden_layers": 16,
+  "num_key_value_heads": 8,
+  "pad_token_id": 0,
+  "rope_theta": 1000000.0,
+  "tie_embedding": true,
+  "transformers_version": "4.57.1",
+  "use_cache": true,
+  "use_pos_enc": true,
+  "vocab_size": 65536
+}
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,7 @@
+{
+  "_from_model_config": true,
+  "bos_token_id": 1,
+  "eos_token_id": 7,
+  "pad_token_id": 0,
+  "transformers_version": "4.57.1"
+}
--- a/model.safetensors
+++ b/model.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:4b1e61a9f7c2115767daccf60a5c71be61050a5b4aa032ce9232f7af78df6d95
+size 2340697784
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,23 @@
+{
+  "bos_token": {
+    "content": "<|startoftext|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "<|im_end|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|pad|>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer_config.json
+++ b/tokenizer_config.json