初始化项目，由ModelHub XC社区提供模型

Model: xiaowangge/minicpm4-8b-gguf Source: Original Platform
2026-06-22 03:07:13 +08:00
commit 11e710dd3f
6 changed files with 155 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,47 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bin.* filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *.tfevents* filter=lfs diff=lfs merge=lfs -text
 *.db* filter=lfs diff=lfs merge=lfs -text
 *.ark* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
 **/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.gguf* filter=lfs diff=lfs merge=lfs -text
 *.ggml filter=lfs diff=lfs merge=lfs -text
 *.llamafile* filter=lfs diff=lfs merge=lfs -text
 *.pt2 filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,98 @@
 ---
 frameworks:
 - Pytorch
 license: Apache License 2.0
 tasks:
 - text-generation
 #model-type:
 ##如 gpt、phi、llama、chatglm、baichuan 等
 #- gpt
 #domain:
 ##如 nlp、cv、audio、multi-modal
 #- nlp
 #language:
 ##语言代码列表 https://help.aliyun.com/document_detail/215387.html?spm=a2c4g.11186623.0.0.9f8d7467kni6Aa
 #- cn
 #metrics:
 ##如 CIDEr、Blue、ROUGE 等
 #- CIDEr
 #tags:
 ##各种自定义，包括 pretrained、fine-tuned、instruction-tuned、RL-tuned 等训练方法和其他
 #- pretrained
 #tools:
 ##如 vllm、fastchat、llamacpp、AdaSeq 等
 #- vllm
 language:
  - zh
  - en
 base_model:
  - OpenBMB/MiniCPM4-8B
 base_model_relation: quantized
 ---
 ### 介绍
 1. 该模型基于 `https://www.modelscope.cn/models/OpenBMB/MiniCPM4-8B` 转换。
 2. 开源许可遵循 `MiniCPM4-8B`。
 ### 模型下载
 #### SDK 下载
 ```bash
 # 安装 ModelScope
 pip install modelscope
 ```
 ```python
 # SDK模型下载
 from modelscope import snapshot_download
 model_dir = snapshot_download('xiaowangge/minicpm4-8b-gguf')
 ```
 #### Git 下载
 ```
 # Git模型下载
 git clone https://www.modelscope.cn/xiaowangge/minicpm4-8b-gguf.git
 ```
 ### 快速开始
 > 本地构建或下载预构建形式的 `llama.cpp` 文件，使用 `llama-cli` 推理。
 #### 源码构建 llama-cli
 ```bash
 # 克隆 llama.cpp 源码
 git clone -b  https://github.com/ggml-org/llama.cpp
 # 进入目录
 cd llama.cpp
 # 构建配置，开启 CUDA 加速，禁用 CURL
 cmake -B build -DGGML_CUDA=ON -DLLAMA_CURL=OFF
 # 多任务加速构建
 cmake --build build --config Release -j 10
 # 测试
 build/bin/llama-cli -h
 ```
 #### llama-cli 推理
 ```bash
 # GPU 加速
 build/bin/llama-cli -m ./minicpm4-8b-fp16.gguf -c 1024 -ngl 128 -n 512 -p "介绍下你自己"
 ```
 #### ollama 推理
 > 如果不想进行复杂的 `llama.cpp `编译或配置，可使用 `ollama(version>=0.9.2)` 快速推理。
 ```bash
 ollama run xiaowangge/minicpm4
 ```
--- a/configuration.json
+++ b/configuration.json
@@ -0,0 +1 @@
 {"framework":"Pytorch","task":"text-generation"}
--- a/minicpm4-8b-fp16.gguf
+++ b/minicpm4-8b-fp16.gguf
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:cfe621d49d5cc5cee17043f5c96e93c00bd1c596f4ee140fe3baeb8366cc00d0
 size 16372735296
--- a/minicpm4-8b-q4_K_M.gguf
+++ b/minicpm4-8b-q4_K_M.gguf
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:ccb5f071bf493b73029cbf190344cec01a599fafcc22e80de6361c396ddac07b
 size 4965526080
--- a/minicpm4-8b-q8_0.gguf
+++ b/minicpm4-8b-q8_0.gguf
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:54bc78f66953d50e0c1a18bab8db71a283ebd7e366178f79d415388990a8adcc
 size 8699309376
		`@@ -0,0 +1 @@`
							`{"framework":"Pytorch","task":"text-generation"}`