初始化项目，由ModelHub XC社区提供模型

Model: hmzBen/medgemma-1.5-medical-q4km Source: Original Platform
2026-06-09 08:43:15 +08:00
commit b52904f4f5
4 changed files with 115 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,37 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+medgemma-1.5-4b-it-F16.gguf filter=lfs diff=lfs merge=lfs -text
+medgemma-1.5-medical-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,72 @@
+---
+license: other
+language:
+  - en
+tags:
+  - gguf
+  - llama.cpp
+  - medgemma
+  - medical
+  - quantized
+library_name: llama.cpp
+pipeline_tag: text-generation
+base_model: google/medgemma-1.5-4b-it
+---
+
+# MedGemma 1.5 Medical Q4_K_M (GGUF)
+
+This repository hosts a GGUF export of **MedGemma-1.5-4B-IT**, quantized for efficient local inference.
+
+## Summary
+
+- **Base model**: `google/medgemma-1.5-4b-it`
+- **Format**: GGUF (for `llama.cpp`)
+- **Quantization**: `Q4_K_M` (mixed precision)
+- **Intended use**: local medical assistant workflows, triage support, structured extraction
+
+## Files
+
+- `medgemma-1.5-medical-Q4_K_M.gguf` (quantized)
+- `medgemma-1.5-4b-it-F16.gguf` (optional, full precision)
+
+## Usage (llama.cpp)
+
+```bash
+./llama-server \
+  -m medgemma-1.5-medical-Q4_K_M.gguf \
+  --host 0.0.0.0 \
+  --port 8080 \
+  --alias medgemma
+```
+
+## Usage (Python client)
+
+```python
+from medgemma_client import MedGemmaAgent
+
+agent = MedGemmaAgent(base_url="http://localhost:8080")
+print(agent.generate_clinical_text("Patient has stiff neck and fever. What is the triage concern?"))
+```
+
+## Quantization Notes
+
+This GGUF was produced using an I-Matrix calibrated on a medical mixed-domain dataset:
+- Doctor-patient dialogue
+- Medical facts
+- Diagnostic reasoning
+
+The goal is to preserve clinical reasoning while reducing memory footprint.
+
+## Safety and Limitations
+
+This model is **not a substitute for professional medical advice**. It can make mistakes and must be used with human oversight. Always validate outputs before use in clinical decision-making.
+
+## License
+
+MedGemma is distributed under the **Health AI Developer Foundations** license by Google. Ensure your use and redistribution comply with the model terms:
+- https://developers.google.com/health-ai-developer-foundations
+
+## Acknowledgments
+
+- Google DeepMind for MedGemma
+- ggml-org for llama.cpp
--- a/medgemma-1.5-4b-it-F16.gguf
+++ b/medgemma-1.5-4b-it-F16.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:a765f81af049b1b08da974b4ed6977127af906e14e35be869af9bc920be4918d
+size 7767803904
--- a/medgemma-1.5-medical-Q4_K_M.gguf
+++ b/medgemma-1.5-medical-Q4_K_M.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:4f3a31ce7d4643f509842618e0f3c9a66c0990b7bc4232d691a23027b175fe32
+size 2489894400