commit 6c28f50bf8958d98512037147de349d02318a555 Author: ModelHub XC Date: Sat Jun 6 09:52:15 2026 +0800 初始化项目,由ModelHub XC社区提供模型 Model: aiplatforms/ru-chat-3b-gguf-q4 Source: Original Platform diff --git a/.gitattributes b/.gitattributes new file mode 100644 index 0000000..f5be2b1 --- /dev/null +++ b/.gitattributes @@ -0,0 +1,36 @@ +*.7z filter=lfs diff=lfs merge=lfs -text +*.arrow filter=lfs diff=lfs merge=lfs -text +*.bin filter=lfs diff=lfs merge=lfs -text +*.bz2 filter=lfs diff=lfs merge=lfs -text +*.ckpt filter=lfs diff=lfs merge=lfs -text +*.ftz filter=lfs diff=lfs merge=lfs -text +*.gz filter=lfs diff=lfs merge=lfs -text +*.h5 filter=lfs diff=lfs merge=lfs -text +*.joblib filter=lfs diff=lfs merge=lfs -text +*.lfs.* filter=lfs diff=lfs merge=lfs -text +*.mlmodel filter=lfs diff=lfs merge=lfs -text +*.model filter=lfs diff=lfs merge=lfs -text +*.msgpack filter=lfs diff=lfs merge=lfs -text +*.npy filter=lfs diff=lfs merge=lfs -text +*.npz filter=lfs diff=lfs merge=lfs -text +*.onnx filter=lfs diff=lfs merge=lfs -text +*.ot filter=lfs diff=lfs merge=lfs -text +*.parquet filter=lfs diff=lfs merge=lfs -text +*.pb filter=lfs diff=lfs merge=lfs -text +*.pickle filter=lfs diff=lfs merge=lfs -text +*.pkl filter=lfs diff=lfs merge=lfs -text +*.pt filter=lfs diff=lfs merge=lfs -text +*.pth filter=lfs diff=lfs merge=lfs -text +*.rar filter=lfs diff=lfs merge=lfs -text +*.safetensors filter=lfs diff=lfs merge=lfs -text +saved_model/**/* filter=lfs diff=lfs merge=lfs -text +*.tar.* filter=lfs diff=lfs merge=lfs -text +*.tar filter=lfs diff=lfs merge=lfs -text +*.tflite filter=lfs diff=lfs merge=lfs -text +*.tgz filter=lfs diff=lfs merge=lfs -text +*.wasm filter=lfs diff=lfs merge=lfs -text +*.xz filter=lfs diff=lfs merge=lfs -text +*.zip filter=lfs diff=lfs merge=lfs -text +*.zst filter=lfs diff=lfs merge=lfs -text +*tfevents* filter=lfs diff=lfs merge=lfs -text +model_q4_0.gguf filter=lfs diff=lfs merge=lfs -text diff --git a/README.md b/README.md new file mode 100644 index 0000000..396355f --- /dev/null +++ b/README.md @@ -0,0 +1,54 @@ +--- +license: apache-2.0 +language: +- ru +- en +tags: +- aiplatforms +- russian +- local-ai +- gguf +- llama-cpp +- chat +- experimental +pipeline_tag: text-generation +--- + +# AI Platforms RU Chat 3B GGUF Q4 + +Экспериментальная русскоязычная chat-модель AI Platforms для локального inference, оценки SFT и тестирования компактных on-premise LLM. + +## Назначение + +- локальные chat-прототипы; +- оценка русскоязычного SFT; +- быстрый inference на рабочей станции или GPU-сервере; +- смешивание с RAG/tool-use обвязкой в закрытых стендах. + +## Технические заметки + +- Формат: GGUF для локального inference через llama.cpp, LM Studio, Ollama-совместимые пайплайны или кастомную обвязку. +- Язык: русский, частично английский. +- Рекомендуемый сценарий: локальный inference в контролируемой среде. +- Для публичных и корпоративных сценариев требуется внешний слой безопасности и доменная оценка. + +## Как использовать + +Файлы модели доступны во вкладке **Files and versions**. Используйте runtime, совместимый с форматом конкретного репозитория. + +Для закрытых стендов рекомендуем использовать модель вместе с: + +- системным prompt под конкретный сценарий; +- внешними guardrails и пост-модерацией; +- логированием ответов; +- отдельным тестовым набором для оценки качества и рисков. + +## Ограничения + +- Модель может ошибаться и галлюцинировать без внешнего контекста. +- Не является готовым production-ассистентом. +- Для промышленного внедрения необходимы тестирование на данных заказчика, guardrails, мониторинг и контроль качества. + +## AI Platforms + +[AI Platforms](https://aiplatforms.ru/) проектирует и внедряет локальные ИИ-платформы для бизнеса: приватные LLM, RAG, машинное зрение, AI-агентов, 3D-аватары и AI-серверы под ключ. diff --git a/model_q4_0.gguf b/model_q4_0.gguf new file mode 100644 index 0000000..da2a97d --- /dev/null +++ b/model_q4_0.gguf @@ -0,0 +1,3 @@ +version https://git-lfs.github.com/spec/v1 +oid sha256:20eafb7632627702afe7850a064bf50eac74a43399b1d1b856223b33564df96c +size 1822849472