Files
ru-chat-3b-gguf-q4/README.md
ModelHub XC 6c28f50bf8 初始化项目,由ModelHub XC社区提供模型
Model: aiplatforms/ru-chat-3b-gguf-q4
Source: Original Platform
2026-06-06 09:52:15 +08:00

55 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
license: apache-2.0
language:
- ru
- en
tags:
- aiplatforms
- russian
- local-ai
- gguf
- llama-cpp
- chat
- experimental
pipeline_tag: text-generation
---
# AI Platforms RU Chat 3B GGUF Q4
Экспериментальная русскоязычная chat-модель AI Platforms для локального inference, оценки SFT и тестирования компактных on-premise LLM.
## Назначение
- локальные chat-прототипы;
- оценка русскоязычного SFT;
- быстрый inference на рабочей станции или GPU-сервере;
- смешивание с RAG/tool-use обвязкой в закрытых стендах.
## Технические заметки
- Формат: GGUF для локального inference через llama.cpp, LM Studio, Ollama-совместимые пайплайны или кастомную обвязку.
- Язык: русский, частично английский.
- Рекомендуемый сценарий: локальный inference в контролируемой среде.
- Для публичных и корпоративных сценариев требуется внешний слой безопасности и доменная оценка.
## Как использовать
Файлы модели доступны во вкладке **Files and versions**. Используйте runtime, совместимый с форматом конкретного репозитория.
Для закрытых стендов рекомендуем использовать модель вместе с:
- системным prompt под конкретный сценарий;
- внешними guardrails и пост-модерацией;
- логированием ответов;
- отдельным тестовым набором для оценки качества и рисков.
## Ограничения
- Модель может ошибаться и галлюцинировать без внешнего контекста.
- Не является готовым production-ассистентом.
- Для промышленного внедрения необходимы тестирование на данных заказчика, guardrails, мониторинг и контроль качества.
## AI Platforms
[AI Platforms](https://aiplatforms.ru/) проектирует и внедряет локальные ИИ-платформы для бизнеса: приватные LLM, RAG, машинное зрение, AI-агентов, 3D-аватары и AI-серверы под ключ.