6c28f50bf8958d98512037147de349d02318a555
Model: aiplatforms/ru-chat-3b-gguf-q4 Source: Original Platform
license, language, tags, pipeline_tag
| license | language | tags | pipeline_tag | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| apache-2.0 |
|
|
text-generation |
AI Platforms RU Chat 3B GGUF Q4
Экспериментальная русскоязычная chat-модель AI Platforms для локального inference, оценки SFT и тестирования компактных on-premise LLM.
Назначение
- локальные chat-прототипы;
- оценка русскоязычного SFT;
- быстрый inference на рабочей станции или GPU-сервере;
- смешивание с RAG/tool-use обвязкой в закрытых стендах.
Технические заметки
- Формат: GGUF для локального inference через llama.cpp, LM Studio, Ollama-совместимые пайплайны или кастомную обвязку.
- Язык: русский, частично английский.
- Рекомендуемый сценарий: локальный inference в контролируемой среде.
- Для публичных и корпоративных сценариев требуется внешний слой безопасности и доменная оценка.
Как использовать
Файлы модели доступны во вкладке Files and versions. Используйте runtime, совместимый с форматом конкретного репозитория.
Для закрытых стендов рекомендуем использовать модель вместе с:
- системным prompt под конкретный сценарий;
- внешними guardrails и пост-модерацией;
- логированием ответов;
- отдельным тестовым набором для оценки качества и рисков.
Ограничения
- Модель может ошибаться и галлюцинировать без внешнего контекста.
- Не является готовым production-ассистентом.
- Для промышленного внедрения необходимы тестирование на данных заказчика, guardrails, мониторинг и контроль качества.
AI Platforms
AI Platforms проектирует и внедряет локальные ИИ-платформы для бизнеса: приватные LLM, RAG, машинное зрение, AI-агентов, 3D-аватары и AI-серверы под ключ.
Description