2.4 KiB
2.4 KiB
license, language, base_model, library_name, tags, pipeline_tag
| license | language | base_model | library_name | tags | pipeline_tag | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| apache-2.0 |
|
mistralai/Mistral-7B-Instruct-v0.3 | transformers |
|
text-generation |
LYRA-Uz
LYRA-Uz — o‘zbek tilida yuqori sifatli ko‘rsatmalarni bajaruvchi (instruction-tuned) ochiq manbali til modeli. Mistral-7B-Instruct-v0.3 arxitekturasi asosida o‘zbek va ingliz tillaridagi maʼlumotlar bilan maxsus oʻqitilgan. Apache 2.0 litsenziyasi bilan erkin foydalanish mumkin.
Asosiy imkoniyatlari
- Savol-javob — o‘zbek tilidagi umumiy bilim savollariga javob beradi
- Matnni umumlashtirish — uzoq matnlarni qisqacha bayon qiladi
- Tarjima — o‘zbek ↔ ingliz tillari o‘rtasida tarjima qiladi
- Matn tasnifi — yangiliklar, hissiy tahlil va boshqa toifalarga ajratadi
- Ko‘rsatmalarni bajarish — berilgan vazifani ingliz va o‘zbek tillarida tushunib, bajaradi
Tezkor ishlatish
```python
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("Abduqodir06/Lyra-Uz")
model = AutoModelForCausalLM.from_pretrained(
"Abduqodir06/Lyra-Uz",
load_in_4bit=True,
device_map="auto"
)
prompt = "O'zbekiston poytaxti qaysi?"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
LYRA loyihasi haqida
Ushbu model LYRA (Large Uzbek Language Reasoning Architecture) loyihasining bir qismidir. To‘liq loyiha quyidagi bosqichlarni o‘z ichiga oladi (hozirda ustida ish olib borilmoqda):
- Tokenizer optimallashtirish — o‘zbek tili morfologiyasiga mos BPE
- RAG va veb-qidiruv — bilimlarni real vaqtda qidirib javob berish
- Deploy — FastAPI, Telegram bot va ommaviy foydalanish
Hozirgi holat: Ushbu repo’dagi model LYRA loyihasining birinchi tayyor komponentidir. Qo‘shimcha funksiyalar (RAG, veb-qidiruv, maxsus tokenizator) ustida ish olib borilmoqda.
Texnik maʼlumotlar
| Xususiyat | Qiymat |
|---|---|
| Parametrlar soni | 7 milliard |
| Arxitektura | Mistral-7B-Instruct-v0.3 |
| Litsenziya | Apache 2.0 |
| GPU talabi (FP16) | ~14.5 GB VRAM |
| GPU talabi (4-bit) | ~4.5 GB VRAM |
| Tillari | o‘zbek (asosiy), ingliz |