106 lines
2.2 KiB
Markdown
106 lines
2.2 KiB
Markdown
---
|
||
language:
|
||
- tr
|
||
license: apache-2.0
|
||
base_model: mistralai/Mistral-Nemo-Instruct-2407
|
||
tags:
|
||
- mistral
|
||
- turkish
|
||
- teknofest
|
||
- tubitak
|
||
- fine-tuned
|
||
- qlora
|
||
- unsloth
|
||
pipeline_tag: text-generation
|
||
---
|
||
|
||
# ProjeDanışmanAi
|
||
|
||
**TEKNOFEST ve TÜBİTAK yarışmacıları için Türkçe yapay zeka danışmanı.**
|
||
|
||
Mistral-Nemo-Instruct-2407 (12B) modeli, TEKNOFEST ve TÜBİTAK yarışma süreçlerine özel Türkçe veri setiyle fine-tune edilmiştir.
|
||
|
||
---
|
||
|
||
## Model Detayları
|
||
|
||
| Özellik | Değer |
|
||
|---|---|
|
||
| Temel Model | mistralai/Mistral-Nemo-Instruct-2407 |
|
||
| Yöntem | QLoRA 4-bit + unsloth |
|
||
| LoRA Rank | 64 (alpha=128, rsLoRA=True) |
|
||
| Eğitim Verisi | 3043 Türkçe instruction-output çifti |
|
||
| Epoch | 5 |
|
||
| Max Seq Length | 3072 |
|
||
| Train Loss | 0.3591 |
|
||
|
||
---
|
||
|
||
## Kullanım Alanları
|
||
|
||
- TEKNOFEST KTR/PTR teknik rapor yazımı
|
||
- TÜBİTAK başvuru hazırlığı
|
||
- Proje fikri netleştirme
|
||
- Risk analizi ve uygulanabilirlik değerlendirmesi
|
||
- Başlık ve özet üretimi
|
||
- Jüri ve sunum hazırlığı
|
||
|
||
---
|
||
|
||
## Veri Seti
|
||
|
||
3043 Türkçe örnekten oluşan özel veri seti:
|
||
|
||
| Kategori | Örnek Sayısı |
|
||
|---|---|
|
||
| rapor_yazimi | 761 |
|
||
| sifirdan_proje | 730 |
|
||
| genel_ozet | 593 |
|
||
| strateji | 505 |
|
||
| hata_duzeltme | 324 |
|
||
| red (alan dışı red) | 130 |
|
||
|
||
---
|
||
|
||
## Kullanım
|
||
|
||
### GGUF (Ollama ile)
|
||
|
||
```bash
|
||
ollama create projedanismanai -f Modelfile
|
||
ollama run projedanismanai
|
||
```
|
||
|
||
### Python (unsloth ile)
|
||
|
||
```python
|
||
from unsloth import FastLanguageModel
|
||
|
||
model, tokenizer = FastLanguageModel.from_pretrained(
|
||
model_name = "Rudblest/projedanismanai",
|
||
max_seq_length = 3072,
|
||
dtype = None,
|
||
load_in_4bit = True,
|
||
)
|
||
FastLanguageModel.for_inference(model)
|
||
|
||
prompt = "<s>[INST] TEKNOFEST KTR raporunda risk analizi nasıl yazılır? [/INST] "
|
||
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
|
||
output = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
|
||
print(tokenizer.decode(output[0], skip_special_tokens=True))
|
||
```
|
||
|
||
---
|
||
|
||
## Sınırlamalar
|
||
|
||
- Yalnızca Türkçe cevap verir
|
||
- Alan dışı sorular (yemek, borsa, sağlık vb.) reddedilir
|
||
- TEKNOFEST/TÜBİTAK dışı mühendislik konularında performans düşebilir
|
||
|
||
---
|
||
|
||
## Lisans
|
||
|
||
Apache 2.0 — Mistral-Nemo temel modeli lisansına uygun.
|