初始化项目,由ModelHub XC社区提供模型
Model: Rudblest/projedanismanai Source: Original Platform
This commit is contained in:
105
README.md
Normal file
105
README.md
Normal file
@@ -0,0 +1,105 @@
|
||||
---
|
||||
language:
|
||||
- tr
|
||||
license: apache-2.0
|
||||
base_model: mistralai/Mistral-Nemo-Instruct-2407
|
||||
tags:
|
||||
- mistral
|
||||
- turkish
|
||||
- teknofest
|
||||
- tubitak
|
||||
- fine-tuned
|
||||
- qlora
|
||||
- unsloth
|
||||
pipeline_tag: text-generation
|
||||
---
|
||||
|
||||
# ProjeDanışmanAi
|
||||
|
||||
**TEKNOFEST ve TÜBİTAK yarışmacıları için Türkçe yapay zeka danışmanı.**
|
||||
|
||||
Mistral-Nemo-Instruct-2407 (12B) modeli, TEKNOFEST ve TÜBİTAK yarışma süreçlerine özel Türkçe veri setiyle fine-tune edilmiştir.
|
||||
|
||||
---
|
||||
|
||||
## Model Detayları
|
||||
|
||||
| Özellik | Değer |
|
||||
|---|---|
|
||||
| Temel Model | mistralai/Mistral-Nemo-Instruct-2407 |
|
||||
| Yöntem | QLoRA 4-bit + unsloth |
|
||||
| LoRA Rank | 64 (alpha=128, rsLoRA=True) |
|
||||
| Eğitim Verisi | 3043 Türkçe instruction-output çifti |
|
||||
| Epoch | 5 |
|
||||
| Max Seq Length | 3072 |
|
||||
| Train Loss | 0.3591 |
|
||||
|
||||
---
|
||||
|
||||
## Kullanım Alanları
|
||||
|
||||
- TEKNOFEST KTR/PTR teknik rapor yazımı
|
||||
- TÜBİTAK başvuru hazırlığı
|
||||
- Proje fikri netleştirme
|
||||
- Risk analizi ve uygulanabilirlik değerlendirmesi
|
||||
- Başlık ve özet üretimi
|
||||
- Jüri ve sunum hazırlığı
|
||||
|
||||
---
|
||||
|
||||
## Veri Seti
|
||||
|
||||
3043 Türkçe örnekten oluşan özel veri seti:
|
||||
|
||||
| Kategori | Örnek Sayısı |
|
||||
|---|---|
|
||||
| rapor_yazimi | 761 |
|
||||
| sifirdan_proje | 730 |
|
||||
| genel_ozet | 593 |
|
||||
| strateji | 505 |
|
||||
| hata_duzeltme | 324 |
|
||||
| red (alan dışı red) | 130 |
|
||||
|
||||
---
|
||||
|
||||
## Kullanım
|
||||
|
||||
### GGUF (Ollama ile)
|
||||
|
||||
```bash
|
||||
ollama create projedanismanai -f Modelfile
|
||||
ollama run projedanismanai
|
||||
```
|
||||
|
||||
### Python (unsloth ile)
|
||||
|
||||
```python
|
||||
from unsloth import FastLanguageModel
|
||||
|
||||
model, tokenizer = FastLanguageModel.from_pretrained(
|
||||
model_name = "Rudblest/projedanismanai",
|
||||
max_seq_length = 3072,
|
||||
dtype = None,
|
||||
load_in_4bit = True,
|
||||
)
|
||||
FastLanguageModel.for_inference(model)
|
||||
|
||||
prompt = "<s>[INST] TEKNOFEST KTR raporunda risk analizi nasıl yazılır? [/INST] "
|
||||
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
|
||||
output = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
|
||||
print(tokenizer.decode(output[0], skip_special_tokens=True))
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Sınırlamalar
|
||||
|
||||
- Yalnızca Türkçe cevap verir
|
||||
- Alan dışı sorular (yemek, borsa, sağlık vb.) reddedilir
|
||||
- TEKNOFEST/TÜBİTAK dışı mühendislik konularında performans düşebilir
|
||||
|
||||
---
|
||||
|
||||
## Lisans
|
||||
|
||||
Apache 2.0 — Mistral-Nemo temel modeli lisansına uygun.
|
||||
Reference in New Issue
Block a user