Model: Rudblest/projedanismanai Source: Original Platform
language, license, base_model, tags, pipeline_tag
| language | license | base_model | tags | pipeline_tag | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
apache-2.0 | mistralai/Mistral-Nemo-Instruct-2407 |
|
text-generation |
ProjeDanışmanAi
TEKNOFEST ve TÜBİTAK yarışmacıları için Türkçe yapay zeka danışmanı.
Mistral-Nemo-Instruct-2407 (12B) modeli, TEKNOFEST ve TÜBİTAK yarışma süreçlerine özel Türkçe veri setiyle fine-tune edilmiştir.
Model Detayları
| Özellik | Değer |
|---|---|
| Temel Model | mistralai/Mistral-Nemo-Instruct-2407 |
| Yöntem | QLoRA 4-bit + unsloth |
| LoRA Rank | 64 (alpha=128, rsLoRA=True) |
| Eğitim Verisi | 3043 Türkçe instruction-output çifti |
| Epoch | 5 |
| Max Seq Length | 3072 |
| Train Loss | 0.3591 |
Kullanım Alanları
- TEKNOFEST KTR/PTR teknik rapor yazımı
- TÜBİTAK başvuru hazırlığı
- Proje fikri netleştirme
- Risk analizi ve uygulanabilirlik değerlendirmesi
- Başlık ve özet üretimi
- Jüri ve sunum hazırlığı
Veri Seti
3043 Türkçe örnekten oluşan özel veri seti:
| Kategori | Örnek Sayısı |
|---|---|
| rapor_yazimi | 761 |
| sifirdan_proje | 730 |
| genel_ozet | 593 |
| strateji | 505 |
| hata_duzeltme | 324 |
| red (alan dışı red) | 130 |
Kullanım
GGUF (Ollama ile)
ollama create projedanismanai -f Modelfile
ollama run projedanismanai
Python (unsloth ile)
from unsloth import FastLanguageModel
model, tokenizer = FastLanguageModel.from_pretrained(
model_name = "Rudblest/projedanismanai",
max_seq_length = 3072,
dtype = None,
load_in_4bit = True,
)
FastLanguageModel.for_inference(model)
prompt = "<s>[INST] TEKNOFEST KTR raporunda risk analizi nasıl yazılır? [/INST] "
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
print(tokenizer.decode(output[0], skip_special_tokens=True))
Sınırlamalar
- Yalnızca Türkçe cevap verir
- Alan dışı sorular (yemek, borsa, sağlık vb.) reddedilir
- TEKNOFEST/TÜBİTAK dışı mühendislik konularında performans düşebilir
Lisans
Apache 2.0 — Mistral-Nemo temel modeli lisansına uygun.
Description