--- language: - tr license: apache-2.0 base_model: mistralai/Mistral-Nemo-Instruct-2407 tags: - mistral - turkish - teknofest - tubitak - fine-tuned - qlora - unsloth pipeline_tag: text-generation --- # ProjeDanışmanAi **TEKNOFEST ve TÜBİTAK yarışmacıları için Türkçe yapay zeka danışmanı.** Mistral-Nemo-Instruct-2407 (12B) modeli, TEKNOFEST ve TÜBİTAK yarışma süreçlerine özel Türkçe veri setiyle fine-tune edilmiştir. --- ## Model Detayları | Özellik | Değer | |---|---| | Temel Model | mistralai/Mistral-Nemo-Instruct-2407 | | Yöntem | QLoRA 4-bit + unsloth | | LoRA Rank | 64 (alpha=128, rsLoRA=True) | | Eğitim Verisi | 3043 Türkçe instruction-output çifti | | Epoch | 5 | | Max Seq Length | 3072 | | Train Loss | 0.3591 | --- ## Kullanım Alanları - TEKNOFEST KTR/PTR teknik rapor yazımı - TÜBİTAK başvuru hazırlığı - Proje fikri netleştirme - Risk analizi ve uygulanabilirlik değerlendirmesi - Başlık ve özet üretimi - Jüri ve sunum hazırlığı --- ## Veri Seti 3043 Türkçe örnekten oluşan özel veri seti: | Kategori | Örnek Sayısı | |---|---| | rapor_yazimi | 761 | | sifirdan_proje | 730 | | genel_ozet | 593 | | strateji | 505 | | hata_duzeltme | 324 | | red (alan dışı red) | 130 | --- ## Kullanım ### GGUF (Ollama ile) ```bash ollama create projedanismanai -f Modelfile ollama run projedanismanai ``` ### Python (unsloth ile) ```python from unsloth import FastLanguageModel model, tokenizer = FastLanguageModel.from_pretrained( model_name = "Rudblest/projedanismanai", max_seq_length = 3072, dtype = None, load_in_4bit = True, ) FastLanguageModel.for_inference(model) prompt = "[INST] TEKNOFEST KTR raporunda risk analizi nasıl yazılır? [/INST] " inputs = tokenizer(prompt, return_tensors="pt").to("cuda") output = model.generate(**inputs, max_new_tokens=512, temperature=0.7) print(tokenizer.decode(output[0], skip_special_tokens=True)) ``` --- ## Sınırlamalar - Yalnızca Türkçe cevap verir - Alan dışı sorular (yemek, borsa, sağlık vb.) reddedilir - TEKNOFEST/TÜBİTAK dışı mühendislik konularında performans düşebilir --- ## Lisans Apache 2.0 — Mistral-Nemo temel modeli lisansına uygun.