Files
projedanismanai/README.md
ModelHub XC c7848d7662 初始化项目,由ModelHub XC社区提供模型
Model: Rudblest/projedanismanai
Source: Original Platform
2026-05-25 21:25:16 +08:00

106 lines
2.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
language:
- tr
license: apache-2.0
base_model: mistralai/Mistral-Nemo-Instruct-2407
tags:
- mistral
- turkish
- teknofest
- tubitak
- fine-tuned
- qlora
- unsloth
pipeline_tag: text-generation
---
# ProjeDanışmanAi
**TEKNOFEST ve TÜBİTAK yarışmacıları için Türkçe yapay zeka danışmanı.**
Mistral-Nemo-Instruct-2407 (12B) modeli, TEKNOFEST ve TÜBİTAK yarışma süreçlerine özel Türkçe veri setiyle fine-tune edilmiştir.
---
## Model Detayları
| Özellik | Değer |
|---|---|
| Temel Model | mistralai/Mistral-Nemo-Instruct-2407 |
| Yöntem | QLoRA 4-bit + unsloth |
| LoRA Rank | 64 (alpha=128, rsLoRA=True) |
| Eğitim Verisi | 3043 Türkçe instruction-output çifti |
| Epoch | 5 |
| Max Seq Length | 3072 |
| Train Loss | 0.3591 |
---
## Kullanım Alanları
- TEKNOFEST KTR/PTR teknik rapor yazımı
- TÜBİTAK başvuru hazırlığı
- Proje fikri netleştirme
- Risk analizi ve uygulanabilirlik değerlendirmesi
- Başlık ve özet üretimi
- Jüri ve sunum hazırlığı
---
## Veri Seti
3043 Türkçe örnekten oluşan özel veri seti:
| Kategori | Örnek Sayısı |
|---|---|
| rapor_yazimi | 761 |
| sifirdan_proje | 730 |
| genel_ozet | 593 |
| strateji | 505 |
| hata_duzeltme | 324 |
| red (alan dışı red) | 130 |
---
## Kullanım
### GGUF (Ollama ile)
```bash
ollama create projedanismanai -f Modelfile
ollama run projedanismanai
```
### Python (unsloth ile)
```python
from unsloth import FastLanguageModel
model, tokenizer = FastLanguageModel.from_pretrained(
model_name = "Rudblest/projedanismanai",
max_seq_length = 3072,
dtype = None,
load_in_4bit = True,
)
FastLanguageModel.for_inference(model)
prompt = "<s>[INST] TEKNOFEST KTR raporunda risk analizi nasıl yazılır? [/INST] "
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
output = model.generate(**inputs, max_new_tokens=512, temperature=0.7)
print(tokenizer.decode(output[0], skip_special_tokens=True))
```
---
## Sınırlamalar
- Yalnızca Türkçe cevap verir
- Alan dışı sorular (yemek, borsa, sağlık vb.) reddedilir
- TEKNOFEST/TÜBİTAK dışı mühendislik konularında performans düşebilir
---
## Lisans
Apache 2.0 — Mistral-Nemo temel modeli lisansına uygun.