SykoLLM V5.6, SykoLLM ailesinin şu ana kadar eğitilmiş en gelişmiş ve en yetenekli modelidir. Bir önceki nesil olan V5.5-Beta'ya kıyasla çok daha fazla veriyle, çok daha güçlü donanımda eğitilmiştir.
BOS token yoktur. Model direkt <|user|> ile başlar, başa <s> veya herhangi bir başlangıç token'ıekleme.
Cümleyi bitiren token <|end|>'dir (ID: 3), <|endoftext|> değil. Generate ederken eos_token_id=3 vermeyi unutma, yoksa model durmaz.
<|endoftext|> (ID: 0) yalnızca vocab'ın 0. slotunu doldurmak için vardır, eğitimde hiç kullanılmamıştır.
Token ID Tablosu
Token
ID
Görevi
`<
endoftext
>`
`<
user
>`
`<
assistant
>`
`<
end
>`
`<
pad
>`
🚀 Kullanım
fromtransformersimportAutoModelForCausalLM,AutoTokenizerimporttorchmodel_id="SykoSLM/SykoLLM-V5.6"tokenizer=AutoTokenizer.from_pretrained(model_id)model=AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto")defchat(user_message):# BOS YOK — direkt <|user|> ile başlıyoruzprompt=f"<|user|>\n{user_message}<|end|>\n<|assistant|>\n"inputs=tokenizer(prompt,return_tensors="pt").to(model.device)withtorch.no_grad():outputs=model.generate(**inputs,max_new_tokens=256,do_sample=True,temperature=0.7,top_p=0.9,repetition_penalty=1.1,eos_token_id=3,# <|end|> gelince durpad_token_id=4# <|pad|>)# Sadece modelin ürettiği kısmı al, prompt'u çıkargenerated=outputs[0][inputs["input_ids"].shape[1]:]returntokenizer.decode(generated,skip_special_tokens=True)print(chat("Merhaba! Kendini tanıtır mısın?"))
🗺️ SykoLLM Ailesi
Versiyon
Durum
Veri Miktarı
Donanım
SykoLLM V5.5-Beta
✅ Yayında
~300K örnek
2× Tesla T4
SykoLLM V5.6
✅Yayında
~1.7M örnek
A100
⚠️ Sınırlamalar
Bağlam penceresi 1024 token ile sınırlıdır.
Model yalnızca ön-eğitim (pre-training) görmüştür; RLHF veya DPO gibi hizalama adımları uygulanmamıştır. Zaman zaman tutarsız yanıtlar üretebilir.
Kritik, tıbbi, hukuki veya güvenlik gerektiren uygulamalarda kullanımı önerilmez.
📄 Lisans
Apache 2.0 — Ticari kullanım serbesttir, modelin kaynağının belirtilmesi beklenir.