fromtransformersimportAutoModelForCausalLM,AutoTokenizermodel=AutoModelForCausalLM.from_pretrained("Alamori/GoldenNet-Qwen2.5-0.5B-Full-v1",device_map="auto",torch_dtype="auto")tokenizer=AutoTokenizer.from_pretrained("Alamori/GoldenNet-Qwen2.5-0.5B-Full-v1")# Classification examplecorrespondence="""جمهورية العراق
وزارة التربية
العدد: 1234/ت/2025
إلى/ السيد مدير عام التعليم المحترم
م/ طلب تعيين معلمين
نرجو الموافقة على تعيين 50 معلماً.
مع التقدير"""instruction="صنّف المراسلة الحكومية التالية إلى إحدى الفئات: طلب، شكوى، تقرير، إعلام، استفسار، دعوة، تعميم، إحالة. أجب بصيغة JSON."messages=[{"role":"user","content":f"{instruction}\n\n{correspondence}"}]text=tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True)inputs=tokenizer(text,return_tensors="pt").to(model.device)outputs=model.generate(**inputs,max_new_tokens=256,temperature=0.1)print(tokenizer.decode(outputs[0][inputs['input_ids'].shape[1]:],skip_special_tokens=True))
When to Use This Model
Use Full-v1 when you need maximum task-specific performance and have sufficient storage/memory
Use QLoRA-v1 for best balance of quality and efficiency (recommended for most cases)
Use LoRA-v1 for comparison or when you need standard LoRA compatibility