Urdu-Llama-3.2-3B-Instruct-v1

Khurram123/Urdu-Llama-3.2-3B-Instruct-v1

Go to file

ModelHub XC 8fbb4a4ac1 初始化项目，由ModelHub XC社区提供模型

Model: Khurram123/Urdu-Llama-3.2-3B-Instruct-v1
Source: Original Platform

2026-05-10 01:55:27 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 01:55:27 +08:00

README.md

language, license, base_model, tags, datasets, metrics, model-index

language

license

base_model

Model Highlights

Native Urdu Reasoning: Trained on the large-traversaal/urdu-instruct dataset (51.7k rows), enabling the model to handle translation, creative writing, and QA tasks with cultural nuance.
Efficient Architecture: Fine-tuned using Unsloth and QLoRA on an NVIDIA RTX 4060 Ti, making it a powerful yet lightweight 3B parameter model.
Optimized for 2026: Uses the latest Llama 3.2 multilingual tokenizer for better Urdu script handling.

How to Use

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "Khurram123/Urdu-Llama-3.2-3B-Instruct-v1"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")

instruction = "مصنوعی ذہانت کے مستقبل پر ایک مختصر نوٹ لکھیں۔"
prompt = f"### ہدایت:\n{instruction}\n\n### جواب:\n"

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))