Go to file

ModelHub XC d486bfc105 初始化项目，由ModelHub XC社区提供模型

Model: AksaraLLM/AksaraLLM-Qwen-1.5B
Source: Original Platform

2026-05-22 01:18:23 +08:00

checkpoint_step2

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step100

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step200

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step300

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step400

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step500

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step600

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step700

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step800

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

checkpoint_step900

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-22 01:18:23 +08:00

README.md

language, license, library_name, pipeline_tag, base_model, tags

language

license

library_name

pipeline_tag

base_model

AksaraLLM-Qwen-1.5B

Indonesian-tuned Qwen2 1.5B (1.78B params actual). Production checkpoint of the AksaraLLM-Qwen-1.5B series.

Measured baseline (Devin audit, CPU bf16, 50 short Indonesian sentences)

Metric	Value
Perplexity	8.4
English-stopword ratio in ID-prompted output	0.0%
Indonesian-stopword ratio in ID-prompted output	24.5%
Parameters	1777.1 M
Architecture	Qwen2ForCausalLM

Versions

This repo is the rolling production tag for the 1.5B Qwen2 line. Earlier fixed-snapshot variants:

AksaraLLM/AksaraLLM-Qwen-1.5B-v5-public (PPL 8.4, recommended public download)
AksaraLLM/AksaraLLM-Qwen-1.5B-v3-public (older)
AksaraLLM/AksaraLLM-Qwen-1.5B-v3b-overnight (experimental long-run)
AksaraLLM/aksarallm-1.5b-v2-checkpoint (older 1.5B Qwen2 baseline, PPL 9.9)

Quickstart

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tok = AutoTokenizer.from_pretrained("AksaraLLM/AksaraLLM-Qwen-1.5B")
model = AutoModelForCausalLM.from_pretrained(
    "AksaraLLM/AksaraLLM-Qwen-1.5B",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
inp = tok("Indonesia adalah negara", return_tensors="pt").to(model.device)
print(tok.decode(model.generate(**inp, max_new_tokens=120, do_sample=True, top_p=0.9)[0], skip_special_tokens=True))

Known issues / fix-it list

tie_word_embeddings config / checkpoint mismatch (same as v5-public). Set tie_word_embeddings: false in config.json to silence the warning safely.
Identity uncalibrated (model may say "I'm Qwen").
No chat template in tokenizer_config.json — add Qwen2 ChatML.

License

Apache 2.0

Sample outputs (CPU inference, greedy, repeat_penalty=1.15)

Real generation captured during the Devin audit on 2026-05-02. Greedy decoding (do_sample=False) so these are reproducible.

Continuations (no chat template)

Prompt: Indonesia adalah negara kepulauan terbesar di dunia,
Continuation: dengan 17.508 pulau yang tersebar di seluruh wilayahnya. Indonesia memiliki berbagai jenis tanaman dan hewan, termasuk beberapa spesies unik seperti kelinci kambing (Borneo), burung bali (Sunda), dan buaya laut (Sumatera). Selain itu, Indonesia juga merupakan salah satu negara

Prompt: Resep sederhana untuk membuat nasi goreng adalah
Continuation: dengan memasaknya menggunakan bahan-bahan yang mudah didapatkan di rumah. Bisa juga disajikan sebagai hidangan makan malam atau sarapan. Banyak orang menganggap bahwa nasi goreng hanya bisa dibuat oleh chef, namun sebenarnya tidak demikian. Hanya saja cara pembuatan dan proses penyajian yang ber

Prompt: Ibukota Republik Indonesia adalah
Continuation: Jakarta. Kota ini terletak di bagian tengah pulau Jawa, tepatnya berada pada ketinggian 10 meter dari permukaan laut dan memiliki luas wilayah sekitar 584 kilometer persegi. Jakarta merupakan ibu negara atau Ibukota Republik Indonesia yang menjadi pusat pemerintahan nasional serta

Prompt: Bahasa Indonesia berasal dari rumpun bahasa
Continuation: yang berbeda-beda, yaitu: A. Jawa dan Madura B. Melayu dan Minangkabau C. Aceh dan Sunda D. Sumatera dan Kalimantan

Jawaban: C

Penjelasan:

Bahasa Indonesia adalah sebuah bahasa yang terdiri atas beberapa subbahasa atau var