pretrain-wura

Go to file

ModelHub XC d7dc2b1708 初始化项目，由ModelHub XC社区提供模型

Model: llama-lang-adapt/pretrain-wura
Source: Original Platform

2026-05-17 14:22:53 +08:00

.gitattributes

2026-05-17 14:22:53 +08:00

config.json

2026-05-17 14:22:53 +08:00

generation_config.json

2026-05-17 14:22:53 +08:00

pytorch_model-00001-of-00003.bin

2026-05-17 14:22:53 +08:00

pytorch_model-00002-of-00003.bin

2026-05-17 14:22:53 +08:00

pytorch_model-00003-of-00003.bin

2026-05-17 14:22:53 +08:00

pytorch_model.bin.index.json

2026-05-17 14:22:53 +08:00

README.md

2026-05-17 14:22:53 +08:00

special_tokens_map.json

2026-05-17 14:22:53 +08:00

tokenizer_config.json

2026-05-17 14:22:53 +08:00

tokenizer.model

2026-05-17 14:22:53 +08:00

datasets

llama-lang-adapt/wura

We continual pre-train meta-llama/Llama-2-7b-hf on monolingual WURA corpus for 20 languages. All languages are uniformly sampled.

Important Parameters