Go to file

ModelHub XC 4680e50981 初始化项目，由ModelHub XC社区提供模型

Model: tartuNLP/Llama-2-7b-Ukrainian
Source: Original Platform

2026-04-22 00:43:36 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

model-00001-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

model-00002-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

model-00003-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-04-22 00:43:36 +08:00

README.md

library_name, license, datasets, language, pipeline_tag, base_model

library_name

license

datasets

language

pipeline_tag

base_model

transformers

llama2

uonlp/CulturaX

text-generation

meta-llama/Llama-2-7b-hf

Llama-2-7b-Ukrainian

Model Details

Model Description

Llama-2-7b-Ukrainian is a bilingual pre-trained model supporting Ukrainian and English. Continued pre-training from Llama-2-7b on 5B tokens consisting of 75% Ukrainian documents and 25% English documents from CulturaX.

Paper: To Err Is Human, but Llamas Can Learn It Too

Training Hyperparameters

Hyperparameter	Value
Training steps	19080
Batch size	256
Weight decay	0.1
Context length	1024
Learning rate	2e-5 linear decay to 2e-6
Precision	bf16
Optimizer	AdamW

Citation

BibTeX:

@article{luhtaru2024err,
  title={To Err Is Human, but Llamas Can Learn It Too},
  author={Luhtaru, Agnes and Purason, Taido and Vainikko, Martin and Del, Maksym and Fishel, Mark},
  journal={arXiv preprint arXiv:2403.05493},
  year={2024}
}