Go to file

ModelHub XC 1206ae2ad3 初始化项目，由ModelHub XC社区提供模型

Model: tartuNLP/Llammas-base
Source: Original Platform

2026-06-12 20:53:50 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

pytorch_model-00001-of-00002.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

pytorch_model-00002-of-00002.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

pytorch_model.bin.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-06-12 20:53:50 +08:00

README.md

language, pipeline_tag, base_model, license

language

pipeline_tag

base_model

license

text-generation

meta-llama/Llama-2-7b-hf

llama2

LLammas-base 🐑

Llama-2-7B with continued pre-training of 5B tokens of CulturaX (75% Estonian, 25% English documents).

This model is also instruction-tuned resulting in Llammas.

More details in our paper.

Citation

@misc{kuulmets2024teaching,
      title={Teaching Llama a New Language Through Cross-Lingual Knowledge Transfer}, 
      author={Hele-Andra Kuulmets and Taido Purason and Agnes Luhtaru and Mark Fishel},
      year={2024},
      eprint={2404.04042},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}