Model: 42ailab/OLMo3-190M-zh Source: Original Platform
从零训练的 190M 中文 base 模型,OLMo3 canonical 架构。活水 42ailab 出品,配套《零基础 AI 大模型研发训练营》L04 预训练讲。
from transformers import AutoModelForCausalLM, AutoTokenizer tok = AutoTokenizer.from_pretrained("42ailab/OLMo3-190M-zh") model = AutoModelForCausalLM.from_pretrained("42ailab/OLMo3-190M-zh")
合计 1 绿 / 3 黄 / 3 红 — 这是 base 的状态。改进版见 42ailab/OLMo3-190M-zh-v3.1(continue pretrain 后"北大在北京"/"Python 是编程语言"等改善)。
42ailab/OLMo3-190M-zh-v3.1
v3 (本 repo) ──continue pretrain──▶ v3.1 (42ailab/OLMo3-190M-zh-v3.1)
@misc{huoshui-olmo3-190m-zh, title={OLMo3-190M-zh: Chinese Pretrain Teaching Model}, author={活水 AI 实验室 (42ailab) and 阳志平}, year={2026}, howpublished={\url{https://huggingface.co/42ailab/OLMo3-190M-zh}}, note={LLM001 Course, Lecture 04} }