t1-1.5B

Go to file

ModelHub XC e6aba40944 初始化项目，由ModelHub XC社区提供模型

Model: Amu/t1-1.5B
Source: Original Platform

2026-05-11 15:24:50 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 15:24:50 +08:00

README.md

license, language, datasets, base_model, library_name

license

language

datasets

base_model

library_name

mit

simplescaling/s1K

lightblue/reasoning-multilingual-R1-Llama-70B-train

Qwen/Qwen2.5-1.5B-Instruct

transformers

It's a 1.5B model.

It's a distill model like s1 and deepseek-r1-distill.

It's test model. I hope I can reproduce a rl model like RL-Zero.

This model is a mini-step.

Thanks for evveryone in the open community.

how to use:

from vllm import LLM, SamplingParams
from transformers import AutoTokenizer

model = LLM(
    "Amu/t1-1.5B"
)
tok = AutoTokenizer.from_pretrained("simplescaling/s1-32B")

stop_token_ids = tok("<|im_end|>")["input_ids"]

sampling_params = SamplingParams(
    max_tokens=32768,
    min_tokens=0,
    stop_token_ids=stop_token_ids,
)

prompt = "How many r in raspberry"
prompt = "<|im_start|>system\nYou are t1, created by Amu. You are a helpful assistant.<|im_end|>\n<|im_start|>user\n" + prompt + "<|im_end|>\n<|im_start|>assistant\n"

o = model.generate(prompt, sampling_params=sampling_params)
print(o[0].outputs[0].text)