Qwen3-4B-Thinking-2507-Esper3.1/README.md at d6f12e5e86cba0892a4c505c493d1429b16cf73b

ValiantLabs/Qwen3-4B-Thinking-2507-Esper3.1

Files

ModelHub XC d6f12e5e86 初始化项目，由ModelHub XC社区提供模型

Model: ValiantLabs/Qwen3-4B-Thinking-2507-Esper3.1
Source: Original Platform

2026-05-27 22:20:23 +08:00

4.7 KiB

Raw Blame History

language, library_name, pipeline_tag, tags, base_model, datasets, license

language

library_name

pipeline_tag

Prompting Guide

Esper 3.1 uses the Qwen3-4B-Thinking-2507 prompt format.

Example inference script to get started:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "ValiantLabs/Qwen3-4B-Thinking-2507-Esper3.1"

# load the tokenizer and the model
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)

# prepare the model input
prompt = "Write a Terraform configuration that uses the `aws_ami` data source to find the latest Amazon Linux 2 AMI. Then, provision an EC2 instance using this dynamically determined AMI ID."
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True,
    enable_thinking=True # Switches between thinking and non-thinking modes. Default is True.
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

# conduct text completion
generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=32768
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist() 

# parsing thinking content
try:
    # rindex finding 151668 (</think>)
    index = len(output_ids) - output_ids[::-1].index(151668)
except ValueError:
    index = 0

thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")

print("thinking content:", thinking_content)
print("content:", content)

Esper 3.1 is created by Valiant Labs.

Check out our HuggingFace page to see all of our models!

We care about open source. For everyone to use.

4.7 KiB Raw Blame History

Prompting Guide

4.7 KiB

Raw Blame History