pratinavseth/cricket-captain-qwen3-06b-merged

Go to file

ModelHub XC 30256fefe0 初始化项目，由ModelHub XC社区提供模型

Model: pratinavseth/cricket-captain-qwen3-06b-merged
Source: Original Platform

2026-05-02 05:10:32 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-02 05:10:32 +08:00

README.md

base_model, library_name, tags, license, pipeline_tag

base_model

library_name

cricket-captain-qwen3-06b-merged

Qwen/Qwen3-0.6B with the pratinavseth/cricket-captain-qwen3-06b-stage2 LoRA adapter (stage 2 GRPO, step 50) merged into the base weights. Single-file model, ready to load without PEFT — usable directly via transformers, vllm, or TGI.

Live Space: https://huggingface.co/spaces/pratinavseth/cricket-captain-llm
Source code: https://github.com/pratinavseth/cricket-captain-llm
Adapter (un-merged): pratinavseth/cricket-captain-qwen3-06b-stage2
W&B run: https://wandb.ai/ptnv-s-research/huggingface

Usage

from transformers import AutoModelForCausalLM, AutoTokenizer
tok = AutoTokenizer.from_pretrained("pratinavseth/cricket-captain-qwen3-06b-merged")
model = AutoModelForCausalLM.from_pretrained("pratinavseth/cricket-captain-qwen3-06b-merged", torch_dtype="bfloat16", device_map="auto")

The model expects the cricket-captain prompt schema produced by the OpenEnv environment in this repo (see inference.py for prompt construction).