shopifyinterngrinder/sidekick-autocomplete-06b

Go to file

ModelHub XC 2494c2b3ef 初始化项目，由ModelHub XC社区提供模型

Model: shopifyinterngrinder/sidekick-autocomplete-06b
Source: Original Platform

2026-05-03 04:00:47 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

chat_template.jinja

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

training_args.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-03 04:00:47 +08:00

README.md

base_model, language, library_name, license, pipeline_tag, tags, datasets

base_model

language

library_name

license

pipeline_tag

shopifyinterngrinder/sidekick-autocomplete-06b

Fine-tuned from Qwen/Qwen3-0.6B using TRL SFT.

Training Details

Parameter	Value
Base Model	Qwen/Qwen3-0.6B
Dataset	shopifyinterngrinder/sidekick-autocomplete-data @ `main`
Training Examples	900
Validation Examples	101
Epochs	3
Learning Rate	2e-05
Batch Size (per device)	1
Gradient Accumulation	2
Max Sequence Length	512
Precision	bf16
Optimizer	adamw_torch_fused
Warmup Steps	50
Weight Decay	0.01
LR Scheduler	cosine
Packing	Enabled
Dataset Format	chat

Framework Versions

Library	Version
Transformers	4.57.6
TRL	0.29.0
PyTorch	2.8.0+cu128
Datasets	3.6.0
Accelerate	1.13.0