初始化项目，由ModelHub XC社区提供模型

Model: shopifyinterngrinder/sidekick-autocomplete-06b-sft-real Source: Original Platform
2026-04-24 14:20:33 +08:00
commit 09974f1eb5
13 changed files with 151934 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -0,0 +1,51 @@
+---
+base_model: Qwen/Qwen3-0.6B
+language:
+- en
+library_name: transformers
+license: apache-2.0
+pipeline_tag: text-generation
+tags:
+- sidekick
+- sft
+- chat
+- shopify
+datasets:
+- shopifyinterngrinder/sidekick-autocomplete-data-real
+---
+
+# shopifyinterngrinder/sidekick-autocomplete-06b-sft-real
+
+Fine-tuned from [Qwen/Qwen3-0.6B](https://huggingface.co/Qwen/Qwen3-0.6B) using [TRL](https://github.com/huggingface/trl) SFT.
+
+## Training Details
+
+| Parameter | Value |
+|---|---|
+| Base Model | [Qwen/Qwen3-0.6B](https://huggingface.co/Qwen/Qwen3-0.6B) |
+| Dataset | [shopifyinterngrinder/sidekick-autocomplete-data-real](https://huggingface.co/datasets/shopifyinterngrinder/sidekick-autocomplete-data-real) @ `main` |
+| Training Examples | 13,565 |
+| Validation Examples | 1,508 |
+| Epochs | 3 |
+| Learning Rate | 2e-05 |
+| Batch Size (per device) | 1 |
+| Gradient Accumulation | 2 |
+| Max Sequence Length | 512 |
+| Precision | bf16 |
+| Optimizer | adamw_torch_fused |
+| Warmup Steps | 50 |
+| Weight Decay | 0.01 |
+| LR Scheduler | cosine |
+| Packing | Enabled |
+| Dataset Format | chat |
+
+
+## Framework Versions
+
+| Library | Version |
+|---|---|
+| Transformers | 4.57.6 |
+| TRL | 0.29.0 |
+| PyTorch | 2.8.0+cu128 |
+| Datasets | 3.6.0 |
+| Accelerate | 1.13.0 |