qwen3-1.7b-coffee-sft/README.md

---
license: apache-2.0
language:
  - zh
base_model: Qwen/Qwen3-1.7B
tags:
  - conversational
  - sft
  - coffee
  - traditional-chinese
  - qwen3
  - task-oriented-dialogue
datasets:
  - renhehuang/coffee-order-zhtw
pipeline_tag: text-generation
---

# Qwen3-1.7B Coffee Order Assistant (繁體中文)

基於 [Qwen/Qwen3-1.7B](https://huggingface.co/Qwen/Qwen3-1.7B) 進行全參數 SFT 微調的咖啡點餐助理模型。

> 💡 量化版本（INT4，~1.45 GB）：[renhehuang/qwen3-1.7b-coffee-sft-quanto-int4](https://huggingface.co/renhehuang/qwen3-1.7b-coffee-sft-quanto-int4)

## 模型描述

此模型專為繁體中文咖啡點餐場景設計，能夠：
- 理解用戶的點餐意圖
- 處理多輪對話
- 確認訂單細節（飲品種類、冰熱、加濃縮咖啡）
- 處理訂單修改與取消

### 支援的菜單項目
- 美式
- 拿鐵
- 燕麥奶拿鐵
- 鮮奶

### 可選項目
- 冰/熱
- 加一份濃縮咖啡

## 使用方式

```python
from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "renhehuang/qwen3-1.7b-coffee-sft"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True)

messages = [
    {"role": "system", "content": "你是一位專業的咖啡點餐助理，負責協助使用者完成點餐。菜單包含：美式、拿鐵、燕麥奶拿鐵、鮮奶。"},
    {"role": "user", "content": "我想要一杯冰拿鐵"}
]

input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(
    **inputs,
    max_new_tokens=128,
    do_sample=True,
    temperature=0.7,
    top_p=0.9,
)

response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)
```

## 訓練細節

### 訓練配置
| 參數 | 值 |
|------|-----|
| 基礎模型 | Qwen/Qwen3-1.7B |
| 訓練方式 | Full Parameter SFT |
| 學習率 | 5e-6 |
| Batch Size | 1 |
| Gradient Accumulation | 16 |
| Epochs | 3 |
| Max Length | 512 |
| Optimizer | AdamW |
| LR Scheduler | Cosine |
| Warmup Ratio | 0.1 |

### 訓練資料
- 資料集：[renhehuang/coffee-order-zhtw](https://huggingface.co/datasets/renhehuang/coffee-order-zhtw)
- 資料筆數：約 2900+ 筆多輪對話
- 語言：繁體中文（台灣）

### 硬體
- Apple Silicon (MPS)

## 限制與注意事項

- 此模型僅針對咖啡點餐場景進行訓練，不適用於一般對話
- 菜單項目固定，無法處理菜單外的飲品
- 每杯飲品最多只能加一份濃縮咖啡
- 所有飲品統一為大杯

## 授權

本模型基於 Apache 2.0 授權發布。

## 引用

如果您使用此模型，請引用：

```bibtex
@misc{qwen3-coffee-sft,
  author = {Ren-He Huang},
  title = {Qwen3-1.7B Coffee Order Assistant},
  year = {2025},
  publisher = {HuggingFace},
  url = {https://huggingface.co/renhehuang/qwen3-1.7b-coffee-sft}
}
```