zeeshaan-ai/solo-tune-test684: Model synced from source: zeeshaan-ai/solo-tune-test684 - solo-tune-test684 - Gitea: Git with a cup of tea

zeeshaan-ai/solo-tune-test684

Go to file

ModelHub XC 88b23f4c6e 初始化项目，由ModelHub XC社区提供模型

Model: zeeshaan-ai/solo-tune-test684
Source: Original Platform

2026-05-11 02:59:22 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

added_tokens.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-11 02:59:22 +08:00

README.md

library_name, base_model, tags, datasets, pipeline_tag

library_name

base_model

tags

datasets

pipeline_tag

transformers

Qwen/Qwen3-0.6B

solo

fine-tuned

lora

unsloth

openai/gsm8k

text-generation

Model Details


Base Model	Qwen/Qwen3-0.6B
Method	LoRA (PEFT)
Parameters	0.6B

Training Hyperparameters


Epochs	2
Max Steps	100
Batch Size	2
Gradient Accumulation	4
Learning Rate	0.0002
LoRA r	4
LoRA Alpha	4
Max Sequence Length	2048
Training Duration	3m

Dataset

_{Trained with Solo}