light-3B-beta/README.md

---
base_model:
- Qwen/Qwen2.5-3B-Instruct
- Qwen/Qwen2.5-3B
library_name: transformers
tags:
- mergekit
- merge
license: other
license_name: qwen-research
inference: true
pipeline_tag: text-generation
widget:
  - messages:
      - role: user
        content: こんにちは！
  - messages:
      - role: user
        content: 魚を捌くのは難しいですか？
  - messages:
      - role: user
        content: ナイジェリアの首都はどこですか？
  - messages:
      - role: user
        content: hello!
  - messages:
      - role: user
        content: 貝は砂浜に落ちてるものですか？
  - messages:
      - role: user
        content: おはようございます。
  - messages:
      - role: user
        content: 錫はどういうものに使われますか？
  - messages:
      - role: user
        content: 露骨とあからさまが違う言葉であることを証明してください。
  - messages:
      - role: user
        content: 你好
  - messages:
      - role: user
        content: 魚を捌くのは難しいですか？
  - messages:
      - role: user
        content: Où se trouve Shinjuku ?
  - messages:
      - role: user
        content: Bonjour!
---
Built with Qwen
# merge

This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

## Merge Details
### Merge Method

This model was merged using the [TIES](https://arxiv.org/abs/2306.01708) merge method using [Qwen/Qwen2.5-3B](https://huggingface.co/Qwen/Qwen2.5-3B) as a base.

### Models Merged

The following models were included in the merge:
* [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)

### Configuration

The following YAML configuration was used to produce this model:

```yaml
models:
  - model: Qwen/Qwen2.5-3B-Instruct
    parameters:
      weight: 1
      density: 1
merge_method: ties
base_model: Qwen/Qwen2.5-3B
parameters:
  weight: 1
  density: 1
  normalize: true
  int8_mask: true
dtype: bfloat16
```
初始化项目，由ModelHub XC社区提供模型 Model: Sakalti/light-3B-beta Source: Original Platform 2026-04-27 21:41:17 +08:00			`---`
			`base_model:`
			`- Qwen/Qwen2.5-3B-Instruct`
			`- Qwen/Qwen2.5-3B`
			`library_name: transformers`
			`tags:`
			`- mergekit`
			`- merge`
			`license: other`
			`license_name: qwen-research`
			`inference: true`
			`pipeline_tag: text-generation`
			`widget:`
			`- messages:`
			`- role: user`
			`content: こんにちは！`
			`- messages:`
			`- role: user`
			`content: 魚を捌くのは難しいですか？`
			`- messages:`
			`- role: user`
			`content: ナイジェリアの首都はどこですか？`
			`- messages:`
			`- role: user`
			`content: hello!`
			`- messages:`
			`- role: user`
			`content: 貝は砂浜に落ちてるものですか？`
			`- messages:`
			`- role: user`
			`content: おはようございます。`
			`- messages:`
			`- role: user`
			`content: 錫はどういうものに使われますか？`
			`- messages:`
			`- role: user`
			`content: 露骨とあからさまが違う言葉であることを証明してください。`
			`- messages:`
			`- role: user`
			`content: 你好`
			`- messages:`
			`- role: user`
			`content: 魚を捌くのは難しいですか？`
			`- messages:`
			`- role: user`
			`content: Où se trouve Shinjuku ?`
			`- messages:`
			`- role: user`
			`content: Bonjour!`
			`---`
			`Built with Qwen`
			`# merge`

			`This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).`

			`## Merge Details`
			`### Merge Method`

			`This model was merged using the [TIES](https://arxiv.org/abs/2306.01708) merge method using [Qwen/Qwen2.5-3B](https://huggingface.co/Qwen/Qwen2.5-3B) as a base.`

			`### Models Merged`

			`The following models were included in the merge:`
			`* [Qwen/Qwen2.5-3B-Instruct](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)`

			`### Configuration`

			`The following YAML configuration was used to produce this model:`

			```yaml
			`models:`
			`- model: Qwen/Qwen2.5-3B-Instruct`
			`parameters:`
			`weight: 1`
			`density: 1`
			`merge_method: ties`
			`base_model: Qwen/Qwen2.5-3B`
			`parameters:`
			`weight: 1`
			`density: 1`
			`normalize: true`
			`int8_mask: true`
			`dtype: bfloat16`
			```