mlabonne/UltraMerge-7B

Go to file

Cherrytest 783faa12ba Update README.md

2025-03-18 02:51:40 +00:00

.gitattributes

System init .gitattributes

2025-03-18 02:48:06 +00:00

config.json

Update README.md

2025-03-18 02:51:39 +00:00

configuration.json

Update README.md

2025-03-18 02:51:39 +00:00

generation_config.json

Update README.md

2025-03-18 02:51:39 +00:00

model-00001-of-00003.safetensors

Update README.md

2025-03-18 02:51:40 +00:00

model-00002-of-00003.safetensors

Update README.md

2025-03-18 02:51:40 +00:00

model-00003-of-00003.safetensors

Update README.md

2025-03-18 02:51:40 +00:00

model.safetensors.index.json

Update README.md

2025-03-18 02:51:39 +00:00

README.md

Update README.md

2025-03-18 02:51:39 +00:00

special_tokens_map.json

Update README.md

2025-03-18 02:51:39 +00:00

tokenizer_config.json

Update README.md

2025-03-18 02:51:39 +00:00

tokenizer.json

Update README.md

2025-03-18 02:51:39 +00:00

tokenizer.model

Update README.md

2025-03-18 02:51:40 +00:00

README.md

library_name, license, tags

library_name

license

tags

transformers

cc-by-nc-4.0

merge

automerger

UltraMerge-7B

This model is an experimental DPO fine-tune of automerger/YamShadow-7B on the following datasets:

mlabonne/truthy-dpo-v0.1
mlabonne/distilabel-intel-orca-dpo-pairs
mlabonne/chatml-OpenHermes2.5-dpo-binarized-alpha
mlabonne/ultrafeedback-binarized-preferences-cleaned

I have no idea about what's the best chat template. Probably Mistral-Instruct or ChatML.