Go to file

ModelHub XC c1748ace58 初始化项目，由ModelHub XC社区提供模型

Model: freewheelin/free-llama3-dpo-v0.2
Source: Original Platform

2026-05-10 17:21:16 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

model-00001-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

model-00002-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

model-00003-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

model-00004-of-00004.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-10 17:21:16 +08:00

README.md

language, license

language

license

mit

Model Card for free-llama-dpo-v0.2

Developed by : Freewheelin AI Technical Team

Hardware and Software

Training Factors: We fine-tuned this model using the HuggingFace TRL Trainer

Method

This model was trained using the learning method introduced in the SOLAR paper.