Files

ModelHub XC ba85b3f1f4 初始化项目，由ModelHub XC社区提供模型

Model: Abhinav-hf/qwen-grpo-sft-trained-16bit
Source: Original Platform

2026-05-01 11:36:09 +08:00

base_model, tags, license, language

base_model

Uploaded finetuned model

Developed by: Abhinav-hf
License: apache-2.0
Finetuned from model: unsloth/Qwen2.5-3B-Instruct

This qwen2 model was trained 2x faster with Unsloth and Huggingface's TRL library.