OsmosisProofling-SFT/README.md at 748de6c7f8f04dbdd2ff1522855348fb549f098a

Files

ModelHub XC 748de6c7f8 初始化项目，由ModelHub XC社区提供模型

Model: xiaolesu/OsmosisProofling-SFT
Source: Original Platform

2026-05-05 04:41:07 +08:00

592 B

Raw Blame History

xiaolesu/OsmosisProofling-SFT

Experimental checkpoint from "Data Overlap as a Post-Training Hyperparameter for Autoformalization." This is the SFT-only variant (Qwen3-8B, thinking disabled) trained on 20K heterogeneous (natural-language, Lean 4) pairs. See the paper repo for details, results, and all artifacts.

📄 Paper

This model is part of the experiments in:

SFT-GRPO Data Overlap as a Post-Training Hyperparameter for Autoformalization
Xiaole Su, Kasey Zhang, Andy Lyu
https://arxiv.org/abs/2604.13515

592 B Raw Blame History

xiaolesu/OsmosisProofling-SFT

📄 Paper

592 B

Raw Blame History