llm-jp/optimal-sparsity-code-d2048-E64-k8-26.4B-A3.9B

Go to file

ModelHub XC 8eec7940b9 初始化项目，由ModelHub XC社区提供模型

Model: llm-jp/optimal-sparsity-code-d2048-E64-k8-26.4B-A3.9B
Source: Original Platform

2026-04-12 20:40:58 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

configuration.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00001-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00002-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00003-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00004-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00005-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00006-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00007-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00008-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00009-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00010-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model-00011-of-00011.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-04-12 20:40:58 +08:00

README.md

pipeline_tag, library_name, license, tags

pipeline_tag

library_name

license

Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks

This repository contains model checkpoints from the paper Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks.

For more details, including code and evaluation procedures, please refer to the official GitHub repository: https://github.com/rioyokotalab/optimal-sparsity

How to cite

If you find our work helpful, please feel free to cite the paper.

@inproceedings{
    nakamura2026optimal,
    title={Optimal Sparsity of Mixture-of-Experts Language Models for Reasoning Tasks},
    author={Taishi Nakamura and Satoki Ishikawa and Masaki Kawamura and Takumi Okamoto and Daisuke Nohara and Jun Suzuki and Rio Yokota},
    booktitle={The Fourteenth International Conference on Learning Representations},
    year={2026},
    url={https://openreview.net/forum?id=XFw2EPRUUR}
}