Go to file

ModelHub XC d652fe3c32 初始化项目，由ModelHub XC社区提供模型

Model: RthItalia/NanoLLM-Qwen2.5-14B-v3.1
Source: Original Platform

2026-05-09 10:59:03 +08:00

nano_compact

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

LICENSE

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

load_artifact.py

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

modeling_nanollm.py

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

quantized_modules.pt

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

spec.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-09 10:59:03 +08:00

README.md

license, library_name, base_model, tags

license

library_name

base_model

NanoLLM Qwen2.5-14B-Instruct v3.1

Compact self-contained NanoLLM format is in nano_compact/.

from transformers import AutoModelForCausalLM, AutoTokenizer
repo_id = "RthItalia/NanoLLM-Qwen2.5-14B-v3.1"
tokenizer = AutoTokenizer.from_pretrained(repo_id, subfolder="nano_compact", use_fast=True)
model = AutoModelForCausalLM.from_pretrained(repo_id, subfolder="nano_compact", trust_remote_code=True, device_map="auto")

Validation against 8-bit reference:

avg cosine: 0.98984375
min cosine: 0.9765625
gate: avg >= 0.985

nano_compact/model.safetensors contains Nano quantized tensors and does not require downloading the Qwen base weights.