Biggie-SmoLlm-0.4B

Go to file

ModelHub XC d09c411e33 初始化项目，由ModelHub XC社区提供模型

Model: nisten/Biggie-SmoLlm-0.4B
Source: Original Platform

2026-05-12 21:01:52 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

Biggie_SmolLM_400M_q8_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

biggie_trained_2bit.gguf

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

biggie_trained_4bit.gguf

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

biggie_trained_5bit.gguf

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

pytorch_model.bin

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-05-12 21:01:52 +08:00

README.md

base_model

base_model
HuggingFaceTB/SmolLM-360M-Instruct

###Coherent Frankenstein of smolLm-0.36b upped to 0.4b

This took about 5 hours of semi-automated continuous merging to figure out the recipe. Model is smarter, and UNTRAINED. Uploaded it for training. Yet it performs well as is even quantized to 8bit. 8bit gguf included for testing.

wget https://huggingface.co/nisten/Biggie-SmoLlm-0.4B/resolve/main/Biggie_SmolLM_400M_q8_0.gguf

./llama-cli -ngl 99 -co --temp 0 -p "How to build a city on Mars via calculating Aldrin-Cycler orbits?" -m Biggie_SmolLM_400M_q8_0.gguf -cnv -fa --keep -1