初始化项目，由ModelHub XC社区提供模型

Model: QuantLLM/SmolLM2-135M-QuantLLM Source: Original Platform
2026-06-15 22:20:11 +08:00
commit 8100472ff4
7 changed files with 245223 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,35 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
 *.arrow filter=lfs diff=lfs merge=lfs -text
 *.bin filter=lfs diff=lfs merge=lfs -text
 *.bz2 filter=lfs diff=lfs merge=lfs -text
 *.ckpt filter=lfs diff=lfs merge=lfs -text
 *.ftz filter=lfs diff=lfs merge=lfs -text
 *.gz filter=lfs diff=lfs merge=lfs -text
 *.h5 filter=lfs diff=lfs merge=lfs -text
 *.joblib filter=lfs diff=lfs merge=lfs -text
 *.lfs.* filter=lfs diff=lfs merge=lfs -text
 *.mlmodel filter=lfs diff=lfs merge=lfs -text
 *.model filter=lfs diff=lfs merge=lfs -text
 *.msgpack filter=lfs diff=lfs merge=lfs -text
 *.npy filter=lfs diff=lfs merge=lfs -text
 *.npz filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.parquet filter=lfs diff=lfs merge=lfs -text
 *.pb filter=lfs diff=lfs merge=lfs -text
 *.pickle filter=lfs diff=lfs merge=lfs -text
 *.pkl filter=lfs diff=lfs merge=lfs -text
 *.pt filter=lfs diff=lfs merge=lfs -text
 *.pth filter=lfs diff=lfs merge=lfs -text
 *.rar filter=lfs diff=lfs merge=lfs -text
 *.safetensors filter=lfs diff=lfs merge=lfs -text
 saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.tar.* filter=lfs diff=lfs merge=lfs -text
 *.tar filter=lfs diff=lfs merge=lfs -text
 *.tflite filter=lfs diff=lfs merge=lfs -text
 *.tgz filter=lfs diff=lfs merge=lfs -text
 *.wasm filter=lfs diff=lfs merge=lfs -text
 *.xz filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,141 @@
 ---
 license: apache-2.0
 base_model: HuggingFaceTB/SmolLM2-135M
 library_name: transformers
 language:
  - en
 tags:
  - quantllm
  - transformers
  - safetensors
 pipeline_tag: text-generation
 ---
 <div align="center">
 # 🤗 SmolLM2-135M-QuantLLM
 **HuggingFaceTB/SmolLM2-135M** converted to **SAFETENSORS** format
 [![QuantLLM](https://img.shields.io/badge/🚀_Made_with-QuantLLM-orange?style=for-the-badge)](https://github.com/codewithdark-git/QuantLLM)
 [![Format](https://img.shields.io/badge/Format-SAFETENSORS-blue?style=for-the-badge)]()
 <a href="https://github.com/codewithdark-git/QuantLLM">⭐ Star QuantLLM on GitHub</a>
 </div>
 ---
 ## 📖 About This Model
 This model is **[HuggingFaceTB/SmolLM2-135M](https://huggingface.co/HuggingFaceTB/SmolLM2-135M)** converted to **SafeTensors** format for use with HuggingFace Transformers and PyTorch.
 | Property | Value |
 |----------|-------|
 | **Base Model** | [HuggingFaceTB/SmolLM2-135M](https://huggingface.co/HuggingFaceTB/SmolLM2-135M) |
 | **Format** | SAFETENSORS |
 | **Quantization** | None (Full Precision) |
 | **License** | apache-2.0 |
 | **Created With** | [QuantLLM](https://github.com/codewithdark-git/QuantLLM) |
 ## 🚀 Quick Start
 ### With Transformers
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Load model and tokenizer
 model = AutoModelForCausalLM.from_pretrained("codewithdark/SmolLM2-135M-QuantLLM")
 tokenizer = AutoTokenizer.from_pretrained("codewithdark/SmolLM2-135M-QuantLLM")
 # Generate text
 inputs = tokenizer("Once upon a time", return_tensors="pt")
 outputs = model.generate(**inputs, max_new_tokens=100, do_sample=True)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
 ### With QuantLLM
 ```python
 from quantllm import TurboModel
 # Load with automatic optimization
 model = TurboModel.from_pretrained("codewithdark/SmolLM2-135M-QuantLLM")
 # Generate
 response = model.generate("Write a poem about coding")
 print(response)
 ```
 ### Requirements
 ```bash
 pip install transformers torch
 ```
 ## 📊 Model Details
 | Property | Value |
 |----------|-------|
 | **Original Model** | [HuggingFaceTB/SmolLM2-135M](https://huggingface.co/HuggingFaceTB/SmolLM2-135M) |
 | **Format** | SAFETENSORS |
 | **Quantization** | Full Precision |
 | **License** | `apache-2.0` |
 | **Export Date** | 2026-04-29 |
 | **Exported By** | [QuantLLM v2.1](https://github.com/codewithdark-git/QuantLLM) |
 ---
 ## 🚀 Created with QuantLLM
 <div align="center">
 [![QuantLLM](https://img.shields.io/badge/🚀_QuantLLM-Ultra--fast_LLM_Quantization-orange?style=for-the-badge)](https://github.com/codewithdark-git/QuantLLM)
 **Convert any model to GGUF, ONNX, or MLX in one line!**
 ```python
 from quantllm import turbo
 # Load any HuggingFace model
 model = turbo("HuggingFaceTB/SmolLM2-135M")
 # Export to any format
 model.export("safetensors", quantization="Q4_K_M")
 # Push to HuggingFace
 model.push("your-repo", format="safetensors")
 ```
 <a href="https://github.com/codewithdark-git/QuantLLM">
  <img src="https://img.shields.io/github/stars/codewithdark-git/QuantLLM?style=social" alt="GitHub Stars">
 </a>
 **[📚 Documentation](https://github.com/codewithdark-git/QuantLLM#readme)** · 
 **[🐛 Report Issue](https://github.com/codewithdark-git/QuantLLM/issues)** · 
 **[💡 Request Feature](https://github.com/codewithdark-git/QuantLLM/issues)**
 </div>
 ## 📊 Export Details
 Exported with [QuantLLM](https://github.com/codewithdark-git/QuantLLM) from `HuggingFaceTB/SmolLM2-135M` (134.5M params).
 | Property | Value |
 |----------|-------|
 | **Format** | SafeTensors |
 | **Size** | 541.6 MB |
 | **Parameters** | 134.5M |
 | **Dtype** | float32 |
 ### How to use
--- a/config.json
+++ b/config.json
@@ -0,0 +1,34 @@
 {
  "architectures": [
    "LlamaForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "bos_token_id": 0,
  "dtype": "float32",
  "eos_token_id": 0,
  "head_dim": 64,
  "hidden_act": "silu",
  "hidden_size": 576,
  "initializer_range": 0.041666666666666664,
  "intermediate_size": 1536,
  "is_llama_config": true,
  "max_position_embeddings": 8192,
  "mlp_bias": false,
  "model_type": "llama",
  "num_attention_heads": 9,
  "num_hidden_layers": 30,
  "num_key_value_heads": 3,
  "pad_token_id": null,
  "pretraining_tp": 1,
  "rms_norm_eps": 1e-05,
  "rope_interleaved": false,
  "rope_parameters": {
    "rope_theta": 100000,
    "rope_type": "default"
  },
  "tie_word_embeddings": true,
  "transformers_version": "5.7.0",
  "use_cache": true,
  "vocab_size": 49152
 }
--- a/generation_config.json
+++ b/generation_config.json
@@ -0,0 +1,6 @@
 {
  "_from_model_config": true,
  "bos_token_id": 0,
  "eos_token_id": 0,
  "transformers_version": "5.7.0"
 }
--- a/model.safetensors
+++ b/model.safetensors
@@ -0,0 +1,3 @@
 version https://git-lfs.github.com/spec/v1
 oid sha256:19db913ad817fcd5d544972dfe168ed96f7c9c8cd40ef431da285f016cadbc1c
 size 538090408
--- a/tokenizer.json
+++ b/tokenizer.json
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,34 @@
 {
  "add_prefix_space": false,
  "backend": "tokenizers",
  "bos_token": "<|endoftext|>",
  "clean_up_tokenization_spaces": false,
  "eos_token": "<|endoftext|>",
  "errors": "replace",
  "extra_special_tokens": [
    "<|endoftext|>",
    "<|im_start|>",
    "<|im_end|>",
    "<repo_name>",
    "<reponame>",
    "<file_sep>",
    "<filename>",
    "<gh_stars>",
    "<issue_start>",
    "<issue_comment>",
    "<issue_closed>",
    "<jupyter_start>",
    "<jupyter_text>",
    "<jupyter_code>",
    "<jupyter_output>",
    "<jupyter_script>",
    "<empty_output>"
  ],
  "is_local": false,
  "local_files_only": false,
  "model_max_length": 8192,
  "pad_token": "<|endoftext|>",
  "tokenizer_class": "GPT2Tokenizer",
  "unk_token": "<|endoftext|>",
  "vocab_size": 49152
 }