初始化项目，由ModelHub XC社区提供模型

Model: disham993/electrical-embeddinggemma-ir_finetune_16bit Source: Original Platform
2026-05-14 12:27:42 +08:00
commit dc99db43b9
19 changed files with 51744 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,38 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text
+eeir-models-retrieval-comparison.png filter=lfs diff=lfs merge=lfs -text
+poster.png filter=lfs diff=lfs merge=lfs -text
--- a/1_Pooling/config.json
+++ b/1_Pooling/config.json
@@ -0,0 +1,10 @@
+{
+    "word_embedding_dimension": 768,
+    "pooling_mode_cls_token": false,
+    "pooling_mode_mean_tokens": true,
+    "pooling_mode_max_tokens": false,
+    "pooling_mode_mean_sqrt_len_tokens": false,
+    "pooling_mode_weightedmean_tokens": false,
+    "pooling_mode_lasttoken": false,
+    "include_prompt": true
+}
--- a/2_Dense/config.json
+++ b/2_Dense/config.json
@@ -0,0 +1,6 @@
+{
+    "in_features": 768,
+    "out_features": 3072,
+    "bias": false,
+    "activation_function": "torch.nn.modules.linear.Identity"
+}
--- a/2_Dense/model.safetensors
+++ b/2_Dense/model.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:1a96e74fabcdf6b81dc67562b923e9f9c6ab4a0b7e75d1a2a705debfd0d704b1
+size 4718680
--- a/3_Dense/config.json
+++ b/3_Dense/config.json
@@ -0,0 +1,6 @@
+{
+    "in_features": 3072,
+    "out_features": 768,
+    "bias": false,
+    "activation_function": "torch.nn.modules.linear.Identity"
+}
--- a/3_Dense/model.safetensors
+++ b/3_Dense/model.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:e52d25716b14b0cf5142e1743dee3d5caeef0b42d4567ec510124cdb2896ca49
+size 4718680
--- a/README.md
+++ b/README.md
@@ -0,0 +1,164 @@
+---
+language:
+- en
+library_name: sentence-transformers
+pipeline_tag: feature-extraction
+base_model: unsloth/embeddinggemma-300m
+datasets:
+- disham993/ElectricalElectronicsIR
+tags:
+- embedding
+- retrieval
+- electrical-engineering
+- unsloth
+- safetensors
+- sentence-transformers
+- information-retrieval
+- rag
+- semantic-search
+- arxiv:2509.20354
+license: mit
+---
+
+# electrical-embeddinggemma-ir_finetune_16bit
+
+## Model Description
+
+This model is a **fully merged fp16 checkpoint** fine-tuned from [`unsloth/embeddinggemma-300m`](https://huggingface.co/unsloth/embeddinggemma-300m) — Unsloth's optimized mirror of Google's [EmbeddingGemma-300M](https://huggingface.co/google/embeddinggemma-300m) — for feature-extraction tasks, specifically dense Information Retrieval (IR) in the electrical and electronics engineering domain. The LoRA adapter weights have been merged into the base model and saved as full fp16 `.safetensors` weights, making this the most compatible variant for the Hugging Face ecosystem (Sentence Transformers, vLLM, Text Embeddings Inference, etc.).
+
+This repository contains the complete model weights (~1.2 GB) and does **not** require a `llama.cpp` backend.
+
+<p align="center"><img src="https://huggingface.co/disham993/electrical-embeddinggemma-ir_finetune_16bit/resolve/main/poster.png" width="340"/></p>
+
+## Training Data
+
+The model was trained on the [`disham993/ElectricalElectronicsIR`](https://huggingface.co/datasets/disham993/ElectricalElectronicsIR) dataset — 20,000 question-passage pairs covering electrical engineering, electronics, power systems, and communications.
+
+- **16k train / 2k validation / 2k test**
+- Queries: 133–822 characters; passages: 586–5,590 characters
+- Topics include phased array antennas, IEC 61850 protocols, Josephson junctions, OTDR measurements, MIMO channel estimation, FPGA partial reconfiguration, and more
+
+## Model Details
+
+| | |
+|---|---|
+| **Base Model** | `unsloth/embeddinggemma-300m` (308M params) |
+| **Format** | Merged fp16 (`.safetensors`) |
+| **Task** | Feature Extraction (Dense IR / Semantic Search) |
+| **Language** | English (en) |
+| **Dataset** | `disham993/ElectricalElectronicsIR` |
+| **Model size** | ~1.2 GB |
+| **License** | MIT |
+
+## Training Procedure
+
+### Training Hyperparameters
+
+| | |
+|---|---|
+| **Method** | LoRA via Unsloth's `FastSentenceTransformer`, merged to fp16 |
+| **LoRA rank / alpha** | r=32, α=64 |
+| **Target modules** | q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj |
+| **Loss** | `MultipleNegativesRankingLoss` (in-batch negatives) |
+| **Batch size** | 128 per device × 2 gradient accumulation = 256 effective |
+| **Learning rate** | 2e-5 (linear schedule, 3% warmup) |
+| **Max steps** | 100 |
+| **Max sequence length** | 1024 |
+| **Precision** | bf16 (training) → fp16 (saved) |
+| **Batch sampler** | `NO_DUPLICATES` |
+| **Hardware** | NVIDIA RTX 5090 |
+
+## Evaluation Results
+
+Evaluated on the held-out test split (2,000 queries) of `disham993/ElectricalElectronicsIR` using `sentence_transformers.evaluation.InformationRetrievalEvaluator`.
+
+| Model | MAP@100 | NDCG@10 | MRR@10 | Recall@10 |
+|---|---|---|---|---|
+| `unsloth/embeddinggemma-300m` (baseline) | 0.5753 | 0.6221 | 0.5682 | 0.7925 |
+| `electrical-embeddinggemma-ir_lora` | 0.9795 | 0.9847 | 0.9795 | 1.0000 |
+| **`electrical-embeddinggemma-ir_finetune_16bit` (this model)** | **0.9797** | **0.9849** | **0.9797** | **1.0000** |
+| `electrical-embeddinggemma-ir_f16` | 0.9849 | 0.9887 | 0.9849 | 0.9995 |
+| `electrical-embeddinggemma-ir_q8_0` | 0.9844 | 0.9883 | 0.9844 | 0.9995 |
+| `electrical-embeddinggemma-ir_q4_k_m` | 0.9841 | 0.9879 | 0.9840 | 0.9990 |
+| `electrical-embeddinggemma-ir_q5_k_m` | 0.9824 | 0.9866 | 0.9823 | 0.9990 |
+
+**+41 pp MAP@100 and +73% relative MRR@10 improvement over the general-purpose baseline. Recall@10 = 1.0000 — perfect top-10 coverage.**
+
+## Usage
+
+```bash
+# Install dependencies
+pip install sentence-transformers torch
+```
+
+```python
+import torch
+import torch.nn.functional as F
+from sentence_transformers import SentenceTransformer
+
+# === SEMANTIC SEARCH EXAMPLE ===
+if __name__ == "__main__":
+    print("Downloading and Booting Engine...")
+    
+    # SentenceTransformers flawlessly supports this repository natively!
+    model = SentenceTransformer("disham993/electrical-electronics-gemma-ir_finetune_16bit")
+    
+    query = "How do transformers step up voltage?"
+    
+    # A miniature corpus of engineering documents
+    documents = [
+        "Ohm's law defines the relationship between voltage, current, and resistance.",
+        "AC circuits use alternating current which changes direction periodically.",
+        "A step-up transformer has more turns on its secondary coil than its primary, increasing voltage.",
+        "Capacitors store electrical energy in an electric field.",
+        "Inductors resist changes in electric current passing through them.",
+        "Transformers operate on Faraday's law of induction to transfer energy between circuits.",
+        "Diodes allow current to pass in only one direction.",
+        "Voltage is the electric potential difference between two points."
+    ]
+    
+    print("Extracting Embeddings...")
+    # Convert texts directly to PyTorch tensors
+    query_emb = model.encode(query, convert_to_tensor=True)
+    doc_embs = model.encode(documents, convert_to_tensor=True)
+    
+    # Calculate similarities natively 
+    similarities = F.cosine_similarity(query_emb.unsqueeze(0), doc_embs)
+    
+    # Retrieve the top 3 highest scoring documents
+    top_3_idx = torch.topk(similarities, k=3).indices.tolist()
+    
+    print(f"\n--- Top 3 Documents for Query: '{query}' ---")
+    for rank, idx in enumerate(top_3_idx, 1):
+        print(f"Rank {rank} (Score: {similarities[idx]:.4f}) | {documents[idx]}")
+```
+
+## Limitations and Bias
+
+While this model performs exceptionally well in the electrical and electronics engineering domain, it is not designed for use in other domains. Additionally, it may:
+
+- Underperform on queries that mix electrical engineering with unrelated domains (e.g., biomedical, legal, financial)
+- Show reduced performance on non-English text or highly colloquial phrasing
+- Be slower and more memory-intensive than the GGUF variants (~1.2 GB vs ~236 MB for q4_k_m)
+
+This model is intended for research, educational, and production IR applications in the electrical engineering domain.
+
+## Training Infrastructure
+
+For the complete fine-tuning and evaluation pipeline — from data loading to GGUF export — refer to the [GitHub repository](https://github.com/di37/electrical-embeddinggemma-ir-finetuning-evaluation) and the notebooks `Finetuning_EmbeddingGemma_EEIR_RTX_5090.ipynb` and `Evaluate_All_Models.ipynb`.
+
+## Last Update
+
+2026-04-18
+
+## Citation
+
+```bibtex
+@misc{electrical-embeddinggemma-ir,
+  author       = {disham993},
+  title        = {Electrical \& Electronics Engineering Embedding Models},
+  year         = {2026},
+  howpublished = {\url{https://huggingface.co/collections/disham993/electrical-and-electronics-engineering-embedding-models}},
+}
+```
+
--- a/added_tokens.json
+++ b/added_tokens.json
@@ -0,0 +1,3 @@
+{
+  "<image_soft_token>": 262144
+}
--- a/config.json
+++ b/config.json
@@ -0,0 +1,62 @@
+{
+    "_sliding_window_pattern": 6,
+    "architectures": [
+        "Gemma3TextModel"
+    ],
+    "attention_bias": false,
+    "attention_dropout": 0.0,
+    "attn_logit_softcapping": null,
+    "bos_token_id": 2,
+    "torch_dtype": "bfloat16",
+    "eos_token_id": 1,
+    "final_logit_softcapping": null,
+    "head_dim": 256,
+    "hidden_activation": "gelu_pytorch_tanh",
+    "hidden_size": 768,
+    "initializer_range": 0.02,
+    "intermediate_size": 1152,
+    "layer_types": [
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "full_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "full_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "full_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "sliding_attention",
+        "full_attention"
+    ],
+    "max_position_embeddings": 2048,
+    "model_name": "unsloth/embeddinggemma-300m",
+    "model_type": "gemma3_text",
+    "num_attention_heads": 3,
+    "num_hidden_layers": 24,
+    "num_key_value_heads": 1,
+    "pad_token_id": 0,
+    "query_pre_attn_scalar": 256,
+    "rms_norm_eps": 1e-06,
+    "rope_local_base_freq": 10000.0,
+    "rope_scaling": null,
+    "rope_theta": 1000000.0,
+    "sliding_window": 512,
+    "tokenizer_class": "GemmaTokenizerFast",
+    "unsloth_version": "2026.4.6",
+    "use_bidirectional_attention": true,
+    "use_cache": true,
+    "vocab_size": 262144
+}
--- a/config_sentence_transformers.json
+++ b/config_sentence_transformers.json
@@ -0,0 +1,14 @@
+{
+  "model_type": "SentenceTransformer",
+  "__version__": {
+    "sentence_transformers": "5.3.0",
+    "transformers": "4.56.2",
+    "pytorch": "2.10.0+cu128"
+  },
+  "prompts": {
+    "query": "",
+    "document": ""
+  },
+  "default_prompt_name": null,
+  "similarity_fn_name": "cosine"
+}
--- a/eeir-models-retrieval-comparison.png
+++ b/eeir-models-retrieval-comparison.png
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:1e4c5292f17104668aaefe797397515f723c31a4a5c24b7d3e824996c5834605
+size 100559
--- a/model.safetensors
+++ b/model.safetensors
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:3cd2fb3fe8231cef44e800759736a9a282c40b3d2278fe127578a7bd45287c74
+size 1211486072
--- a/modules.json
+++ b/modules.json
@@ -0,0 +1,32 @@
+[
+  {
+    "idx": 0,
+    "name": "0",
+    "path": "",
+    "type": "sentence_transformers.models.Transformer"
+  },
+  {
+    "idx": 1,
+    "name": "1",
+    "path": "1_Pooling",
+    "type": "sentence_transformers.models.Pooling"
+  },
+  {
+    "idx": 2,
+    "name": "2",
+    "path": "2_Dense",
+    "type": "sentence_transformers.models.Dense"
+  },
+  {
+    "idx": 3,
+    "name": "3",
+    "path": "3_Dense",
+    "type": "sentence_transformers.models.Dense"
+  },
+  {
+    "idx": 4,
+    "name": "4",
+    "path": "4_Normalize",
+    "type": "sentence_transformers.models.Normalize"
+  }
+]
--- a/poster.png
+++ b/poster.png
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:322e1f2a54f78bde72c68c1ba597802cc43ea8dfee6b86202eeabfecb5c9d06f
+size 379748
--- a/sentence_bert_config.json
+++ b/sentence_bert_config.json
@@ -0,0 +1,4 @@
+{
+    "max_seq_length": 2048,
+    "do_lower_case": false
+}
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,33 @@
+{
+  "boi_token": "<start_of_image>",
+  "bos_token": {
+    "content": "<bos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eoi_token": "<end_of_image>",
+  "eos_token": {
+    "content": "<eos>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "image_token": "<image_soft_token>",
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}
--- a/tokenizer.json
+++ b/tokenizer.json
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:45732ebfacbc3b3da71bd8290d8c14c0df3b2d8d63d86970a953c59d71bd36d8
+size 33385261
--- a/tokenizer.model
+++ b/tokenizer.model
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:1299c11d7cf632ef3b4e11937501358ada021bbdf7c47638d13c0ee982f2e79c
+size 4689074
--- a/tokenizer_config.json
+++ b/tokenizer_config.json