初始化项目，由ModelHub XC社区提供模型

Model: GraphWiz/LLaMA2-7B-DPO Source: Original Platform
2026-04-29 06:05:47 +08:00
commit f7efb3dd4f
7 changed files with 226 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,35 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
--- a/README.md
+++ b/README.md
@@ -0,0 +1,75 @@
+---
+license: apache-2.0
+datasets:
+- GraphWiz/GraphInstruct-RFT-72K
+metrics:
+- accuracy
+pipeline_tag: text-generation
+tags:
+- graph problem
+---
+
+# GraphWiz 
+
+Project Page: [https://graph-wiz.github.io/](https://graph-wiz.github.io/)
+
+Paper: [https://arxiv.org/abs/2402.16029.pdf](https://arxiv.org/abs/2402.16029)
+
+Code: [https://github.com/nuochenpku/Graph-Reasoning-LLM](https://github.com/nuochenpku/Graph-Reasoning-LLM)
+
+
+GraphWiz is a powerful instruction-following LLM that can map textural descriptions of graphs and structures, and then solve different graph problems explicitly in natural language.
+
+Training strategies include two stages: **Mixed-task Training** and **DPO Alignment**.
+
+
+## Results
+
+
+| *Models* | **Cycle** | **Connect** | **Bipartite** | **Topology** | **Shortest** | **Triangle** | **Flow** | **Hamilton** | **Subgraph** | **Average** |
+|:-------------------------------------:|:-------------------------------:|:--------------------------------:|:----------------------------------:|:---------------------------------:|:---------------------------------:|:---------------------------------:|:-----------------------------:|:---------------------------------:|:---------------------------------:|:--------------------------------------:|
+| *In-Context Learning* |||||||||||
+| **GPT-4 (zero-shot)**                 | 38.75                           | 17.00                            | 65.25                              | 5.00                              | 9.25                              | 5.75                              | 3.25                          | 59.25                             | 45.50                             | 27.67                                  |
+| **GhatGPT (2-shot)**                  | 51.25                           | 43.75                            | 70.75                              | 4.50                              | 3.50                              | 17.25                             | 8.50                          | 54.25                             | 43.00                             | 32.97                                  |
+| **GPT-4 (2-shot)**                    | 52.50                           | 62.75                            | 74.25                              | 25.25                             | 18.25                             | 31.00                             | 7.75                          | {75.75}                    | 46.75                             | 43.81                                  |
+| *Mistral-7B* |||||||||||
+| **Naive SFT**                         | 73.75                           | 83.50                            | 78.50                              | 1.00                              | 23.00                             | 47.00                             | 28.75                         | 31.75                             | 41.25                             | 46.56                                  |
+| **GraphWiz**                        | **92.00**                  | **89.50**                     | 72.00                              | 19.00                             | **31.25**                      | 38.75                             | 29.25                         | 26.50                             | **85.50**                      | 53.75                                  |
+| **GraphWiz-DPO**                    | 85.50                           | 79.50                            | **85.50**                     | **85.25**                      | 12.50                             | 29.00                             | 35.50                         | 62.75                             | 48.50                             | 58.22                                  |
+| *LLaMA 2-7B* |||||||||||
+| **Naive SFT**                         | 73.75                           | 83.50                            | 41.25                              | 4.00                              | 9.50                              | 30.00                             | 16.50                         | 69.00                             | 75.45                             | 44.81                                  |
+| **GraphWiz**                        | 91.50                           | 87.00                            | 74.00                              | 18.00                             | **28.00**                    | 38.25                             | 24.50                         | 52.25                             | **82.25**                    | 55.08                                  |
+| **GraphWiz-DPO**                    | 89.00                           | 82.50                            | 84.75                              | 46.75                             | 24.00                             | **52.75**                      | **43.50**                | **81.50**                      | 77.25                             | **65.00**                           |
+| *LLaMA 2-13B* |||||||||||
+| **Naive SFT**                         | 73.75                           | 83.75                            | 59.00                              | 0.50                              | 11.75                             | 34.75                             | 24.25                         | 59.75                             | 54.75                             | 44.69                                  |
+| **GraphWiz**                        | **94.75**                    | 87.00                            | 78.00                              | 28.00                             | 27.75                             | 36.00                             | 24.50                         | 59.00                             | 81.50                             | 57.39                                  |
+| **GraphWiz-DPO**                    | 87.50                           | **88.50**                   | **88.25**                       | **72.75**                    | 22.00                             | **48.75**                    | **43.75**                  | 46.50                             | 77.00                             | **63.89**                         |
+
+
+
+## Examples
+
+```
+G-Q: Determine whether or not there is a cycle in an undirected graph. In an undirected graph..,the
+ nodes are numbered from 0 to 88, and the edges are: (0, 73) (0, 51) (0, 10) (0, 63) (0, 28) (1, 62) (1, 57) (1, 84) (1, 61) (1, 5)
+ (1, 24) (2, 84) (2, 3) (2, 66) (2, 68) (2, 17) (2, 35) (2, 34) (2, 15) (3, 39) (3, 52) (3, 16) (3, 15) (3, 8) (4, 69) (4, 85)
+ (4, 36) (4, 72) (5, 44) (6, 77) (6, 7) (7, 85) (8, 64) (8, 23) (8, 28) (9, 34) (9, 31) (9, 61) (9, 28) (10, 26) (11, 37) (11, 39)
+ (11, 19) (11, 64) (13, 73) (13, 61) (13, 80) (13, 85) (14, 86) (14, 59) (14, 32) (14, 58) (14, 85) (14, 66) (15, 43) (15, 48) (15, 73)
+ (15, 19) (15, 47) (15, 68) (16, 46) (16, 60) (16, 84) (17, 44) (17, 72) (17, 36) (17, 37) (17, 61) (18, 20) (18, 24) (18, 22) (18, 41)
+ (19, 45) (19, 83) (20, 25) (20, 29) (21, 38) (21, 64) (21, 24) (21, 22) (21, 34) (22, 23) (23, 34) (23, 30) (23, 83) (24, 47) (24, 50)
+ (25, 59) (25, 42) (25, 70) (25, 72) (26, 45) (26, 30) (26, 87) (26, 80) (26, 50) (27, 77) (27, 58) (27, 60) (27, 29) (28, 36) (28, 59)
+ (28, 88) (29, 31) (29, 33) (29, 56) (29, 55) (29, 78) (29, 73) (29, 82) (30, 34) (31, 58) (31, 70) (32, 78) (33, 73) (33, 68) (34, 48)
+(34, 88) (34, 51) (34, 66) (34, 54) (35, 43) (35, 56) (36, 44) (36, 39) (37, 57) (37, 71) (38, 47) (38, 58) (38, 88) (39, 74) (39, 48)
+ (39, 45) (39, 42) (40, 60) (40, 59) (40, 71) (40, 76) (41, 79) (42, 60) (42, 62) (42, 72) (43, 57) (44, 47) (44, 74) (44, 75) (44, 82)
+ (44, 70) (45, 68) (45, 67) (45, 71) (46, 84) (47, 56) (48, 75) (49, 71) (49, 58) (50, 76) (51, 55) (51, 87) (51, 79) (52, 78) (56, 69)
+(56, 83) (56, 79) (57, 76) (57, 70) (57, 72) (57, 78) (59, 70) (60, 80) (60, 76) (60, 77) (60, 75) (61, 74) (61, 77) (62, 84) (62, 66)
+ (66, 69) (68, 88) (70, 88) (70, 76) (71, 81) (71, 72) (71, 86) (72, 75) (73, 82) (73, 83) (74, 85). Is there a cycle in this graph?
+
+
+GraphWiz: 
+There are many possible ways to find a cycle in this graph, but one example is: Starting from node 0, we can go to node 73 (via edge 0-73), then to node 82 (via edge 73-82),
+then to node 44 (via edge 82-44), then to node 17 (via edge 44-17), then to node 36 (via edge 17-36), then to node 28 (via edge 36-28),
+and back to node 0 (via edge 28-0). This forms a cycle [0-73-82-44-17-36-28-0] without revisiting any edge. So, there is a cycle in this graph.
+
+```
+
--- a/config.json
+++ b/config.json
@@ -0,0 +1,37 @@
+{
+  "JK": "last",
+  "_name_or_path": "/hpc2hdd/home/yli258/jhaidata/Graph-Reasoning-LLM/ckpts/llama_7b_rft_v1_k6",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "dropout_ratio": 0,
+  "end_token_id": 2,
+  "eos_token_id": 2,
+  "gnn_emb_dim": 300,
+  "gnn_type": "gin",
+  "graph_pooling": "mean",
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "model_type": "llama",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "num_layer": 5,
+  "num_tasks": 1,
+  "pad_token_id": 2,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.36.2",
+  "use_cache": true,
+  "vocab_size": 32000
+}
--- a/pytorch_model.bin
+++ b/pytorch_model.bin
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:f67f6c876f2168c8e38854a236c7a38b258788c1a3b25b3739ed5833b6162c96
+size 13476927589
--- a/special_tokens_map.json
+++ b/special_tokens_map.json
@@ -0,0 +1,30 @@
+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}
--- a/tokenizer.model
+++ b/tokenizer.model
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
+size 499723
--- a/tokenizer_config.json
+++ b/tokenizer_config.json
@@ -0,0 +1,43 @@
+{
+  "add_bos_token": true,
+  "add_eos_token": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "fast_tokenizer": true,
+  "legacy": false,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "</s>",
+  "padding_side": "left",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false
+}