初始化项目，由ModelHub XC社区提供模型

Model: wudejian789/MolMetaLM-base Source: Original Platform
2026-05-30 23:22:19 +08:00
commit 6dd5bb7b8d
10 changed files with 14635 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -0,0 +1,26 @@
+---
+pipeline_tag: text-generation
+tags:
+- Molecule Language Model
+- Physicochemical Knowledge
+---
+
+refer to https://github.com/CSUBioGroup/MolMetaLM for more details. 
+
+# Usage
+
+## Prepare tokenizer and model
+```python
+from transformers import AutoTokenizer, AutoModel
+tokenizer = AutoTokenizer.from_pretrained('wudejian789/MolMetaLM-base')
+model = AutoModel.from_pretrained('wudejian789/MolMetaLM-base')
+```
+
+## Obtain molecular representations from SMILES
+```python
+smi = "COc1cc2c(cc1OC)CC([NH3+])C2"
+tokenized_smi = tokenizer(" ".join(list(smi)), return_token_type_ids=False, 
+                          return_tensors='pt', max_length=512, padding='longest', truncation=True)
+emb_smi = model(**tokenized_smi).last_hidden_state
+print(emb_smi.shape) # batch size, seq length, embedding size
+```