38 lines
808 B
Markdown
38 lines
808 B
Markdown
|
|
---
|
||
|
|
license: mit
|
||
|
|
datasets:
|
||
|
|
- mhenrichsen/hestenettet
|
||
|
|
language:
|
||
|
|
- da
|
||
|
|
---
|
||
|
|
|
||
|
|
# HestenettetLM
|
||
|
|
En dansk LLM trænet på hele hestenettet over 3 epoker.
|
||
|
|
|
||
|
|
Modellen er baseret på Mistral 7b, og har et kontekstvindue på 8k.
|
||
|
|
|
||
|
|
```python
|
||
|
|
from transformers import AutoTokenizer, TextStreamer, AutoModelForCausalLM
|
||
|
|
|
||
|
|
model = AutoModelForCausalLM.from_pretrained("mhenrichsen/hestenettetLM")
|
||
|
|
tokenizer = AutoTokenizer.from_pretrained("mhenrichsen/hestenettetLM")
|
||
|
|
streamer = TextStreamer(tokenizer, skip_special_tokens=True)
|
||
|
|
|
||
|
|
|
||
|
|
tokens = tokenizer(
|
||
|
|
"Den bedste hest er en ",
|
||
|
|
return_tensors='pt'
|
||
|
|
)['input_ids']
|
||
|
|
|
||
|
|
# Generate output
|
||
|
|
generation_output = model.generate(
|
||
|
|
tokens,
|
||
|
|
streamer=streamer,
|
||
|
|
max_length = 8194,
|
||
|
|
)
|
||
|
|
```
|
||
|
|
|
||
|
|
Eksempel:
|
||
|
|
"Den bedste hest er en "
|
||
|
|
bliver til:
|
||
|
|
"Den bedste hest er en veltrænet hest."
|