Go to file

ModelHub XC e783d46aa9 初始化项目，由ModelHub XC社区提供模型

Model: Mirelle/opt-125M-pt-br-finetuned
Source: Original Platform

2026-04-25 14:15:07 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

pytorch_model.bin

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-04-25 14:15:07 +08:00

README.md

widget, license, datasets, language, metrics, library_name, pipeline_tag

widget

license

datasets

language

metrics

library_name

pipeline_tag

text
Em uma bela manhã de

text
Em uma cidade tão grande como

text
Maria e Joana são

mit

mc4

perplexity

transformers

text-generation

OPT-125M finetuned Portuguese

Fine-tuning the OPT-125M model on a reduced corpus of mc4-Portuguese with approximately 300M tokens.

Hyper-parameters

learning_rate = 5e-5
batch_size = 32
warmup = 500
seq_length = 512
num_train_epochs = 2.0

With an A100 with 40GB of RAM, the training took around 3 hours

Perplexity: 9.4

Sample Use

from transformers import pipeline
generator = pipeline('text-generation', model='Mirelle/opt-125M-pt-br-finetuned', max_length=100, do_sample=True)
generator("Em uma bela manhã de")