train_sst2_42_1779354538

Go to file

ModelHub XC e68fb677be 初始化项目，由ModelHub XC社区提供模型

Model: rbelanec/train_sst2_42_1779354538
Source: Original Platform

2026-06-01 01:56:16 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

all_results.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

eval_results.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

model.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

train_results.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

train.yaml

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

trainer_log.jsonl

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

trainer_state.json

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

training_args.bin

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

training_eval_loss.png

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

training_loss.png

初始化项目，由ModelHub XC社区提供模型

2026-06-01 01:56:16 +08:00

README.md

library_name, license, base_model, tags, model-index

library_name

license

base_model

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 2e-06
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.1
num_epochs: 1

Training results

Training Loss	Epoch	Step	Validation Loss	Input Tokens Seen
0.0578	0.0500	379	0.1688	187072
0.1097	0.1000	758	0.1367	373504
0.0564	0.1501	1137	0.1656	557824
0.1883	0.2001	1516	0.1097	743424
0.2857	0.2501	1895	0.1319	930944
0.1387	0.3001	2274	0.1241	1116800
0.0494	0.3501	2653	0.1384	1303872
0.1412	0.4002	3032	0.1309	1490688
0.0509	0.4502	3411	0.1158	1678208
0.179	0.5002	3790	0.1276	1864128
0.1555	0.5502	4169	0.0994	2047552
0.1894	0.6002	4548	0.1099	2232448
0.1297	0.6503	4927	0.0997	2420096
0.1829	0.7003	5306	0.0936	2605504
0.0314	0.7503	5685	0.1006	2790656
0.1396	0.8003	6064	0.0963	2979456
0.171	0.8503	6443	0.1007	3167488
0.0013	0.9004	6822	0.0976	3355520
0.0683	0.9504	7201	0.0981	3541632

Framework versions

Transformers 4.51.3
Pytorch 2.10.0+cu128
Datasets 4.0.0
Tokenizers 0.21.4