LWM-7B-1M-1000000ctx-AEZAKMI-3_1-1702

adamo1139/LWM-7B-1M-1000000ctx-AEZAKMI-3_1-1702

Go to file

ModelHub XC 796558edab 初始化项目，由ModelHub XC社区提供模型

Model: adamo1139/LWM-7B-1M-1000000ctx-AEZAKMI-3_1-1702
Source: Original Platform

2026-05-23 08:29:17 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

model-00001-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

model-00002-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

model-00003-of-00003.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

tokenizer.model

初始化项目，由ModelHub XC社区提供模型

2026-05-23 08:29:17 +08:00

README.md

license

license
llama2

LargeWorldModel 7B 1000000 ctx finetuned on AEZAKMI v3.1 dataset for epochs at max_seq_len of 4000 using QLoRA with lora_r 32 and cosine lr decaying from 0.00015. I will be uploading exl2 quants and base model in safetensors format soon.

Fine-tuned with unsloth, FA2 on local RTX 3090 Ti. Training took around 6 hours. I think most of the long ctx capabilities remain.