2026-04-21 22:33:52 - INFO - __main__ - Model parameters ModelArguments(base_model_revision=None, model_name_or_path='/root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200', model_revision='main', model_code_revision=None, torch_dtype='bfloat16', tokenizer_name_or_path=None, trust_remote_code=False, attn_implementation='flash_attention_2', use_peft=False, lora_r=16, lora_alpha=32, lora_dropout=0.05, lora_target_modules=None, lora_modules_to_save=None, load_in_8bit=False, load_in_4bit=False, bnb_4bit_quant_type='nf4', use_bnb_nested_quant=False, bnb_4bit_quant_storage='uint8')
2026-04-21 22:33:52 - INFO - __main__ - Data parameters DataArguments(chat_template=None, dataset_mixer={'Anthropic/hh-rlhf': 1.0}, text_column='text', dataset_splits=['train', 'test'], dataset_configs=['helpful-base'], dataset_dir=None, preprocessing_num_workers=12, use_persistent_hf_cache=True, hf_cache_dir='/root/dynamic-dpo-v4/hf/datasets', truncation_side=None, auto_insert_empty_system_msg=True, preprocessing_log_samples=0, preprocessing_log_dir=None)
2026-04-21 22:33:52 - INFO - __main__ - Training/evaluation parameters NewDPOConfig(
_n_gpu=1,
accelerator_config={'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None, 'use_configured_state': False},
adafactor=False,
adam_beta1=0.9,
adam_beta2=0.999,
adam_epsilon=1e-08,
auto_find_batch_size=False,
average_tokens_across_devices=False,
batch_eval_metrics=False,
beta=0.1,
bf16=True,
bf16_full_eval=False,
data_seed=None,
dataloader_drop_last=True,
dataloader_num_workers=0,
dataloader_persistent_workers=False,
dataloader_pin_memory=True,
dataloader_prefetch_factor=None,
dataset_num_proc=12,
ddp_backend=None,
ddp_broadcast_buffers=None,
ddp_bucket_cap_mb=None,
ddp_find_unused_parameters=None,
ddp_timeout=1800,
debug=[],
deepspeed=None,
disable_dropout=True,
disable_tqdm=False,
do_eval=True,
do_predict=False,
do_train=False,
eta=0.1,
eval_accumulation_steps=None,
eval_delay=0,
eval_do_concat_batches=True,
eval_on_start=False,
eval_steps=200,
eval_strategy=IntervalStrategy.STEPS,
eval_use_gather_object=False,
f_alpha_divergence_coef=1.0,
f_divergence_type=reverse_kl,
force_use_ref_model=False,
fp16=False,
fp16_backend=auto,
fp16_full_eval=False,
fp16_opt_level=O1,
fsdp=[],
fsdp_config={'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False},
fsdp_min_num_params=0,
fsdp_transformer_layer_cls_to_wrap=None,
full_determinism=False,
generate_during_eval=False,
gradient_accumulation_steps=2,
gradient_checkpointing=True,
gradient_checkpointing_kwargs={'use_reentrant': False},
greater_is_better=None,
group_by_length=False,
half_precision_backend=auto,
hub_always_push=False,
hub_margin_dataset_id=None,
hub_model_id=jackf857/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun,
hub_model_revision=main,
hub_private_repo=None,
hub_strategy=HubStrategy.EVERY_SAVE,
hub_token=<HUB_TOKEN>,
ignore_data_skip=False,
include_for_metrics=[],
include_inputs_for_metrics=False,
include_num_input_tokens_seen=False,
include_tokens_per_second=False,
is_encoder_decoder=None,
jit_mode_eval=False,
label_names=None,
label_pad_token_id=-100,
label_smoothing=0.0,
label_smoothing_factor=0.0,
learning_rate=5e-07,
length_column_name=length,
load_best_model_at_end=False,
local_rank=0,
log_level=info,
log_level_replica=warning,
log_on_each_node=True,
logging_dir=outputs/llama3-8b-base-new-method-s_star0.6/runs/Apr21_22-33-51_f6a54ae9d6f6,
logging_first_step=True,
logging_nan_inf_filter=True,
logging_steps=5,
logging_strategy=IntervalStrategy.STEPS,
loss_type=sigmoid,
lr_scheduler_kwargs={},
lr_scheduler_type=SchedulerType.COSINE,
margin_dataset_private=None,
margin_dataset_split=train,
margin_log_path=/root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/margin_logs,
margin_log_steps=1,
margin_save_full=True,
max_grad_norm=1.0,
max_length=512,
max_prompt_length=256,
max_steps=-1,
max_target_length=None,
metric_for_best_model=None,
model_adapter_name=None,
model_init_kwargs=None,
mp_parameters=,
neftune_noise_alpha=None,
no_cuda=False,
non_finite_logits_handling=error,
num_train_epochs=1,
optim=OptimizerNames.ADAMW_TORCH,
optim_args=None,
optim_target_modules=None,
output_dir=/root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun,
overwrite_output_dir=False,
padding_value=None,
past_index=-1,
per_device_eval_batch_size=8,
per_device_train_batch_size=8,
post_tokenization_log_dir=None,
post_tokenization_log_samples=0,
precompute_ref_batch_size=None,
precompute_ref_eval_batch_size=None,
precompute_ref_log_probs=False,
prediction_loss_only=False,
push_margin_dataset=True,
push_to_hub=True,
push_to_hub_model_id=None,
push_to_hub_organization=None,
push_to_hub_token=<PUSH_TO_HUB_TOKEN>,
q_target=0.45,
ray_scope=last,
ref_adapter_name=None,
ref_model_init_kwargs=None,
ref_model_mixup_alpha=0.9,
ref_model_sync_steps=64,
reference_free=False,
remove_unused_columns=False,
report_to=['wandb'],
require_explicit_ref_model=True,
restore_callback_states_from_checkpoint=False,
resume_from_checkpoint=None,
reuse_tokenized_dataset=True,
rpo_alpha=None,
run_name=llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun,
s_star=0.6,
save_on_each_node=False,
save_only_model=False,
save_safetensors=True,
save_steps=50,
save_strategy=SaveStrategy.NO,
save_total_limit=2,
seed=42,
sft_weight=0.0,
skip_memory_metrics=True,
sync_ref_model=False,
tf32=None,
tokenization_batch_size=128,
tokenization_mode=online,
tokenized_dataset_cache_dir=/root/dynamic-dpo-v4/tokenized_preferences,
torch_compile=False,
torch_compile_backend=None,
torch_compile_mode=None,
torch_empty_cache_steps=None,
torchdynamo=None,
tp_size=0,
tpu_metrics_debug=False,
tpu_num_cores=None,
trainer_type=new_dpo,
truncation_mode=keep_end,
use_cpu=False,
use_ipex=False,
use_legacy_prediction_loop=False,
use_liger_kernel=False,
use_mps_device=False,
wandb_project=llama3-8b-base-new-method-hh-beta-0.1,
warmup_ratio=0.1,
warmup_steps=0,
weight_decay=0.0,
)
2026-04-21 22:33:52 - INFO - __main__ - Using W&B project from training args: llama3-8b-base-new-method-hh-beta-0.1
2026-04-21 22:33:52 - INFO - __main__ - New-DPO parameters: beta=0.1, q_target=0.45, s_star=0.6, eta=0.1
2026-04-21 22:33:52 - INFO - __main__ - Using persistent HF datasets cache at /root/dynamic-dpo-v4/hf/datasets
2026-04-21 22:33:56 - WARNING - __main__ - Dropped 237 non-canonical HH preference examples from split `train` before normalization (126 x HH preprocessing expects exactly one final assistant response in chosen/rejected suffixes., 111 x HH chosen/rejected transcripts must each contain a divergent assistant response.).
Normalizing raw HH preferences (train):   0%|          | 0/43598 [00:00<?, ? examples/s]Normalizing raw HH preferences (train):   0%|          | 0/43598 [00:00<?, ? examples/s]Normalizing raw HH preferences (train):   0%|          | 0/43598 [00:00<?, ? examples/s]Normalizing raw HH preferences (train):   0%|          | 0/43598 [00:00<?, ? examples/s]Normalizing raw HH preferences (train):   3%|▎         | 1111/43598 [00:00<00:03, 11042.95 examples/s]Normalizing raw HH preferences (train):   3%|▎         | 1100/43598 [00:00<00:03, 10948.07 examples/s]Normalizing raw HH preferences (train):   3%|▎         | 1108/43598 [00:00<00:03, 11012.12 examples/s]Normalizing raw HH preferences (train):   3%|▎         | 1116/43598 [00:00<00:03, 11094.75 examples/s]Normalizing raw HH preferences (train):   5%|▌         | 2314/43598 [00:00<00:03, 11610.68 examples/s]Normalizing raw HH preferences (train):   5%|▌         | 2303/43598 [00:00<00:03, 11575.62 examples/s]Normalizing raw HH preferences (train):   5%|▌         | 2314/43598 [00:00<00:03, 11622.48 examples/s]Normalizing raw HH preferences (train):   5%|▌         | 2320/43598 [00:00<00:03, 11643.71 examples/s]Normalizing raw HH preferences (train):   8%|▊         | 3523/43598 [00:00<00:03, 11821.06 examples/s]Normalizing raw HH preferences (train):   8%|▊         | 3511/43598 [00:00<00:03, 11777.96 examples/s]Normalizing raw HH preferences (train):   8%|▊         | 3485/43598 [00:00<00:03, 11641.85 examples/s]Normalizing raw HH preferences (train):  11%|█         | 4713/43598 [00:00<00:03, 11845.90 examples/s]Normalizing raw HH preferences (train):   9%|▉         | 4000/43598 [00:00<00:03, 11306.60 examples/s]Normalizing raw HH preferences (train):  11%|█         | 4700/43598 [00:00<00:03, 11818.54 examples/s]Normalizing raw HH preferences (train):  11%|█         | 4677/43598 [00:00<00:03, 11748.62 examples/s]Normalizing raw HH preferences (train):  14%|█▎        | 5908/43598 [00:00<00:03, 11877.62 examples/s]Normalizing raw HH preferences (train):  12%|█▏        | 5181/43598 [00:00<00:03, 11477.11 examples/s]Normalizing raw HH preferences (train):  14%|█▎        | 5894/43598 [00:00<00:03, 11855.23 examples/s]Normalizing raw HH preferences (train):  13%|█▎        | 5872/43598 [00:00<00:03, 11817.04 examples/s]Normalizing raw HH preferences (train):  15%|█▍        | 6379/43598 [00:00<00:03, 11637.71 examples/s]Normalizing raw HH preferences (train):  17%|█▋        | 7296/43598 [00:00<00:04, 7572.63 examples/s] Normalizing raw HH preferences (train):  17%|█▋        | 7299/43598 [00:00<00:04, 7789.99 examples/s] Normalizing raw HH preferences (train):  19%|█▉        | 8494/43598 [00:00<00:04, 8569.10 examples/s]Normalizing raw HH preferences (train):  17%|█▋        | 7301/43598 [00:00<00:04, 7347.46 examples/s] Normalizing raw HH preferences (train):  18%|█▊        | 7953/43598 [00:00<00:04, 7906.46 examples/s] Normalizing raw HH preferences (train):  19%|█▉        | 8496/43598 [00:00<00:04, 8751.83 examples/s]Normalizing raw HH preferences (train):  22%|██▏       | 9691/43598 [00:00<00:03, 9397.30 examples/s]Normalizing raw HH preferences (train):  19%|█▉        | 8496/43598 [00:00<00:04, 8356.87 examples/s]Normalizing raw HH preferences (train):  21%|██        | 9036/43598 [00:00<00:04, 8543.09 examples/s]Normalizing raw HH preferences (train):  22%|██▏       | 9694/43598 [00:00<00:03, 9548.72 examples/s]Normalizing raw HH preferences (train):  25%|██▍       | 10880/43598 [00:01<00:03, 10039.03 examples/s]Normalizing raw HH preferences (train):  22%|██▏       | 9696/43598 [00:01<00:03, 9225.96 examples/s]Normalizing raw HH preferences (train):  23%|██▎       | 10229/43598 [00:01<00:03, 9346.69 examples/s]Normalizing raw HH preferences (train):  25%|██▍       | 10792/43598 [00:01<00:03, 9919.84 examples/s]Normalizing raw HH preferences (train):  28%|██▊       | 12000/43598 [00:01<00:03, 10247.59 examples/s]Normalizing raw HH preferences (train):  25%|██▍       | 10894/43598 [00:01<00:03, 9925.00 examples/s]Normalizing raw HH preferences (train):  26%|██▌       | 11431/43598 [00:01<00:03, 10020.45 examples/s]Normalizing raw HH preferences (train):  27%|██▋       | 11957/43598 [00:01<00:03, 10388.22 examples/s]Normalizing raw HH preferences (train):  30%|███       | 13192/43598 [00:01<00:02, 10706.35 examples/s]Normalizing raw HH preferences (train):  29%|██▉       | 12655/43598 [00:01<00:02, 10559.26 examples/s]Normalizing raw HH preferences (train):  29%|██▉       | 12655/43598 [00:01<00:02, 10514.94 examples/s]Normalizing raw HH preferences (train):  33%|███▎      | 14383/43598 [00:01<00:02, 11043.35 examples/s]Normalizing raw HH preferences (train):  31%|███▏      | 13691/43598 [00:01<00:02, 10817.46 examples/s]Normalizing raw HH preferences (train):  32%|███▏      | 13812/43598 [00:01<00:02, 10833.14 examples/s]Normalizing raw HH preferences (train):  32%|███▏      | 13843/43598 [00:01<00:02, 10852.65 examples/s]Normalizing raw HH preferences (train):  36%|███▌      | 15664/43598 [00:01<00:02, 11396.93 examples/s]Normalizing raw HH preferences (train):  34%|███▍      | 14888/43598 [00:01<00:02, 11113.85 examples/s]Normalizing raw HH preferences (train):  34%|███▍      | 15000/43598 [00:01<00:02, 10893.63 examples/s]Normalizing raw HH preferences (train):  34%|███▍      | 15000/43598 [00:01<00:02, 10856.30 examples/s]Normalizing raw HH preferences (train):  39%|███▊      | 16878/43598 [00:01<00:02, 11608.15 examples/s]Normalizing raw HH preferences (train):  37%|███▋      | 16202/43598 [00:01<00:02, 11209.12 examples/s]Normalizing raw HH preferences (train):  37%|███▋      | 16185/43598 [00:01<00:02, 11120.85 examples/s]Normalizing raw HH preferences (train):  38%|███▊      | 16659/43598 [00:01<00:02, 11316.14 examples/s]Normalizing raw HH preferences (train):  40%|███▉      | 17394/43598 [00:01<00:02, 11412.26 examples/s]Normalizing raw HH preferences (train):  43%|████▎     | 18633/43598 [00:01<00:02, 11543.64 examples/s]Normalizing raw HH preferences (train):  40%|███▉      | 17340/43598 [00:01<00:02, 11236.25 examples/s]Normalizing raw HH preferences (train):  41%|████      | 17841/43598 [00:01<00:02, 11441.28 examples/s]Normalizing raw HH preferences (train):  43%|████▎     | 18636/43598 [00:01<00:02, 11533.73 examples/s]Normalizing raw HH preferences (train):  45%|████▌     | 19822/43598 [00:01<00:02, 11632.39 examples/s]Normalizing raw HH preferences (train):  42%|████▏     | 18488/43598 [00:01<00:02, 11301.88 examples/s]Normalizing raw HH preferences (train):  45%|████▌     | 19662/43598 [00:01<00:02, 11494.29 examples/s]Normalizing raw HH preferences (train):  45%|████▌     | 19835/43598 [00:01<00:02, 11664.41 examples/s]Normalizing raw HH preferences (train):  48%|████▊     | 21000/43598 [00:01<00:01, 11461.43 examples/s]Normalizing raw HH preferences (train):  45%|████▌     | 19673/43598 [00:01<00:02, 11456.83 examples/s]Normalizing raw HH preferences (train):  51%|█████     | 22155/43598 [00:02<00:01, 11484.90 examples/s]Normalizing raw HH preferences (train):  48%|████▊     | 20846/43598 [00:01<00:01, 11533.90 examples/s]Normalizing raw HH preferences (train):  49%|████▉     | 21359/43598 [00:01<00:01, 11429.97 examples/s]Normalizing raw HH preferences (train):  50%|████▉     | 21657/43598 [00:02<00:01, 11669.11 examples/s]Normalizing raw HH preferences (train):  54%|█████▎    | 23353/43598 [00:02<00:01, 11624.74 examples/s]Normalizing raw HH preferences (train):  52%|█████▏    | 22654/43598 [00:02<00:01, 11551.35 examples/s]Normalizing raw HH preferences (train):  52%|█████▏    | 22845/43598 [00:02<00:01, 11723.59 examples/s]Normalizing raw HH preferences (train):  52%|█████▏    | 22522/43598 [00:02<00:01, 11391.19 examples/s]Normalizing raw HH preferences (train):  57%|█████▋    | 24648/43598 [00:02<00:01, 11748.46 examples/s]Normalizing raw HH preferences (train):  55%|█████▍    | 23864/43598 [00:02<00:01, 11686.06 examples/s]Normalizing raw HH preferences (train):  54%|█████▍    | 23693/43598 [00:02<00:01, 11460.12 examples/s]Normalizing raw HH preferences (train):  57%|█████▋    | 24648/43598 [00:02<00:01, 11711.66 examples/s]Normalizing raw HH preferences (train):  59%|█████▉    | 25836/43598 [00:02<00:01, 11784.56 examples/s]Normalizing raw HH preferences (train):  57%|█████▋    | 24871/43598 [00:02<00:01, 11544.96 examples/s]Normalizing raw HH preferences (train):  59%|█████▉    | 25654/43598 [00:02<00:01, 11643.34 examples/s]Normalizing raw HH preferences (train):  59%|█████▉    | 25836/43598 [00:02<00:01, 11753.96 examples/s]Normalizing raw HH preferences (train):  63%|██████▎   | 27643/43598 [00:02<00:01, 11672.40 examples/s]Normalizing raw HH preferences (train):  62%|██████▏   | 26833/43598 [00:02<00:01, 11677.35 examples/s]Normalizing raw HH preferences (train):  61%|██████    | 26636/43598 [00:02<00:01, 11507.69 examples/s]Normalizing raw HH preferences (train):  63%|██████▎   | 27648/43598 [00:02<00:01, 11676.91 examples/s]Normalizing raw HH preferences (train):  66%|██████▌   | 28835/43598 [00:02<00:01, 11733.12 examples/s]Normalizing raw HH preferences (train):  64%|██████▍   | 27807/43598 [00:02<00:01, 11556.74 examples/s]Normalizing raw HH preferences (train):  66%|██████▌   | 28655/43598 [00:02<00:01, 11645.64 examples/s]Normalizing raw HH preferences (train):  66%|██████▌   | 28843/43598 [00:02<00:01, 11740.76 examples/s]Normalizing raw HH preferences (train):  67%|██████▋   | 28999/43598 [00:02<00:01, 11652.07 examples/s]Normalizing raw HH preferences (train):  70%|███████   | 30656/43598 [00:02<00:01, 11743.21 examples/s]Normalizing raw HH preferences (train):  68%|██████▊   | 29864/43598 [00:02<00:01, 11751.22 examples/s]Normalizing raw HH preferences (train):  70%|███████   | 30662/43598 [00:02<00:01, 11758.46 examples/s]Normalizing raw HH preferences (train):  73%|███████▎  | 31846/43598 [00:02<00:00, 11781.70 examples/s]Normalizing raw HH preferences (train):  71%|███████   | 30750/43598 [00:02<00:01, 11655.43 examples/s]Normalizing raw HH preferences (train):  73%|███████▎  | 31659/43598 [00:02<00:01, 11747.21 examples/s]Normalizing raw HH preferences (train):  74%|███████▍  | 32378/43598 [00:02<00:00, 11650.96 examples/s]Normalizing raw HH preferences (train):  73%|███████▎  | 31935/43598 [00:02<00:00, 11702.52 examples/s]Normalizing raw HH preferences (train):  77%|███████▋  | 33530/43598 [00:03<00:00, 11583.60 examples/s]Normalizing raw HH preferences (train):  75%|███████▌  | 32851/43598 [00:02<00:00, 11787.39 examples/s]Normalizing raw HH preferences (train):  77%|███████▋  | 33642/43598 [00:03<00:00, 11704.36 examples/s]Normalizing raw HH preferences (train):  77%|███████▋  | 33656/43598 [00:03<00:00, 11617.91 examples/s]Normalizing raw HH preferences (train):  81%|████████  | 35210/43598 [00:03<00:00, 11450.32 examples/s]Normalizing raw HH preferences (train):  80%|███████▉  | 34663/43598 [00:03<00:00, 11703.33 examples/s]Normalizing raw HH preferences (train):  80%|███████▉  | 34823/43598 [00:03<00:00, 11729.23 examples/s]Normalizing raw HH preferences (train):  80%|███████▉  | 34830/43598 [00:03<00:00, 11646.21 examples/s]Normalizing raw HH preferences (train):  83%|████████▎ | 36367/43598 [00:03<00:00, 11476.31 examples/s]Normalizing raw HH preferences (train):  82%|████████▏ | 35838/43598 [00:03<00:00, 11711.79 examples/s]Normalizing raw HH preferences (train):  84%|████████▍ | 36532/43598 [00:03<00:00, 11606.44 examples/s]Normalizing raw HH preferences (train):  86%|████████▋ | 37663/43598 [00:03<00:00, 11626.47 examples/s]Normalizing raw HH preferences (train):  84%|████████▎ | 36500/43598 [00:03<00:00, 11462.66 examples/s]Normalizing raw HH preferences (train):  87%|████████▋ | 37724/43598 [00:03<00:00, 11681.07 examples/s]Normalizing raw HH preferences (train):  86%|████████▋ | 37654/43598 [00:03<00:00, 11613.51 examples/s]Normalizing raw HH preferences (train):  89%|████████▉ | 38836/43598 [00:03<00:00, 11650.05 examples/s]Normalizing raw HH preferences (train):  86%|████████▋ | 37680/43598 [00:03<00:00, 11543.04 examples/s]Normalizing raw HH preferences (train):  89%|████████▉ | 38828/43598 [00:03<00:00, 11640.26 examples/s]Normalizing raw HH preferences (train):  90%|█████████ | 39397/43598 [00:03<00:00, 11494.92 examples/s]Normalizing raw HH preferences (train):  89%|████████▉ | 38848/43598 [00:03<00:00, 11578.32 examples/s]Normalizing raw HH preferences (train):  93%|█████████▎| 40656/43598 [00:03<00:00, 11637.10 examples/s]Normalizing raw HH preferences (train):  92%|█████████▏| 40000/43598 [00:03<00:00, 11434.01 examples/s]Normalizing raw HH preferences (train):  93%|█████████▎| 40659/43598 [00:03<00:00, 11623.80 examples/s]Normalizing raw HH preferences (train):  96%|█████████▌| 41849/43598 [00:03<00:00, 11709.01 examples/s]Normalizing raw HH preferences (train):  94%|█████████▍| 41191/43598 [00:03<00:00, 11555.39 examples/s]Normalizing raw HH preferences (train):  93%|█████████▎| 40655/43598 [00:03<00:00, 11587.18 examples/s]Normalizing raw HH preferences (train):  96%|█████████▌| 41852/43598 [00:03<00:00, 11700.96 examples/s]Normalizing raw HH preferences (train):  97%|█████████▋| 42380/43598 [00:03<00:00, 11644.38 examples/s]Normalizing raw HH preferences (train):  96%|█████████▌| 41848/43598 [00:03<00:00, 11672.91 examples/s]Normalizing raw HH preferences (train):  99%|█████████▉| 43083/43598 [00:03<00:00, 8566.15 examples/s] Normalizing raw HH preferences (train): 100%|██████████| 43598/43598 [00:04<00:00, 10782.90 examples/s]
Normalizing raw HH preferences (train):  99%|█████████▉| 43083/43598 [00:04<00:00, 8301.55 examples/s] Normalizing raw HH preferences (train): 100%|██████████| 43598/43598 [00:04<00:00, 10742.38 examples/s]
Normalizing raw HH preferences (train):  99%|█████████▉| 43083/43598 [00:04<00:00, 8331.99 examples/s] Normalizing raw HH preferences (train): 100%|██████████| 43598/43598 [00:04<00:00, 7563.45 examples/s] Normalizing raw HH preferences (train): 100%|██████████| 43598/43598 [00:04<00:00, 10656.90 examples/s]
Normalizing raw HH preferences (train): 100%|██████████| 43598/43598 [00:04<00:00, 10655.66 examples/s]
2026-04-21 22:34:01 - WARNING - __main__ - Dropped 15 non-canonical HH preference examples from split `test` before normalization (9 x HH preprocessing expects exactly one final assistant response in chosen/rejected suffixes., 6 x HH chosen/rejected transcripts must each contain a divergent assistant response.).
Normalizing raw HH preferences (test):   0%|          | 0/2339 [00:00<?, ? examples/s]Normalizing raw HH preferences (test):  48%|████▊     | 1116/2339 [00:00<00:00, 11109.82 examples/s]Normalizing raw HH preferences (test):  98%|█████████▊| 2297/2339 [00:00<00:00, 11515.59 examples/s]Normalizing raw HH preferences (test): 100%|██████████| 2339/2339 [00:00<00:00, 11226.24 examples/s]
2026-04-21 22:34:01 - INFO - __main__ - Training on the following splits: ['train : 43598', 'test : 2339']
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file tokenizer.json
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file tokenizer.model
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file added_tokens.json
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file special_tokens_map.json
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file tokenizer_config.json
[INFO|tokenization_utils_base.py:2058] 2026-04-21 22:34:01,704 >> loading file chat_template.jinja
Normalizing raw HH preferences (test):   0%|          | 0/2339 [00:00<?, ? examples/s]Normalizing raw HH preferences (test):   0%|          | 0/2339 [00:00<?, ? examples/s]Normalizing raw HH preferences (test):   0%|          | 0/2339 [00:00<?, ? examples/s]Normalizing raw HH preferences (test):  48%|████▊     | 1125/2339 [00:00<00:00, 11193.62 examples/s]Normalizing raw HH preferences (test):  48%|████▊     | 1127/2339 [00:00<00:00, 11220.12 examples/s]Normalizing raw HH preferences (test):  48%|████▊     | 1116/2339 [00:00<00:00, 11103.97 examples/s]Normalizing raw HH preferences (test):  99%|█████████▊| 2305/2339 [00:00<00:00, 11541.01 examples/s]Normalizing raw HH preferences (test): 100%|██████████| 2339/2339 [00:00<00:00, 11282.16 examples/s]
Normalizing raw HH preferences (test):  98%|█████████▊| 2284/2339 [00:00<00:00, 11419.25 examples/s]Normalizing raw HH preferences (test):  98%|█████████▊| 2298/2339 [00:00<00:00, 11520.17 examples/s]Normalizing raw HH preferences (test): 100%|██████████| 2339/2339 [00:00<00:00, 11254.96 examples/s]
Normalizing raw HH preferences (test): 100%|██████████| 2339/2339 [00:00<00:00, 11181.88 examples/s]
[INFO|tokenization_utils_base.py:2323] 2026-04-21 22:34:02,124 >> Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
2026-04-21 22:34:02 - INFO - __main__ - Processed train sample 41905:

Prompt:
<|begin_of_text|><|start_header_id|>user<|end_header_id|>

What is the best way to clean my refrigerator?<|eot_id|><|start_header_id|>assistant<|end_header_id|>

Well, I have a few ideas, but the best way to know what works best is to run some tests and then analyze the data to figure out which technique works best.<|eot_id|><|start_header_id|>user<|end_header_id|>

What are your ideas?<|eot_id|>

Chosen:
<|start_header_id|>assistant<|end_header_id|>

Some of my ideas include wiping down the interior with a rag, using bleach and water to wipe down the door, emptying the contents of the fridge to scrub the shelves with a clean cloth, cleaning the interior of the fridge with vinegar and water, and using a vacuum cleaner to clean the interior.<|eot_id|>

Rejected:
<|start_header_id|>assistant<|end_header_id|>

I was thinking that you could try different types of soap, which could be a variation of “soap,” like antibacterial soap.  I was also thinking that you could try using different tools, like a toothbrush, to clean the inside.  Or I was thinking that you could try different ways to get the gunk out, like using a squeegee, or using a paper towel.  I was also thinking you could try other types of cleaning, like vacuuming, but I think that could have the opposite of the desired effect.<|eot_id|>
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:391: UserWarning: You passed a model_id to the trainer. This will automatically create an `AutoModelForCausalLM` or a `PeftModel` (if you passed a `peft_config`) for you.
  warnings.warn(
[INFO|configuration_utils.py:691] 2026-04-21 22:34:02,347 >> loading configuration file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/config.json
[INFO|configuration_utils.py:765] 2026-04-21 22:34:02,348 >> Model config LlamaConfig {
  "architectures": [
    "LlamaForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "head_dim": 128,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 14336,
  "max_position_embeddings": 8192,
  "mlp_bias": false,
  "model_type": "llama",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "num_key_value_heads": 8,
  "pretraining_tp": 1,
  "rms_norm_eps": 1e-05,
  "rope_scaling": null,
  "rope_theta": 500000.0,
  "tie_word_embeddings": false,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.51.0",
  "use_cache": false,
  "vocab_size": 128256
}

[INFO|modeling_utils.py:1121] 2026-04-21 22:34:02,356 >> loading weights file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/model.safetensors.index.json
[INFO|modeling_utils.py:2167] 2026-04-21 22:34:02,356 >> Instantiating LlamaForCausalLM model under default dtype torch.bfloat16.
[WARNING|logging.py:328] 2026-04-21 22:34:02,358 >> You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
[INFO|configuration_utils.py:1142] 2026-04-21 22:34:02,360 >> Generate config GenerationConfig {
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "use_cache": false
}

Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:391: UserWarning: You passed a model_id to the trainer. This will automatically create an `AutoModelForCausalLM` or a `PeftModel` (if you passed a `peft_config`) for you.
  warnings.warn(
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:391: UserWarning: You passed a model_id to the trainer. This will automatically create an `AutoModelForCausalLM` or a `PeftModel` (if you passed a `peft_config`) for you.
  warnings.warn(
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:391: UserWarning: You passed a model_id to the trainer. This will automatically create an `AutoModelForCausalLM` or a `PeftModel` (if you passed a `peft_config`) for you.
  warnings.warn(
[WARNING|logging.py:328] 2026-04-21 22:34:02,672 >> You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
[WARNING|logging.py:328] 2026-04-21 22:34:02,674 >> You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
[WARNING|logging.py:328] 2026-04-21 22:34:02,682 >> You are attempting to use Flash Attention 2.0 with a model not initialized on GPU. Make sure to move the model to GPU after initializing it on CPU with `model.to('cuda')`.
Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1476.94it/s]
Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1407.48it/s]
Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1477.02it/s]
Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1514.03it/s]
Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1455.06it/s]
[WARNING|trainer.py:821] 2026-04-21 22:34:02,758 >> Trainer.tokenizer is now deprecated. You should use `Trainer.processing_class = processing_class` instead.
[WARNING|trainer.py:821] 2026-04-21 22:34:02,761 >> Trainer.tokenizer is now deprecated. You should use `Trainer.processing_class = processing_class` instead.
Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards: 100%|██████████| 7/7 [00:00<00:00, 1508.90it/s]
[WARNING|trainer.py:821] 2026-04-21 22:34:02,768 >> Trainer.tokenizer is now deprecated. You should use `Trainer.processing_class = processing_class` instead.
Loading checkpoint shards:  14%|█▍        | 1/7 [00:01<00:10,  1.70s/it]Loading checkpoint shards:  29%|██▊       | 2/7 [00:03<00:08,  1.73s/it]Loading checkpoint shards:  43%|████▎     | 3/7 [00:05<00:06,  1.73s/it]Loading checkpoint shards:  57%|█████▋    | 4/7 [00:06<00:05,  1.74s/it]Loading checkpoint shards:  71%|███████▏  | 5/7 [00:08<00:03,  1.70s/it]Loading checkpoint shards:  86%|████████▌ | 6/7 [00:10<00:01,  1.70s/it]Loading checkpoint shards: 100%|██████████| 7/7 [00:11<00:00,  1.43s/it]Loading checkpoint shards: 100%|██████████| 7/7 [00:11<00:00,  1.59s/it]
[INFO|modeling_utils.py:4926] 2026-04-21 22:34:13,505 >> All model checkpoint weights were used when initializing LlamaForCausalLM.

[INFO|modeling_utils.py:4934] 2026-04-21 22:34:13,505 >> All the weights of LlamaForCausalLM were initialized from the model checkpoint at /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200.
If your task is similar to the task the model of the checkpoint was trained on, you can already use LlamaForCausalLM for predictions without further training.
[INFO|configuration_utils.py:1095] 2026-04-21 22:34:13,507 >> loading configuration file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/generation_config.json
[INFO|configuration_utils.py:1142] 2026-04-21 22:34:13,507 >> Generate config GenerationConfig {
  "bos_token_id": 128000,
  "do_sample": true,
  "eos_token_id": 128001,
  "max_length": 4096,
  "temperature": 0.6,
  "top_p": 0.9
}

[INFO|configuration_utils.py:691] 2026-04-21 22:34:13,508 >> loading configuration file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/config.json
[INFO|configuration_utils.py:765] 2026-04-21 22:34:13,509 >> Model config LlamaConfig {
  "architectures": [
    "LlamaForCausalLM"
  ],
  "attention_bias": false,
  "attention_dropout": 0.0,
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "head_dim": 128,
  "hidden_act": "silu",
  "hidden_size": 4096,
  "initializer_range": 0.02,
  "intermediate_size": 14336,
  "max_position_embeddings": 8192,
  "mlp_bias": false,
  "model_type": "llama",
  "num_attention_heads": 32,
  "num_hidden_layers": 32,
  "num_key_value_heads": 8,
  "pretraining_tp": 1,
  "rms_norm_eps": 1e-05,
  "rope_scaling": null,
  "rope_theta": 500000.0,
  "tie_word_embeddings": false,
  "torch_dtype": "bfloat16",
  "transformers_version": "4.51.0",
  "use_cache": false,
  "vocab_size": 128256
}

[INFO|modeling_utils.py:1121] 2026-04-21 22:34:13,509 >> loading weights file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/model.safetensors.index.json
[INFO|modeling_utils.py:2167] 2026-04-21 22:34:13,510 >> Instantiating LlamaForCausalLM model under default dtype torch.bfloat16.
[INFO|configuration_utils.py:1142] 2026-04-21 22:34:13,512 >> Generate config GenerationConfig {
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "use_cache": false
}

Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]Loading checkpoint shards:  14%|█▍        | 1/7 [00:01<00:09,  1.64s/it]Loading checkpoint shards:  29%|██▊       | 2/7 [00:03<00:08,  1.69s/it]Loading checkpoint shards:  43%|████▎     | 3/7 [00:05<00:06,  1.68s/it]Loading checkpoint shards:  57%|█████▋    | 4/7 [00:06<00:05,  1.71s/it]Loading checkpoint shards:  71%|███████▏  | 5/7 [00:08<00:03,  1.68s/it]Loading checkpoint shards:  86%|████████▌ | 6/7 [00:10<00:01,  1.68s/it]Loading checkpoint shards: 100%|██████████| 7/7 [00:10<00:00,  1.41s/it]Loading checkpoint shards: 100%|██████████| 7/7 [00:10<00:00,  1.56s/it]
[INFO|modeling_utils.py:4926] 2026-04-21 22:34:24,488 >> All model checkpoint weights were used when initializing LlamaForCausalLM.

[INFO|modeling_utils.py:4934] 2026-04-21 22:34:24,489 >> All the weights of LlamaForCausalLM were initialized from the model checkpoint at /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200.
If your task is similar to the task the model of the checkpoint was trained on, you can already use LlamaForCausalLM for predictions without further training.
[INFO|configuration_utils.py:1095] 2026-04-21 22:34:24,491 >> loading configuration file /root/dynamic-dpo-v4/sft-checkpoints/llama-3-8b-base-sft-hh-helpful-4xh200/generation_config.json
[INFO|configuration_utils.py:1142] 2026-04-21 22:34:24,491 >> Generate config GenerationConfig {
  "bos_token_id": 128000,
  "do_sample": true,
  "eos_token_id": 128001,
  "max_length": 4096,
  "temperature": 0.6,
  "top_p": 0.9
}

[WARNING|trainer.py:821] 2026-04-21 22:34:24,493 >> Trainer.tokenizer is now deprecated. You should use `Trainer.processing_class = processing_class` instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:24,493 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:24,502 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:24,503 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:24,507 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:518: FutureWarning: `tokenizer` is deprecated and will be removed in version 5.0.0 for `NewDPOTrainer.__init__`. Use `processing_class` instead.
  super().__init__(
[WARNING|trainer.py:816] 2026-04-21 22:34:25,971 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,971 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,971 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,991 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,991 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,992 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,992 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,993 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:25,993 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
[WARNING|trainer.py:816] 2026-04-21 22:34:26,003 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:518: FutureWarning: `tokenizer` is deprecated and will be removed in version 5.0.0 for `NewDPOTrainer.__init__`. Use `processing_class` instead.
  super().__init__(
[WARNING|trainer.py:816] 2026-04-21 22:34:26,004 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:518: FutureWarning: `tokenizer` is deprecated and will be removed in version 5.0.0 for `NewDPOTrainer.__init__`. Use `processing_class` instead.
  super().__init__(
[WARNING|trainer.py:816] 2026-04-21 22:34:26,004 >> Trainer.tokenizer is now deprecated. You should use Trainer.processing_class instead.
/root/dynamic-dpo-v4/scripts/tokenized_dpo_trainer.py:518: FutureWarning: `tokenizer` is deprecated and will be removed in version 5.0.0 for `NewDPOTrainer.__init__`. Use `processing_class` instead.
  super().__init__(
[INFO|trainer.py:748] 2026-04-21 22:34:26,406 >> Using auto half precision backend
/root/dynamic-dpo-v4/.venv/lib/python3.11/site-packages/accelerate/accelerator.py:1557: UserWarning: Upcasted low precision parameters in LlamaForCausalLM because mixed precision turned on in FSDP. Affects: model.embed_tokens.weight, model.norm.weight, lm_head.weight.
  warnings.warn(
/root/dynamic-dpo-v4/.venv/lib/python3.11/site-packages/accelerate/accelerator.py:1557: UserWarning: Upcasted low precision parameters in LlamaDecoderLayer because mixed precision turned on in FSDP. Affects: self_attn.q_proj.weight, self_attn.k_proj.weight, self_attn.v_proj.weight, self_attn.o_proj.weight, mlp.gate_proj.weight, mlp.up_proj.weight, mlp.down_proj.weight, input_layernorm.weight, post_attention_layernorm.weight.
  warnings.warn(
/root/dynamic-dpo-v4/.venv/lib/python3.11/site-packages/accelerate/accelerator.py:1563: UserWarning: FSDP upcast of low precision parameters may affect the precision of model checkpoints.
  warnings.warn(
[INFO|trainer.py:2414] 2026-04-21 22:34:36,013 >> ***** Running training *****
[INFO|trainer.py:2415] 2026-04-21 22:34:36,013 >>   Num examples = 43,598
[INFO|trainer.py:2416] 2026-04-21 22:34:36,013 >>   Num Epochs = 1
[INFO|trainer.py:2417] 2026-04-21 22:34:36,013 >>   Instantaneous batch size per device = 8
[INFO|trainer.py:2420] 2026-04-21 22:34:36,013 >>   Total train batch size (w. parallel, distributed & accumulation) = 64
[INFO|trainer.py:2421] 2026-04-21 22:34:36,013 >>   Gradient Accumulation steps = 2
[INFO|trainer.py:2422] 2026-04-21 22:34:36,013 >>   Total optimization steps = 681
[INFO|trainer.py:2423] 2026-04-21 22:34:36,014 >>   Number of trainable parameters = 2,007,565,312
[INFO|integration_utils.py:831] 2026-04-21 22:34:36,015 >> Automatic Weights & Biases logging enabled, to disable set os.environ["WANDB_DISABLED"] = "true"
wandb: Currently logged in as: feng-cheng (feng-cheng-northeastern-university). Use `wandb login --relogin` to force relogin
wandb: - Waiting for wandb.init()...wandb: \ Waiting for wandb.init()...wandb: wandb version 0.26.0 is available!  To upgrade, please run:
wandb:  $ pip install wandb --upgrade
wandb: Tracking run with wandb version 0.17.5
wandb: Run data is saved locally in /root/dynamic-dpo-v4/wandb/wandb/run-20260421_223437-cejacemh
wandb: Run `wandb offline` to turn off syncing.
wandb: Syncing run llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun
wandb: ⭐️ View project at https://wandb.ai/feng-cheng-northeastern-university/llama3-8b-base-new-method-hh-beta-0.1
wandb: 🚀 View run at https://wandb.ai/feng-cheng-northeastern-university/llama3-8b-base-new-method-hh-beta-0.1/runs/cejacemh
  0%|          | 0/681 [00:00<?, ?it/s][WARNING|modeling_utils.py:1713] 2026-04-21 22:34:40,411 >> Could not estimate the number of tokens of the input, floating-point operations will not be computed
[WARNING|modeling_utils.py:1713] 2026-04-21 22:34:40,421 >> Could not estimate the number of tokens of the input, floating-point operations will not be computed
[WARNING|modeling_utils.py:1713] 2026-04-21 22:34:40,426 >> Could not estimate the number of tokens of the input, floating-point operations will not be computed
[WARNING|modeling_utils.py:1713] 2026-04-21 22:34:40,435 >> Could not estimate the number of tokens of the input, floating-point operations will not be computed
  0%|          | 1/681 [00:02<30:20,  2.68s/it]                                               {'loss': 1.389, 'grad_norm': 83.50728607177734, 'learning_rate': 0.0, 'fcm_dpo/beta': 0.10000000149011612, 'fcm_dpo/q_t': 0.5005706548690796, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': -0.02287006378173828, 'margin_dpo/margin_mean': -0.02287048101425171, 'margin_dpo/margin_std': 0.41920793056488037, 'logps/chosen': -50.1435661315918, 'logps/rejected': -74.09991455078125, 'logps/ref_chosen': -50.14883804321289, 'logps/ref_rejected': -74.1280517578125, 'logits/chosen': -0.4974287748336792, 'logits/rejected': -0.43299180269241333, 'epoch': 0.0}
  0%|          | 1/681 [00:02<30:20,  2.68s/it]  0%|          | 2/681 [00:05<29:05,  2.57s/it]  0%|          | 3/681 [00:07<28:49,  2.55s/it]  1%|          | 4/681 [00:10<29:09,  2.58s/it]  1%|          | 5/681 [00:12<29:01,  2.58s/it]                                               {'loss': 1.3899, 'grad_norm': 90.14773559570312, 'learning_rate': 2.898550724637681e-08, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.5008102059364319, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': -0.03240281343460083, 'margin_dpo/margin_mean': -0.03240284323692322, 'margin_dpo/margin_std': 0.3555586636066437, 'logps/chosen': -56.07246017456055, 'logps/rejected': -78.67597198486328, 'logps/ref_chosen': -56.05734634399414, 'logps/ref_rejected': -78.69325256347656, 'logits/chosen': -0.4901035726070404, 'logits/rejected': -0.4534408450126648, 'epoch': 0.01}
  1%|          | 5/681 [00:12<29:01,  2.58s/it]  1%|          | 6/681 [00:15<27:31,  2.45s/it]  1%|          | 7/681 [00:17<26:54,  2.39s/it]  1%|          | 8/681 [00:19<26:36,  2.37s/it]  1%|▏         | 9/681 [00:22<27:12,  2.43s/it]  1%|▏         | 10/681 [00:24<27:42,  2.48s/it]                                                {'loss': 1.3839, 'grad_norm': 70.48045349121094, 'learning_rate': 6.521739130434782e-08, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.4993022382259369, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.027925759553909302, 'margin_dpo/margin_mean': 0.027925794944167137, 'margin_dpo/margin_std': 0.37033817172050476, 'logps/chosen': -59.527122497558594, 'logps/rejected': -91.18089294433594, 'logps/ref_chosen': -59.54457473754883, 'logps/ref_rejected': -91.17041778564453, 'logits/chosen': -0.5015245079994202, 'logits/rejected': -0.4629823565483093, 'epoch': 0.01}
  1%|▏         | 10/681 [00:24<27:42,  2.48s/it]  2%|▏         | 11/681 [00:27<28:25,  2.55s/it]  2%|▏         | 12/681 [00:30<28:33,  2.56s/it]  2%|▏         | 13/681 [00:32<28:55,  2.60s/it]  2%|▏         | 14/681 [00:35<28:32,  2.57s/it]  2%|▏         | 15/681 [00:37<28:23,  2.56s/it]                                                {'loss': 1.3861, 'grad_norm': 64.33786010742188, 'learning_rate': 1.0144927536231885e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.49986687302589417, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.005324178840965033, 'margin_dpo/margin_mean': 0.005324071738868952, 'margin_dpo/margin_std': 0.36571556329727173, 'logps/chosen': -58.83959197998047, 'logps/rejected': -92.95245361328125, 'logps/ref_chosen': -58.83195877075195, 'logps/ref_rejected': -92.93949890136719, 'logits/chosen': -0.4974799156188965, 'logits/rejected': -0.46847113966941833, 'epoch': 0.02}
  2%|▏         | 15/681 [00:37<28:23,  2.56s/it]  2%|▏         | 16/681 [00:40<28:00,  2.53s/it]  2%|▏         | 17/681 [00:42<27:44,  2.51s/it]  3%|▎         | 18/681 [00:45<27:39,  2.50s/it]  3%|▎         | 19/681 [00:47<27:45,  2.52s/it]  3%|▎         | 20/681 [00:50<27:43,  2.52s/it]                                                {'loss': 1.381, 'grad_norm': 73.8245620727539, 'learning_rate': 1.3768115942028986e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.49860554933547974, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.05579507350921631, 'margin_dpo/margin_mean': 0.055795006453990936, 'margin_dpo/margin_std': 0.33391329646110535, 'logps/chosen': -59.63999557495117, 'logps/rejected': -82.81639862060547, 'logps/ref_chosen': -59.6396598815918, 'logps/ref_rejected': -82.76026916503906, 'logits/chosen': -0.5040138959884644, 'logits/rejected': -0.45514219999313354, 'epoch': 0.03}
  3%|▎         | 20/681 [00:50<27:43,  2.52s/it]  3%|▎         | 21/681 [00:52<27:31,  2.50s/it]  3%|▎         | 22/681 [00:55<27:55,  2.54s/it]  3%|▎         | 23/681 [00:58<28:51,  2.63s/it]  4%|▎         | 24/681 [01:00<28:53,  2.64s/it]  4%|▎         | 25/681 [01:03<28:50,  2.64s/it]                                                {'loss': 1.366, 'grad_norm': 73.5445785522461, 'learning_rate': 1.7391304347826085e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.49479326605796814, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.20841345191001892, 'margin_dpo/margin_mean': 0.20841336250305176, 'margin_dpo/margin_std': 0.4185457229614258, 'logps/chosen': -53.173057556152344, 'logps/rejected': -89.17227172851562, 'logps/ref_chosen': -53.205284118652344, 'logps/ref_rejected': -88.99608612060547, 'logits/chosen': -0.5032899975776672, 'logits/rejected': -0.4763486981391907, 'epoch': 0.04}
  4%|▎         | 25/681 [01:03<28:50,  2.64s/it]  4%|▍         | 26/681 [01:05<27:31,  2.52s/it]  4%|▍         | 27/681 [01:08<27:17,  2.50s/it]  4%|▍         | 28/681 [01:10<27:23,  2.52s/it]  4%|▍         | 29/681 [01:13<26:20,  2.42s/it]  4%|▍         | 30/681 [01:15<26:56,  2.48s/it]                                                {'loss': 1.3389, 'grad_norm': 87.73991394042969, 'learning_rate': 2.1014492753623187e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.48778820037841797, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.4891234338283539, 'margin_dpo/margin_mean': 0.4891238212585449, 'margin_dpo/margin_std': 0.5750466585159302, 'logps/chosen': -53.45922088623047, 'logps/rejected': -98.26947021484375, 'logps/ref_chosen': -53.5526008605957, 'logps/ref_rejected': -97.87371826171875, 'logits/chosen': -0.5239602327346802, 'logits/rejected': -0.48419055342674255, 'epoch': 0.04}
  4%|▍         | 30/681 [01:15<26:56,  2.48s/it]  5%|▍         | 31/681 [01:18<27:28,  2.54s/it]  5%|▍         | 32/681 [01:21<28:03,  2.59s/it]  5%|▍         | 33/681 [01:23<27:44,  2.57s/it]  5%|▍         | 34/681 [01:26<27:49,  2.58s/it]  5%|▌         | 35/681 [01:28<28:04,  2.61s/it]                                                {'loss': 1.3122, 'grad_norm': 82.94285583496094, 'learning_rate': 2.463768115942029e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.48066458106040955, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 0.7763983607292175, 'margin_dpo/margin_mean': 0.776398241519928, 'margin_dpo/margin_std': 0.8276771306991577, 'logps/chosen': -56.198211669921875, 'logps/rejected': -92.41334533691406, 'logps/ref_chosen': -56.3298454284668, 'logps/ref_rejected': -91.76858520507812, 'logits/chosen': -0.4989829957485199, 'logits/rejected': -0.4650956094264984, 'epoch': 0.05}
  5%|▌         | 35/681 [01:28<28:04,  2.61s/it]  5%|▌         | 36/681 [01:31<28:09,  2.62s/it]  5%|▌         | 37/681 [01:34<27:59,  2.61s/it]  6%|▌         | 38/681 [01:36<26:41,  2.49s/it]  6%|▌         | 39/681 [01:38<26:43,  2.50s/it]  6%|▌         | 40/681 [01:41<27:17,  2.56s/it]                                                {'loss': 1.2606, 'grad_norm': 60.41274642944336, 'learning_rate': 2.8260869565217386e-07, 'fcm_dpo/beta': 0.10000000894069672, 'fcm_dpo/q_t': 0.46632710099220276, 'fcm_dpo/delta': 0.0, 'fcm_dpo/margin': 1.359745979309082, 'margin_dpo/margin_mean': 1.359745979309082, 'margin_dpo/margin_std': 1.4517606496810913, 'logps/chosen': -54.27339553833008, 'logps/rejected': -84.19175720214844, 'logps/ref_chosen': -54.38492965698242, 'logps/ref_rejected': -82.94353485107422, 'logits/chosen': -0.5347701907157898, 'logits/rejected': -0.4986083507537842, 'epoch': 0.06}
  6%|▌         | 40/681 [01:41<27:17,  2.56s/it]  6%|▌         | 41/681 [01:44<27:13,  2.55s/it]  6%|▌         | 42/681 [01:46<27:07,  2.55s/it]  6%|▋         | 43/681 [01:49<27:07,  2.55s/it]  6%|▋         | 44/681 [01:51<27:22,  2.58s/it]  7%|▋         | 45/681 [01:54<27:26,  2.59s/it]                                                {'loss': 1.1498, 'grad_norm': 74.45612335205078, 'learning_rate': 3.188405797101449e-07, 'fcm_dpo/beta': 0.1127050369977951, 'fcm_dpo/q_t': 0.4357197880744934, 'fcm_dpo/delta': 0.25362294912338257, 'fcm_dpo/margin': 2.3980860710144043, 'margin_dpo/margin_mean': 2.398085832595825, 'margin_dpo/margin_std': 2.2269370555877686, 'logps/chosen': -54.6392822265625, 'logps/rejected': -100.20148468017578, 'logps/ref_chosen': -54.862335205078125, 'logps/ref_rejected': -98.0264663696289, 'logits/chosen': -0.5095103979110718, 'logits/rejected': -0.48132508993148804, 'epoch': 0.07}
  7%|▋         | 45/681 [01:54<27:26,  2.59s/it]  7%|▋         | 46/681 [01:57<27:32,  2.60s/it]  7%|▋         | 47/681 [01:59<27:35,  2.61s/it]  7%|▋         | 48/681 [02:02<27:57,  2.65s/it]  7%|▋         | 49/681 [02:04<27:33,  2.62s/it]  7%|▋         | 50/681 [02:07<27:37,  2.63s/it]                                                {'loss': 1.0187, 'grad_norm': 79.67459869384766, 'learning_rate': 3.5507246376811595e-07, 'fcm_dpo/beta': 0.141450434923172, 'fcm_dpo/q_t': 0.3908053934574127, 'fcm_dpo/delta': 0.12390259653329849, 'fcm_dpo/margin': 3.386523485183716, 'margin_dpo/margin_mean': 3.386524200439453, 'margin_dpo/margin_std': 3.3679816722869873, 'logps/chosen': -58.14664840698242, 'logps/rejected': -94.92338562011719, 'logps/ref_chosen': -58.304595947265625, 'logps/ref_rejected': -91.69480895996094, 'logits/chosen': -0.5551148653030396, 'logits/rejected': -0.5035051107406616, 'epoch': 0.07}
  7%|▋         | 50/681 [02:07<27:37,  2.63s/it]  7%|▋         | 51/681 [02:10<27:30,  2.62s/it]  8%|▊         | 52/681 [02:12<26:47,  2.56s/it]  8%|▊         | 53/681 [02:15<26:45,  2.56s/it]  8%|▊         | 54/681 [02:17<26:04,  2.49s/it]  8%|▊         | 55/681 [02:19<25:11,  2.41s/it]                                                {'loss': 0.8962, 'grad_norm': 62.811153411865234, 'learning_rate': 3.9130434782608694e-07, 'fcm_dpo/beta': 0.135177880525589, 'fcm_dpo/q_t': 0.3425524830818176, 'fcm_dpo/delta': -0.16671812534332275, 'fcm_dpo/margin': 5.600610256195068, 'margin_dpo/margin_mean': 5.600610256195068, 'margin_dpo/margin_std': 5.793082237243652, 'logps/chosen': -56.37145233154297, 'logps/rejected': -91.59982299804688, 'logps/ref_chosen': -56.06591796875, 'logps/ref_rejected': -85.69367980957031, 'logits/chosen': -0.6010715961456299, 'logits/rejected': -0.5568638443946838, 'epoch': 0.08}
  8%|▊         | 55/681 [02:19<25:11,  2.41s/it]  8%|▊         | 56/681 [02:22<26:01,  2.50s/it]  8%|▊         | 57/681 [02:24<25:52,  2.49s/it]  9%|▊         | 58/681 [02:27<26:16,  2.53s/it]  9%|▊         | 59/681 [02:30<26:39,  2.57s/it]  9%|▉         | 60/681 [02:32<25:57,  2.51s/it]                                                {'loss': 0.8969, 'grad_norm': 67.2679214477539, 'learning_rate': 4.2753623188405794e-07, 'fcm_dpo/beta': 0.11089271306991577, 'fcm_dpo/q_t': 0.33725228905677795, 'fcm_dpo/delta': -0.1925317347049713, 'fcm_dpo/margin': 7.025670528411865, 'margin_dpo/margin_mean': 7.025670528411865, 'margin_dpo/margin_std': 7.496710777282715, 'logps/chosen': -61.9241828918457, 'logps/rejected': -97.98988342285156, 'logps/ref_chosen': -60.6871337890625, 'logps/ref_rejected': -89.72715759277344, 'logits/chosen': -0.6061812043190002, 'logits/rejected': -0.5570945739746094, 'epoch': 0.09}
  9%|▉         | 60/681 [02:32<25:57,  2.51s/it]  9%|▉         | 61/681 [02:35<26:16,  2.54s/it]  9%|▉         | 62/681 [02:37<26:45,  2.59s/it]  9%|▉         | 63/681 [02:40<26:29,  2.57s/it]  9%|▉         | 64/681 [02:42<26:04,  2.54s/it] 10%|▉         | 65/681 [02:45<26:12,  2.55s/it]                                                {'loss': 0.923, 'grad_norm': 48.89730453491211, 'learning_rate': 4.63768115942029e-07, 'fcm_dpo/beta': 0.09299755096435547, 'fcm_dpo/q_t': 0.3424831032752991, 'fcm_dpo/delta': -0.18385855853557587, 'fcm_dpo/margin': 8.298527717590332, 'margin_dpo/margin_mean': 8.298527717590332, 'margin_dpo/margin_std': 9.724918365478516, 'logps/chosen': -63.573402404785156, 'logps/rejected': -103.41975402832031, 'logps/ref_chosen': -61.75325393676758, 'logps/ref_rejected': -93.30108642578125, 'logits/chosen': -0.6179511547088623, 'logits/rejected': -0.5864478945732117, 'epoch': 0.1}
 10%|▉         | 65/681 [02:45<26:12,  2.55s/it] 10%|▉         | 66/681 [02:48<26:21,  2.57s/it] 10%|▉         | 67/681 [02:50<25:24,  2.48s/it] 10%|▉         | 68/681 [02:52<25:07,  2.46s/it] 10%|█         | 69/681 [02:55<26:08,  2.56s/it] 10%|█         | 70/681 [02:57<25:45,  2.53s/it]                                                {'loss': 0.9041, 'grad_norm': 47.65688705444336, 'learning_rate': 5e-07, 'fcm_dpo/beta': 0.07844052463769913, 'fcm_dpo/q_t': 0.3441976308822632, 'fcm_dpo/delta': -0.1582036018371582, 'fcm_dpo/margin': 9.539754867553711, 'margin_dpo/margin_mean': 9.539755821228027, 'margin_dpo/margin_std': 10.295551300048828, 'logps/chosen': -62.56956100463867, 'logps/rejected': -96.57740783691406, 'logps/ref_chosen': -59.548004150390625, 'logps/ref_rejected': -84.01609802246094, 'logits/chosen': -0.6304086446762085, 'logits/rejected': -0.5917232632637024, 'epoch': 0.1}
 10%|█         | 70/681 [02:58<25:45,  2.53s/it] 10%|█         | 71/681 [03:00<26:01,  2.56s/it] 11%|█         | 72/681 [03:03<26:11,  2.58s/it] 11%|█         | 73/681 [03:05<26:14,  2.59s/it] 11%|█         | 74/681 [03:08<26:01,  2.57s/it] 11%|█         | 75/681 [03:11<26:11,  2.59s/it]                                                {'loss': 0.873, 'grad_norm': 36.49312973022461, 'learning_rate': 4.999176576834721e-07, 'fcm_dpo/beta': 0.06165589019656181, 'fcm_dpo/q_t': 0.3237493336200714, 'fcm_dpo/delta': -0.32924890518188477, 'fcm_dpo/margin': 14.760737419128418, 'margin_dpo/margin_mean': 14.760736465454102, 'margin_dpo/margin_std': 17.107942581176758, 'logps/chosen': -65.28561401367188, 'logps/rejected': -118.2331771850586, 'logps/ref_chosen': -59.86931228637695, 'logps/ref_rejected': -98.05613708496094, 'logits/chosen': -0.6605738997459412, 'logits/rejected': -0.6328510642051697, 'epoch': 0.11}
 11%|█         | 75/681 [03:11<26:11,  2.59s/it] 11%|█         | 76/681 [03:13<26:00,  2.58s/it] 11%|█▏        | 77/681 [03:15<24:59,  2.48s/it] 11%|█▏        | 78/681 [03:18<25:26,  2.53s/it] 12%|█▏        | 79/681 [03:21<25:42,  2.56s/it] 12%|█▏        | 80/681 [03:23<25:35,  2.56s/it]                                                {'loss': 0.9203, 'grad_norm': 35.74776077270508, 'learning_rate': 4.996706849759452e-07, 'fcm_dpo/beta': 0.04629804939031601, 'fcm_dpo/q_t': 0.341538667678833, 'fcm_dpo/delta': -0.19796454906463623, 'fcm_dpo/margin': 16.89699935913086, 'margin_dpo/margin_mean': 16.896997451782227, 'margin_dpo/margin_std': 19.718297958374023, 'logps/chosen': -63.93366622924805, 'logps/rejected': -111.06534576416016, 'logps/ref_chosen': -56.18925857543945, 'logps/ref_rejected': -86.42393493652344, 'logits/chosen': -0.6835442781448364, 'logits/rejected': -0.6468649506568909, 'epoch': 0.12}
 12%|█▏        | 80/681 [03:23<25:35,  2.56s/it] 12%|█▏        | 81/681 [03:26<26:10,  2.62s/it] 12%|█▏        | 82/681 [03:28<25:55,  2.60s/it] 12%|█▏        | 83/681 [03:31<25:19,  2.54s/it] 12%|█▏        | 84/681 [03:34<25:50,  2.60s/it] 12%|█▏        | 85/681 [03:36<25:47,  2.60s/it]                                                {'loss': 0.9443, 'grad_norm': 34.31068420410156, 'learning_rate': 4.992592445678582e-07, 'fcm_dpo/beta': 0.0381317213177681, 'fcm_dpo/q_t': 0.34707337617874146, 'fcm_dpo/delta': -0.16901178658008575, 'fcm_dpo/margin': 19.726295471191406, 'margin_dpo/margin_mean': 19.726295471191406, 'margin_dpo/margin_std': 24.040042877197266, 'logps/chosen': -70.46139526367188, 'logps/rejected': -128.18124389648438, 'logps/ref_chosen': -60.018287658691406, 'logps/ref_rejected': -98.01185607910156, 'logits/chosen': -0.6622103452682495, 'logits/rejected': -0.6311969757080078, 'epoch': 0.12}
 12%|█▏        | 85/681 [03:36<25:47,  2.60s/it] 13%|█▎        | 86/681 [03:39<26:01,  2.62s/it] 13%|█▎        | 87/681 [03:41<25:52,  2.61s/it] 13%|█▎        | 88/681 [03:44<25:52,  2.62s/it] 13%|█▎        | 89/681 [03:47<25:23,  2.57s/it] 13%|█▎        | 90/681 [03:49<24:59,  2.54s/it]                                                {'loss': 1.0061, 'grad_norm': 35.00300216674805, 'learning_rate': 4.986836074908615e-07, 'fcm_dpo/beta': 0.03405915945768356, 'fcm_dpo/q_t': 0.3624621331691742, 'fcm_dpo/delta': -0.11596596240997314, 'fcm_dpo/margin': 20.768291473388672, 'margin_dpo/margin_mean': 20.768291473388672, 'margin_dpo/margin_std': 29.607013702392578, 'logps/chosen': -73.39559173583984, 'logps/rejected': -131.07809448242188, 'logps/ref_chosen': -59.8709831237793, 'logps/ref_rejected': -96.78519439697266, 'logits/chosen': -0.7018736600875854, 'logits/rejected': -0.6867517232894897, 'epoch': 0.13}
 13%|█▎        | 90/681 [03:49<24:59,  2.54s/it] 13%|█▎        | 91/681 [03:52<25:07,  2.56s/it] 14%|█▎        | 92/681 [03:54<24:50,  2.53s/it] 14%|█▎        | 93/681 [03:56<24:01,  2.45s/it] 14%|█▍        | 94/681 [03:59<25:05,  2.56s/it] 14%|█▍        | 95/681 [04:02<24:41,  2.53s/it]                                                {'loss': 0.9664, 'grad_norm': 27.68400764465332, 'learning_rate': 4.979441529392784e-07, 'fcm_dpo/beta': 0.030608216300606728, 'fcm_dpo/q_t': 0.36035576462745667, 'fcm_dpo/delta': -0.07700999826192856, 'fcm_dpo/margin': 21.932090759277344, 'margin_dpo/margin_mean': 21.932090759277344, 'margin_dpo/margin_std': 26.880752563476562, 'logps/chosen': -69.35963439941406, 'logps/rejected': -119.02693939208984, 'logps/ref_chosen': -55.94385528564453, 'logps/ref_rejected': -83.6790542602539, 'logits/chosen': -0.708720326423645, 'logits/rejected': -0.6767187714576721, 'epoch': 0.14}
 14%|█▍        | 95/681 [04:02<24:41,  2.53s/it] 14%|█▍        | 96/681 [04:04<24:42,  2.53s/it] 14%|█▍        | 97/681 [04:07<24:44,  2.54s/it] 14%|█▍        | 98/681 [04:09<24:14,  2.50s/it] 15%|█▍        | 99/681 [04:11<23:22,  2.41s/it] 15%|█▍        | 100/681 [04:14<23:53,  2.47s/it]                                                 {'loss': 0.9722, 'grad_norm': 30.916765213012695, 'learning_rate': 4.970413680203148e-07, 'fcm_dpo/beta': 0.028173187747597694, 'fcm_dpo/q_t': 0.36101511120796204, 'fcm_dpo/delta': -0.068596251308918, 'fcm_dpo/margin': 23.49247169494629, 'margin_dpo/margin_mean': 23.49247169494629, 'margin_dpo/margin_std': 28.96224594116211, 'logps/chosen': -71.47965240478516, 'logps/rejected': -124.03050231933594, 'logps/ref_chosen': -57.05888748168945, 'logps/ref_rejected': -86.11727142333984, 'logits/chosen': -0.6772828698158264, 'logits/rejected': -0.648100733757019, 'epoch': 0.15}
 15%|█▍        | 100/681 [04:14<23:53,  2.47s/it] 15%|█▍        | 101/681 [04:16<23:39,  2.45s/it] 15%|█▍        | 102/681 [04:19<23:26,  2.43s/it] 15%|█▌        | 103/681 [04:21<23:09,  2.40s/it] 15%|█▌        | 104/681 [04:23<22:36,  2.35s/it] 15%|█▌        | 105/681 [04:26<23:34,  2.46s/it]                                                 {'loss': 0.9567, 'grad_norm': 26.486059188842773, 'learning_rate': 4.959758474331832e-07, 'fcm_dpo/beta': 0.027121257036924362, 'fcm_dpo/q_t': 0.35333341360092163, 'fcm_dpo/delta': -0.13553811609745026, 'fcm_dpo/margin': 26.961578369140625, 'margin_dpo/margin_mean': 26.961578369140625, 'margin_dpo/margin_std': 32.831111907958984, 'logps/chosen': -76.32167053222656, 'logps/rejected': -130.57305908203125, 'logps/ref_chosen': -59.20774459838867, 'logps/ref_rejected': -86.49754333496094, 'logits/chosen': -0.6960592269897461, 'logits/rejected': -0.6600139141082764, 'epoch': 0.15}
 15%|█▌        | 105/681 [04:26<23:34,  2.46s/it] 16%|█▌        | 106/681 [04:28<23:30,  2.45s/it] 16%|█▌        | 107/681 [04:31<24:00,  2.51s/it] 16%|█▌        | 108/681 [04:33<23:35,  2.47s/it] 16%|█▌        | 109/681 [04:36<24:08,  2.53s/it] 16%|█▌        | 110/681 [04:39<24:25,  2.57s/it]                                                 {'loss': 0.9511, 'grad_norm': 24.114713668823242, 'learning_rate': 4.947482930773511e-07, 'fcm_dpo/beta': 0.02301758900284767, 'fcm_dpo/q_t': 0.3538368046283722, 'fcm_dpo/delta': -0.11018934100866318, 'fcm_dpo/margin': 30.556344985961914, 'margin_dpo/margin_mean': 30.556344985961914, 'margin_dpo/margin_std': 35.99966812133789, 'logps/chosen': -78.81887817382812, 'logps/rejected': -139.77645874023438, 'logps/ref_chosen': -60.437957763671875, 'logps/ref_rejected': -90.83917999267578, 'logits/chosen': -0.6646202206611633, 'logits/rejected': -0.6281755566596985, 'epoch': 0.16}
 16%|█▌        | 110/681 [04:39<24:25,  2.57s/it] 16%|█▋        | 111/681 [04:41<24:18,  2.56s/it] 16%|█▋        | 112/681 [04:44<23:21,  2.46s/it] 17%|█▋        | 113/681 [04:46<23:45,  2.51s/it] 17%|█▋        | 114/681 [04:49<23:35,  2.50s/it] 17%|█▋        | 115/681 [04:51<24:01,  2.55s/it]                                                 {'loss': 0.9992, 'grad_norm': 40.84029769897461, 'learning_rate': 4.933595135901732e-07, 'fcm_dpo/beta': 0.021153923124074936, 'fcm_dpo/q_t': 0.3688841462135315, 'fcm_dpo/delta': -0.041334737092256546, 'fcm_dpo/margin': 30.124019622802734, 'margin_dpo/margin_mean': 30.124013900756836, 'margin_dpo/margin_std': 39.94293212890625, 'logps/chosen': -84.20191955566406, 'logps/rejected': -137.90447998046875, 'logps/ref_chosen': -61.7908821105957, 'logps/ref_rejected': -85.36943054199219, 'logits/chosen': -0.6649340391159058, 'logits/rejected': -0.6294328570365906, 'epoch': 0.17}
 17%|█▋        | 115/681 [04:51<24:01,  2.55s/it] 17%|█▋        | 116/681 [04:54<23:20,  2.48s/it] 17%|█▋        | 117/681 [04:56<23:09,  2.46s/it] 17%|█▋        | 118/681 [04:59<23:29,  2.50s/it] 17%|█▋        | 119/681 [05:01<24:13,  2.59s/it] 18%|█▊        | 120/681 [05:04<24:08,  2.58s/it]                                                 {'loss': 0.9818, 'grad_norm': 26.78792381286621, 'learning_rate': 4.918104238142103e-07, 'fcm_dpo/beta': 0.02078414149582386, 'fcm_dpo/q_t': 0.36713889241218567, 'fcm_dpo/delta': -0.037118665874004364, 'fcm_dpo/margin': 30.540584564208984, 'margin_dpo/margin_mean': 30.540584564208984, 'margin_dpo/margin_std': 38.079750061035156, 'logps/chosen': -91.19302368164062, 'logps/rejected': -143.1626434326172, 'logps/ref_chosen': -65.3261489868164, 'logps/ref_rejected': -86.75518798828125, 'logits/chosen': -0.6711692214012146, 'logits/rejected': -0.645135760307312, 'epoch': 0.18}
 18%|█▊        | 120/681 [05:04<24:08,  2.58s/it] 18%|█▊        | 121/681 [05:07<23:50,  2.55s/it] 18%|█▊        | 122/681 [05:09<23:08,  2.48s/it] 18%|█▊        | 123/681 [05:12<23:42,  2.55s/it] 18%|█▊        | 124/681 [05:14<23:44,  2.56s/it] 18%|█▊        | 125/681 [05:17<23:24,  2.53s/it]                                                 {'loss': 0.9204, 'grad_norm': 23.552217483520508, 'learning_rate': 4.90102044194588e-07, 'fcm_dpo/beta': 0.017505459487438202, 'fcm_dpo/q_t': 0.3401046693325043, 'fcm_dpo/delta': -0.22550848126411438, 'fcm_dpo/margin': 46.04296112060547, 'margin_dpo/margin_mean': 46.0429573059082, 'margin_dpo/margin_std': 55.54075241088867, 'logps/chosen': -87.12136840820312, 'logps/rejected': -176.0518035888672, 'logps/ref_chosen': -58.323204040527344, 'logps/ref_rejected': -101.2106704711914, 'logits/chosen': -0.6151807904243469, 'logits/rejected': -0.6104758381843567, 'epoch': 0.18}
 18%|█▊        | 125/681 [05:17<23:24,  2.53s/it] 19%|█▊        | 126/681 [05:19<23:43,  2.56s/it] 19%|█▊        | 127/681 [05:22<23:53,  2.59s/it] 19%|█▉        | 128/681 [05:25<24:06,  2.62s/it] 19%|█▉        | 129/681 [05:27<23:55,  2.60s/it] 19%|█▉        | 130/681 [05:30<23:41,  2.58s/it]                                                 {'loss': 1.0035, 'grad_norm': 22.16413116455078, 'learning_rate': 4.882355001067891e-07, 'fcm_dpo/beta': 0.01598326489329338, 'fcm_dpo/q_t': 0.3680208623409271, 'fcm_dpo/delta': -0.04410712048411369, 'fcm_dpo/margin': 40.082298278808594, 'margin_dpo/margin_mean': 40.082298278808594, 'margin_dpo/margin_std': 53.219139099121094, 'logps/chosen': -86.93000793457031, 'logps/rejected': -156.78482055664062, 'logps/ref_chosen': -56.38518524169922, 'logps/ref_rejected': -86.15767669677734, 'logits/chosen': -0.5932961106300354, 'logits/rejected': -0.5749183893203735, 'epoch': 0.19}
 19%|█▉        | 130/681 [05:30<23:41,  2.58s/it] 19%|█▉        | 131/681 [05:32<23:45,  2.59s/it] 19%|█▉        | 132/681 [05:35<23:22,  2.56s/it] 20%|█▉        | 133/681 [05:37<23:31,  2.58s/it] 20%|█▉        | 134/681 [05:40<22:49,  2.50s/it] 20%|█▉        | 135/681 [05:42<22:39,  2.49s/it]                                                 {'loss': 0.9545, 'grad_norm': 25.677669525146484, 'learning_rate': 4.862120211153265e-07, 'fcm_dpo/beta': 0.014573054388165474, 'fcm_dpo/q_t': 0.3577379286289215, 'fcm_dpo/delta': -0.09526528418064117, 'fcm_dpo/margin': 47.24794387817383, 'margin_dpo/margin_mean': 47.24794387817383, 'margin_dpo/margin_std': 57.28125762939453, 'logps/chosen': -86.5953140258789, 'logps/rejected': -174.51339721679688, 'logps/ref_chosen': -54.59065628051758, 'logps/ref_rejected': -95.26080322265625, 'logits/chosen': -0.5761778950691223, 'logits/rejected': -0.5731192827224731, 'epoch': 0.2}
 20%|█▉        | 135/681 [05:42<22:39,  2.49s/it] 20%|█▉        | 136/681 [05:45<23:11,  2.55s/it] 20%|██        | 137/681 [05:47<23:08,  2.55s/it] 20%|██        | 138/681 [05:50<22:24,  2.48s/it] 20%|██        | 139/681 [05:52<22:08,  2.45s/it] 21%|██        | 140/681 [05:54<21:47,  2.42s/it]                                                 {'loss': 0.9755, 'grad_norm': 25.558738708496094, 'learning_rate': 4.840329401637809e-07, 'fcm_dpo/beta': 0.013362633995711803, 'fcm_dpo/q_t': 0.3625403940677643, 'fcm_dpo/delta': -0.08761467784643173, 'fcm_dpo/margin': 51.02484893798828, 'margin_dpo/margin_mean': 51.02485275268555, 'margin_dpo/margin_std': 65.68046569824219, 'logps/chosen': -96.27259826660156, 'logps/rejected': -184.53277587890625, 'logps/ref_chosen': -56.04347610473633, 'logps/ref_rejected': -93.27880859375, 'logits/chosen': -0.5525860786437988, 'logits/rejected': -0.545661449432373, 'epoch': 0.21}
 21%|██        | 140/681 [05:54<21:47,  2.42s/it] 21%|██        | 141/681 [05:57<22:31,  2.50s/it] 21%|██        | 142/681 [06:00<23:08,  2.58s/it] 21%|██        | 143/681 [06:03<23:54,  2.67s/it] 21%|██        | 144/681 [06:05<23:57,  2.68s/it] 21%|██▏       | 145/681 [06:08<23:10,  2.59s/it]                                                 {'loss': 1.0202, 'grad_norm': 29.300233840942383, 'learning_rate': 4.816996926967401e-07, 'fcm_dpo/beta': 0.012635116465389729, 'fcm_dpo/q_t': 0.3737943470478058, 'fcm_dpo/delta': -0.008492978289723396, 'fcm_dpo/margin': 48.067604064941406, 'margin_dpo/margin_mean': 48.067596435546875, 'margin_dpo/margin_std': 66.08811950683594, 'logps/chosen': -107.9009017944336, 'logps/rejected': -180.85520935058594, 'logps/ref_chosen': -61.4414176940918, 'logps/ref_rejected': -86.32813262939453, 'logits/chosen': -0.5054234862327576, 'logits/rejected': -0.4867471754550934, 'epoch': 0.21}
 21%|██▏       | 145/681 [06:08<23:10,  2.59s/it] 21%|██▏       | 146/681 [06:10<23:00,  2.58s/it] 22%|██▏       | 147/681 [06:13<23:03,  2.59s/it] 22%|██▏       | 148/681 [06:16<22:55,  2.58s/it] 22%|██▏       | 149/681 [06:18<23:04,  2.60s/it] 22%|██▏       | 150/681 [06:21<22:55,  2.59s/it]                                                 {'loss': 1.0113, 'grad_norm': 25.043779373168945, 'learning_rate': 4.792138157142157e-07, 'fcm_dpo/beta': 0.012664164416491985, 'fcm_dpo/q_t': 0.3732047379016876, 'fcm_dpo/delta': -0.01627928391098976, 'fcm_dpo/margin': 48.467201232910156, 'margin_dpo/margin_mean': 48.467201232910156, 'margin_dpo/margin_std': 64.91874694824219, 'logps/chosen': -104.0806884765625, 'logps/rejected': -182.61329650878906, 'logps/ref_chosen': -57.70451736450195, 'logps/ref_rejected': -87.76991271972656, 'logits/chosen': -0.5404887199401855, 'logits/rejected': -0.5210872888565063, 'epoch': 0.22}
 22%|██▏       | 150/681 [06:21<22:55,  2.59s/it] 22%|██▏       | 151/681 [06:23<22:27,  2.54s/it] 22%|██▏       | 152/681 [06:26<22:58,  2.61s/it] 22%|██▏       | 153/681 [06:29<22:46,  2.59s/it] 23%|██▎       | 154/681 [06:31<22:59,  2.62s/it] 23%|██▎       | 155/681 [06:34<23:13,  2.65s/it]                                                 {'loss': 0.9764, 'grad_norm': 23.727567672729492, 'learning_rate': 4.7657694675916247e-07, 'fcm_dpo/beta': 0.011945498175919056, 'fcm_dpo/q_t': 0.3624417185783386, 'fcm_dpo/delta': -0.06720416247844696, 'fcm_dpo/margin': 55.43426513671875, 'margin_dpo/margin_mean': 55.43426513671875, 'margin_dpo/margin_std': 69.9148178100586, 'logps/chosen': -105.16175842285156, 'logps/rejected': -193.30606079101562, 'logps/ref_chosen': -62.08925247192383, 'logps/ref_rejected': -94.79930114746094, 'logits/chosen': -0.581199586391449, 'logits/rejected': -0.5655697584152222, 'epoch': 0.23}
 23%|██▎       | 155/681 [06:34<23:13,  2.65s/it] 23%|██▎       | 156/681 [06:37<23:09,  2.65s/it] 23%|██▎       | 157/681 [06:39<22:11,  2.54s/it] 23%|██▎       | 158/681 [06:41<22:21,  2.57s/it] 23%|██▎       | 159/681 [06:44<22:30,  2.59s/it] 23%|██▎       | 160/681 [06:47<22:13,  2.56s/it]                                                 {'loss': 1.0372, 'grad_norm': 25.801401138305664, 'learning_rate': 4.737908228387656e-07, 'fcm_dpo/beta': 0.011539025232195854, 'fcm_dpo/q_t': 0.3720964789390564, 'fcm_dpo/delta': -0.045818835496902466, 'fcm_dpo/margin': 55.6801643371582, 'margin_dpo/margin_mean': 55.6801643371582, 'margin_dpo/margin_std': 83.104736328125, 'logps/chosen': -124.75065612792969, 'logps/rejected': -210.2032928466797, 'logps/ref_chosen': -67.15288543701172, 'logps/ref_rejected': -96.92537689208984, 'logits/chosen': -0.5244706869125366, 'logits/rejected': -0.5115067362785339, 'epoch': 0.23}
 23%|██▎       | 160/681 [06:47<22:13,  2.56s/it] 24%|██▎       | 161/681 [06:49<21:18,  2.46s/it] 24%|██▍       | 162/681 [06:52<22:07,  2.56s/it] 24%|██▍       | 163/681 [06:54<22:02,  2.55s/it] 24%|██▍       | 164/681 [06:57<22:05,  2.56s/it] 24%|██▍       | 165/681 [06:59<21:52,  2.54s/it]                                                 {'loss': 1.0098, 'grad_norm': 37.94820022583008, 'learning_rate': 4.708572792802069e-07, 'fcm_dpo/beta': 0.010906776413321495, 'fcm_dpo/q_t': 0.3736818730831146, 'fcm_dpo/delta': -0.010979633778333664, 'fcm_dpo/margin': 55.84454345703125, 'margin_dpo/margin_mean': 55.84454345703125, 'margin_dpo/margin_std': 74.67647552490234, 'logps/chosen': -110.22456359863281, 'logps/rejected': -188.9801025390625, 'logps/ref_chosen': -57.40401077270508, 'logps/ref_rejected': -80.31498718261719, 'logits/chosen': -0.5201188325881958, 'logits/rejected': -0.49569135904312134, 'epoch': 0.24}
 24%|██▍       | 165/681 [06:59<21:52,  2.54s/it] 24%|██▍       | 166/681 [07:01<21:00,  2.45s/it] 25%|██▍       | 167/681 [07:04<21:40,  2.53s/it] 25%|██▍       | 168/681 [07:07<21:45,  2.55s/it] 25%|██▍       | 169/681 [07:10<22:14,  2.61s/it] 25%|██▍       | 170/681 [07:12<22:16,  2.61s/it]                                                 {'loss': 0.9592, 'grad_norm': 23.627363204956055, 'learning_rate': 4.6777824852166437e-07, 'fcm_dpo/beta': 0.010051427409052849, 'fcm_dpo/q_t': 0.3577578365802765, 'fcm_dpo/delta': -0.10779444873332977, 'fcm_dpo/margin': 69.25593566894531, 'margin_dpo/margin_mean': 69.25593566894531, 'margin_dpo/margin_std': 85.97371673583984, 'logps/chosen': -106.43888854980469, 'logps/rejected': -209.40512084960938, 'logps/ref_chosen': -52.029144287109375, 'logps/ref_rejected': -85.73944091796875, 'logits/chosen': -0.45740675926208496, 'logits/rejected': -0.4491025507450104, 'epoch': 0.25}
 25%|██▍       | 170/681 [07:12<22:16,  2.61s/it] 25%|██▌       | 171/681 [07:14<21:25,  2.52s/it] 25%|██▌       | 172/681 [07:17<21:14,  2.50s/it] 25%|██▌       | 173/681 [07:19<21:06,  2.49s/it] 26%|██▌       | 174/681 [07:22<21:08,  2.50s/it] 26%|██▌       | 175/681 [07:25<21:23,  2.54s/it]                                                 {'loss': 0.9915, 'grad_norm': 29.522018432617188, 'learning_rate': 4.645557588393406e-07, 'fcm_dpo/beta': 0.009930510073900223, 'fcm_dpo/q_t': 0.3673258423805237, 'fcm_dpo/delta': -0.047995198518037796, 'fcm_dpo/margin': 65.00736236572266, 'margin_dpo/margin_mean': 65.00736236572266, 'margin_dpo/margin_std': 84.73751831054688, 'logps/chosen': -128.42086791992188, 'logps/rejected': -223.41519165039062, 'logps/ref_chosen': -62.996971130371094, 'logps/ref_rejected': -92.98394012451172, 'logits/chosen': -0.45035696029663086, 'logits/rejected': -0.4322957396507263, 'epoch': 0.26}
 26%|██▌       | 175/681 [07:25<21:23,  2.54s/it] 26%|██▌       | 176/681 [07:27<20:55,  2.49s/it] 26%|██▌       | 177/681 [07:30<21:13,  2.53s/it] 26%|██▌       | 178/681 [07:32<21:19,  2.54s/it] 26%|██▋       | 179/681 [07:35<21:38,  2.59s/it] 26%|██▋       | 180/681 [07:37<21:21,  2.56s/it]                                                 {'loss': 0.9528, 'grad_norm': 23.635892868041992, 'learning_rate': 4.611919330113591e-07, 'fcm_dpo/beta': 0.008855604566633701, 'fcm_dpo/q_t': 0.35542401671409607, 'fcm_dpo/delta': -0.11197604238986969, 'fcm_dpo/margin': 79.53601837158203, 'margin_dpo/margin_mean': 79.53601837158203, 'margin_dpo/margin_std': 97.05994415283203, 'logps/chosen': -127.61091613769531, 'logps/rejected': -247.19143676757812, 'logps/ref_chosen': -57.0670280456543, 'logps/ref_rejected': -97.1115493774414, 'logits/chosen': -0.38669413328170776, 'logits/rejected': -0.3846648335456848, 'epoch': 0.26}
 26%|██▋       | 180/681 [07:37<21:21,  2.56s/it] 27%|██▋       | 181/681 [07:40<21:26,  2.57s/it] 27%|██▋       | 182/681 [07:42<21:05,  2.54s/it] 27%|██▋       | 183/681 [07:45<20:33,  2.48s/it] 27%|██▋       | 184/681 [07:47<21:04,  2.55s/it] 27%|██▋       | 185/681 [07:50<20:44,  2.51s/it]                                                 {'loss': 1.0713, 'grad_norm': 26.241926193237305, 'learning_rate': 4.5768898691940836e-07, 'fcm_dpo/beta': 0.008529609069228172, 'fcm_dpo/q_t': 0.39326274394989014, 'fcm_dpo/delta': 0.05834978073835373, 'fcm_dpo/margin': 58.99933624267578, 'margin_dpo/margin_mean': 58.99933624267578, 'margin_dpo/margin_std': 85.73370361328125, 'logps/chosen': -120.03946685791016, 'logps/rejected': -199.70809936523438, 'logps/ref_chosen': -54.840736389160156, 'logps/ref_rejected': -75.51002502441406, 'logits/chosen': -0.421181857585907, 'logits/rejected': -0.40174850821495056, 'epoch': 0.27}
 27%|██▋       | 185/681 [07:50<20:44,  2.51s/it] 27%|██▋       | 186/681 [07:52<20:38,  2.50s/it] 27%|██▋       | 187/681 [07:55<20:06,  2.44s/it] 28%|██▊       | 188/681 [07:57<20:20,  2.48s/it] 28%|██▊       | 189/681 [08:00<20:26,  2.49s/it] 28%|██▊       | 190/681 [08:02<19:48,  2.42s/it]                                                 {'loss': 0.9793, 'grad_norm': 28.541696548461914, 'learning_rate': 4.5404922808905543e-07, 'fcm_dpo/beta': 0.008668321184813976, 'fcm_dpo/q_t': 0.3645266592502594, 'fcm_dpo/delta': -0.054877202957868576, 'fcm_dpo/margin': 75.03819274902344, 'margin_dpo/margin_mean': 75.03819274902344, 'margin_dpo/margin_std': 94.09630584716797, 'logps/chosen': -127.11979675292969, 'logps/rejected': -231.29647827148438, 'logps/ref_chosen': -57.72148895263672, 'logps/ref_rejected': -86.85997009277344, 'logits/chosen': -0.41162386536598206, 'logits/rejected': -0.39615827798843384, 'epoch': 0.28}
 28%|██▊       | 190/681 [08:02<19:48,  2.42s/it] 28%|██▊       | 191/681 [08:05<20:29,  2.51s/it] 28%|██▊       | 192/681 [08:07<20:33,  2.52s/it] 28%|██▊       | 193/681 [08:10<20:13,  2.49s/it] 28%|██▊       | 194/681 [08:12<19:36,  2.42s/it] 29%|██▊       | 195/681 [08:14<20:03,  2.48s/it]                                                 {'loss': 0.9959, 'grad_norm': 28.007156372070312, 'learning_rate': 4.5027505416968985e-07, 'fcm_dpo/beta': 0.008089645765721798, 'fcm_dpo/q_t': 0.3677811920642853, 'fcm_dpo/delta': -0.03434378653764725, 'fcm_dpo/margin': 77.82075500488281, 'margin_dpo/margin_mean': 77.82075500488281, 'margin_dpo/margin_std': 99.57084655761719, 'logps/chosen': -140.86399841308594, 'logps/rejected': -249.8879852294922, 'logps/ref_chosen': -58.26164627075195, 'logps/ref_rejected': -89.46485900878906, 'logits/chosen': -0.3651648759841919, 'logits/rejected': -0.35718274116516113, 'epoch': 0.29}
 29%|██▊       | 195/681 [08:15<20:03,  2.48s/it] 29%|██▉       | 196/681 [08:17<20:10,  2.50s/it] 29%|██▉       | 197/681 [08:20<20:18,  2.52s/it] 29%|██▉       | 198/681 [08:22<20:24,  2.54s/it] 29%|██▉       | 199/681 [08:25<20:43,  2.58s/it] 29%|██▉       | 200/681 [08:27<20:43,  2.59s/it]                                                 {'loss': 0.9767, 'grad_norm': 28.69991111755371, 'learning_rate': 4.4636895135509966e-07, 'fcm_dpo/beta': 0.007911969907581806, 'fcm_dpo/q_t': 0.365100622177124, 'fcm_dpo/delta': -0.04977406933903694, 'fcm_dpo/margin': 81.63540649414062, 'margin_dpo/margin_mean': 81.63540649414062, 'margin_dpo/margin_std': 101.0685806274414, 'logps/chosen': -130.88851928710938, 'logps/rejected': -239.95675659179688, 'logps/ref_chosen': -55.71953201293945, 'logps/ref_rejected': -83.15235137939453, 'logits/chosen': -0.3688076138496399, 'logits/rejected': -0.3557121157646179, 'epoch': 0.29}
 29%|██▉       | 200/681 [08:27<20:43,  2.59s/it][INFO|trainer.py:4307] 2026-04-21 22:43:06,885 >> 
***** Running Evaluation *****
[INFO|trainer.py:4309] 2026-04-21 22:43:06,885 >>   Num examples = 2339
[INFO|trainer.py:4312] 2026-04-21 22:43:06,885 >>   Batch size = 8

  0%|          | 0/73 [00:00<?, ?it/s][A
  3%|▎         | 2/73 [00:00<00:19,  3.68it/s][A
  4%|▍         | 3/73 [00:01<00:27,  2.59it/s][A
  5%|▌         | 4/73 [00:01<00:30,  2.28it/s][A
  7%|▋         | 5/73 [00:02<00:32,  2.12it/s][A
  8%|▊         | 6/73 [00:02<00:33,  2.01it/s][A
 10%|▉         | 7/73 [00:03<00:31,  2.08it/s][A
 11%|█         | 8/73 [00:03<00:33,  1.94it/s][A
 12%|█▏        | 9/73 [00:04<00:34,  1.88it/s][A
 14%|█▎        | 10/73 [00:04<00:34,  1.85it/s][A
 15%|█▌        | 11/73 [00:05<00:33,  1.86it/s][A
 16%|█▋        | 12/73 [00:05<00:33,  1.81it/s][A
 18%|█▊        | 13/73 [00:06<00:32,  1.85it/s][A
 19%|█▉        | 14/73 [00:07<00:32,  1.82it/s][A
 21%|██        | 15/73 [00:07<00:31,  1.83it/s][A
 22%|██▏       | 16/73 [00:08<00:32,  1.78it/s][A
 23%|██▎       | 17/73 [00:08<00:31,  1.77it/s][A
 25%|██▍       | 18/73 [00:09<00:31,  1.75it/s][A
 26%|██▌       | 19/73 [00:09<00:31,  1.73it/s][A
 27%|██▋       | 20/73 [00:10<00:30,  1.71it/s][A
 29%|██▉       | 21/73 [00:11<00:30,  1.71it/s][A
 30%|███       | 22/73 [00:11<00:30,  1.69it/s][A
 32%|███▏      | 23/73 [00:12<00:28,  1.74it/s][A
 33%|███▎      | 24/73 [00:12<00:27,  1.75it/s][A
 34%|███▍      | 25/73 [00:13<00:27,  1.74it/s][A
 36%|███▌      | 26/73 [00:13<00:26,  1.76it/s][A
 37%|███▋      | 27/73 [00:14<00:23,  1.95it/s][A
 38%|███▊      | 28/73 [00:14<00:23,  1.91it/s][A
 40%|███▉      | 29/73 [00:15<00:22,  1.93it/s][A
 41%|████      | 30/73 [00:15<00:22,  1.95it/s][A
 42%|████▏     | 31/73 [00:16<00:22,  1.87it/s][A
 44%|████▍     | 32/73 [00:17<00:21,  1.91it/s][A
 45%|████▌     | 33/73 [00:17<00:20,  1.94it/s][A
 47%|████▋     | 34/73 [00:18<00:20,  1.89it/s][A
 48%|████▊     | 35/73 [00:18<00:20,  1.82it/s][A
 49%|████▉     | 36/73 [00:19<00:20,  1.83it/s][A
 51%|█████     | 37/73 [00:19<00:20,  1.80it/s][A
 52%|█████▏    | 38/73 [00:20<00:18,  1.89it/s][A
 53%|█████▎    | 39/73 [00:20<00:18,  1.81it/s][A
 55%|█████▍    | 40/73 [00:21<00:18,  1.83it/s][A
 56%|█████▌    | 41/73 [00:21<00:16,  1.90it/s][A
 58%|█████▊    | 42/73 [00:22<00:16,  1.84it/s][A
 59%|█████▉    | 43/73 [00:22<00:15,  1.88it/s][A
 60%|██████    | 44/73 [00:23<00:15,  1.86it/s][A
 62%|██████▏   | 45/73 [00:24<00:15,  1.79it/s][A
 63%|██████▎   | 46/73 [00:24<00:14,  1.87it/s][A
 64%|██████▍   | 47/73 [00:25<00:14,  1.84it/s][A
 66%|██████▌   | 48/73 [00:25<00:13,  1.82it/s][A
 67%|██████▋   | 49/73 [00:26<00:13,  1.80it/s][A
 68%|██████▊   | 50/73 [00:26<00:12,  1.82it/s][A
 70%|██████▉   | 51/73 [00:27<00:12,  1.80it/s][A
 71%|███████   | 52/73 [00:27<00:11,  1.76it/s][A
 73%|███████▎  | 53/73 [00:28<00:11,  1.73it/s][A
 74%|███████▍  | 54/73 [00:29<00:10,  1.84it/s][A
 75%|███████▌  | 55/73 [00:29<00:09,  1.83it/s][A
 77%|███████▋  | 56/73 [00:30<00:09,  1.87it/s][A
 78%|███████▊  | 57/73 [00:30<00:08,  1.80it/s][A
 79%|███████▉  | 58/73 [00:31<00:08,  1.87it/s][A
 81%|████████  | 59/73 [00:31<00:07,  1.87it/s][A
 82%|████████▏ | 60/73 [00:32<00:07,  1.84it/s][A
 84%|████████▎ | 61/73 [00:32<00:06,  1.83it/s][A
 85%|████████▍ | 62/73 [00:33<00:06,  1.79it/s][A
 86%|████████▋ | 63/73 [00:33<00:05,  1.91it/s][A
 88%|████████▊ | 64/73 [00:34<00:04,  1.97it/s][A
 89%|████████▉ | 65/73 [00:34<00:04,  1.95it/s][A
 90%|█████████ | 66/73 [00:35<00:03,  1.87it/s][A
 92%|█████████▏| 67/73 [00:35<00:03,  1.90it/s][A
 93%|█████████▎| 68/73 [00:36<00:02,  1.85it/s][A
 95%|█████████▍| 69/73 [00:37<00:02,  1.82it/s][A
 96%|█████████▌| 70/73 [00:37<00:01,  1.81it/s][A
 97%|█████████▋| 71/73 [00:38<00:01,  1.82it/s][A
 99%|█████████▊| 72/73 [00:38<00:00,  1.82it/s][A
100%|██████████| 73/73 [00:39<00:00,  1.98it/s][A                                                 
                                               [A{'eval_loss': 0.5984740257263184, 'eval_runtime': 39.7643, 'eval_samples_per_second': 58.822, 'eval_steps_per_second': 1.861, 'eval_fcm_dpo/beta': 0.010551726445555687, 'eval_fcm_dpo/q_t': 0.4060860276222229, 'eval_fcm_dpo/delta': 0.055143389850854874, 'eval_fcm_dpo/margin': 47.49774932861328, 'eval_margin_dpo/margin_mean': 47.49774932861328, 'eval_margin_dpo/margin_std': 101.77977752685547, 'eval_logps/chosen': -179.96328735351562, 'eval_logps/rejected': -235.20794677734375, 'eval_logps/ref_chosen': -79.05104064941406, 'eval_logps/ref_rejected': -86.79793548583984, 'eval_logits/chosen': -0.40839019417762756, 'eval_logits/rejected': -0.3899528980255127, 'epoch': 0.29}
 29%|██▉       | 200/681 [09:07<20:43,  2.59s/it]
100%|██████████| 73/73 [00:39<00:00,  1.98it/s][A
                                               [A 30%|██▉       | 201/681 [09:10<1:56:23, 14.55s/it] 30%|██▉       | 202/681 [09:13<1:27:47, 11.00s/it] 30%|██▉       | 203/681 [09:15<1:08:01,  8.54s/it] 30%|██▉       | 204/681 [09:18<54:02,  6.80s/it]   30%|███       | 205/681 [09:21<43:44,  5.51s/it]                                                 {'loss': 0.9696, 'grad_norm': 38.45856857299805, 'learning_rate': 4.4233349274571974e-07, 'fcm_dpo/beta': 0.010471022687852383, 'fcm_dpo/q_t': 0.3502196669578552, 'fcm_dpo/delta': -0.17127129435539246, 'fcm_dpo/margin': 72.22938537597656, 'margin_dpo/margin_mean': 72.22938537597656, 'margin_dpo/margin_std': 95.00855255126953, 'logps/chosen': -145.1938934326172, 'logps/rejected': -244.39273071289062, 'logps/ref_chosen': -65.13258361816406, 'logps/ref_rejected': -92.10203552246094, 'logits/chosen': -0.40718260407447815, 'logits/rejected': -0.3891496956348419, 'epoch': 0.3}
 30%|███       | 205/681 [09:21<43:44,  5.51s/it] 30%|███       | 206/681 [09:23<35:56,  4.54s/it] 30%|███       | 207/681 [09:25<30:59,  3.92s/it] 31%|███       | 208/681 [09:28<27:52,  3.54s/it] 31%|███       | 209/681 [09:30<24:56,  3.17s/it] 31%|███       | 210/681 [09:33<23:06,  2.94s/it]                                                 {'loss': 0.9227, 'grad_norm': 25.199186325073242, 'learning_rate': 4.381713366536311e-07, 'fcm_dpo/beta': 0.008621977642178535, 'fcm_dpo/q_t': 0.3427308201789856, 'fcm_dpo/delta': -0.17882244288921356, 'fcm_dpo/margin': 88.25994873046875, 'margin_dpo/margin_mean': 88.25994110107422, 'margin_dpo/margin_std': 101.74530029296875, 'logps/chosen': -135.15476989746094, 'logps/rejected': -255.94863891601562, 'logps/ref_chosen': -54.52837371826172, 'logps/ref_rejected': -87.06227111816406, 'logits/chosen': -0.3917924165725708, 'logits/rejected': -0.3768480718135834, 'epoch': 0.31}
 31%|███       | 210/681 [09:33<23:06,  2.94s/it] 31%|███       | 211/681 [09:35<21:33,  2.75s/it] 31%|███       | 212/681 [09:38<21:13,  2.72s/it] 31%|███▏      | 213/681 [09:41<21:28,  2.75s/it] 31%|███▏      | 214/681 [09:43<20:13,  2.60s/it] 32%|███▏      | 215/681 [09:45<20:13,  2.60s/it]                                                 {'loss': 0.9549, 'grad_norm': 28.223777770996094, 'learning_rate': 4.3388522485142885e-07, 'fcm_dpo/beta': 0.0077339522540569305, 'fcm_dpo/q_t': 0.35661423206329346, 'fcm_dpo/delta': -0.09488168358802795, 'fcm_dpo/margin': 88.91537475585938, 'margin_dpo/margin_mean': 88.91536712646484, 'margin_dpo/margin_std': 104.00807189941406, 'logps/chosen': -147.28273010253906, 'logps/rejected': -266.5479736328125, 'logps/ref_chosen': -59.905250549316406, 'logps/ref_rejected': -90.25511932373047, 'logits/chosen': -0.4153861403465271, 'logits/rejected': -0.39465969800949097, 'epoch': 0.32}
 32%|███▏      | 215/681 [09:45<20:13,  2.60s/it] 32%|███▏      | 216/681 [09:48<20:23,  2.63s/it] 32%|███▏      | 217/681 [09:51<20:02,  2.59s/it] 32%|███▏      | 218/681 [09:53<20:05,  2.60s/it] 32%|███▏      | 219/681 [09:56<20:09,  2.62s/it] 32%|███▏      | 220/681 [09:58<20:04,  2.61s/it]                                                 {'loss': 0.993, 'grad_norm': 29.1616268157959, 'learning_rate': 4.2947798076611047e-07, 'fcm_dpo/beta': 0.007219684775918722, 'fcm_dpo/q_t': 0.3702937960624695, 'fcm_dpo/delta': -0.007601064629852772, 'fcm_dpo/margin': 83.97865295410156, 'margin_dpo/margin_mean': 83.97865295410156, 'margin_dpo/margin_std': 102.7934799194336, 'logps/chosen': -151.2802734375, 'logps/rejected': -265.3018798828125, 'logps/ref_chosen': -57.68498611450195, 'logps/ref_rejected': -87.72792053222656, 'logits/chosen': -0.4109880030155182, 'logits/rejected': -0.3932788074016571, 'epoch': 0.32}
 32%|███▏      | 220/681 [09:59<20:04,  2.61s/it] 32%|███▏      | 221/681 [10:01<19:43,  2.57s/it] 33%|███▎      | 222/681 [10:04<19:38,  2.57s/it] 33%|███▎      | 223/681 [10:06<18:40,  2.45s/it] 33%|███▎      | 224/681 [10:08<18:26,  2.42s/it] 33%|███▎      | 225/681 [10:10<18:12,  2.40s/it]                                                 {'loss': 0.9375, 'grad_norm': 33.25477981567383, 'learning_rate': 4.249525076191759e-07, 'fcm_dpo/beta': 0.006763989571481943, 'fcm_dpo/q_t': 0.3473281264305115, 'fcm_dpo/delta': -0.13978341221809387, 'fcm_dpo/margin': 107.536376953125, 'margin_dpo/margin_mean': 107.536376953125, 'margin_dpo/margin_std': 123.95018005371094, 'logps/chosen': -171.83956909179688, 'logps/rejected': -318.1661071777344, 'logps/ref_chosen': -54.47245407104492, 'logps/ref_rejected': -93.26266479492188, 'logits/chosen': -0.3368683457374573, 'logits/rejected': -0.3260774612426758, 'epoch': 0.33}
 33%|███▎      | 225/681 [10:10<18:12,  2.40s/it] 33%|███▎      | 226/681 [10:13<18:41,  2.46s/it] 33%|███▎      | 227/681 [10:15<18:16,  2.42s/it] 33%|███▎      | 228/681 [10:18<18:38,  2.47s/it] 34%|███▎      | 229/681 [10:20<18:35,  2.47s/it] 34%|███▍      | 230/681 [10:23<18:19,  2.44s/it]                                                 {'loss': 0.9652, 'grad_norm': 26.257822036743164, 'learning_rate': 4.203117865141635e-07, 'fcm_dpo/beta': 0.006237152963876724, 'fcm_dpo/q_t': 0.35965046286582947, 'fcm_dpo/delta': -0.06372438371181488, 'fcm_dpo/margin': 105.6369400024414, 'margin_dpo/margin_mean': 105.6369400024414, 'margin_dpo/margin_std': 124.76959228515625, 'logps/chosen': -172.18060302734375, 'logps/rejected': -306.90704345703125, 'logps/ref_chosen': -58.7701301574707, 'logps/ref_rejected': -87.85963439941406, 'logits/chosen': -0.37301507592201233, 'logits/rejected': -0.3503766357898712, 'epoch': 0.34}
 34%|███▍      | 230/681 [10:23<18:19,  2.44s/it] 34%|███▍      | 231/681 [10:25<18:38,  2.49s/it] 34%|███▍      | 232/681 [10:28<19:05,  2.55s/it] 34%|███▍      | 233/681 [10:31<19:24,  2.60s/it] 34%|███▍      | 234/681 [10:33<19:27,  2.61s/it] 35%|███▍      | 235/681 [10:36<19:15,  2.59s/it]                                                 {'loss': 1.0075, 'grad_norm': 38.68661880493164, 'learning_rate': 4.1555887447288255e-07, 'fcm_dpo/beta': 0.006058714352548122, 'fcm_dpo/q_t': 0.37649449706077576, 'fcm_dpo/delta': 0.011923698708415031, 'fcm_dpo/margin': 97.03569030761719, 'margin_dpo/margin_mean': 97.03569030761719, 'margin_dpo/margin_std': 123.6645278930664, 'logps/chosen': -174.42852783203125, 'logps/rejected': -303.6126403808594, 'logps/ref_chosen': -59.0481071472168, 'logps/ref_rejected': -91.19654846191406, 'logits/chosen': -0.38763222098350525, 'logits/rejected': -0.37434476613998413, 'epoch': 0.35}
 35%|███▍      | 235/681 [10:36<19:15,  2.59s/it] 35%|███▍      | 236/681 [10:39<19:39,  2.65s/it] 35%|███▍      | 237/681 [10:41<19:40,  2.66s/it] 35%|███▍      | 238/681 [10:44<19:51,  2.69s/it] 35%|███▌      | 239/681 [10:46<18:59,  2.58s/it] 35%|███▌      | 240/681 [10:49<18:54,  2.57s/it]                                                 {'loss': 0.9776, 'grad_norm': 38.213321685791016, 'learning_rate': 4.106969024216348e-07, 'fcm_dpo/beta': 0.005926494486629963, 'fcm_dpo/q_t': 0.3663932681083679, 'fcm_dpo/delta': -0.02454141527414322, 'fcm_dpo/margin': 104.9325942993164, 'margin_dpo/margin_mean': 104.9325942993164, 'margin_dpo/margin_std': 123.68228912353516, 'logps/chosen': -182.47573852539062, 'logps/rejected': -323.2536926269531, 'logps/ref_chosen': -55.238983154296875, 'logps/ref_rejected': -91.08428955078125, 'logits/chosen': -0.3597189784049988, 'logits/rejected': -0.35432037711143494, 'epoch': 0.35}
 35%|███▌      | 240/681 [10:49<18:54,  2.57s/it] 35%|███▌      | 241/681 [10:51<18:34,  2.53s/it] 36%|███▌      | 242/681 [10:54<18:20,  2.51s/it] 36%|███▌      | 243/681 [10:56<18:18,  2.51s/it] 36%|███▌      | 244/681 [10:59<18:15,  2.51s/it] 36%|███▌      | 245/681 [11:02<18:43,  2.58s/it]                                                 {'loss': 0.9381, 'grad_norm': 34.15117645263672, 'learning_rate': 4.057290731287531e-07, 'fcm_dpo/beta': 0.005522926338016987, 'fcm_dpo/q_t': 0.35423046350479126, 'fcm_dpo/delta': -0.09819710999727249, 'fcm_dpo/margin': 124.70765686035156, 'margin_dpo/margin_mean': 124.7076416015625, 'margin_dpo/margin_std': 138.202880859375, 'logps/chosen': -202.49417114257812, 'logps/rejected': -348.1711730957031, 'logps/ref_chosen': -65.08844757080078, 'logps/ref_rejected': -86.05777740478516, 'logits/chosen': -0.37256139516830444, 'logits/rejected': -0.34320348501205444, 'epoch': 0.36}
 36%|███▌      | 245/681 [11:02<18:43,  2.58s/it] 36%|███▌      | 246/681 [11:04<18:52,  2.60s/it] 36%|███▋      | 247/681 [11:07<18:34,  2.57s/it] 36%|███▋      | 248/681 [11:09<18:34,  2.57s/it] 37%|███▋      | 249/681 [11:12<18:17,  2.54s/it] 37%|███▋      | 250/681 [11:14<17:59,  2.50s/it]                                                 {'loss': 0.9688, 'grad_norm': 38.33260726928711, 'learning_rate': 4.006586590948141e-07, 'fcm_dpo/beta': 0.005308011546730995, 'fcm_dpo/q_t': 0.3652518391609192, 'fcm_dpo/delta': -0.02011699415743351, 'fcm_dpo/margin': 116.39664459228516, 'margin_dpo/margin_mean': 116.39664459228516, 'margin_dpo/margin_std': 128.171875, 'logps/chosen': -204.6479034423828, 'logps/rejected': -349.326904296875, 'logps/ref_chosen': -59.08491897583008, 'logps/ref_rejected': -87.36727142333984, 'logits/chosen': -0.38754525780677795, 'logits/rejected': -0.36416977643966675, 'epoch': 0.37}
 37%|███▋      | 250/681 [11:14<17:59,  2.50s/it] 37%|███▋      | 251/681 [11:17<17:45,  2.48s/it] 37%|███▋      | 252/681 [11:19<17:48,  2.49s/it] 37%|███▋      | 253/681 [11:22<18:04,  2.53s/it] 37%|███▋      | 254/681 [11:25<18:16,  2.57s/it] 37%|███▋      | 255/681 [11:27<17:51,  2.52s/it]                                                 {'loss': 1.0064, 'grad_norm': 34.73932647705078, 'learning_rate': 3.954890003969163e-07, 'fcm_dpo/beta': 0.005321727134287357, 'fcm_dpo/q_t': 0.3720734715461731, 'fcm_dpo/delta': 0.008542664349079132, 'fcm_dpo/margin': 111.1045150756836, 'margin_dpo/margin_mean': 111.1045150756836, 'margin_dpo/margin_std': 139.63497924804688, 'logps/chosen': -217.4912567138672, 'logps/rejected': -355.06402587890625, 'logps/ref_chosen': -61.85979461669922, 'logps/ref_rejected': -88.32804107666016, 'logits/chosen': -0.37525609135627747, 'logits/rejected': -0.3513938784599304, 'epoch': 0.37}
 37%|███▋      | 255/681 [11:27<17:51,  2.52s/it] 38%|███▊      | 256/681 [11:29<17:49,  2.52s/it] 38%|███▊      | 257/681 [11:32<18:01,  2.55s/it] 38%|███▊      | 258/681 [11:34<17:33,  2.49s/it] 38%|███▊      | 259/681 [11:37<17:34,  2.50s/it] 38%|███▊      | 260/681 [11:40<17:51,  2.54s/it]                                                 {'loss': 0.9784, 'grad_norm': 43.125038146972656, 'learning_rate': 3.9022350248844246e-07, 'fcm_dpo/beta': 0.005232472904026508, 'fcm_dpo/q_t': 0.36637741327285767, 'fcm_dpo/delta': -0.022610364481806755, 'fcm_dpo/margin': 118.58265686035156, 'margin_dpo/margin_mean': 118.58265686035156, 'margin_dpo/margin_std': 140.423095703125, 'logps/chosen': -199.85968017578125, 'logps/rejected': -356.0733642578125, 'logps/ref_chosen': -52.843467712402344, 'logps/ref_rejected': -90.4744873046875, 'logits/chosen': -0.36137908697128296, 'logits/rejected': -0.3586873412132263, 'epoch': 0.38}
 38%|███▊      | 260/681 [11:40<17:51,  2.54s/it] 38%|███▊      | 261/681 [11:42<17:24,  2.49s/it] 38%|███▊      | 262/681 [11:44<17:06,  2.45s/it] 39%|███▊      | 263/681 [11:47<17:12,  2.47s/it] 39%|███▉      | 264/681 [11:50<17:42,  2.55s/it] 39%|███▉      | 265/681 [11:52<17:19,  2.50s/it]                                                 {'loss': 0.961, 'grad_norm': 59.875736236572266, 'learning_rate': 3.848656339557562e-07, 'fcm_dpo/beta': 0.005059250630438328, 'fcm_dpo/q_t': 0.3604031205177307, 'fcm_dpo/delta': -0.050201721489429474, 'fcm_dpo/margin': 127.75601959228516, 'margin_dpo/margin_mean': 127.75602722167969, 'margin_dpo/margin_std': 145.37832641601562, 'logps/chosen': -235.56326293945312, 'logps/rejected': -394.6995849609375, 'logps/ref_chosen': -59.35320281982422, 'logps/ref_rejected': -90.73350524902344, 'logits/chosen': -0.3211337924003601, 'logits/rejected': -0.3021458685398102, 'epoch': 0.39}
 39%|███▉      | 265/681 [11:52<17:19,  2.50s/it] 39%|███▉      | 266/681 [11:54<17:13,  2.49s/it] 39%|███▉      | 267/681 [11:57<17:16,  2.50s/it] 39%|███▉      | 268/681 [11:59<17:18,  2.52s/it] 40%|███▉      | 269/681 [12:02<17:05,  2.49s/it] 40%|███▉      | 270/681 [12:05<17:24,  2.54s/it]                                                 {'loss': 0.9914, 'grad_norm': 33.326416015625, 'learning_rate': 3.794189242333106e-07, 'fcm_dpo/beta': 0.004921893123537302, 'fcm_dpo/q_t': 0.36820322275161743, 'fcm_dpo/delta': -0.016059506684541702, 'fcm_dpo/margin': 124.87815856933594, 'margin_dpo/margin_mean': 124.87815856933594, 'margin_dpo/margin_std': 155.1671600341797, 'logps/chosen': -250.6675567626953, 'logps/rejected': -404.6500244140625, 'logps/ref_chosen': -66.30875396728516, 'logps/ref_rejected': -95.4130630493164, 'logits/chosen': -0.3540351688861847, 'logits/rejected': -0.33318471908569336, 'epoch': 0.4}
 40%|███▉      | 270/681 [12:05<17:24,  2.54s/it] 40%|███▉      | 271/681 [12:07<17:13,  2.52s/it] 40%|███▉      | 272/681 [12:10<17:35,  2.58s/it] 40%|████      | 273/681 [12:12<17:18,  2.55s/it] 40%|████      | 274/681 [12:15<17:08,  2.53s/it] 40%|████      | 275/681 [12:17<17:33,  2.60s/it]                                                 {'loss': 0.9386, 'grad_norm': 35.31757736206055, 'learning_rate': 3.738869612786737e-07, 'fcm_dpo/beta': 0.004636920988559723, 'fcm_dpo/q_t': 0.35574159026145935, 'fcm_dpo/delta': -0.06920859962701797, 'fcm_dpo/margin': 143.0980224609375, 'margin_dpo/margin_mean': 143.0980224609375, 'margin_dpo/margin_std': 151.79656982421875, 'logps/chosen': -223.6616973876953, 'logps/rejected': -404.2982177734375, 'logps/ref_chosen': -54.69990921020508, 'logps/ref_rejected': -92.23838806152344, 'logits/chosen': -0.29508358240127563, 'logits/rejected': -0.28438499569892883, 'epoch': 0.4}
 40%|████      | 275/681 [12:18<17:33,  2.60s/it] 41%|████      | 276/681 [12:20<17:16,  2.56s/it] 41%|████      | 277/681 [12:22<16:35,  2.46s/it] 41%|████      | 278/681 [12:25<16:41,  2.49s/it] 41%|████      | 279/681 [12:27<16:42,  2.49s/it] 41%|████      | 280/681 [12:30<16:56,  2.54s/it]                                                 {'loss': 0.9399, 'grad_norm': 52.24574279785156, 'learning_rate': 3.6827338920900253e-07, 'fcm_dpo/beta': 0.004416828043758869, 'fcm_dpo/q_t': 0.35707592964172363, 'fcm_dpo/delta': -0.06373202055692673, 'fcm_dpo/margin': 149.3416290283203, 'margin_dpo/margin_mean': 149.3416290283203, 'margin_dpo/margin_std': 158.734619140625, 'logps/chosen': -238.4672088623047, 'logps/rejected': -421.35711669921875, 'logps/ref_chosen': -54.64586639404297, 'logps/ref_rejected': -88.19416809082031, 'logits/chosen': -0.2858836352825165, 'logits/rejected': -0.2778168320655823, 'epoch': 0.41}
 41%|████      | 280/681 [12:30<16:56,  2.54s/it] 41%|████▏     | 281/681 [12:32<16:56,  2.54s/it] 41%|████▏     | 282/681 [12:35<16:52,  2.54s/it] 42%|████▏     | 283/681 [12:38<16:57,  2.56s/it] 42%|████▏     | 284/681 [12:40<17:16,  2.61s/it] 42%|████▏     | 285/681 [12:43<17:09,  2.60s/it]                                                 {'loss': 0.9501, 'grad_norm': 36.15656661987305, 'learning_rate': 3.625819059005228e-07, 'fcm_dpo/beta': 0.004238150082528591, 'fcm_dpo/q_t': 0.3608683943748474, 'fcm_dpo/delta': -0.031216781586408615, 'fcm_dpo/margin': 148.39759826660156, 'margin_dpo/margin_mean': 148.39761352539062, 'margin_dpo/margin_std': 154.8343048095703, 'logps/chosen': -271.26629638671875, 'logps/rejected': -449.8021545410156, 'logps/ref_chosen': -63.02496337890625, 'logps/ref_rejected': -93.16323852539062, 'logits/chosen': -0.3247283399105072, 'logits/rejected': -0.3061348497867584, 'epoch': 0.42}
 42%|████▏     | 285/681 [12:43<17:09,  2.60s/it] 42%|████▏     | 286/681 [12:45<17:03,  2.59s/it] 42%|████▏     | 287/681 [12:48<16:21,  2.49s/it] 42%|████▏     | 288/681 [12:50<16:27,  2.51s/it] 42%|████▏     | 289/681 [12:53<16:19,  2.50s/it] 43%|████▎     | 290/681 [12:55<16:03,  2.46s/it]                                                 {'loss': 0.9404, 'grad_norm': 28.974525451660156, 'learning_rate': 3.568162605525952e-07, 'fcm_dpo/beta': 0.004017127677798271, 'fcm_dpo/q_t': 0.35577893257141113, 'fcm_dpo/delta': -0.07293753325939178, 'fcm_dpo/margin': 166.34750366210938, 'margin_dpo/margin_mean': 166.34750366210938, 'margin_dpo/margin_std': 178.529296875, 'logps/chosen': -278.18634033203125, 'logps/rejected': -477.75714111328125, 'logps/ref_chosen': -58.37105178833008, 'logps/ref_rejected': -91.59428405761719, 'logits/chosen': -0.28096064925193787, 'logits/rejected': -0.26907119154930115, 'epoch': 0.43}
 43%|████▎     | 290/681 [12:55<16:03,  2.46s/it] 43%|████▎     | 291/681 [12:58<16:17,  2.51s/it] 43%|████▎     | 292/681 [13:00<15:57,  2.46s/it] 43%|████▎     | 293/681 [13:03<16:14,  2.51s/it] 43%|████▎     | 294/681 [13:05<16:05,  2.49s/it] 43%|████▎     | 295/681 [13:08<15:54,  2.47s/it]                                                 {'loss': 0.9886, 'grad_norm': 48.21137619018555, 'learning_rate': 3.509802512179737e-07, 'fcm_dpo/beta': 0.0038156050723046064, 'fcm_dpo/q_t': 0.3686682879924774, 'fcm_dpo/delta': -0.006700708530843258, 'fcm_dpo/margin': 158.75344848632812, 'margin_dpo/margin_mean': 158.75344848632812, 'margin_dpo/margin_std': 190.89013671875, 'logps/chosen': -266.36083984375, 'logps/rejected': -455.293701171875, 'logps/ref_chosen': -55.113426208496094, 'logps/ref_rejected': -85.29283905029297, 'logits/chosen': -0.30817854404449463, 'logits/rejected': -0.2976076900959015, 'epoch': 0.43}
 43%|████▎     | 295/681 [13:08<15:54,  2.47s/it] 43%|████▎     | 296/681 [13:10<15:59,  2.49s/it] 44%|████▎     | 297/681 [13:13<16:04,  2.51s/it] 44%|████▍     | 298/681 [13:15<16:31,  2.59s/it] 44%|████▍     | 299/681 [13:18<16:21,  2.57s/it] 44%|████▍     | 300/681 [13:21<16:29,  2.60s/it]                                                 {'loss': 0.9968, 'grad_norm': 48.85098648071289, 'learning_rate': 3.4507772230088147e-07, 'fcm_dpo/beta': 0.003914177417755127, 'fcm_dpo/q_t': 0.37021997570991516, 'fcm_dpo/delta': -0.005944193806499243, 'fcm_dpo/margin': 154.51087951660156, 'margin_dpo/margin_mean': 154.51087951660156, 'margin_dpo/margin_std': 190.1680145263672, 'logps/chosen': -299.68817138671875, 'logps/rejected': -491.77008056640625, 'logps/ref_chosen': -59.46582794189453, 'logps/ref_rejected': -97.03690338134766, 'logits/chosen': -0.3540688157081604, 'logits/rejected': -0.35069912672042847, 'epoch': 0.44}
 44%|████▍     | 300/681 [13:21<16:29,  2.60s/it] 44%|████▍     | 301/681 [13:23<15:47,  2.49s/it] 44%|████▍     | 302/681 [13:25<15:55,  2.52s/it] 44%|████▍     | 303/681 [13:28<16:02,  2.55s/it] 45%|████▍     | 304/681 [13:31<16:15,  2.59s/it] 45%|████▍     | 305/681 [13:33<16:17,  2.60s/it]                                                 {'loss': 0.9864, 'grad_norm': 30.252052307128906, 'learning_rate': 3.391125620245535e-07, 'fcm_dpo/beta': 0.0037945318035781384, 'fcm_dpo/q_t': 0.3729243278503418, 'fcm_dpo/delta': 0.018312707543373108, 'fcm_dpo/margin': 153.49285888671875, 'margin_dpo/margin_mean': 153.49285888671875, 'margin_dpo/margin_std': 174.68467712402344, 'logps/chosen': -264.3889465332031, 'logps/rejected': -447.05078125, 'logps/ref_chosen': -62.78144454956055, 'logps/ref_rejected': -91.95039367675781, 'logits/chosen': -0.38246288895606995, 'logits/rejected': -0.36992448568344116, 'epoch': 0.45}
 45%|████▍     | 305/681 [13:33<16:17,  2.60s/it] 45%|████▍     | 306/681 [13:36<16:19,  2.61s/it] 45%|████▌     | 307/681 [13:39<16:40,  2.67s/it] 45%|████▌     | 308/681 [13:42<16:50,  2.71s/it] 45%|████▌     | 309/681 [13:44<16:49,  2.71s/it] 46%|████▌     | 310/681 [13:47<16:39,  2.70s/it]                                                 {'loss': 0.9708, 'grad_norm': 32.29579544067383, 'learning_rate': 3.3308869986991487e-07, 'fcm_dpo/beta': 0.0039411550387740135, 'fcm_dpo/q_t': 0.3692263960838318, 'fcm_dpo/delta': 0.013458488509058952, 'fcm_dpo/margin': 148.8785400390625, 'margin_dpo/margin_mean': 148.87855529785156, 'margin_dpo/margin_std': 156.66542053222656, 'logps/chosen': -252.6819610595703, 'logps/rejected': -422.9564514160156, 'logps/ref_chosen': -61.359039306640625, 'logps/ref_rejected': -82.75496673583984, 'logits/chosen': -0.3574088215827942, 'logits/rejected': -0.33746927976608276, 'epoch': 0.46}
 46%|████▌     | 310/681 [13:47<16:39,  2.70s/it] 46%|████▌     | 311/681 [13:49<16:08,  2.62s/it] 46%|████▌     | 312/681 [13:52<15:30,  2.52s/it] 46%|████▌     | 313/681 [13:54<15:05,  2.46s/it] 46%|████▌     | 314/681 [13:57<15:12,  2.49s/it] 46%|████▋     | 315/681 [13:59<15:12,  2.49s/it]                                                 {'loss': 0.9925, 'grad_norm': 48.496238708496094, 'learning_rate': 3.270101039870797e-07, 'fcm_dpo/beta': 0.0038400962948799133, 'fcm_dpo/q_t': 0.3695194125175476, 'fcm_dpo/delta': -0.01564035564661026, 'fcm_dpo/margin': 159.8279571533203, 'margin_dpo/margin_mean': 159.8279571533203, 'margin_dpo/margin_std': 199.2019805908203, 'logps/chosen': -291.8459167480469, 'logps/rejected': -484.48077392578125, 'logps/ref_chosen': -51.77602005004883, 'logps/ref_rejected': -84.58292388916016, 'logits/chosen': -0.30073413252830505, 'logits/rejected': -0.29121869802474976, 'epoch': 0.46}
 46%|████▋     | 315/681 [13:59<15:12,  2.49s/it] 46%|████▋     | 316/681 [14:02<15:14,  2.51s/it] 47%|████▋     | 317/681 [14:04<15:24,  2.54s/it] 47%|████▋     | 318/681 [14:07<15:15,  2.52s/it] 47%|████▋     | 319/681 [14:09<15:32,  2.58s/it] 47%|████▋     | 320/681 [14:12<15:48,  2.63s/it]                                                 {'loss': 0.9121, 'grad_norm': 38.94823455810547, 'learning_rate': 3.208807785813777e-07, 'fcm_dpo/beta': 0.0036372647155076265, 'fcm_dpo/q_t': 0.3486129343509674, 'fcm_dpo/delta': -0.10146065801382065, 'fcm_dpo/margin': 190.74334716796875, 'margin_dpo/margin_mean': 190.74334716796875, 'margin_dpo/margin_std': 189.1331787109375, 'logps/chosen': -283.16229248046875, 'logps/rejected': -516.3914184570312, 'logps/ref_chosen': -56.777862548828125, 'logps/ref_rejected': -99.26368713378906, 'logits/chosen': -0.3392784595489502, 'logits/rejected': -0.3321293592453003, 'epoch': 0.47}
 47%|████▋     | 320/681 [14:12<15:48,  2.63s/it] 47%|████▋     | 321/681 [14:15<15:37,  2.61s/it] 47%|████▋     | 322/681 [14:17<15:35,  2.61s/it] 47%|████▋     | 323/681 [14:20<15:33,  2.61s/it] 48%|████▊     | 324/681 [14:22<15:11,  2.55s/it] 48%|████▊     | 325/681 [14:25<15:29,  2.61s/it]                                                 {'loss': 0.9858, 'grad_norm': 46.6136474609375, 'learning_rate': 3.147047612756302e-07, 'fcm_dpo/beta': 0.003477086080238223, 'fcm_dpo/q_t': 0.3705959916114807, 'fcm_dpo/delta': 0.012917397543787956, 'fcm_dpo/margin': 168.87332153320312, 'margin_dpo/margin_mean': 168.87332153320312, 'margin_dpo/margin_std': 188.2744140625, 'logps/chosen': -309.4768981933594, 'logps/rejected': -503.86883544921875, 'logps/ref_chosen': -58.28468704223633, 'logps/ref_rejected': -83.80326843261719, 'logits/chosen': -0.3095089793205261, 'logits/rejected': -0.29444074630737305, 'epoch': 0.48}
 48%|████▊     | 325/681 [14:25<15:29,  2.61s/it] 48%|████▊     | 326/681 [14:28<15:25,  2.61s/it] 48%|████▊     | 327/681 [14:30<15:32,  2.63s/it] 48%|████▊     | 328/681 [14:33<15:27,  2.63s/it] 48%|████▊     | 329/681 [14:36<15:06,  2.58s/it] 48%|████▊     | 330/681 [14:38<15:08,  2.59s/it]                                                 {'loss': 0.9518, 'grad_norm': 33.46125030517578, 'learning_rate': 3.084861204504122e-07, 'fcm_dpo/beta': 0.0035190985072404146, 'fcm_dpo/q_t': 0.3618434965610504, 'fcm_dpo/delta': -0.028615426272153854, 'fcm_dpo/margin': 178.0848388671875, 'margin_dpo/margin_mean': 178.0848388671875, 'margin_dpo/margin_std': 184.51199340820312, 'logps/chosen': -294.0130615234375, 'logps/rejected': -503.3817443847656, 'logps/ref_chosen': -62.75822067260742, 'logps/ref_rejected': -94.04203033447266, 'logits/chosen': -0.3480074405670166, 'logits/rejected': -0.3351406455039978, 'epoch': 0.48}
 48%|████▊     | 330/681 [14:38<15:08,  2.59s/it] 49%|████▊     | 331/681 [14:41<15:12,  2.61s/it] 49%|████▉     | 332/681 [14:43<14:54,  2.56s/it] 49%|████▉     | 333/681 [14:46<14:39,  2.53s/it] 49%|████▉     | 334/681 [14:48<14:28,  2.50s/it] 49%|████▉     | 335/681 [14:51<14:31,  2.52s/it]                                                 {'loss': 0.9994, 'grad_norm': 38.16062927246094, 'learning_rate': 3.022289525640531e-07, 'fcm_dpo/beta': 0.003449521493166685, 'fcm_dpo/q_t': 0.374795138835907, 'fcm_dpo/delta': 0.025535067543387413, 'fcm_dpo/margin': 166.8475799560547, 'margin_dpo/margin_mean': 166.8475799560547, 'margin_dpo/margin_std': 196.09652709960938, 'logps/chosen': -310.823486328125, 'logps/rejected': -507.77044677734375, 'logps/ref_chosen': -58.59650421142578, 'logps/ref_rejected': -88.69586944580078, 'logits/chosen': -0.35363438725471497, 'logits/rejected': -0.3413279056549072, 'epoch': 0.49}
 49%|████▉     | 335/681 [14:51<14:31,  2.52s/it] 49%|████▉     | 336/681 [14:53<14:33,  2.53s/it] 49%|████▉     | 337/681 [14:56<14:08,  2.47s/it] 50%|████▉     | 338/681 [14:58<14:14,  2.49s/it] 50%|████▉     | 339/681 [15:00<13:49,  2.43s/it] 50%|████▉     | 340/681 [15:03<14:04,  2.48s/it]                                                 {'loss': 0.9382, 'grad_norm': 33.71820831298828, 'learning_rate': 2.959373794541426e-07, 'fcm_dpo/beta': 0.00335273751989007, 'fcm_dpo/q_t': 0.3557378649711609, 'fcm_dpo/delta': -0.06508271396160126, 'fcm_dpo/margin': 196.6968536376953, 'margin_dpo/margin_mean': 196.6968536376953, 'margin_dpo/margin_std': 204.6141357421875, 'logps/chosen': -308.72821044921875, 'logps/rejected': -541.68701171875, 'logps/ref_chosen': -58.18162155151367, 'logps/ref_rejected': -94.44358825683594, 'logits/chosen': -0.3746200203895569, 'logits/rejected': -0.3606112599372864, 'epoch': 0.5}
 50%|████▉     | 340/681 [15:03<14:04,  2.48s/it] 50%|█████     | 341/681 [15:05<13:38,  2.41s/it] 50%|█████     | 342/681 [15:08<14:14,  2.52s/it] 50%|█████     | 343/681 [15:10<14:01,  2.49s/it] 51%|█████     | 344/681 [15:13<13:54,  2.48s/it] 51%|█████     | 345/681 [15:16<14:28,  2.59s/it]                                                 {'loss': 0.9402, 'grad_norm': 31.20911979675293, 'learning_rate': 2.896155456223163e-07, 'fcm_dpo/beta': 0.003242532955482602, 'fcm_dpo/q_t': 0.36007246375083923, 'fcm_dpo/delta': -0.03586641699075699, 'fcm_dpo/margin': 195.18536376953125, 'margin_dpo/margin_mean': 195.18536376953125, 'margin_dpo/margin_std': 193.4260711669922, 'logps/chosen': -296.33489990234375, 'logps/rejected': -532.6407470703125, 'logps/ref_chosen': -57.9904899597168, 'logps/ref_rejected': -99.11092376708984, 'logits/chosen': -0.4067712724208832, 'logits/rejected': -0.3969467282295227, 'epoch': 0.51}
 51%|█████     | 345/681 [15:16<14:28,  2.59s/it] 51%|█████     | 346/681 [15:18<14:14,  2.55s/it] 51%|█████     | 347/681 [15:20<13:33,  2.44s/it] 51%|█████     | 348/681 [15:23<13:17,  2.40s/it] 51%|█████     | 349/681 [15:25<13:34,  2.45s/it] 51%|█████▏    | 350/681 [15:28<13:51,  2.51s/it]                                                 {'loss': 0.9973, 'grad_norm': 44.616703033447266, 'learning_rate': 2.8326761550411346e-07, 'fcm_dpo/beta': 0.0032154968939721584, 'fcm_dpo/q_t': 0.3731505274772644, 'fcm_dpo/delta': 0.021350596100091934, 'fcm_dpo/margin': 180.19900512695312, 'margin_dpo/margin_mean': 180.19900512695312, 'margin_dpo/margin_std': 214.97982788085938, 'logps/chosen': -335.93255615234375, 'logps/rejected': -547.0894775390625, 'logps/ref_chosen': -58.29923629760742, 'logps/ref_rejected': -89.25711822509766, 'logits/chosen': -0.38301217555999756, 'logits/rejected': -0.37859946489334106, 'epoch': 0.51}
 51%|█████▏    | 350/681 [15:28<13:51,  2.51s/it] 52%|█████▏    | 351/681 [15:30<13:55,  2.53s/it] 52%|█████▏    | 352/681 [15:33<13:57,  2.55s/it] 52%|█████▏    | 353/681 [15:36<13:58,  2.56s/it] 52%|█████▏    | 354/681 [15:38<14:05,  2.59s/it] 52%|█████▏    | 355/681 [15:41<13:53,  2.56s/it]                                                 {'loss': 0.9792, 'grad_norm': 71.0094223022461, 'learning_rate': 2.7689777072570284e-07, 'fcm_dpo/beta': 0.0032494659535586834, 'fcm_dpo/q_t': 0.3689090609550476, 'fcm_dpo/delta': -0.003944025840610266, 'fcm_dpo/margin': 185.5841522216797, 'margin_dpo/margin_mean': 185.5841522216797, 'margin_dpo/margin_std': 211.45913696289062, 'logps/chosen': -334.85272216796875, 'logps/rejected': -545.5897216796875, 'logps/ref_chosen': -60.788482666015625, 'logps/ref_rejected': -85.94129943847656, 'logits/chosen': -0.4027875065803528, 'logits/rejected': -0.3871976435184479, 'epoch': 0.52}
 52%|█████▏    | 355/681 [15:41<13:53,  2.56s/it] 52%|█████▏    | 356/681 [15:44<14:13,  2.63s/it] 52%|█████▏    | 357/681 [15:46<14:20,  2.66s/it] 53%|█████▎    | 358/681 [15:49<14:24,  2.68s/it] 53%|█████▎    | 359/681 [15:52<14:10,  2.64s/it] 53%|█████▎    | 360/681 [15:54<13:53,  2.60s/it]                                                 {'loss': 1.0286, 'grad_norm': 41.69169616699219, 'learning_rate': 2.7051020734928443e-07, 'fcm_dpo/beta': 0.0032737895380705595, 'fcm_dpo/q_t': 0.3836524188518524, 'fcm_dpo/delta': 0.027207667008042336, 'fcm_dpo/margin': 163.24708557128906, 'margin_dpo/margin_mean': 163.24708557128906, 'margin_dpo/margin_std': 207.1353759765625, 'logps/chosen': -335.9218444824219, 'logps/rejected': -522.1071166992188, 'logps/ref_chosen': -57.6871337890625, 'logps/ref_rejected': -80.62527465820312, 'logits/chosen': -0.37818944454193115, 'logits/rejected': -0.3610234558582306, 'epoch': 0.53}
 53%|█████▎    | 360/681 [15:54<13:53,  2.60s/it] 53%|█████▎    | 361/681 [15:57<14:00,  2.63s/it] 53%|█████▎    | 362/681 [15:59<13:28,  2.53s/it] 53%|█████▎    | 363/681 [16:01<13:01,  2.46s/it] 53%|█████▎    | 364/681 [16:04<13:19,  2.52s/it] 54%|█████▎    | 365/681 [16:07<13:26,  2.55s/it]                                                 {'loss': 0.9461, 'grad_norm': 34.91660690307617, 'learning_rate': 2.641091331089811e-07, 'fcm_dpo/beta': 0.0032265144400298595, 'fcm_dpo/q_t': 0.35923275351524353, 'fcm_dpo/delta': -0.0519678071141243, 'fcm_dpo/margin': 200.8280029296875, 'margin_dpo/margin_mean': 200.82803344726562, 'margin_dpo/margin_std': 215.3280487060547, 'logps/chosen': -300.1896667480469, 'logps/rejected': -540.5555419921875, 'logps/ref_chosen': -51.490867614746094, 'logps/ref_rejected': -91.02871704101562, 'logits/chosen': -0.33706134557724, 'logits/rejected': -0.3363405764102936, 'epoch': 0.54}
 54%|█████▎    | 365/681 [16:07<13:26,  2.55s/it] 54%|█████▎    | 366/681 [16:09<13:33,  2.58s/it] 54%|█████▍    | 367/681 [16:12<13:55,  2.66s/it] 54%|█████▍    | 368/681 [16:15<13:46,  2.64s/it] 54%|█████▍    | 369/681 [16:17<13:44,  2.64s/it] 54%|█████▍    | 370/681 [16:20<13:57,  2.69s/it]                                                 {'loss': 1.0101, 'grad_norm': 50.44911193847656, 'learning_rate': 2.5769876463904263e-07, 'fcm_dpo/beta': 0.0032107695005834103, 'fcm_dpo/q_t': 0.37912872433662415, 'fcm_dpo/delta': 0.05830075219273567, 'fcm_dpo/margin': 169.78909301757812, 'margin_dpo/margin_mean': 169.78909301757812, 'margin_dpo/margin_std': 197.232666015625, 'logps/chosen': -303.07366943359375, 'logps/rejected': -504.18377685546875, 'logps/ref_chosen': -58.113502502441406, 'logps/ref_rejected': -89.43451690673828, 'logits/chosen': -0.3650849461555481, 'logits/rejected': -0.35905131697654724, 'epoch': 0.54}
 54%|█████▍    | 370/681 [16:20<13:57,  2.69s/it] 54%|█████▍    | 371/681 [16:23<13:55,  2.69s/it] 55%|█████▍    | 372/681 [16:25<13:13,  2.57s/it] 55%|█████▍    | 373/681 [16:28<13:05,  2.55s/it] 55%|█████▍    | 374/681 [16:30<13:15,  2.59s/it] 55%|█████▌    | 375/681 [16:33<13:15,  2.60s/it]                                                 {'loss': 0.9763, 'grad_norm': 40.54216003417969, 'learning_rate': 2.512833246961859e-07, 'fcm_dpo/beta': 0.003249173518270254, 'fcm_dpo/q_t': 0.3639177083969116, 'fcm_dpo/delta': -0.03621614724397659, 'fcm_dpo/margin': 194.74484252929688, 'margin_dpo/margin_mean': 194.74484252929688, 'margin_dpo/margin_std': 230.34060668945312, 'logps/chosen': -325.7327880859375, 'logps/rejected': -544.4915771484375, 'logps/ref_chosen': -65.23600769042969, 'logps/ref_rejected': -89.24995422363281, 'logits/chosen': -0.41527968645095825, 'logits/rejected': -0.3979854881763458, 'epoch': 0.55}
 55%|█████▌    | 375/681 [16:33<13:15,  2.60s/it] 55%|█████▌    | 376/681 [16:36<13:30,  2.66s/it] 55%|█████▌    | 377/681 [16:38<13:12,  2.61s/it] 56%|█████▌    | 378/681 [16:40<12:26,  2.46s/it] 56%|█████▌    | 379/681 [16:43<12:36,  2.50s/it] 56%|█████▌    | 380/681 [16:45<12:19,  2.46s/it]                                                 {'loss': 0.9291, 'grad_norm': 30.83326530456543, 'learning_rate': 2.4486703937790243e-07, 'fcm_dpo/beta': 0.003087093820795417, 'fcm_dpo/q_t': 0.3510977625846863, 'fcm_dpo/delta': -0.08724673092365265, 'fcm_dpo/margin': 220.7941131591797, 'margin_dpo/margin_mean': 220.79409790039062, 'margin_dpo/margin_std': 231.2888641357422, 'logps/chosen': -309.36334228515625, 'logps/rejected': -578.9722900390625, 'logps/ref_chosen': -53.33893966674805, 'logps/ref_rejected': -102.15375518798828, 'logits/chosen': -0.35653212666511536, 'logits/rejected': -0.36338263750076294, 'epoch': 0.56}
 56%|█████▌    | 380/681 [16:45<12:19,  2.46s/it] 56%|█████▌    | 381/681 [16:48<12:17,  2.46s/it] 56%|█████▌    | 382/681 [16:50<12:35,  2.53s/it] 56%|█████▌    | 383/681 [16:53<12:33,  2.53s/it] 56%|█████▋    | 384/681 [16:56<12:35,  2.54s/it] 57%|█████▋    | 385/681 [16:58<12:27,  2.53s/it]                                                 {'loss': 0.9882, 'grad_norm': 33.003395080566406, 'learning_rate': 2.3845413533856514e-07, 'fcm_dpo/beta': 0.0030052317306399345, 'fcm_dpo/q_t': 0.37150126695632935, 'fcm_dpo/delta': 0.018545908853411674, 'fcm_dpo/margin': 193.73928833007812, 'margin_dpo/margin_mean': 193.73927307128906, 'margin_dpo/margin_std': 221.2782440185547, 'logps/chosen': -344.1658630371094, 'logps/rejected': -568.9893798828125, 'logps/ref_chosen': -58.36262130737305, 'logps/ref_rejected': -89.44685363769531, 'logits/chosen': -0.3649640679359436, 'logits/rejected': -0.3546612858772278, 'epoch': 0.57}
 57%|█████▋    | 385/681 [16:58<12:27,  2.53s/it] 57%|█████▋    | 386/681 [17:01<12:29,  2.54s/it] 57%|█████▋    | 387/681 [17:03<12:28,  2.55s/it] 57%|█████▋    | 388/681 [17:06<12:14,  2.51s/it] 57%|█████▋    | 389/681 [17:08<12:04,  2.48s/it] 57%|█████▋    | 390/681 [17:11<12:06,  2.50s/it]                                                 {'loss': 0.9741, 'grad_norm': 34.66581726074219, 'learning_rate': 2.320488370051681e-07, 'fcm_dpo/beta': 0.0029720370657742023, 'fcm_dpo/q_t': 0.36599045991897583, 'fcm_dpo/delta': -0.022272076457738876, 'fcm_dpo/margin': 208.7709503173828, 'margin_dpo/margin_mean': 208.7709503173828, 'margin_dpo/margin_std': 244.04592895507812, 'logps/chosen': -367.145263671875, 'logps/rejected': -610.010009765625, 'logps/ref_chosen': -56.380653381347656, 'logps/ref_rejected': -90.47447204589844, 'logits/chosen': -0.3872172236442566, 'logits/rejected': -0.3775530159473419, 'epoch': 0.57}
 57%|█████▋    | 390/681 [17:11<12:06,  2.50s/it] 57%|█████▋    | 391/681 [17:13<12:10,  2.52s/it] 58%|█████▊    | 392/681 [17:16<12:26,  2.58s/it] 58%|█████▊    | 393/681 [17:18<12:04,  2.52s/it] 58%|█████▊    | 394/681 [17:21<12:10,  2.55s/it] 58%|█████▊    | 395/681 [17:23<11:58,  2.51s/it]                                                 {'loss': 1.0072, 'grad_norm': 38.42062759399414, 'learning_rate': 2.2565536379453404e-07, 'fcm_dpo/beta': 0.0030248172115534544, 'fcm_dpo/q_t': 0.37626224756240845, 'fcm_dpo/delta': 0.0180402509868145, 'fcm_dpo/margin': 192.4487762451172, 'margin_dpo/margin_mean': 192.4487762451172, 'margin_dpo/margin_std': 244.62527465820312, 'logps/chosen': -349.0114440917969, 'logps/rejected': -572.6387939453125, 'logps/ref_chosen': -55.95304489135742, 'logps/ref_rejected': -87.13162994384766, 'logits/chosen': -0.40114063024520874, 'logits/rejected': -0.39468201994895935, 'epoch': 0.58}
 58%|█████▊    | 395/681 [17:23<11:58,  2.51s/it] 58%|█████▊    | 396/681 [17:26<11:58,  2.52s/it] 58%|█████▊    | 397/681 [17:28<11:51,  2.50s/it] 58%|█████▊    | 398/681 [17:31<11:31,  2.44s/it] 59%|█████▊    | 399/681 [17:33<11:16,  2.40s/it] 59%|█████▊    | 400/681 [17:35<11:30,  2.46s/it]                                                 {'loss': 0.9245, 'grad_norm': 28.816965103149414, 'learning_rate': 2.192779273338215e-07, 'fcm_dpo/beta': 0.0028987762052565813, 'fcm_dpo/q_t': 0.3521673381328583, 'fcm_dpo/delta': -0.08543933928012848, 'fcm_dpo/margin': 234.6150665283203, 'margin_dpo/margin_mean': 234.6150665283203, 'margin_dpo/margin_std': 239.69271850585938, 'logps/chosen': -368.6856994628906, 'logps/rejected': -635.4100341796875, 'logps/ref_chosen': -64.59160614013672, 'logps/ref_rejected': -96.700927734375, 'logits/chosen': -0.4242188036441803, 'logits/rejected': -0.40835875272750854, 'epoch': 0.59}
 59%|█████▊    | 400/681 [17:36<11:30,  2.46s/it][INFO|trainer.py:4307] 2026-04-21 22:52:14,935 >> 
***** Running Evaluation *****
[INFO|trainer.py:4309] 2026-04-21 22:52:14,935 >>   Num examples = 2339
[INFO|trainer.py:4312] 2026-04-21 22:52:14,935 >>   Batch size = 8

  0%|          | 0/73 [00:00<?, ?it/s][A
  3%|▎         | 2/73 [00:00<00:19,  3.65it/s][A
  4%|▍         | 3/73 [00:01<00:27,  2.59it/s][A
  5%|▌         | 4/73 [00:01<00:30,  2.27it/s][A
  7%|▋         | 5/73 [00:02<00:32,  2.12it/s][A
  8%|▊         | 6/73 [00:02<00:33,  2.01it/s][A
 10%|▉         | 7/73 [00:03<00:31,  2.09it/s][A
 11%|█         | 8/73 [00:03<00:33,  1.94it/s][A
 12%|█▏        | 9/73 [00:04<00:34,  1.88it/s][A
 14%|█▎        | 10/73 [00:04<00:33,  1.85it/s][A
 15%|█▌        | 11/73 [00:05<00:33,  1.86it/s][A
 16%|█▋        | 12/73 [00:05<00:33,  1.81it/s][A
 18%|█▊        | 13/73 [00:06<00:32,  1.85it/s][A
 19%|█▉        | 14/73 [00:07<00:32,  1.82it/s][A
 21%|██        | 15/73 [00:07<00:31,  1.83it/s][A
 22%|██▏       | 16/73 [00:08<00:32,  1.76it/s][A
 23%|██▎       | 17/73 [00:08<00:31,  1.77it/s][A
 25%|██▍       | 18/73 [00:09<00:31,  1.75it/s][A
 26%|██▌       | 19/73 [00:09<00:31,  1.73it/s][A
 27%|██▋       | 20/73 [00:10<00:30,  1.71it/s][A
 29%|██▉       | 21/73 [00:11<00:30,  1.71it/s][A
 30%|███       | 22/73 [00:11<00:30,  1.69it/s][A
 32%|███▏      | 23/73 [00:12<00:28,  1.74it/s][A
 33%|███▎      | 24/73 [00:12<00:27,  1.75it/s][A
 34%|███▍      | 25/73 [00:13<00:27,  1.74it/s][A
 36%|███▌      | 26/73 [00:14<00:26,  1.75it/s][A
 37%|███▋      | 27/73 [00:14<00:23,  1.95it/s][A
 38%|███▊      | 28/73 [00:14<00:23,  1.91it/s][A
 40%|███▉      | 29/73 [00:15<00:22,  1.93it/s][A
 41%|████      | 30/73 [00:15<00:22,  1.95it/s][A
 42%|████▏     | 31/73 [00:16<00:22,  1.87it/s][A
 44%|████▍     | 32/73 [00:17<00:21,  1.91it/s][A
 45%|████▌     | 33/73 [00:17<00:20,  1.94it/s][A
 47%|████▋     | 34/73 [00:18<00:20,  1.88it/s][A
 48%|████▊     | 35/73 [00:18<00:20,  1.81it/s][A
 49%|████▉     | 36/73 [00:19<00:20,  1.82it/s][A
 51%|█████     | 37/73 [00:19<00:20,  1.80it/s][A
 52%|█████▏    | 38/73 [00:20<00:18,  1.90it/s][A
 53%|█████▎    | 39/73 [00:20<00:18,  1.82it/s][A
 55%|█████▍    | 40/73 [00:21<00:17,  1.84it/s][A
 56%|█████▌    | 41/73 [00:21<00:16,  1.91it/s][A
 58%|█████▊    | 42/73 [00:22<00:16,  1.84it/s][A
 59%|█████▉    | 43/73 [00:22<00:15,  1.88it/s][A
 60%|██████    | 44/73 [00:23<00:15,  1.86it/s][A
 62%|██████▏   | 45/73 [00:24<00:15,  1.79it/s][A
 63%|██████▎   | 46/73 [00:24<00:14,  1.87it/s][A
 64%|██████▍   | 47/73 [00:25<00:14,  1.84it/s][A
 66%|██████▌   | 48/73 [00:25<00:13,  1.82it/s][A
 67%|██████▋   | 49/73 [00:26<00:13,  1.80it/s][A
 68%|██████▊   | 50/73 [00:26<00:12,  1.82it/s][A
 70%|██████▉   | 51/73 [00:27<00:12,  1.80it/s][A
 71%|███████   | 52/73 [00:27<00:11,  1.76it/s][A
 73%|███████▎  | 53/73 [00:28<00:11,  1.73it/s][A
 74%|███████▍  | 54/73 [00:29<00:10,  1.84it/s][A
 75%|███████▌  | 55/73 [00:29<00:09,  1.83it/s][A
 77%|███████▋  | 56/73 [00:30<00:09,  1.87it/s][A
 78%|███████▊  | 57/73 [00:30<00:08,  1.80it/s][A
 79%|███████▉  | 58/73 [00:31<00:08,  1.87it/s][A
 81%|████████  | 59/73 [00:31<00:07,  1.86it/s][A
 82%|████████▏ | 60/73 [00:32<00:07,  1.84it/s][A
 84%|████████▎ | 61/73 [00:32<00:06,  1.83it/s][A
 85%|████████▍ | 62/73 [00:33<00:06,  1.79it/s][A
 86%|████████▋ | 63/73 [00:33<00:05,  1.91it/s][A
 88%|████████▊ | 64/73 [00:34<00:04,  1.98it/s][A
 89%|████████▉ | 65/73 [00:34<00:04,  1.95it/s][A
 90%|█████████ | 66/73 [00:35<00:03,  1.86it/s][A
 92%|█████████▏| 67/73 [00:35<00:03,  1.90it/s][A
 93%|█████████▎| 68/73 [00:36<00:02,  1.85it/s][A
 95%|█████████▍| 69/73 [00:37<00:02,  1.82it/s][A
 96%|█████████▌| 70/73 [00:37<00:01,  1.82it/s][A
 97%|█████████▋| 71/73 [00:38<00:01,  1.82it/s][A
 99%|█████████▊| 72/73 [00:38<00:00,  1.82it/s][A
100%|██████████| 73/73 [00:39<00:00,  1.98it/s][A                                                 
                                               [A{'eval_loss': 0.5729401111602783, 'eval_runtime': 39.7615, 'eval_samples_per_second': 58.826, 'eval_steps_per_second': 1.861, 'eval_fcm_dpo/beta': 0.003817289602011442, 'eval_fcm_dpo/q_t': 0.39730218052864075, 'eval_fcm_dpo/delta': 0.06625650823116302, 'eval_fcm_dpo/margin': 134.67041015625, 'eval_margin_dpo/margin_mean': 134.67041015625, 'eval_margin_dpo/margin_std': 251.6155242919922, 'eval_logps/chosen': -454.1283264160156, 'eval_logps/rejected': -596.5455932617188, 'eval_logps/ref_chosen': -79.05104064941406, 'eval_logps/ref_rejected': -86.79793548583984, 'eval_logits/chosen': -0.43868309259414673, 'eval_logits/rejected': -0.4222582280635834, 'epoch': 0.59}
 59%|█████▊    | 400/681 [18:15<11:30,  2.46s/it]
100%|██████████| 73/73 [00:39<00:00,  1.98it/s][A
                                               [A 59%|█████▉    | 401/681 [18:18<1:07:17, 14.42s/it] 59%|█████▉    | 402/681 [18:20<50:14, 10.80s/it]   59%|█████▉    | 403/681 [18:23<38:23,  8.28s/it] 59%|█████▉    | 404/681 [18:25<30:12,  6.54s/it] 59%|█████▉    | 405/681 [18:27<24:15,  5.27s/it]                                                 {'loss': 0.9244, 'grad_norm': 62.11888885498047, 'learning_rate': 2.129207286861638e-07, 'fcm_dpo/beta': 0.003784316824749112, 'fcm_dpo/q_t': 0.3333556056022644, 'fcm_dpo/delta': -0.2645108699798584, 'fcm_dpo/margin': 221.6338348388672, 'margin_dpo/margin_mean': 221.6338348388672, 'margin_dpo/margin_std': 262.4577941894531, 'logps/chosen': -352.8330078125, 'logps/rejected': -602.1383666992188, 'logps/ref_chosen': -53.61777877807617, 'logps/ref_rejected': -81.28938293457031, 'logits/chosen': -0.40359169244766235, 'logits/rejected': -0.39246273040771484, 'epoch': 0.59}
 59%|█████▉    | 405/681 [18:27<24:15,  5.27s/it] 60%|█████▉    | 406/681 [18:30<20:14,  4.42s/it] 60%|█████▉    | 407/681 [18:32<17:29,  3.83s/it] 60%|█████▉    | 408/681 [18:35<15:50,  3.48s/it] 60%|██████    | 409/681 [18:38<14:40,  3.24s/it] 60%|██████    | 410/681 [18:40<13:41,  3.03s/it]                                                 {'loss': 0.9824, 'grad_norm': 36.665096282958984, 'learning_rate': 2.065879555832674e-07, 'fcm_dpo/beta': 0.0033690209966152906, 'fcm_dpo/q_t': 0.3654642701148987, 'fcm_dpo/delta': -0.02751757577061653, 'fcm_dpo/margin': 185.41323852539062, 'margin_dpo/margin_mean': 185.41323852539062, 'margin_dpo/margin_std': 221.5907440185547, 'logps/chosen': -350.5545654296875, 'logps/rejected': -562.5972290039062, 'logps/ref_chosen': -58.9287223815918, 'logps/ref_rejected': -85.55818176269531, 'logits/chosen': -0.4079107642173767, 'logits/rejected': -0.3933170437812805, 'epoch': 0.6}
 60%|██████    | 410/681 [18:40<13:41,  3.03s/it] 60%|██████    | 411/681 [18:42<12:33,  2.79s/it] 60%|██████    | 412/681 [18:45<11:57,  2.67s/it] 61%|██████    | 413/681 [18:47<11:53,  2.66s/it] 61%|██████    | 414/681 [18:50<11:43,  2.64s/it] 61%|██████    | 415/681 [18:53<11:51,  2.68s/it]                                                 {'loss': 0.9633, 'grad_norm': 39.306392669677734, 'learning_rate': 2.002837796667909e-07, 'fcm_dpo/beta': 0.003266123589128256, 'fcm_dpo/q_t': 0.3626883924007416, 'fcm_dpo/delta': -0.03337870165705681, 'fcm_dpo/margin': 192.88467407226562, 'margin_dpo/margin_mean': 192.88467407226562, 'margin_dpo/margin_std': 213.9280548095703, 'logps/chosen': -352.2253112792969, 'logps/rejected': -580.3240356445312, 'logps/ref_chosen': -58.45662307739258, 'logps/ref_rejected': -93.67063903808594, 'logits/chosen': -0.382286936044693, 'logits/rejected': -0.3848063051700592, 'epoch': 0.61}
 61%|██████    | 415/681 [18:53<11:51,  2.68s/it] 61%|██████    | 416/681 [18:55<11:37,  2.63s/it] 61%|██████    | 417/681 [18:58<11:20,  2.58s/it] 61%|██████▏   | 418/681 [19:00<11:24,  2.60s/it] 62%|██████▏   | 419/681 [19:03<11:16,  2.58s/it] 62%|██████▏   | 420/681 [19:05<11:07,  2.56s/it]                                                 {'loss': 0.9405, 'grad_norm': 52.39727020263672, 'learning_rate': 1.9401235374032425e-07, 'fcm_dpo/beta': 0.003045933786779642, 'fcm_dpo/q_t': 0.3554866909980774, 'fcm_dpo/delta': -0.07158443331718445, 'fcm_dpo/margin': 218.24789428710938, 'margin_dpo/margin_mean': 218.24789428710938, 'margin_dpo/margin_std': 232.1405487060547, 'logps/chosen': -361.6821594238281, 'logps/rejected': -600.5580444335938, 'logps/ref_chosen': -64.2349853515625, 'logps/ref_rejected': -84.86299133300781, 'logits/chosen': -0.4089987874031067, 'logits/rejected': -0.3841163218021393, 'epoch': 0.62}
 62%|██████▏   | 420/681 [19:05<11:07,  2.56s/it] 62%|██████▏   | 421/681 [19:08<11:08,  2.57s/it] 62%|██████▏   | 422/681 [19:11<11:18,  2.62s/it] 62%|██████▏   | 423/681 [19:13<10:58,  2.55s/it] 62%|██████▏   | 424/681 [19:16<11:07,  2.60s/it] 62%|██████▏   | 425/681 [19:18<11:06,  2.60s/it]                                                 {'loss': 1.0006, 'grad_norm': 36.52717590332031, 'learning_rate': 1.8777780903377732e-07, 'fcm_dpo/beta': 0.0030709414277225733, 'fcm_dpo/q_t': 0.37453344464302063, 'fcm_dpo/delta': 0.03329915553331375, 'fcm_dpo/margin': 185.03384399414062, 'margin_dpo/margin_mean': 185.03384399414062, 'margin_dpo/margin_std': 220.0364990234375, 'logps/chosen': -333.1438293457031, 'logps/rejected': -547.294677734375, 'logps/ref_chosen': -56.054161071777344, 'logps/ref_rejected': -85.17119598388672, 'logits/chosen': -0.41324177384376526, 'logits/rejected': -0.39911994338035583, 'epoch': 0.62}
 62%|██████▏   | 425/681 [19:19<11:06,  2.60s/it] 63%|██████▎   | 426/681 [19:21<11:07,  2.62s/it] 63%|██████▎   | 427/681 [19:24<11:04,  2.62s/it] 63%|██████▎   | 428/681 [19:26<11:05,  2.63s/it] 63%|██████▎   | 429/681 [19:29<11:08,  2.65s/it] 63%|██████▎   | 430/681 [19:32<11:21,  2.71s/it]                                                 {'loss': 1.0109, 'grad_norm': 40.842708587646484, 'learning_rate': 1.8158425248197928e-07, 'fcm_dpo/beta': 0.003164885099977255, 'fcm_dpo/q_t': 0.37670689821243286, 'fcm_dpo/delta': 0.03732316568493843, 'fcm_dpo/margin': 178.30136108398438, 'margin_dpo/margin_mean': 178.30136108398438, 'margin_dpo/margin_std': 218.34555053710938, 'logps/chosen': -347.55450439453125, 'logps/rejected': -548.4766235351562, 'logps/ref_chosen': -69.24568176269531, 'logps/ref_rejected': -91.8664321899414, 'logits/chosen': -0.4269745945930481, 'logits/rejected': -0.40301522612571716, 'epoch': 0.63}
 63%|██████▎   | 430/681 [19:32<11:21,  2.71s/it] 63%|██████▎   | 431/681 [19:35<11:15,  2.70s/it] 63%|██████▎   | 432/681 [19:37<11:16,  2.72s/it] 64%|██████▎   | 433/681 [19:40<10:52,  2.63s/it] 64%|██████▎   | 434/681 [19:42<10:42,  2.60s/it] 64%|██████▍   | 435/681 [19:45<10:14,  2.50s/it]                                                 {'loss': 0.9696, 'grad_norm': 33.455562591552734, 'learning_rate': 1.7543576401928218e-07, 'fcm_dpo/beta': 0.003134062048047781, 'fcm_dpo/q_t': 0.3648958206176758, 'fcm_dpo/delta': -0.024000858888030052, 'fcm_dpo/margin': 198.20034790039062, 'margin_dpo/margin_mean': 198.2003631591797, 'margin_dpo/margin_std': 223.5625457763672, 'logps/chosen': -344.5923767089844, 'logps/rejected': -573.4454345703125, 'logps/ref_chosen': -60.03449630737305, 'logps/ref_rejected': -90.6872329711914, 'logits/chosen': -0.38360780477523804, 'logits/rejected': -0.3695995807647705, 'epoch': 0.64}
 64%|██████▍   | 435/681 [19:45<10:14,  2.50s/it] 64%|██████▍   | 436/681 [19:47<10:35,  2.59s/it] 64%|██████▍   | 437/681 [19:50<10:41,  2.63s/it] 64%|██████▍   | 438/681 [19:53<10:22,  2.56s/it] 64%|██████▍   | 439/681 [19:55<10:16,  2.55s/it] 65%|██████▍   | 440/681 [19:57<09:59,  2.49s/it]                                                 {'loss': 0.9793, 'grad_norm': 39.6731071472168, 'learning_rate': 1.6933639389195134e-07, 'fcm_dpo/beta': 0.0031414516270160675, 'fcm_dpo/q_t': 0.3708716332912445, 'fcm_dpo/delta': 0.008422891609370708, 'fcm_dpo/margin': 188.22352600097656, 'margin_dpo/margin_mean': 188.22352600097656, 'margin_dpo/margin_std': 209.7587127685547, 'logps/chosen': -336.13507080078125, 'logps/rejected': -544.5213623046875, 'logps/ref_chosen': -65.50349426269531, 'logps/ref_rejected': -85.66627502441406, 'logits/chosen': -0.4058264195919037, 'logits/rejected': -0.38181501626968384, 'epoch': 0.65}
 65%|██████▍   | 440/681 [19:57<09:59,  2.49s/it] 65%|██████▍   | 441/681 [20:00<10:10,  2.54s/it] 65%|██████▍   | 442/681 [20:02<09:56,  2.49s/it] 65%|██████▌   | 443/681 [20:05<10:06,  2.55s/it] 65%|██████▌   | 444/681 [20:08<09:59,  2.53s/it] 65%|██████▌   | 445/681 [20:10<09:57,  2.53s/it]                                                 {'loss': 0.9762, 'grad_norm': 31.921981811523438, 'learning_rate': 1.6329015999011182e-07, 'fcm_dpo/beta': 0.00310450023971498, 'fcm_dpo/q_t': 0.36341750621795654, 'fcm_dpo/delta': -0.04807734861969948, 'fcm_dpo/margin': 207.53652954101562, 'margin_dpo/margin_mean': 207.53652954101562, 'margin_dpo/margin_std': 250.76455688476562, 'logps/chosen': -361.6647033691406, 'logps/rejected': -598.40234375, 'logps/ref_chosen': -60.72443389892578, 'logps/ref_rejected': -89.9255142211914, 'logits/chosen': -0.3922547996044159, 'logits/rejected': -0.37669098377227783, 'epoch': 0.65}
 65%|██████▌   | 445/681 [20:10<09:57,  2.53s/it] 65%|██████▌   | 446/681 [20:13<09:59,  2.55s/it] 66%|██████▌   | 447/681 [20:15<09:47,  2.51s/it] 66%|██████▌   | 448/681 [20:18<09:57,  2.56s/it] 66%|██████▌   | 449/681 [20:20<09:49,  2.54s/it] 66%|██████▌   | 450/681 [20:23<09:53,  2.57s/it]                                                 {'loss': 0.924, 'grad_norm': 38.20564270019531, 'learning_rate': 1.573010452010098e-07, 'fcm_dpo/beta': 0.002883550710976124, 'fcm_dpo/q_t': 0.35191330313682556, 'fcm_dpo/delta': -0.08991138637065887, 'fcm_dpo/margin': 237.09793090820312, 'margin_dpo/margin_mean': 237.09793090820312, 'margin_dpo/margin_std': 247.1533660888672, 'logps/chosen': -349.90106201171875, 'logps/rejected': -625.751708984375, 'logps/ref_chosen': -59.96248245239258, 'logps/ref_rejected': -98.71509552001953, 'logits/chosen': -0.378944993019104, 'logits/rejected': -0.3763580918312073, 'epoch': 0.66}
 66%|██████▌   | 450/681 [20:23<09:53,  2.57s/it] 66%|██████▌   | 451/681 [20:25<09:26,  2.46s/it] 66%|██████▋   | 452/681 [20:28<09:20,  2.45s/it] 67%|██████▋   | 453/681 [20:30<09:07,  2.40s/it] 67%|██████▋   | 454/681 [20:32<09:10,  2.43s/it] 67%|██████▋   | 455/681 [20:35<09:11,  2.44s/it]                                                 {'loss': 0.9596, 'grad_norm': 35.098609924316406, 'learning_rate': 1.5137299478533064e-07, 'fcm_dpo/beta': 0.002764140721410513, 'fcm_dpo/q_t': 0.362155020236969, 'fcm_dpo/delta': -0.03560318797826767, 'fcm_dpo/margin': 229.11276245117188, 'margin_dpo/margin_mean': 229.11276245117188, 'margin_dpo/margin_std': 254.59921264648438, 'logps/chosen': -346.89105224609375, 'logps/rejected': -612.1546630859375, 'logps/ref_chosen': -54.48131561279297, 'logps/ref_rejected': -90.6321029663086, 'logits/chosen': -0.3881308138370514, 'logits/rejected': -0.3764522671699524, 'epoch': 0.67}
 67%|██████▋   | 455/681 [20:35<09:11,  2.44s/it] 67%|██████▋   | 456/681 [20:37<09:18,  2.48s/it] 67%|██████▋   | 457/681 [20:40<09:20,  2.50s/it] 67%|██████▋   | 458/681 [20:43<09:18,  2.50s/it] 67%|██████▋   | 459/681 [20:45<09:20,  2.52s/it] 68%|██████▊   | 460/681 [20:48<09:28,  2.57s/it]                                                 {'loss': 0.9276, 'grad_norm': 46.92758560180664, 'learning_rate': 1.4550991377830423e-07, 'fcm_dpo/beta': 0.0025613114703446627, 'fcm_dpo/q_t': 0.3553471565246582, 'fcm_dpo/delta': -0.05846347659826279, 'fcm_dpo/margin': 255.3362274169922, 'margin_dpo/margin_mean': 255.3362579345703, 'margin_dpo/margin_std': 251.95751953125, 'logps/chosen': -382.7040100097656, 'logps/rejected': -680.7238159179688, 'logps/ref_chosen': -52.97611618041992, 'logps/ref_rejected': -95.65971374511719, 'logits/chosen': -0.4343814253807068, 'logits/rejected': -0.4337409436702728, 'epoch': 0.68}
 68%|██████▊   | 460/681 [20:48<09:28,  2.57s/it] 68%|██████▊   | 461/681 [20:50<09:35,  2.62s/it] 68%|██████▊   | 462/681 [20:53<09:23,  2.57s/it] 68%|██████▊   | 463/681 [20:55<09:18,  2.56s/it] 68%|██████▊   | 464/681 [20:58<08:57,  2.48s/it] 68%|██████▊   | 465/681 [21:00<09:00,  2.50s/it]                                                 {'loss': 0.9691, 'grad_norm': 36.07568359375, 'learning_rate': 1.3971566441730714e-07, 'fcm_dpo/beta': 0.0025722947902977467, 'fcm_dpo/q_t': 0.36578595638275146, 'fcm_dpo/delta': -0.020649045705795288, 'fcm_dpo/margin': 240.62417602539062, 'margin_dpo/margin_mean': 240.62417602539062, 'margin_dpo/margin_std': 267.12054443359375, 'logps/chosen': -415.87188720703125, 'logps/rejected': -692.3690185546875, 'logps/ref_chosen': -58.2827033996582, 'logps/ref_rejected': -94.15567779541016, 'logits/chosen': -0.46626290678977966, 'logits/rejected': -0.47067561745643616, 'epoch': 0.68}
 68%|██████▊   | 465/681 [21:00<09:00,  2.50s/it] 68%|██████▊   | 466/681 [21:03<09:05,  2.54s/it] 69%|██████▊   | 467/681 [21:05<08:59,  2.52s/it] 69%|██████▊   | 468/681 [21:08<09:11,  2.59s/it] 69%|██████▉   | 469/681 [21:11<09:18,  2.63s/it] 69%|██████▉   | 470/681 [21:13<08:58,  2.55s/it]                                                 {'loss': 0.9596, 'grad_norm': 28.073619842529297, 'learning_rate': 1.339940635976592e-07, 'fcm_dpo/beta': 0.0024534829426556826, 'fcm_dpo/q_t': 0.36288315057754517, 'fcm_dpo/delta': -0.02453800104558468, 'fcm_dpo/margin': 253.6896209716797, 'margin_dpo/margin_mean': 253.6896209716797, 'margin_dpo/margin_std': 270.79937744140625, 'logps/chosen': -398.2627868652344, 'logps/rejected': -685.5933837890625, 'logps/ref_chosen': -62.69774627685547, 'logps/ref_rejected': -96.33873748779297, 'logits/chosen': -0.5113226175308228, 'logits/rejected': -0.49717050790786743, 'epoch': 0.69}
 69%|██████▉   | 470/681 [21:13<08:58,  2.55s/it] 69%|██████▉   | 471/681 [21:16<08:47,  2.51s/it] 69%|██████▉   | 472/681 [21:18<09:01,  2.59s/it] 69%|██████▉   | 473/681 [21:21<09:09,  2.64s/it] 70%|██████▉   | 474/681 [21:24<09:21,  2.71s/it] 70%|██████▉   | 475/681 [21:27<09:01,  2.63s/it]                                                 {'loss': 1.0046, 'grad_norm': 29.91801643371582, 'learning_rate': 1.2834888035828596e-07, 'fcm_dpo/beta': 0.002478546230122447, 'fcm_dpo/q_t': 0.3776451051235199, 'fcm_dpo/delta': 0.038639336824417114, 'fcm_dpo/margin': 227.10226440429688, 'margin_dpo/margin_mean': 227.10226440429688, 'margin_dpo/margin_std': 276.1416320800781, 'logps/chosen': -366.8069763183594, 'logps/rejected': -625.2091674804688, 'logps/ref_chosen': -61.12194061279297, 'logps/ref_rejected': -92.42192077636719, 'logits/chosen': -0.5382334589958191, 'logits/rejected': -0.5220173597335815, 'epoch': 0.7}
 70%|██████▉   | 475/681 [21:27<09:01,  2.63s/it] 70%|██████▉   | 476/681 [21:29<08:54,  2.61s/it] 70%|███████   | 477/681 [21:32<08:50,  2.60s/it] 70%|███████   | 478/681 [21:34<08:51,  2.62s/it] 70%|███████   | 479/681 [21:37<08:37,  2.56s/it] 70%|███████   | 480/681 [21:39<08:31,  2.55s/it]                                                 {'loss': 1.001, 'grad_norm': 55.00226974487305, 'learning_rate': 1.227838333989088e-07, 'fcm_dpo/beta': 0.0025619766674935818, 'fcm_dpo/q_t': 0.37629732489585876, 'fcm_dpo/delta': 0.04407358169555664, 'fcm_dpo/margin': 217.63076782226562, 'margin_dpo/margin_mean': 217.63070678710938, 'margin_dpo/margin_std': 248.6515350341797, 'logps/chosen': -347.72064208984375, 'logps/rejected': -594.4524536132812, 'logps/ref_chosen': -53.550628662109375, 'logps/ref_rejected': -82.65167999267578, 'logits/chosen': -0.5085734128952026, 'logits/rejected': -0.49212780594825745, 'epoch': 0.7}
 70%|███████   | 480/681 [21:39<08:31,  2.55s/it] 71%|███████   | 481/681 [21:42<08:25,  2.53s/it] 71%|███████   | 482/681 [21:44<08:30,  2.57s/it] 71%|███████   | 483/681 [21:47<08:28,  2.57s/it] 71%|███████   | 484/681 [21:49<08:10,  2.49s/it] 71%|███████   | 485/681 [21:52<08:06,  2.48s/it]                                                 {'loss': 0.9685, 'grad_norm': 38.28968811035156, 'learning_rate': 1.1730258863039347e-07, 'fcm_dpo/beta': 0.0026028165593743324, 'fcm_dpo/q_t': 0.3650123178958893, 'fcm_dpo/delta': -0.024844055995345116, 'fcm_dpo/margin': 239.23391723632812, 'margin_dpo/margin_mean': 239.23391723632812, 'margin_dpo/margin_std': 269.9613037109375, 'logps/chosen': -372.1683654785156, 'logps/rejected': -643.341796875, 'logps/ref_chosen': -60.76704788208008, 'logps/ref_rejected': -92.70649719238281, 'logits/chosen': -0.5096001029014587, 'logits/rejected': -0.5005736351013184, 'epoch': 0.71}
 71%|███████   | 485/681 [21:52<08:06,  2.48s/it] 71%|███████▏  | 486/681 [21:54<07:54,  2.44s/it] 72%|███████▏  | 487/681 [21:57<08:04,  2.50s/it] 72%|███████▏  | 488/681 [21:59<08:08,  2.53s/it] 72%|███████▏  | 489/681 [22:02<08:01,  2.51s/it] 72%|███████▏  | 490/681 [22:05<08:11,  2.57s/it]                                                 {'loss': 0.977, 'grad_norm': 33.77944564819336, 'learning_rate': 1.1190875675987355e-07, 'fcm_dpo/beta': 0.002558878855779767, 'fcm_dpo/q_t': 0.3699950575828552, 'fcm_dpo/delta': 0.009935403242707253, 'fcm_dpo/margin': 230.77432250976562, 'margin_dpo/margin_mean': 230.77432250976562, 'margin_dpo/margin_std': 254.27835083007812, 'logps/chosen': -340.79034423828125, 'logps/rejected': -609.4576416015625, 'logps/ref_chosen': -53.78142547607422, 'logps/ref_rejected': -91.67438507080078, 'logits/chosen': -0.5016877055168152, 'logits/rejected': -0.4948623776435852, 'epoch': 0.72}
 72%|███████▏  | 490/681 [22:05<08:11,  2.57s/it] 72%|███████▏  | 491/681 [22:07<08:02,  2.54s/it] 72%|███████▏  | 492/681 [22:10<08:03,  2.56s/it] 72%|███████▏  | 493/681 [22:12<08:13,  2.63s/it] 73%|███████▎  | 494/681 [22:15<08:04,  2.59s/it] 73%|███████▎  | 495/681 [22:18<08:03,  2.60s/it]                                                 {'loss': 1.021, 'grad_norm': 49.648441314697266, 'learning_rate': 1.0660589091223854e-07, 'fcm_dpo/beta': 0.002750278217718005, 'fcm_dpo/q_t': 0.38119006156921387, 'fcm_dpo/delta': 0.05883105471730232, 'fcm_dpo/margin': 196.99557495117188, 'margin_dpo/margin_mean': 196.99557495117188, 'margin_dpo/margin_std': 244.4354248046875, 'logps/chosen': -345.7253112792969, 'logps/rejected': -565.9747314453125, 'logps/ref_chosen': -58.9004020690918, 'logps/ref_rejected': -82.15424346923828, 'logits/chosen': -0.501973032951355, 'logits/rejected': -0.49266910552978516, 'epoch': 0.73}
 73%|███████▎  | 495/681 [22:18<08:03,  2.60s/it] 73%|███████▎  | 496/681 [22:20<08:08,  2.64s/it] 73%|███████▎  | 497/681 [22:23<08:08,  2.66s/it] 73%|███████▎  | 498/681 [22:26<08:14,  2.70s/it] 73%|███████▎  | 499/681 [22:28<08:00,  2.64s/it] 73%|███████▎  | 500/681 [22:31<07:48,  2.59s/it]                                                 {'loss': 0.9971, 'grad_norm': 48.712711334228516, 'learning_rate': 1.0139748428955333e-07, 'fcm_dpo/beta': 0.002816407708451152, 'fcm_dpo/q_t': 0.37294405698776245, 'fcm_dpo/delta': 0.02024873159825802, 'fcm_dpo/margin': 205.9034423828125, 'margin_dpo/margin_mean': 205.90341186523438, 'margin_dpo/margin_std': 241.8444366455078, 'logps/chosen': -387.0251159667969, 'logps/rejected': -618.7114868164062, 'logps/ref_chosen': -62.13483810424805, 'logps/ref_rejected': -87.91773223876953, 'logits/chosen': -0.5191727876663208, 'logits/rejected': -0.5140315294265747, 'epoch': 0.73}
 73%|███████▎  | 500/681 [22:31<07:48,  2.59s/it] 74%|███████▎  | 501/681 [22:33<07:40,  2.56s/it] 74%|███████▎  | 502/681 [22:36<07:40,  2.57s/it] 74%|███████▍  | 503/681 [22:39<07:44,  2.61s/it] 74%|███████▍  | 504/681 [22:41<07:43,  2.62s/it] 74%|███████▍  | 505/681 [22:44<07:38,  2.61s/it]                                                 {'loss': 0.9598, 'grad_norm': 56.58249282836914, 'learning_rate': 9.628696786995188e-08, 'fcm_dpo/beta': 0.002710042055696249, 'fcm_dpo/q_t': 0.36337199807167053, 'fcm_dpo/delta': -0.02353382483124733, 'fcm_dpo/margin': 229.17935180664062, 'margin_dpo/margin_mean': 229.17935180664062, 'margin_dpo/margin_std': 242.96011352539062, 'logps/chosen': -374.4068298339844, 'logps/rejected': -628.546142578125, 'logps/ref_chosen': -62.631813049316406, 'logps/ref_rejected': -87.59168243408203, 'logits/chosen': -0.5033208131790161, 'logits/rejected': -0.48864540457725525, 'epoch': 0.74}
 74%|███████▍  | 505/681 [22:44<07:38,  2.61s/it] 74%|███████▍  | 506/681 [22:46<07:24,  2.54s/it] 74%|███████▍  | 507/681 [22:49<07:15,  2.50s/it] 75%|███████▍  | 508/681 [22:51<07:28,  2.59s/it] 75%|███████▍  | 509/681 [22:54<07:27,  2.60s/it] 75%|███████▍  | 510/681 [22:57<07:35,  2.67s/it]                                                 {'loss': 0.9892, 'grad_norm': 31.705190658569336, 'learning_rate': 9.127770814751932e-08, 'fcm_dpo/beta': 0.0027464856393635273, 'fcm_dpo/q_t': 0.37243741750717163, 'fcm_dpo/delta': 0.013351870700716972, 'fcm_dpo/margin': 213.7869873046875, 'margin_dpo/margin_mean': 213.7869873046875, 'margin_dpo/margin_std': 251.62619018554688, 'logps/chosen': -376.91949462890625, 'logps/rejected': -621.2413330078125, 'logps/ref_chosen': -60.552574157714844, 'logps/ref_rejected': -91.0874252319336, 'logits/chosen': -0.47533559799194336, 'logits/rejected': -0.4699474275112152, 'epoch': 0.75}
 75%|███████▍  | 510/681 [22:57<07:35,  2.67s/it] 75%|███████▌  | 511/681 [22:59<07:27,  2.63s/it] 75%|███████▌  | 512/681 [23:02<07:06,  2.52s/it] 75%|███████▌  | 513/681 [23:04<07:11,  2.57s/it] 75%|███████▌  | 514/681 [23:07<07:12,  2.59s/it] 76%|███████▌  | 515/681 [23:10<07:14,  2.62s/it]                                                 {'loss': 1.0079, 'grad_norm': 40.00129318237305, 'learning_rate': 8.637300491465272e-08, 'fcm_dpo/beta': 0.0027470688801258802, 'fcm_dpo/q_t': 0.37528282403945923, 'fcm_dpo/delta': 0.029249707236886024, 'fcm_dpo/margin': 208.3932647705078, 'margin_dpo/margin_mean': 208.3932647705078, 'margin_dpo/margin_std': 256.8492736816406, 'logps/chosen': -362.11346435546875, 'logps/rejected': -592.9361572265625, 'logps/ref_chosen': -60.9382438659668, 'logps/ref_rejected': -83.36767578125, 'logits/chosen': -0.4838427007198334, 'logits/rejected': -0.4740561544895172, 'epoch': 0.76}
 76%|███████▌  | 515/681 [23:10<07:14,  2.62s/it] 76%|███████▌  | 516/681 [23:12<06:50,  2.49s/it] 76%|███████▌  | 517/681 [23:14<06:49,  2.50s/it] 76%|███████▌  | 518/681 [23:17<06:56,  2.56s/it] 76%|███████▌  | 519/681 [23:20<07:01,  2.60s/it] 76%|███████▋  | 520/681 [23:22<07:04,  2.64s/it]                                                 {'loss': 0.972, 'grad_norm': 32.118003845214844, 'learning_rate': 8.15760890883607e-08, 'fcm_dpo/beta': 0.002783264499157667, 'fcm_dpo/q_t': 0.3678578734397888, 'fcm_dpo/delta': -0.007280466612428427, 'fcm_dpo/margin': 217.810302734375, 'margin_dpo/margin_mean': 217.810302734375, 'margin_dpo/margin_std': 243.54904174804688, 'logps/chosen': -364.2611999511719, 'logps/rejected': -614.7037963867188, 'logps/ref_chosen': -65.47642517089844, 'logps/ref_rejected': -98.10872650146484, 'logits/chosen': -0.48051896691322327, 'logits/rejected': -0.4790908396244049, 'epoch': 0.76}
 76%|███████▋  | 520/681 [23:22<07:04,  2.64s/it] 77%|███████▋  | 521/681 [23:25<07:06,  2.67s/it] 77%|███████▋  | 522/681 [23:28<06:58,  2.63s/it] 77%|███████▋  | 523/681 [23:31<07:04,  2.69s/it] 77%|███████▋  | 524/681 [23:33<06:58,  2.67s/it] 77%|███████▋  | 525/681 [23:36<06:57,  2.68s/it]                                                 {'loss': 0.9739, 'grad_norm': 43.291744232177734, 'learning_rate': 7.689012058193384e-08, 'fcm_dpo/beta': 0.002879193751141429, 'fcm_dpo/q_t': 0.368082195520401, 'fcm_dpo/delta': 0.00723473122343421, 'fcm_dpo/margin': 205.75973510742188, 'margin_dpo/margin_mean': 205.7597198486328, 'margin_dpo/margin_std': 222.150390625, 'logps/chosen': -354.49664306640625, 'logps/rejected': -584.0665283203125, 'logps/ref_chosen': -59.072021484375, 'logps/ref_rejected': -82.8821792602539, 'logits/chosen': -0.49591636657714844, 'logits/rejected': -0.4880523085594177, 'epoch': 0.77}
 77%|███████▋  | 525/681 [23:36<06:57,  2.68s/it] 77%|███████▋  | 526/681 [23:38<06:47,  2.63s/it] 77%|███████▋  | 527/681 [23:41<06:43,  2.62s/it] 78%|███████▊  | 528/681 [23:44<06:45,  2.65s/it] 78%|███████▊  | 529/681 [23:46<06:42,  2.65s/it] 78%|███████▊  | 530/681 [23:49<06:41,  2.66s/it]                                                 {'loss': 0.985, 'grad_norm': 35.54737091064453, 'learning_rate': 7.231818622338822e-08, 'fcm_dpo/beta': 0.002823830349370837, 'fcm_dpo/q_t': 0.36813658475875854, 'fcm_dpo/delta': -0.012813677079975605, 'fcm_dpo/margin': 216.4855499267578, 'margin_dpo/margin_mean': 216.4855499267578, 'margin_dpo/margin_std': 256.6390380859375, 'logps/chosen': -397.35479736328125, 'logps/rejected': -639.7390747070312, 'logps/ref_chosen': -61.11234664916992, 'logps/ref_rejected': -87.01112365722656, 'logits/chosen': -0.5179253816604614, 'logits/rejected': -0.5039080381393433, 'epoch': 0.78}
 78%|███████▊  | 530/681 [23:49<06:41,  2.66s/it] 78%|███████▊  | 531/681 [23:51<06:17,  2.52s/it] 78%|███████▊  | 532/681 [23:54<06:21,  2.56s/it] 78%|███████▊  | 533/681 [23:57<06:25,  2.60s/it] 78%|███████▊  | 534/681 [23:59<06:20,  2.59s/it] 79%|███████▊  | 535/681 [24:02<06:22,  2.62s/it]                                                 {'loss': 0.9981, 'grad_norm': 48.269222259521484, 'learning_rate': 6.786329772205246e-08, 'fcm_dpo/beta': 0.0028174181934446096, 'fcm_dpo/q_t': 0.3706435561180115, 'fcm_dpo/delta': -0.0029197714757174253, 'fcm_dpo/margin': 213.47830200195312, 'margin_dpo/margin_mean': 213.4783172607422, 'margin_dpo/margin_std': 261.0979919433594, 'logps/chosen': -414.7535705566406, 'logps/rejected': -648.9918212890625, 'logps/ref_chosen': -60.96736526489258, 'logps/ref_rejected': -81.727294921875, 'logits/chosen': -0.5222650766372681, 'logits/rejected': -0.5029199719429016, 'epoch': 0.79}
 79%|███████▊  | 535/681 [24:02<06:22,  2.62s/it] 79%|███████▊  | 536/681 [24:04<06:21,  2.63s/it] 79%|███████▉  | 537/681 [24:07<06:15,  2.61s/it] 79%|███████▉  | 538/681 [24:10<06:12,  2.61s/it] 79%|███████▉  | 539/681 [24:12<06:14,  2.64s/it] 79%|███████▉  | 540/681 [24:15<06:12,  2.64s/it]                                                 {'loss': 0.9397, 'grad_norm': 36.01322937011719, 'learning_rate': 6.352838968463919e-08, 'fcm_dpo/beta': 0.002668160479515791, 'fcm_dpo/q_t': 0.35538631677627563, 'fcm_dpo/delta': -0.07808558642864227, 'fcm_dpo/margin': 251.76071166992188, 'margin_dpo/margin_mean': 251.76071166992188, 'margin_dpo/margin_std': 272.35394287109375, 'logps/chosen': -376.98809814453125, 'logps/rejected': -660.5145874023438, 'logps/ref_chosen': -58.64385986328125, 'logps/ref_rejected': -90.40965270996094, 'logits/chosen': -0.5208684206008911, 'logits/rejected': -0.5084649324417114, 'epoch': 0.79}
 79%|███████▉  | 540/681 [24:15<06:12,  2.64s/it] 79%|███████▉  | 541/681 [24:17<05:58,  2.56s/it] 80%|███████▉  | 542/681 [24:20<05:59,  2.59s/it] 80%|███████▉  | 543/681 [24:23<05:56,  2.58s/it] 80%|███████▉  | 544/681 [24:25<05:51,  2.57s/it] 80%|████████  | 545/681 [24:28<05:54,  2.61s/it]                                                 {'loss': 0.9969, 'grad_norm': 34.583797454833984, 'learning_rate': 5.9316317682106294e-08, 'fcm_dpo/beta': 0.002645547967404127, 'fcm_dpo/q_t': 0.3734440207481384, 'fcm_dpo/delta': 0.01414306741207838, 'fcm_dpo/margin': 221.38949584960938, 'margin_dpo/margin_mean': 221.38949584960938, 'margin_dpo/margin_std': 267.8731384277344, 'logps/chosen': -415.88970947265625, 'logps/rejected': -672.986572265625, 'logps/ref_chosen': -64.73474884033203, 'logps/ref_rejected': -100.44208526611328, 'logits/chosen': -0.5391398668289185, 'logits/rejected': -0.5384151339530945, 'epoch': 0.8}
 80%|████████  | 545/681 [24:28<05:54,  2.61s/it] 80%|████████  | 546/681 [24:30<05:48,  2.58s/it] 80%|████████  | 547/681 [24:33<05:52,  2.63s/it] 80%|████████  | 548/681 [24:36<05:44,  2.59s/it] 81%|████████  | 549/681 [24:38<05:37,  2.55s/it] 81%|████████  | 550/681 [24:41<05:35,  2.56s/it]                                                 {'loss': 1.009, 'grad_norm': 35.05332565307617, 'learning_rate': 5.5229856368582376e-08, 'fcm_dpo/beta': 0.002687679138034582, 'fcm_dpo/q_t': 0.37848031520843506, 'fcm_dpo/delta': 0.049287859350442886, 'fcm_dpo/margin': 205.9238739013672, 'margin_dpo/margin_mean': 205.9238739013672, 'margin_dpo/margin_std': 250.6122283935547, 'logps/chosen': -401.68536376953125, 'logps/rejected': -635.6260986328125, 'logps/ref_chosen': -59.13951873779297, 'logps/ref_rejected': -87.15635681152344, 'logits/chosen': -0.5319250226020813, 'logits/rejected': -0.523718535900116, 'epoch': 0.81}
 81%|████████  | 550/681 [24:41<05:35,  2.56s/it] 81%|████████  | 551/681 [24:43<05:27,  2.52s/it] 81%|████████  | 552/681 [24:45<05:20,  2.48s/it] 81%|████████  | 553/681 [24:48<05:21,  2.51s/it] 81%|████████▏ | 554/681 [24:51<05:21,  2.53s/it] 81%|████████▏ | 555/681 [24:53<05:14,  2.49s/it]                                                 {'loss': 0.9221, 'grad_norm': 34.610145568847656, 'learning_rate': 5.127169765359515e-08, 'fcm_dpo/beta': 0.002561022061854601, 'fcm_dpo/q_t': 0.3499818444252014, 'fcm_dpo/delta': -0.10589297860860825, 'fcm_dpo/margin': 271.74420166015625, 'margin_dpo/margin_mean': 271.74420166015625, 'margin_dpo/margin_std': 282.8084411621094, 'logps/chosen': -394.1856384277344, 'logps/rejected': -706.2490844726562, 'logps/ref_chosen': -62.1995849609375, 'logps/ref_rejected': -102.51883697509766, 'logits/chosen': -0.5212115049362183, 'logits/rejected': -0.5161057114601135, 'epoch': 0.81}
 81%|████████▏ | 555/681 [24:53<05:14,  2.49s/it] 82%|████████▏ | 556/681 [24:56<05:21,  2.57s/it] 82%|████████▏ | 557/681 [24:58<05:21,  2.59s/it] 82%|████████▏ | 558/681 [25:01<05:19,  2.60s/it] 82%|████████▏ | 559/681 [25:04<05:15,  2.58s/it] 82%|████████▏ | 560/681 [25:06<05:18,  2.63s/it]                                                 {'loss': 0.983, 'grad_norm': 34.969547271728516, 'learning_rate': 4.7444448928806615e-08, 'fcm_dpo/beta': 0.0024848259054124355, 'fcm_dpo/q_t': 0.3717556595802307, 'fcm_dpo/delta': 0.015132618136703968, 'fcm_dpo/margin': 235.41403198242188, 'margin_dpo/margin_mean': 235.41403198242188, 'margin_dpo/margin_std': 259.69488525390625, 'logps/chosen': -410.2688903808594, 'logps/rejected': -681.5159912109375, 'logps/ref_chosen': -61.541908264160156, 'logps/ref_rejected': -97.37491607666016, 'logits/chosen': -0.5141924619674683, 'logits/rejected': -0.5002972483634949, 'epoch': 0.82}
 82%|████████▏ | 560/681 [25:06<05:18,  2.63s/it] 82%|████████▏ | 561/681 [25:09<05:09,  2.58s/it] 83%|████████▎ | 562/681 [25:11<05:11,  2.61s/it] 83%|████████▎ | 563/681 [25:14<04:59,  2.54s/it] 83%|████████▎ | 564/681 [25:16<04:55,  2.52s/it] 83%|████████▎ | 565/681 [25:19<05:00,  2.59s/it]                                                 {'loss': 0.9922, 'grad_norm': 35.28373718261719, 'learning_rate': 4.375063135042445e-08, 'fcm_dpo/beta': 0.0025754589587450027, 'fcm_dpo/q_t': 0.37311750650405884, 'fcm_dpo/delta': 0.02127731405198574, 'fcm_dpo/margin': 224.775634765625, 'margin_dpo/margin_mean': 224.775634765625, 'margin_dpo/margin_std': 259.5643005371094, 'logps/chosen': -427.0626525878906, 'logps/rejected': -682.8226318359375, 'logps/ref_chosen': -62.85475540161133, 'logps/ref_rejected': -93.8392105102539, 'logits/chosen': -0.48246508836746216, 'logits/rejected': -0.4706944525241852, 'epoch': 0.83}
 83%|████████▎ | 565/681 [25:19<05:00,  2.59s/it] 83%|████████▎ | 566/681 [25:22<05:00,  2.61s/it] 83%|████████▎ | 567/681 [25:24<04:47,  2.52s/it] 83%|████████▎ | 568/681 [25:26<04:43,  2.51s/it] 84%|████████▎ | 569/681 [25:29<04:47,  2.56s/it] 84%|████████▎ | 570/681 [25:32<04:49,  2.61s/it]                                                 {'loss': 0.9792, 'grad_norm': 32.344730377197266, 'learning_rate': 4.019267817841834e-08, 'fcm_dpo/beta': 0.0025527041871100664, 'fcm_dpo/q_t': 0.3671664595603943, 'fcm_dpo/delta': -0.007842612452805042, 'fcm_dpo/margin': 237.66757202148438, 'margin_dpo/margin_mean': 237.66757202148438, 'margin_dpo/margin_std': 269.2391052246094, 'logps/chosen': -414.8893127441406, 'logps/rejected': -682.4862060546875, 'logps/ref_chosen': -57.98622512817383, 'logps/ref_rejected': -87.91555786132812, 'logits/chosen': -0.49153321981430054, 'logits/rejected': -0.4876040816307068, 'epoch': 0.84}
 84%|████████▎ | 570/681 [25:32<04:49,  2.61s/it] 84%|████████▍ | 571/681 [25:34<04:45,  2.60s/it] 84%|████████▍ | 572/681 [25:37<04:35,  2.52s/it] 84%|████████▍ | 573/681 [25:39<04:23,  2.44s/it] 84%|████████▍ | 574/681 [25:42<04:30,  2.53s/it] 84%|████████▍ | 575/681 [25:44<04:31,  2.56s/it]                                                 {'loss': 0.9947, 'grad_norm': 46.91700744628906, 'learning_rate': 3.677293317363864e-08, 'fcm_dpo/beta': 0.002516696462407708, 'fcm_dpo/q_t': 0.36822399497032166, 'fcm_dpo/delta': -0.01592089980840683, 'fcm_dpo/margin': 243.9696044921875, 'margin_dpo/margin_mean': 243.9696044921875, 'margin_dpo/margin_std': 302.0916748046875, 'logps/chosen': -424.9076232910156, 'logps/rejected': -703.3653564453125, 'logps/ref_chosen': -55.194114685058594, 'logps/ref_rejected': -89.68229675292969, 'logits/chosen': -0.4880523085594177, 'logits/rejected': -0.4857984483242035, 'epoch': 0.84}
 84%|████████▍ | 575/681 [25:44<04:31,  2.56s/it] 85%|████████▍ | 576/681 [25:47<04:22,  2.50s/it] 85%|████████▍ | 577/681 [25:49<04:19,  2.50s/it] 85%|████████▍ | 578/681 [25:52<04:20,  2.53s/it] 85%|████████▌ | 579/681 [25:54<04:20,  2.55s/it] 85%|████████▌ | 580/681 [25:57<04:21,  2.59s/it]                                                 {'loss': 0.9794, 'grad_norm': 26.867847442626953, 'learning_rate': 3.349364905389032e-08, 'fcm_dpo/beta': 0.0025378705468028784, 'fcm_dpo/q_t': 0.36850807070732117, 'fcm_dpo/delta': 0.005721461959183216, 'fcm_dpo/margin': 233.96383666992188, 'margin_dpo/margin_mean': 233.9638214111328, 'margin_dpo/margin_std': 259.25726318359375, 'logps/chosen': -380.11614990234375, 'logps/rejected': -648.4356689453125, 'logps/ref_chosen': -54.605796813964844, 'logps/ref_rejected': -88.9614486694336, 'logits/chosen': -0.49183306097984314, 'logits/rejected': -0.4879623055458069, 'epoch': 0.85}
 85%|████████▌ | 580/681 [25:57<04:21,  2.59s/it] 85%|████████▌ | 581/681 [26:00<04:14,  2.55s/it] 85%|████████▌ | 582/681 [26:02<04:16,  2.59s/it] 86%|████████▌ | 583/681 [26:05<04:15,  2.61s/it] 86%|████████▌ | 584/681 [26:07<04:07,  2.55s/it] 86%|████████▌ | 585/681 [26:10<04:03,  2.53s/it]                                                 {'loss': 0.9843, 'grad_norm': 38.553314208984375, 'learning_rate': 3.035698600998121e-08, 'fcm_dpo/beta': 0.002550755860283971, 'fcm_dpo/q_t': 0.36916983127593994, 'fcm_dpo/delta': 0.00011723488569259644, 'fcm_dpo/margin': 234.6815185546875, 'margin_dpo/margin_mean': 234.6815185546875, 'margin_dpo/margin_std': 265.8410339355469, 'logps/chosen': -393.91827392578125, 'logps/rejected': -663.9650268554688, 'logps/ref_chosen': -59.03770065307617, 'logps/ref_rejected': -94.4029541015625, 'logits/chosen': -0.52159583568573, 'logits/rejected': -0.5172958970069885, 'epoch': 0.86}
 86%|████████▌ | 585/681 [26:10<04:03,  2.53s/it] 86%|████████▌ | 586/681 [26:12<03:59,  2.52s/it] 86%|████████▌ | 587/681 [26:15<03:58,  2.53s/it] 86%|████████▋ | 588/681 [26:17<03:49,  2.46s/it] 86%|████████▋ | 589/681 [26:20<03:49,  2.49s/it] 87%|████████▋ | 590/681 [26:22<03:43,  2.46s/it]                                                 {'loss': 0.9663, 'grad_norm': 31.69843101501465, 'learning_rate': 2.736501028272095e-08, 'fcm_dpo/beta': 0.0025425164494663477, 'fcm_dpo/q_t': 0.36495503783226013, 'fcm_dpo/delta': -0.02153742127120495, 'fcm_dpo/margin': 243.96188354492188, 'margin_dpo/margin_mean': 243.96188354492188, 'margin_dpo/margin_std': 272.521728515625, 'logps/chosen': -374.412353515625, 'logps/rejected': -664.7607421875, 'logps/ref_chosen': -53.5163688659668, 'logps/ref_rejected': -99.90290832519531, 'logits/chosen': -0.500575602054596, 'logits/rejected': -0.5034629702568054, 'epoch': 0.87}
 87%|████████▋ | 590/681 [26:22<03:43,  2.46s/it] 87%|████████▋ | 591/681 [26:24<03:30,  2.34s/it] 87%|████████▋ | 592/681 [26:27<03:30,  2.36s/it] 87%|████████▋ | 593/681 [26:29<03:39,  2.49s/it] 87%|████████▋ | 594/681 [26:32<03:36,  2.49s/it] 87%|████████▋ | 595/681 [26:34<03:36,  2.52s/it]                                                 {'loss': 1.0148, 'grad_norm': 27.417510986328125, 'learning_rate': 2.451969280180849e-08, 'fcm_dpo/beta': 0.002531964797526598, 'fcm_dpo/q_t': 0.37717491388320923, 'fcm_dpo/delta': 0.040782030671834946, 'fcm_dpo/margin': 221.4866485595703, 'margin_dpo/margin_mean': 221.4866485595703, 'margin_dpo/margin_std': 274.03509521484375, 'logps/chosen': -368.6888427734375, 'logps/rejected': -616.1609497070312, 'logps/ref_chosen': -51.44538497924805, 'logps/ref_rejected': -77.43083190917969, 'logits/chosen': -0.4844892621040344, 'logits/rejected': -0.463656485080719, 'epoch': 0.87}
 87%|████████▋ | 595/681 [26:35<03:36,  2.52s/it] 88%|████████▊ | 596/681 [26:37<03:35,  2.54s/it] 88%|████████▊ | 597/681 [26:40<03:34,  2.55s/it] 88%|████████▊ | 598/681 [26:42<03:26,  2.49s/it] 88%|████████▊ | 599/681 [26:45<03:31,  2.58s/it] 88%|████████▊ | 600/681 [26:47<03:31,  2.61s/it]                                                 {'loss': 0.9964, 'grad_norm': 38.589534759521484, 'learning_rate': 2.1822907887504932e-08, 'fcm_dpo/beta': 0.002594124060124159, 'fcm_dpo/q_t': 0.3721489906311035, 'fcm_dpo/delta': 0.02012869343161583, 'fcm_dpo/margin': 223.6268310546875, 'margin_dpo/margin_mean': 223.6268310546875, 'margin_dpo/margin_std': 261.2717590332031, 'logps/chosen': -383.90936279296875, 'logps/rejected': -638.107177734375, 'logps/ref_chosen': -57.161705017089844, 'logps/ref_rejected': -87.73274230957031, 'logits/chosen': -0.4984382688999176, 'logits/rejected': -0.4893369674682617, 'epoch': 0.88}
 88%|████████▊ | 600/681 [26:47<03:31,  2.61s/it][INFO|trainer.py:4307] 2026-04-21 23:01:26,880 >> 
***** Running Evaluation *****
[INFO|trainer.py:4309] 2026-04-21 23:01:26,880 >>   Num examples = 2339
[INFO|trainer.py:4312] 2026-04-21 23:01:26,880 >>   Batch size = 8

  0%|          | 0/73 [00:00<?, ?it/s][A
  3%|▎         | 2/73 [00:00<00:19,  3.66it/s][A
  4%|▍         | 3/73 [00:01<00:27,  2.58it/s][A
  5%|▌         | 4/73 [00:01<00:30,  2.27it/s][A
  7%|▋         | 5/73 [00:02<00:32,  2.10it/s][A
  8%|▊         | 6/73 [00:02<00:33,  2.00it/s][A
 10%|▉         | 7/73 [00:03<00:31,  2.08it/s][A
 11%|█         | 8/73 [00:03<00:33,  1.94it/s][A
 12%|█▏        | 9/73 [00:04<00:34,  1.88it/s][A
 14%|█▎        | 10/73 [00:04<00:33,  1.86it/s][A
 15%|█▌        | 11/73 [00:05<00:33,  1.86it/s][A
 16%|█▋        | 12/73 [00:05<00:33,  1.81it/s][A
 18%|█▊        | 13/73 [00:06<00:32,  1.86it/s][A
 19%|█▉        | 14/73 [00:07<00:32,  1.83it/s][A
 21%|██        | 15/73 [00:07<00:31,  1.83it/s][A
 22%|██▏       | 16/73 [00:08<00:32,  1.78it/s][A
 23%|██▎       | 17/73 [00:08<00:31,  1.77it/s][A
 25%|██▍       | 18/73 [00:09<00:31,  1.75it/s][A
 26%|██▌       | 19/73 [00:09<00:31,  1.73it/s][A
 27%|██▋       | 20/73 [00:10<00:30,  1.72it/s][A
 29%|██▉       | 21/73 [00:11<00:30,  1.72it/s][A
 30%|███       | 22/73 [00:11<00:30,  1.69it/s][A
 32%|███▏      | 23/73 [00:12<00:28,  1.74it/s][A
 33%|███▎      | 24/73 [00:12<00:27,  1.76it/s][A
 34%|███▍      | 25/73 [00:13<00:27,  1.74it/s][A
 36%|███▌      | 26/73 [00:13<00:26,  1.76it/s][A
 37%|███▋      | 27/73 [00:14<00:23,  1.95it/s][A
 38%|███▊      | 28/73 [00:14<00:23,  1.90it/s][A
 40%|███▉      | 29/73 [00:15<00:22,  1.93it/s][A
 41%|████      | 30/73 [00:15<00:22,  1.95it/s][A
 42%|████▏     | 31/73 [00:16<00:22,  1.87it/s][A
 44%|████▍     | 32/73 [00:17<00:21,  1.90it/s][A
 45%|████▌     | 33/73 [00:17<00:20,  1.93it/s][A
 47%|████▋     | 34/73 [00:18<00:20,  1.89it/s][A
 48%|████▊     | 35/73 [00:18<00:20,  1.82it/s][A
 49%|████▉     | 36/73 [00:19<00:20,  1.83it/s][A
 51%|█████     | 37/73 [00:19<00:20,  1.79it/s][A
 52%|█████▏    | 38/73 [00:20<00:18,  1.89it/s][A
 53%|█████▎    | 39/73 [00:20<00:18,  1.81it/s][A
 55%|█████▍    | 40/73 [00:21<00:18,  1.83it/s][A
 56%|█████▌    | 41/73 [00:21<00:16,  1.90it/s][A
 58%|█████▊    | 42/73 [00:22<00:16,  1.84it/s][A
 59%|█████▉    | 43/73 [00:22<00:16,  1.87it/s][A
 60%|██████    | 44/73 [00:23<00:15,  1.86it/s][A
 62%|██████▏   | 45/73 [00:24<00:15,  1.79it/s][A
 63%|██████▎   | 46/73 [00:24<00:14,  1.87it/s][A
 64%|██████▍   | 47/73 [00:25<00:14,  1.84it/s][A
 66%|██████▌   | 48/73 [00:25<00:13,  1.83it/s][A
 67%|██████▋   | 49/73 [00:26<00:13,  1.81it/s][A
 68%|██████▊   | 50/73 [00:26<00:12,  1.83it/s][A
 70%|██████▉   | 51/73 [00:27<00:12,  1.80it/s][A
 71%|███████   | 52/73 [00:27<00:11,  1.76it/s][A
 73%|███████▎  | 53/73 [00:28<00:11,  1.73it/s][A
 74%|███████▍  | 54/73 [00:29<00:10,  1.84it/s][A
 75%|███████▌  | 55/73 [00:29<00:09,  1.83it/s][A
 77%|███████▋  | 56/73 [00:30<00:09,  1.87it/s][A
 78%|███████▊  | 57/73 [00:30<00:08,  1.80it/s][A
 79%|███████▉  | 58/73 [00:31<00:08,  1.87it/s][A
 81%|████████  | 59/73 [00:31<00:07,  1.87it/s][A
 82%|████████▏ | 60/73 [00:32<00:07,  1.84it/s][A
 84%|████████▎ | 61/73 [00:32<00:06,  1.83it/s][A
 85%|████████▍ | 62/73 [00:33<00:06,  1.80it/s][A
 86%|████████▋ | 63/73 [00:33<00:05,  1.91it/s][A
 88%|████████▊ | 64/73 [00:34<00:04,  1.98it/s][A
 89%|████████▉ | 65/73 [00:34<00:04,  1.94it/s][A
 90%|█████████ | 66/73 [00:35<00:03,  1.86it/s][A
 92%|█████████▏| 67/73 [00:35<00:03,  1.90it/s][A
 93%|█████████▎| 68/73 [00:36<00:02,  1.85it/s][A
 95%|█████████▍| 69/73 [00:37<00:02,  1.82it/s][A
 96%|█████████▌| 70/73 [00:37<00:01,  1.81it/s][A
 97%|█████████▋| 71/73 [00:38<00:01,  1.83it/s][A
 99%|█████████▊| 72/73 [00:38<00:00,  1.83it/s][A
100%|██████████| 73/73 [00:39<00:00,  1.99it/s][A                                                 
                                               [A{'eval_loss': 0.55719393491745, 'eval_runtime': 39.7472, 'eval_samples_per_second': 58.847, 'eval_steps_per_second': 1.862, 'eval_fcm_dpo/beta': 0.003444387810304761, 'eval_fcm_dpo/q_t': 0.39142969250679016, 'eval_fcm_dpo/delta': 0.05230085551738739, 'eval_fcm_dpo/margin': 156.23291015625, 'eval_margin_dpo/margin_mean': 156.23291015625, 'eval_margin_dpo/margin_std': 271.4756774902344, 'eval_logps/chosen': -459.30078125, 'eval_logps/rejected': -623.2805786132812, 'eval_logps/ref_chosen': -79.05104064941406, 'eval_logps/ref_rejected': -86.79793548583984, 'eval_logits/chosen': -0.5275665521621704, 'eval_logits/rejected': -0.5133021473884583, 'epoch': 0.88}
 88%|████████▊ | 600/681 [27:27<03:31,  2.61s/it]
100%|██████████| 73/73 [00:39<00:00,  1.99it/s][A
                                               [A 88%|████████▊ | 601/681 [27:30<19:15, 14.45s/it] 88%|████████▊ | 602/681 [27:32<14:18, 10.87s/it] 89%|████████▊ | 603/681 [27:34<10:49,  8.33s/it] 89%|████████▊ | 604/681 [27:37<08:32,  6.65s/it] 89%|████████▉ | 605/681 [27:40<06:54,  5.46s/it]                                                 {'loss': 0.8815, 'grad_norm': 34.93064498901367, 'learning_rate': 1.9276432015946446e-08, 'fcm_dpo/beta': 0.0032743208575993776, 'fcm_dpo/q_t': 0.32824546098709106, 'fcm_dpo/delta': -0.2591201961040497, 'fcm_dpo/margin': 255.2403106689453, 'margin_dpo/margin_mean': 255.2403106689453, 'margin_dpo/margin_std': 277.72467041015625, 'logps/chosen': -369.64263916015625, 'logps/rejected': -662.0820922851562, 'logps/ref_chosen': -58.169830322265625, 'logps/ref_rejected': -95.36891174316406, 'logits/chosen': -0.5040395855903625, 'logits/rejected': -0.4974172115325928, 'epoch': 0.89}
 89%|████████▉ | 605/681 [27:40<06:54,  5.46s/it] 89%|████████▉ | 606/681 [27:42<05:40,  4.54s/it] 89%|████████▉ | 607/681 [27:45<04:53,  3.97s/it] 89%|████████▉ | 608/681 [27:47<04:14,  3.49s/it] 89%|████████▉ | 609/681 [27:50<03:45,  3.13s/it] 90%|████████▉ | 610/681 [27:52<03:25,  2.90s/it]                                                 {'loss': 0.9375, 'grad_norm': 36.279544830322266, 'learning_rate': 1.6881942648911074e-08, 'fcm_dpo/beta': 0.0028547747060656548, 'fcm_dpo/q_t': 0.3554316461086273, 'fcm_dpo/delta': -0.07051874697208405, 'fcm_dpo/margin': 233.07736206054688, 'margin_dpo/margin_mean': 233.07736206054688, 'margin_dpo/margin_std': 247.29598999023438, 'logps/chosen': -370.6011047363281, 'logps/rejected': -633.7362670898438, 'logps/ref_chosen': -58.97087860107422, 'logps/ref_rejected': -89.0286865234375, 'logits/chosen': -0.5211396813392639, 'logits/rejected': -0.5063233971595764, 'epoch': 0.9}
 90%|████████▉ | 610/681 [27:52<03:25,  2.90s/it] 90%|████████▉ | 611/681 [27:54<03:10,  2.73s/it] 90%|████████▉ | 612/681 [27:57<02:59,  2.61s/it] 90%|█████████ | 613/681 [27:59<02:55,  2.58s/it] 90%|█████████ | 614/681 [28:02<02:51,  2.55s/it] 90%|█████████ | 615/681 [28:04<02:50,  2.59s/it]                                                 {'loss': 0.9241, 'grad_norm': 35.62370300292969, 'learning_rate': 1.4641017128809801e-08, 'fcm_dpo/beta': 0.0026367397513240576, 'fcm_dpo/q_t': 0.3541339635848999, 'fcm_dpo/delta': -0.06413199007511139, 'fcm_dpo/margin': 249.89028930664062, 'margin_dpo/margin_mean': 249.89022827148438, 'margin_dpo/margin_std': 243.20175170898438, 'logps/chosen': -372.3035583496094, 'logps/rejected': -660.0335083007812, 'logps/ref_chosen': -58.081878662109375, 'logps/ref_rejected': -95.92155456542969, 'logits/chosen': -0.4915865361690521, 'logits/rejected': -0.5005960464477539, 'epoch': 0.9}
 90%|█████████ | 615/681 [28:04<02:50,  2.59s/it] 90%|█████████ | 616/681 [28:07<02:51,  2.64s/it] 91%|█████████ | 617/681 [28:10<02:47,  2.62s/it] 91%|█████████ | 618/681 [28:12<02:44,  2.62s/it] 91%|█████████ | 619/681 [28:15<02:41,  2.60s/it] 91%|█████████ | 620/681 [28:17<02:35,  2.56s/it]                                                 {'loss': 1.0346, 'grad_norm': 41.11799240112305, 'learning_rate': 1.2555131639630567e-08, 'fcm_dpo/beta': 0.002739082556217909, 'fcm_dpo/q_t': 0.3842490315437317, 'fcm_dpo/delta': 0.0633806362748146, 'fcm_dpo/margin': 196.49574279785156, 'margin_dpo/margin_mean': 196.49574279785156, 'margin_dpo/margin_std': 260.45947265625, 'logps/chosen': -404.1942138671875, 'logps/rejected': -619.023681640625, 'logps/ref_chosen': -62.203094482421875, 'logps/ref_rejected': -80.53683471679688, 'logits/chosen': -0.4931033253669739, 'logits/rejected': -0.477125346660614, 'epoch': 0.91}
 91%|█████████ | 620/681 [28:17<02:35,  2.56s/it] 91%|█████████ | 621/681 [28:20<02:33,  2.56s/it] 91%|█████████▏| 622/681 [28:22<02:31,  2.56s/it] 91%|█████████▏| 623/681 [28:25<02:21,  2.44s/it] 92%|█████████▏| 624/681 [28:27<02:19,  2.45s/it] 92%|█████████▏| 625/681 [28:29<02:18,  2.47s/it]                                                 {'loss': 0.9522, 'grad_norm': 37.73185348510742, 'learning_rate': 1.0625660234518913e-08, 'fcm_dpo/beta': 0.0026761619374156, 'fcm_dpo/q_t': 0.3606039881706238, 'fcm_dpo/delta': -0.042652104049921036, 'fcm_dpo/margin': 238.6814727783203, 'margin_dpo/margin_mean': 238.68148803710938, 'margin_dpo/margin_std': 257.99114990234375, 'logps/chosen': -384.24359130859375, 'logps/rejected': -649.6363525390625, 'logps/ref_chosen': -61.727455139160156, 'logps/ref_rejected': -88.4387435913086, 'logits/chosen': -0.49364280700683594, 'logits/rejected': -0.48199111223220825, 'epoch': 0.92}
 92%|█████████▏| 625/681 [28:30<02:18,  2.47s/it] 92%|█████████▏| 626/681 [28:32<02:21,  2.58s/it] 92%|█████████▏| 627/681 [28:35<02:22,  2.63s/it] 92%|█████████▏| 628/681 [28:38<02:17,  2.60s/it] 92%|█████████▏| 629/681 [28:40<02:16,  2.62s/it] 93%|█████████▎| 630/681 [28:43<02:13,  2.62s/it]                                                 {'loss': 0.9872, 'grad_norm': 40.86648178100586, 'learning_rate': 8.85387393063622e-09, 'fcm_dpo/beta': 0.002640167949721217, 'fcm_dpo/q_t': 0.3729027211666107, 'fcm_dpo/delta': 0.01016196422278881, 'fcm_dpo/margin': 223.45654296875, 'margin_dpo/margin_mean': 223.45654296875, 'margin_dpo/margin_std': 258.1217956542969, 'logps/chosen': -378.8038024902344, 'logps/rejected': -637.5016479492188, 'logps/ref_chosen': -61.30865478515625, 'logps/ref_rejected': -96.54997253417969, 'logits/chosen': -0.4925254285335541, 'logits/rejected': -0.48594093322753906, 'epoch': 0.93}
 93%|█████████▎| 630/681 [28:43<02:13,  2.62s/it] 93%|█████████▎| 631/681 [28:45<02:08,  2.58s/it] 93%|█████████▎| 632/681 [28:48<02:02,  2.49s/it] 93%|█████████▎| 633/681 [28:50<01:59,  2.50s/it] 93%|█████████▎| 634/681 [28:53<01:58,  2.53s/it] 93%|█████████▎| 635/681 [28:55<01:55,  2.52s/it]                                                 {'loss': 1.0422, 'grad_norm': 37.90126419067383, 'learning_rate': 7.240939871891699e-09, 'fcm_dpo/beta': 0.0027915460523217916, 'fcm_dpo/q_t': 0.38567864894866943, 'fcm_dpo/delta': 0.07615941017866135, 'fcm_dpo/margin': 189.08535766601562, 'margin_dpo/margin_mean': 189.08535766601562, 'margin_dpo/margin_std': 255.0254364013672, 'logps/chosen': -401.56622314453125, 'logps/rejected': -616.5842895507812, 'logps/ref_chosen': -63.7315673828125, 'logps/ref_rejected': -89.66435241699219, 'logits/chosen': -0.49808454513549805, 'logits/rejected': -0.4813234806060791, 'epoch': 0.93}
 93%|█████████▎| 635/681 [28:55<01:55,  2.52s/it] 93%|█████████▎| 636/681 [28:58<01:55,  2.56s/it] 94%|█████████▎| 637/681 [29:00<01:52,  2.55s/it] 94%|█████████▎| 638/681 [29:03<01:51,  2.59s/it] 94%|█████████▍| 639/681 [29:06<01:50,  2.62s/it] 94%|█████████▍| 640/681 [29:09<01:48,  2.64s/it]                                                 {'loss': 0.9492, 'grad_norm': 34.88581085205078, 'learning_rate': 5.7879205600998296e-09, 'fcm_dpo/beta': 0.002841885667294264, 'fcm_dpo/q_t': 0.35998988151550293, 'fcm_dpo/delta': -0.047639258205890656, 'fcm_dpo/margin': 226.51620483398438, 'margin_dpo/margin_mean': 226.51620483398438, 'margin_dpo/margin_std': 240.34689331054688, 'logps/chosen': -379.24822998046875, 'logps/rejected': -635.0973510742188, 'logps/ref_chosen': -59.17915725708008, 'logps/ref_rejected': -88.51210021972656, 'logits/chosen': -0.4770120084285736, 'logits/rejected': -0.46177831292152405, 'epoch': 0.94}
 94%|█████████▍| 640/681 [29:09<01:48,  2.64s/it] 94%|█████████▍| 641/681 [29:11<01:44,  2.61s/it] 94%|█████████▍| 642/681 [29:14<01:40,  2.57s/it] 94%|█████████▍| 643/681 [29:16<01:39,  2.61s/it] 95%|█████████▍| 644/681 [29:19<01:36,  2.61s/it] 95%|█████████▍| 645/681 [29:22<01:34,  2.63s/it]                                                 {'loss': 1.0362, 'grad_norm': 49.77201461791992, 'learning_rate': 4.495773155069299e-09, 'fcm_dpo/beta': 0.0027807278092950583, 'fcm_dpo/q_t': 0.3824850618839264, 'fcm_dpo/delta': 0.045675117522478104, 'fcm_dpo/margin': 200.19139099121094, 'margin_dpo/margin_mean': 200.19139099121094, 'margin_dpo/margin_std': 274.2567138671875, 'logps/chosen': -392.8785400390625, 'logps/rejected': -627.488037109375, 'logps/ref_chosen': -59.50596237182617, 'logps/ref_rejected': -93.92404174804688, 'logits/chosen': -0.5024424195289612, 'logits/rejected': -0.4973903298377991, 'epoch': 0.95}
 95%|█████████▍| 645/681 [29:22<01:34,  2.63s/it] 95%|█████████▍| 646/681 [29:24<01:29,  2.56s/it] 95%|█████████▌| 647/681 [29:27<01:28,  2.60s/it] 95%|█████████▌| 648/681 [29:29<01:23,  2.53s/it] 95%|█████████▌| 649/681 [29:32<01:22,  2.56s/it] 95%|█████████▌| 650/681 [29:34<01:18,  2.54s/it]                                                 {'loss': 0.983, 'grad_norm': 32.262725830078125, 'learning_rate': 3.3653488440851253e-09, 'fcm_dpo/beta': 0.0028442046605050564, 'fcm_dpo/q_t': 0.3662676215171814, 'fcm_dpo/delta': -0.03724042326211929, 'fcm_dpo/margin': 222.9950408935547, 'margin_dpo/margin_mean': 222.9950408935547, 'margin_dpo/margin_std': 272.8062438964844, 'logps/chosen': -373.74139404296875, 'logps/rejected': -628.5778198242188, 'logps/ref_chosen': -57.774566650390625, 'logps/ref_rejected': -89.61600494384766, 'logits/chosen': -0.4864223003387451, 'logits/rejected': -0.4813409745693207, 'epoch': 0.95}
 95%|█████████▌| 650/681 [29:34<01:18,  2.54s/it] 96%|█████████▌| 651/681 [29:37<01:16,  2.57s/it] 96%|█████████▌| 652/681 [29:39<01:14,  2.57s/it] 96%|█████████▌| 653/681 [29:42<01:12,  2.57s/it] 96%|█████████▌| 654/681 [29:44<01:09,  2.57s/it] 96%|█████████▌| 655/681 [29:47<01:05,  2.54s/it]                                                 {'loss': 0.9655, 'grad_norm': 33.339229583740234, 'learning_rate': 2.397392281198729e-09, 'fcm_dpo/beta': 0.002694058697670698, 'fcm_dpo/q_t': 0.36482754349708557, 'fcm_dpo/delta': -0.033371347934007645, 'fcm_dpo/margin': 234.06857299804688, 'margin_dpo/margin_mean': 234.06857299804688, 'margin_dpo/margin_std': 270.1910705566406, 'logps/chosen': -366.3544006347656, 'logps/rejected': -647.1470947265625, 'logps/ref_chosen': -55.68403244018555, 'logps/ref_rejected': -102.4081802368164, 'logits/chosen': -0.490518182516098, 'logits/rejected': -0.4940160810947418, 'epoch': 0.96}
 96%|█████████▌| 655/681 [29:47<01:05,  2.54s/it] 96%|█████████▋| 656/681 [29:50<01:05,  2.60s/it] 96%|█████████▋| 657/681 [29:52<00:59,  2.49s/it] 97%|█████████▋| 658/681 [29:54<00:56,  2.46s/it] 97%|█████████▋| 659/681 [29:57<00:55,  2.54s/it] 97%|█████████▋| 660/681 [29:59<00:52,  2.50s/it]                                                 {'loss': 0.9108, 'grad_norm': 35.18833541870117, 'learning_rate': 1.592541096695571e-09, 'fcm_dpo/beta': 0.002519825007766485, 'fcm_dpo/q_t': 0.3513564467430115, 'fcm_dpo/delta': -0.08081191033124924, 'fcm_dpo/margin': 267.1984558105469, 'margin_dpo/margin_mean': 267.1984558105469, 'margin_dpo/margin_std': 252.93112182617188, 'logps/chosen': -370.0708312988281, 'logps/rejected': -672.2614135742188, 'logps/ref_chosen': -59.19981002807617, 'logps/ref_rejected': -94.19200134277344, 'logits/chosen': -0.4812515676021576, 'logits/rejected': -0.4766325354576111, 'epoch': 0.97}
 97%|█████████▋| 660/681 [29:59<00:52,  2.50s/it] 97%|█████████▋| 661/681 [30:02<00:48,  2.41s/it] 97%|█████████▋| 662/681 [30:04<00:48,  2.53s/it] 97%|█████████▋| 663/681 [30:07<00:46,  2.59s/it] 98%|█████████▊| 664/681 [30:10<00:44,  2.63s/it] 98%|█████████▊| 665/681 [30:12<00:41,  2.57s/it]                                                 {'loss': 0.9751, 'grad_norm': 32.33696746826172, 'learning_rate': 9.513254770636137e-10, 'fcm_dpo/beta': 0.0024876741226762533, 'fcm_dpo/q_t': 0.36792677640914917, 'fcm_dpo/delta': -0.004373815376311541, 'fcm_dpo/margin': 242.69509887695312, 'margin_dpo/margin_mean': 242.69509887695312, 'margin_dpo/margin_std': 275.34063720703125, 'logps/chosen': -370.6224365234375, 'logps/rejected': -647.927734375, 'logps/ref_chosen': -61.2533073425293, 'logps/ref_rejected': -95.86351013183594, 'logits/chosen': -0.49785465002059937, 'logits/rejected': -0.4872364103794098, 'epoch': 0.98}
 98%|█████████▊| 665/681 [30:12<00:41,  2.57s/it] 98%|█████████▊| 666/681 [30:15<00:39,  2.62s/it] 98%|█████████▊| 667/681 [30:18<00:36,  2.62s/it] 98%|█████████▊| 668/681 [30:20<00:34,  2.64s/it] 98%|█████████▊| 669/681 [30:23<00:31,  2.65s/it] 98%|█████████▊| 670/681 [30:26<00:29,  2.66s/it]                                                 {'loss': 0.9554, 'grad_norm': 26.02719497680664, 'learning_rate': 4.741678157389739e-10, 'fcm_dpo/beta': 0.0024808943271636963, 'fcm_dpo/q_t': 0.36324819922447205, 'fcm_dpo/delta': -0.016260143369436264, 'fcm_dpo/margin': 247.93661499023438, 'margin_dpo/margin_mean': 247.93661499023438, 'margin_dpo/margin_std': 256.9874572753906, 'logps/chosen': -372.7713928222656, 'logps/rejected': -650.2215576171875, 'logps/ref_chosen': -62.95263671875, 'logps/ref_rejected': -92.4662094116211, 'logits/chosen': -0.48116713762283325, 'logits/rejected': -0.46722927689552307, 'epoch': 0.98}
 98%|█████████▊| 670/681 [30:26<00:29,  2.66s/it] 99%|█████████▊| 671/681 [30:28<00:25,  2.56s/it] 99%|█████████▊| 672/681 [30:31<00:22,  2.54s/it] 99%|█████████▉| 673/681 [30:33<00:19,  2.49s/it] 99%|█████████▉| 674/681 [30:36<00:17,  2.53s/it] 99%|█████████▉| 675/681 [30:38<00:15,  2.52s/it]                                                 {'loss': 0.947, 'grad_norm': 27.06682777404785, 'learning_rate': 1.6138243485910863e-10, 'fcm_dpo/beta': 0.002432363573461771, 'fcm_dpo/q_t': 0.361946165561676, 'fcm_dpo/delta': -0.023618485778570175, 'fcm_dpo/margin': 255.810302734375, 'margin_dpo/margin_mean': 255.81027221679688, 'margin_dpo/margin_std': 257.8631286621094, 'logps/chosen': -361.4900817871094, 'logps/rejected': -649.9933471679688, 'logps/ref_chosen': -48.5856819152832, 'logps/ref_rejected': -81.27871704101562, 'logits/chosen': -0.47107481956481934, 'logits/rejected': -0.46272093057632446, 'epoch': 0.99}
 99%|█████████▉| 675/681 [30:38<00:15,  2.52s/it] 99%|█████████▉| 676/681 [30:41<00:12,  2.55s/it] 99%|█████████▉| 677/681 [30:43<00:09,  2.48s/it]100%|█████████▉| 678/681 [30:45<00:07,  2.46s/it]100%|█████████▉| 679/681 [30:48<00:05,  2.54s/it]100%|█████████▉| 680/681 [30:51<00:02,  2.56s/it]                                                 {'loss': 0.9708, 'grad_norm': 29.81550407409668, 'learning_rate': 1.31753782067201e-11, 'fcm_dpo/beta': 0.0023933127522468567, 'fcm_dpo/q_t': 0.36930760741233826, 'fcm_dpo/delta': 0.015318195335566998, 'fcm_dpo/margin': 244.6057586669922, 'margin_dpo/margin_mean': 244.6057586669922, 'margin_dpo/margin_std': 257.46160888671875, 'logps/chosen': -374.1042175292969, 'logps/rejected': -645.6903076171875, 'logps/ref_chosen': -60.25421905517578, 'logps/ref_rejected': -87.23457336425781, 'logits/chosen': -0.5069360733032227, 'logits/rejected': -0.4939002990722656, 'epoch': 1.0}
100%|█████████▉| 680/681 [30:51<00:02,  2.56s/it]100%|██████████| 681/681 [30:53<00:00,  2.55s/it][INFO|trainer.py:2681] 2026-04-21 23:05:32,631 >> 

Training completed. Do not forget to share your model on huggingface.co/models =)


                                                 {'train_runtime': 1856.6581, 'train_samples_per_second': 23.482, 'train_steps_per_second': 0.367, 'train_loss': 0.9952153347312266, 'epoch': 1.0}
100%|██████████| 681/681 [30:53<00:00,  2.55s/it]100%|██████████| 681/681 [30:53<00:00,  2.72s/it]
***** train metrics *****
  epoch                    =        1.0
  total_flos               =        0GF
  train_loss               =     0.9952
  train_runtime            = 0:30:56.65
  train_samples            =      43598
  train_samples_per_second =     23.482
  train_steps_per_second   =      0.367
2026-04-21 23:05:32 - INFO - __main__ - *** Training complete ***
2026-04-21 23:05:32 - INFO - __main__ - *** Save model ***
[INFO|configuration_utils.py:419] 2026-04-21 23:06:08,571 >> Configuration saved in /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/config.json
[INFO|configuration_utils.py:911] 2026-04-21 23:06:08,572 >> Configuration saved in /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/generation_config.json
[INFO|modeling_utils.py:3580] 2026-04-21 23:06:36,066 >> The model is bigger than the maximum size per checkpoint (5GB) and is going to be split in 7 checkpoint shards. You can find where each parameters has been saved in the index located at /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/model.safetensors.index.json.
[INFO|tokenization_utils_base.py:2510] 2026-04-21 23:06:36,069 >> tokenizer config file saved in /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/tokenizer_config.json
[INFO|tokenization_utils_base.py:2519] 2026-04-21 23:06:36,070 >> Special tokens file saved in /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/special_tokens_map.json
2026-04-21 23:06:36 - INFO - __main__ - Saved HF-compatible model artifacts to /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun
[INFO|modelcard.py:450] 2026-04-21 23:06:37,820 >> Dropping the following result as it does not have all the necessary fields:
{'dataset': {'name': 'Anthropic/hh-rlhf', 'type': 'Anthropic/hh-rlhf'}}
[INFO|configuration_utils.py:419] 2026-04-21 23:06:37,823 >> Configuration saved in /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun/config.json
2026-04-21 23:06:37 - INFO - __main__ - *** Evaluate ***
[INFO|trainer.py:4307] 2026-04-21 23:06:37,824 >> 
***** Running Evaluation *****
[INFO|trainer.py:4309] 2026-04-21 23:06:37,824 >>   Num examples = 2339
[INFO|trainer.py:4312] 2026-04-21 23:06:37,824 >>   Batch size = 8
  0%|          | 0/73 [00:00<?, ?it/s]  3%|▎         | 2/73 [00:00<00:19,  3.69it/s]  4%|▍         | 3/73 [00:01<00:26,  2.63it/s]  5%|▌         | 4/73 [00:01<00:30,  2.29it/s]  7%|▋         | 5/73 [00:02<00:31,  2.15it/s]  8%|▊         | 6/73 [00:02<00:32,  2.03it/s] 10%|▉         | 7/73 [00:03<00:31,  2.11it/s] 11%|█         | 8/73 [00:03<00:33,  1.96it/s] 12%|█▏        | 9/73 [00:04<00:33,  1.90it/s] 14%|█▎        | 10/73 [00:04<00:33,  1.87it/s] 15%|█▌        | 11/73 [00:05<00:33,  1.88it/s] 16%|█▋        | 12/73 [00:05<00:33,  1.83it/s] 18%|█▊        | 13/73 [00:06<00:32,  1.87it/s] 19%|█▉        | 14/73 [00:06<00:31,  1.85it/s] 21%|██        | 15/73 [00:07<00:31,  1.85it/s] 22%|██▏       | 16/73 [00:08<00:31,  1.79it/s] 23%|██▎       | 17/73 [00:08<00:31,  1.77it/s] 25%|██▍       | 18/73 [00:09<00:31,  1.76it/s] 26%|██▌       | 19/73 [00:09<00:31,  1.74it/s] 27%|██▋       | 20/73 [00:10<00:30,  1.72it/s] 29%|██▉       | 21/73 [00:11<00:30,  1.72it/s] 30%|███       | 22/73 [00:11<00:29,  1.71it/s] 32%|███▏      | 23/73 [00:12<00:28,  1.75it/s] 33%|███▎      | 24/73 [00:12<00:27,  1.76it/s] 34%|███▍      | 25/73 [00:13<00:27,  1.75it/s] 36%|███▌      | 26/73 [00:13<00:26,  1.76it/s] 37%|███▋      | 27/73 [00:14<00:23,  1.96it/s] 38%|███▊      | 28/73 [00:14<00:23,  1.91it/s] 40%|███▉      | 29/73 [00:15<00:22,  1.94it/s] 41%|████      | 30/73 [00:15<00:21,  1.96it/s] 42%|████▏     | 31/73 [00:16<00:22,  1.88it/s] 44%|████▍     | 32/73 [00:16<00:21,  1.92it/s] 45%|████▌     | 33/73 [00:17<00:20,  1.95it/s] 47%|████▋     | 34/73 [00:17<00:20,  1.91it/s] 48%|████▊     | 35/73 [00:18<00:20,  1.83it/s] 49%|████▉     | 36/73 [00:19<00:20,  1.84it/s] 51%|█████     | 37/73 [00:19<00:19,  1.82it/s] 52%|█████▏    | 38/73 [00:20<00:18,  1.91it/s] 53%|█████▎    | 39/73 [00:20<00:18,  1.83it/s] 55%|█████▍    | 40/73 [00:21<00:17,  1.84it/s] 56%|█████▌    | 41/73 [00:21<00:16,  1.90it/s] 58%|█████▊    | 42/73 [00:22<00:16,  1.85it/s] 59%|█████▉    | 43/73 [00:22<00:15,  1.88it/s] 60%|██████    | 44/73 [00:23<00:15,  1.87it/s] 62%|██████▏   | 45/73 [00:23<00:15,  1.80it/s] 63%|██████▎   | 46/73 [00:24<00:14,  1.88it/s] 64%|██████▍   | 47/73 [00:24<00:14,  1.84it/s] 66%|██████▌   | 48/73 [00:25<00:13,  1.83it/s] 67%|██████▋   | 49/73 [00:26<00:13,  1.81it/s] 68%|██████▊   | 50/73 [00:26<00:12,  1.83it/s] 70%|██████▉   | 51/73 [00:27<00:12,  1.80it/s] 71%|███████   | 52/73 [00:27<00:11,  1.76it/s] 73%|███████▎  | 53/73 [00:28<00:11,  1.73it/s] 74%|███████▍  | 54/73 [00:28<00:10,  1.84it/s] 75%|███████▌  | 55/73 [00:29<00:09,  1.83it/s] 77%|███████▋  | 56/73 [00:29<00:09,  1.86it/s] 78%|███████▊  | 57/73 [00:30<00:08,  1.79it/s] 79%|███████▉  | 58/73 [00:31<00:08,  1.87it/s] 81%|████████  | 59/73 [00:31<00:07,  1.86it/s] 82%|████████▏ | 60/73 [00:32<00:07,  1.84it/s] 84%|████████▎ | 61/73 [00:32<00:06,  1.83it/s] 85%|████████▍ | 62/73 [00:33<00:06,  1.80it/s] 86%|████████▋ | 63/73 [00:33<00:05,  1.91it/s] 88%|████████▊ | 64/73 [00:34<00:04,  1.98it/s] 89%|████████▉ | 65/73 [00:34<00:04,  1.95it/s] 90%|█████████ | 66/73 [00:35<00:03,  1.87it/s] 92%|█████████▏| 67/73 [00:35<00:03,  1.91it/s] 93%|█████████▎| 68/73 [00:36<00:02,  1.86it/s] 95%|█████████▍| 69/73 [00:36<00:02,  1.83it/s] 96%|█████████▌| 70/73 [00:37<00:01,  1.82it/s] 97%|█████████▋| 71/73 [00:38<00:01,  1.82it/s] 99%|█████████▊| 72/73 [00:38<00:00,  1.82it/s]100%|██████████| 73/73 [00:39<00:00,  1.97it/s]100%|██████████| 73/73 [00:39<00:00,  1.87it/s]
***** eval metrics *****
  epoch                       =        1.0
  eval_fcm_dpo/beta           =     0.0034
  eval_fcm_dpo/delta          =     0.0614
  eval_fcm_dpo/margin         =   157.5841
  eval_fcm_dpo/q_t            =     0.3918
  eval_logits/chosen          =    -0.5282
  eval_logits/rejected        =    -0.5172
  eval_logps/chosen           =  -449.2884
  eval_logps/ref_chosen       =    -79.051
  eval_logps/ref_rejected     =   -86.7979
  eval_logps/rejected         =  -614.6193
  eval_loss                   =     0.5512
  eval_margin_dpo/margin_mean =   157.5842
  eval_margin_dpo/margin_std  =     262.95
  eval_runtime                = 0:00:39.57
  eval_samples                =       2339
  eval_samples_per_second     =     59.101
  eval_steps_per_second       =       1.87
2026-04-21 23:07:17 - INFO - __main__ - Pushing to hub...
2026-04-21 23:07:17 - INFO - __main__ - Uploading validated model artifacts from /root/dynamic-dpo-v4/outputs/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun to jackf857/llama-3-8b-base-new-dpo-hh-helpful-s_star0.6-4xh200-batch-64-20260421-214335-rerun
It seems you are trying to upload a large folder at once. This might take some time and then fail if the folder is too large. For such cases, it is recommended to upload in smaller batches or to use `HfApi().upload_large_folder(...)`/`huggingface-cli upload-large-folder` instead. For more details, check out https://huggingface.co/docs/huggingface_hub/main/en/guides/upload#upload-a-large-folder.
2026-04-21 23:07:17 - WARNING - huggingface_hub.hf_api - It seems you are trying to upload a large folder at once. This might take some time and then fail if the folder is too large. For such cases, it is recommended to upload in smaller batches or to use `HfApi().upload_large_folder(...)`/`huggingface-cli upload-large-folder` instead. For more details, check out https://huggingface.co/docs/huggingface_hub/main/en/guides/upload#upload-a-large-folder.
step_0000001.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000002.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000003.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000004.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:   0%|          | 0/689 [00:00<?, ?it/s][A[A[A[A


step_0000005.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[A


step_0000005.npy: 100%|██████████| 384/384 [00:00<00:00, 1.93kB/s][A[A[A[A[A


step_0000004.npy: 100%|██████████| 384/384 [00:00<00:00, 1.73kB/s][A[A[A

step_0000003.npy: 100%|██████████| 384/384 [00:00<00:00, 751B/s][A[Astep_0000005.npy: 100%|██████████| 384/384 [00:00<00:00, 761B/s]  
step_0000004.npy: 100%|██████████| 384/384 [00:00<00:00, 729B/s]  
step_0000003.npy: 100%|██████████| 384/384 [00:00<00:00, 583B/s]


step_0000006.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000006.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]

step_0000002.npy: 100%|██████████| 384/384 [00:01<00:00, 300B/s][A

step_0000007.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000002.npy: 100%|██████████| 384/384 [00:01<00:00, 261B/s]
step_0000007.npy: 100%|██████████| 384/384 [00:00<00:00, 2.05kB/s]
step_0000001.npy: 100%|██████████| 384/384 [00:01<00:00, 240B/s]
step_0000008.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000009.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000008.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]

step_0000010.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000011.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000012.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000001.npy: 100%|██████████| 384/384 [00:02<00:00, 178B/s]
step_0000009.npy: 100%|██████████| 384/384 [00:00<00:00, 1.28kB/s]
step_0000012.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]
step_0000010.npy: 100%|██████████| 384/384 [00:00<00:00, 1.27kB/s]
step_0000011.npy: 100%|██████████| 384/384 [00:00<00:00, 1.24kB/s]
step_0000013.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000014.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000015.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000016.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000014.npy: 100%|██████████| 384/384 [00:00<00:00, 1.57kB/s]
step_0000015.npy: 100%|██████████| 384/384 [00:00<00:00, 1.86kB/s]


step_0000016.npy: 100%|██████████| 384/384 [00:00<00:00, 2.64kB/s][A[A[Astep_0000013.npy: 100%|██████████| 384/384 [00:00<00:00, 1.24kB/s]
step_0000016.npy: 100%|██████████| 384/384 [00:00<00:00, 1.29kB/s]


Upload 689 LFS files:   0%|          | 1/689 [00:02<32:20,  2.82s/it][A[A[A[Astep_0000017.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000018.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000019.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000020.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:   2%|▏         | 16/689 [00:02<01:29,  7.49it/s][A[A[A[A


step_0000021.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000018.npy: 100%|██████████| 384/384 [00:00<00:00, 2.64kB/s]
step_0000020.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000019.npy: 100%|██████████| 384/384 [00:00<00:00, 1.88kB/s]
step_0000021.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]
step_0000017.npy: 100%|██████████| 384/384 [00:00<00:00, 1.30kB/s]
step_0000022.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000023.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000024.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000025.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000026.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000022.npy: 100%|██████████| 384/384 [00:00<00:00, 1.77kB/s]
step_0000024.npy: 100%|██████████| 384/384 [00:00<00:00, 1.64kB/s]
step_0000023.npy: 100%|██████████| 384/384 [00:00<00:00, 1.31kB/s]
step_0000025.npy: 100%|██████████| 384/384 [00:00<00:00, 1.49kB/s]
step_0000027.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000026.npy: 100%|██████████| 384/384 [00:00<00:00, 1.32kB/s]

step_0000028.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000027.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]


Upload 689 LFS files:   3%|▎         | 24/689 [00:03<01:17,  8.54it/s][A[A[A[Astep_0000029.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000030.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000031.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000028.npy: 100%|██████████| 384/384 [00:00<00:00, 1.99kB/s]
step_0000029.npy: 100%|██████████| 384/384 [00:00<00:00, 2.62kB/s]
step_0000032.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000030.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000031.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]
step_0000032.npy: 100%|██████████| 384/384 [00:00<00:00, 2.59kB/s]
step_0000033.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:   4%|▍         | 29/689 [00:04<01:07,  9.74it/s][A[A[A[A
step_0000034.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000035.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000036.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000033.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000037.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000035.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000034.npy: 100%|██████████| 384/384 [00:00<00:00, 1.74kB/s]
step_0000037.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000038.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000039.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:   5%|▍         | 33/689 [00:04<01:07,  9.72it/s][A[A[A[A

step_0000040.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000036.npy: 100%|██████████| 384/384 [00:00<00:00, 1.11kB/s]


step_0000041.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:   5%|▌         | 36/689 [00:04<01:01, 10.65it/s][A[A[A[A

step_0000042.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000040.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000039.npy: 100%|██████████| 384/384 [00:00<00:00, 2.12kB/s]
step_0000041.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]
step_0000038.npy: 100%|██████████| 384/384 [00:00<00:00, 1.26kB/s]
step_0000043.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000042.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]

step_0000044.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000045.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:   6%|▌         | 39/689 [00:04<00:58, 11.12it/s][A[A[A[A


step_0000046.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000047.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000043.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000044.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000045.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000046.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000047.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]


Upload 689 LFS files:   6%|▌         | 43/689 [00:05<00:53, 12.01it/s][A[A[A[Astep_0000048.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000049.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000050.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000051.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:   7%|▋         | 47/689 [00:05<00:44, 14.37it/s][A[A[A[A


step_0000052.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000048.npy: 100%|██████████| 384/384 [00:00<00:00, 2.52kB/s]
step_0000049.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000050.npy: 100%|██████████| 384/384 [00:00<00:00, 2.56kB/s]
step_0000051.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000052.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000053.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000054.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:   7%|▋         | 50/689 [00:05<00:43, 14.67it/s][A[A[A[A

step_0000055.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000053.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000054.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000056.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000057.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000055.npy: 100%|██████████| 384/384 [00:00<00:00, 1.28kB/s]


step_0000058.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000056.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


Upload 689 LFS files:   8%|▊         | 52/689 [00:05<00:57, 11.15it/s][A[A[A[Astep_0000059.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000057.npy: 100%|██████████| 384/384 [00:00<00:00, 2.58kB/s]

step_0000060.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000058.npy: 100%|██████████| 384/384 [00:00<00:00, 2.72kB/s]


Upload 689 LFS files:   8%|▊         | 56/689 [00:05<00:43, 14.52it/s][A[A[A[A

step_0000061.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000059.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000060.npy: 100%|██████████| 384/384 [00:00<00:00, 2.67kB/s]
step_0000062.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000061.npy: 100%|██████████| 384/384 [00:00<00:00, 1.93kB/s]

step_0000063.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000064.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000062.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000065.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:   9%|▊         | 59/689 [00:06<00:53, 11.80it/s][A[A[A[A


step_0000066.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000063.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000064.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]
step_0000065.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]


Upload 689 LFS files:   9%|▉         | 62/689 [00:06<00:46, 13.50it/s][A[A[A[Astep_0000067.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000068.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000069.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000067.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000066.npy: 100%|██████████| 384/384 [00:00<00:00, 913B/s]
step_0000069.npy: 100%|██████████| 384/384 [00:00<00:00, 1.77kB/s]
step_0000070.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000068.npy: 100%|██████████| 384/384 [00:00<00:00, 1.19kB/s]


Upload 689 LFS files:   9%|▉         | 65/689 [00:06<00:56, 11.11it/s][A[A[A[A
step_0000071.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000072.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000073.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000071.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]


Upload 689 LFS files:  10%|▉         | 68/689 [00:07<00:50, 12.33it/s][A[A[A[A
step_0000074.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000072.npy: 100%|██████████| 384/384 [00:00<00:00, 2.00kB/s]
step_0000074.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000075.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000070.npy: 100%|██████████| 384/384 [00:00<00:00, 931B/s]
step_0000076.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000077.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000075.npy: 100%|██████████| 384/384 [00:00<00:00, 2.71kB/s]


Upload 689 LFS files:  10%|█         | 70/689 [00:07<01:00, 10.27it/s][A[A[A[A
step_0000078.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000073.npy: 100%|██████████| 384/384 [00:00<00:00, 882B/s]
step_0000076.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000079.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000077.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]


Upload 689 LFS files:  11%|█         | 73/689 [00:07<00:53, 11.48it/s][A[A[A[A

step_0000080.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000078.npy: 100%|██████████| 384/384 [00:00<00:00, 1.78kB/s]

step_0000081.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  11%|█         | 77/689 [00:07<00:39, 15.62it/s][A[A[A[A


step_0000082.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000079.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]
step_0000080.npy: 100%|██████████| 384/384 [00:00<00:00, 2.02kB/s]
step_0000083.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000081.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000082.npy: 100%|██████████| 384/384 [00:00<00:00, 2.30kB/s]

step_0000084.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  12%|█▏        | 80/689 [00:07<00:41, 14.58it/s][A[A[A[A

step_0000085.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000083.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]
step_0000086.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000084.npy: 100%|██████████| 384/384 [00:00<00:00, 2.60kB/s]

step_0000087.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000085.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]


Upload 689 LFS files:  12%|█▏        | 83/689 [00:08<00:41, 14.75it/s][A[A[A[A

step_0000088.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000086.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000089.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000087.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]


Upload 689 LFS files:  12%|█▏        | 85/689 [00:08<00:39, 15.37it/s][A[A[A[A
step_0000090.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000091.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000088.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


step_0000092.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000090.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000089.npy: 100%|██████████| 384/384 [00:00<00:00, 1.39kB/s]
step_0000091.npy: 100%|██████████| 384/384 [00:00<00:00, 2.61kB/s]
step_0000092.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]


Upload 689 LFS files:  13%|█▎        | 88/689 [00:08<00:43, 13.86it/s][A[A[A[Astep_0000093.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000094.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000095.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000096.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  13%|█▎        | 90/689 [00:08<00:42, 14.13it/s][A[A[A[A


step_0000097.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000093.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000095.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000094.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000096.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000097.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  13%|█▎        | 93/689 [00:08<00:40, 14.56it/s][A[A[A[Astep_0000098.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000099.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  14%|█▍        | 95/689 [00:08<00:39, 14.86it/s][A[A[A[A

step_0000100.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000101.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000098.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]
step_0000102.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000099.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]


Upload 689 LFS files:  14%|█▍        | 98/689 [00:09<00:37, 15.97it/s][A[A[A[A
step_0000103.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000101.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000100.npy: 100%|██████████| 384/384 [00:00<00:00, 2.01kB/s]
step_0000102.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]
step_0000103.npy: 100%|██████████| 384/384 [00:00<00:00, 2.56kB/s]
step_0000104.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000105.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000106.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000107.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000104.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000105.npy: 100%|██████████| 384/384 [00:00<00:00, 2.53kB/s]


Upload 689 LFS files:  15%|█▍        | 100/689 [00:09<00:55, 10.66it/s][A[A[A[Astep_0000108.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000106.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]
step_0000107.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]

step_0000109.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  15%|█▌        | 104/689 [00:09<00:40, 14.44it/s][A[A[A[A

step_0000110.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000108.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000111.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000109.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000110.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]

step_0000112.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000113.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000114.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000112.npy: 100%|██████████| 384/384 [00:00<00:00, 1.74kB/s]
step_0000113.npy: 100%|██████████| 384/384 [00:00<00:00, 2.05kB/s]
step_0000114.npy: 100%|██████████| 384/384 [00:00<00:00, 1.90kB/s]


Upload 689 LFS files:  15%|█▌        | 106/689 [00:10<01:08,  8.51it/s][A[A[A[Astep_0000111.npy: 100%|██████████| 384/384 [00:00<00:00, 822B/s]
step_0000115.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000116.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000117.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000115.npy: 100%|██████████| 384/384 [00:00<00:00, 1.75kB/s]
step_0000116.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000117.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]


Upload 689 LFS files:  16%|█▌        | 111/689 [00:10<00:50, 11.37it/s][A[A[A[Astep_0000118.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  17%|█▋        | 114/689 [00:10<00:42, 13.41it/s][A[A[A[A
step_0000119.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000120.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000121.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000118.npy: 100%|██████████| 384/384 [00:00<00:00, 1.72kB/s]


Upload 689 LFS files:  17%|█▋        | 117/689 [00:10<00:36, 15.71it/s][A[A[A[Astep_0000122.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000119.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000120.npy: 100%|██████████| 384/384 [00:00<00:00, 1.63kB/s]
step_0000121.npy: 100%|██████████| 384/384 [00:00<00:00, 1.95kB/s]
step_0000122.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000123.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000124.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000123.npy: 100%|██████████| 384/384 [00:00<00:00, 2.59kB/s]
step_0000125.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000124.npy: 100%|██████████| 384/384 [00:00<00:00, 2.15kB/s]

step_0000126.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000125.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000127.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000128.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000126.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000129.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000127.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]
step_0000128.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]


Upload 689 LFS files:  17%|█▋        | 120/689 [00:11<01:11,  8.01it/s][A[A[A[Astep_0000130.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000131.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000129.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000132.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000133.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000130.npy: 100%|██████████| 384/384 [00:00<00:00, 2.85kB/s]


Upload 689 LFS files:  19%|█▊        | 129/689 [00:11<00:37, 15.04it/s][A[A[A[Astep_0000134.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000131.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]
step_0000132.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]
step_0000133.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]

step_0000135.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000134.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000136.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  19%|█▉        | 132/689 [00:11<00:36, 15.15it/s][A[A[A[A

step_0000137.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000138.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000135.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000139.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000138.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]
step_0000137.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]


Upload 689 LFS files:  20%|█▉        | 135/689 [00:12<00:37, 14.75it/s][A[A[A[A

step_0000140.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000139.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]

step_0000141.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000142.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000140.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000136.npy: 100%|██████████| 384/384 [00:00<00:00, 938B/s]
step_0000143.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000141.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000142.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]

step_0000144.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000145.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  20%|██        | 138/689 [00:12<00:43, 12.53it/s][A[A[A[Astep_0000143.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000146.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000144.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000145.npy: 100%|██████████| 384/384 [00:00<00:00, 2.72kB/s]


Upload 689 LFS files:  21%|██        | 142/689 [00:12<00:36, 15.14it/s][A[A[A[A
step_0000147.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000148.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000146.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]


Upload 689 LFS files:  21%|██        | 144/689 [00:12<00:36, 14.95it/s][A[A[A[Astep_0000149.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000150.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000147.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]

step_0000151.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000148.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]
step_0000150.npy: 100%|██████████| 384/384 [00:00<00:00, 2.61kB/s]


Upload 689 LFS files:  21%|██▏       | 147/689 [00:12<00:34, 15.85it/s][A[A[A[A

step_0000152.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000149.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000153.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000151.npy: 100%|██████████| 384/384 [00:00<00:00, 2.01kB/s]
step_0000152.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  22%|██▏       | 149/689 [00:13<00:36, 14.74it/s][A[A[A[A
step_0000154.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000155.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000153.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  22%|██▏       | 151/689 [00:13<00:36, 14.90it/s][A[A[A[Astep_0000156.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000157.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000155.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]


step_0000158.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000156.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]
step_0000157.npy: 100%|██████████| 384/384 [00:00<00:00, 2.05kB/s]
step_0000159.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000158.npy: 100%|██████████| 384/384 [00:00<00:00, 2.10kB/s]
step_0000154.npy: 100%|██████████| 384/384 [00:00<00:00, 972B/s]

step_0000160.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000161.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000159.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]
step_0000162.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  22%|██▏       | 154/689 [00:13<00:48, 11.06it/s][A[A[A[A


step_0000163.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000161.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]
step_0000162.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000163.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]
step_0000164.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000165.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000166.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  23%|██▎       | 159/689 [00:13<00:42, 12.41it/s][A[A[A[A


step_0000167.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000160.npy: 100%|██████████| 384/384 [00:00<00:00, 882B/s]
step_0000164.npy: 100%|██████████| 384/384 [00:00<00:00, 2.19kB/s]
step_0000166.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000167.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]


Upload 689 LFS files:  23%|██▎       | 161/689 [00:14<00:43, 12.19it/s][A[A[A[Astep_0000168.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000165.npy: 100%|██████████| 384/384 [00:00<00:00, 1.66kB/s]

step_0000169.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000170.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000171.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  24%|██▍       | 165/689 [00:14<00:36, 14.21it/s][A[A[A[A


step_0000172.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000169.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]
step_0000171.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]
step_0000172.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]

step_0000173.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000168.npy: 100%|██████████| 384/384 [00:00<00:00, 889B/s]
step_0000170.npy: 100%|██████████| 384/384 [00:00<00:00, 944B/s]
step_0000173.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]
step_0000174.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000175.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  24%|██▍       | 168/689 [00:14<00:44, 11.68it/s][A[A[A[A

step_0000176.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000177.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000174.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000175.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]


Upload 689 LFS files:  25%|██▍       | 170/689 [00:14<00:44, 11.61it/s][A[A[A[Astep_0000178.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000176.npy: 100%|██████████| 384/384 [00:00<00:00, 2.10kB/s]
step_0000177.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  25%|██▌       | 174/689 [00:14<00:33, 15.46it/s][A[A[A[A
step_0000179.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000180.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000178.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000181.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000180.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000179.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]


Upload 689 LFS files:  26%|██▌       | 177/689 [00:15<00:33, 15.16it/s][A[A[A[A
step_0000182.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000183.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000181.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  26%|██▌       | 179/689 [00:15<00:32, 15.68it/s][A[A[A[Astep_0000184.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000185.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000182.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000183.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]

step_0000186.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000184.npy: 100%|██████████| 384/384 [00:00<00:00, 2.62kB/s]
step_0000187.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000185.npy: 100%|██████████| 384/384 [00:00<00:00, 1.81kB/s]


Upload 689 LFS files:  26%|██▋       | 182/689 [00:15<00:35, 14.41it/s][A[A[A[A

step_0000188.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000186.npy: 100%|██████████| 384/384 [00:00<00:00, 2.15kB/s]

step_0000189.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  27%|██▋       | 185/689 [00:15<00:30, 16.46it/s][A[A[A[A


step_0000190.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000187.npy: 100%|██████████| 384/384 [00:00<00:00, 2.09kB/s]
step_0000188.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000189.npy: 100%|██████████| 384/384 [00:00<00:00, 1.72kB/s]
step_0000190.npy: 100%|██████████| 384/384 [00:00<00:00, 2.05kB/s]
step_0000191.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000192.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  27%|██▋       | 187/689 [00:16<00:47, 10.63it/s][A[A[A[A

step_0000193.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000194.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000191.npy: 100%|██████████| 384/384 [00:00<00:00, 1.91kB/s]
step_0000193.npy: 100%|██████████| 384/384 [00:00<00:00, 2.30kB/s]
step_0000192.npy: 100%|██████████| 384/384 [00:00<00:00, 1.40kB/s]


Upload 689 LFS files:  28%|██▊       | 190/689 [00:16<00:41, 12.15it/s][A[A[A[Astep_0000195.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000194.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]

step_0000196.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000195.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]


Upload 689 LFS files:  28%|██▊       | 192/689 [00:16<00:41, 11.94it/s][A[A[A[Astep_0000197.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000198.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000196.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]

step_0000199.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000197.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000198.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000200.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  28%|██▊       | 194/689 [00:16<00:49, 10.06it/s][A[A[A[A

step_0000201.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000199.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]

step_0000202.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000200.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000201.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]
step_0000202.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000203.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000204.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  29%|██▊       | 198/689 [00:17<00:45, 10.87it/s][A[A[A[A

step_0000205.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000206.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000207.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000203.npy: 100%|██████████| 384/384 [00:00<00:00, 2.08kB/s]
step_0000204.npy: 100%|██████████| 384/384 [00:00<00:00, 1.85kB/s]
step_0000205.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000207.npy: 100%|██████████| 384/384 [00:00<00:00, 2.63kB/s]


Upload 689 LFS files:  29%|██▉       | 203/689 [00:17<00:34, 13.92it/s][A[A[A[Astep_0000208.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000206.npy: 100%|██████████| 384/384 [00:00<00:00, 1.39kB/s]

step_0000209.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000210.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000211.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000208.npy: 100%|██████████| 384/384 [00:00<00:00, 2.72kB/s]


Upload 689 LFS files:  30%|██▉       | 206/689 [00:17<00:34, 13.99it/s][A[A[A[Astep_0000212.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000210.npy: 100%|██████████| 384/384 [00:00<00:00, 2.56kB/s]
step_0000209.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000211.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]

step_0000213.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000212.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000214.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  30%|███       | 209/689 [00:17<00:32, 14.74it/s][A[A[A[A

step_0000215.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000216.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000213.npy: 100%|██████████| 384/384 [00:00<00:00, 1.90kB/s]


Upload 689 LFS files:  31%|███       | 212/689 [00:17<00:28, 16.56it/s][A[A[A[A
step_0000217.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000215.npy: 100%|██████████| 384/384 [00:00<00:00, 2.59kB/s]
step_0000214.npy: 100%|██████████| 384/384 [00:00<00:00, 2.12kB/s]
step_0000216.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000217.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000218.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000219.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  31%|███       | 214/689 [00:18<00:36, 13.01it/s][A[A[A[A

step_0000220.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000221.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000222.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000218.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]
step_0000219.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000220.npy: 100%|██████████| 384/384 [00:00<00:00, 2.60kB/s]
step_0000221.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]
step_0000222.npy: 100%|██████████| 384/384 [00:00<00:00, 2.14kB/s]


Upload 689 LFS files:  32%|███▏      | 218/689 [00:18<00:35, 13.18it/s][A[A[A[Astep_0000223.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000224.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000225.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000226.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  32%|███▏      | 222/689 [00:18<00:27, 16.85it/s][A[A[A[A


step_0000227.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000223.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000224.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000225.npy: 100%|██████████| 384/384 [00:00<00:00, 1.98kB/s]
step_0000226.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000227.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000228.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000229.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  33%|███▎      | 225/689 [00:18<00:30, 15.08it/s][A[A[A[A

step_0000230.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000231.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000232.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000228.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000230.npy: 100%|██████████| 384/384 [00:00<00:00, 2.61kB/s]
step_0000229.npy: 100%|██████████| 384/384 [00:00<00:00, 1.97kB/s]
step_0000232.npy: 100%|██████████| 384/384 [00:00<00:00, 2.52kB/s]


Upload 689 LFS files:  33%|███▎      | 228/689 [00:18<00:32, 13.98it/s][A[A[A[Astep_0000233.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000231.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]

step_0000234.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000235.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  34%|███▎      | 231/689 [00:19<00:30, 15.09it/s][A[A[A[A


step_0000236.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000233.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]
step_0000237.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000235.npy: 100%|██████████| 384/384 [00:00<00:00, 2.84kB/s]
step_0000234.npy: 100%|██████████| 384/384 [00:00<00:00, 1.58kB/s]
step_0000236.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  34%|███▍      | 233/689 [00:19<00:32, 13.86it/s][A[A[A[A
step_0000238.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000237.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000239.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000240.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  34%|███▍      | 236/689 [00:19<00:27, 16.21it/s][A[A[A[A


step_0000241.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000238.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]

step_0000242.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000239.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]
step_0000241.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]
step_0000240.npy: 100%|██████████| 384/384 [00:00<00:00, 1.88kB/s]


Upload 689 LFS files:  35%|███▍      | 238/689 [00:19<00:32, 13.78it/s][A[A[A[Astep_0000243.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000242.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000244.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000245.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  35%|███▍      | 240/689 [00:19<00:30, 14.59it/s][A[A[A[A


step_0000246.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000243.npy: 100%|██████████| 384/384 [00:00<00:00, 2.63kB/s]
step_0000247.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000244.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000245.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000247.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  35%|███▌      | 243/689 [00:19<00:31, 14.36it/s][A[A[A[Astep_0000248.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000249.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000250.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  36%|███▌      | 245/689 [00:20<00:31, 14.17it/s][A[A[A[A


step_0000251.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000248.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000246.npy: 100%|██████████| 384/384 [00:00<00:00, 986B/s]
step_0000249.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000250.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000252.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000251.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]


Upload 689 LFS files:  36%|███▌      | 247/689 [00:20<00:35, 12.46it/s][A[A[A[A
step_0000253.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000254.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000252.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000255.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  36%|███▋      | 250/689 [00:20<00:30, 14.16it/s][A[A[A[A


step_0000256.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000253.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000254.npy: 100%|██████████| 384/384 [00:00<00:00, 2.00kB/s]

step_0000257.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  37%|███▋      | 252/689 [00:20<00:29, 14.72it/s][A[A[A[Astep_0000255.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000258.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  37%|███▋      | 254/689 [00:20<00:27, 15.58it/s][A[A[A[A

step_0000259.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000260.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000258.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000257.npy: 100%|██████████| 384/384 [00:00<00:00, 1.86kB/s]
step_0000259.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000256.npy: 100%|██████████| 384/384 [00:00<00:00, 894B/s]
step_0000260.npy: 100%|██████████| 384/384 [00:00<00:00, 2.71kB/s]
step_0000261.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000262.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000263.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  37%|███▋      | 256/689 [00:21<00:44,  9.72it/s][A[A[A[A


step_0000264.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000261.npy: 100%|██████████| 384/384 [00:00<00:00, 2.68kB/s]
step_0000262.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000264.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]


Upload 689 LFS files:  38%|███▊      | 259/689 [00:21<00:38, 11.28it/s][A[A[A[Astep_0000265.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000266.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000263.npy: 100%|██████████| 384/384 [00:00<00:00, 1.56kB/s]


step_0000267.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000268.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000265.npy: 100%|██████████| 384/384 [00:00<00:00, 2.62kB/s]
step_0000266.npy: 100%|██████████| 384/384 [00:00<00:00, 2.52kB/s]


Upload 689 LFS files:  38%|███▊      | 263/689 [00:21<00:29, 14.39it/s][A[A[A[Astep_0000269.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000268.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]

step_0000270.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000267.npy: 100%|██████████| 384/384 [00:00<00:00, 1.60kB/s]
step_0000269.npy: 100%|██████████| 384/384 [00:00<00:00, 1.98kB/s]


Upload 689 LFS files:  38%|███▊      | 265/689 [00:21<00:32, 12.85it/s][A[A[A[Astep_0000271.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000272.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000270.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]

step_0000273.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000271.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]
step_0000272.npy: 100%|██████████| 384/384 [00:00<00:00, 1.87kB/s]
step_0000274.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  39%|███▉      | 267/689 [00:22<00:42,  9.98it/s][A[A[A[A

step_0000275.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000276.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000274.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]


Upload 689 LFS files:  39%|███▉      | 270/689 [00:22<00:36, 11.57it/s][A[A[A[Astep_0000277.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000273.npy: 100%|██████████| 384/384 [00:00<00:00, 932B/s]
step_0000276.npy: 100%|██████████| 384/384 [00:00<00:00, 2.76kB/s]
step_0000275.npy: 100%|██████████| 384/384 [00:00<00:00, 1.68kB/s]

step_0000278.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000277.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000279.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  40%|███▉      | 273/689 [00:22<00:32, 12.64it/s][A[A[A[A

step_0000280.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000281.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000278.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000280.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]


Upload 689 LFS files:  40%|████      | 277/689 [00:22<00:27, 14.87it/s][A[A[A[A
step_0000282.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000281.npy: 100%|██████████| 384/384 [00:00<00:00, 2.30kB/s]


step_0000283.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000284.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000282.npy: 100%|██████████| 384/384 [00:00<00:00, 2.06kB/s]
step_0000279.npy: 100%|██████████| 384/384 [00:00<00:00, 938B/s]
step_0000283.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000285.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000284.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]

step_0000286.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000285.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]


Upload 689 LFS files:  40%|████      | 279/689 [00:22<00:38, 10.52it/s][A[A[A[Astep_0000287.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000288.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000289.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  41%|████▏     | 285/689 [00:23<00:25, 15.94it/s][A[A[A[A


step_0000290.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000287.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]
step_0000288.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000289.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000291.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000290.npy: 100%|██████████| 384/384 [00:00<00:00, 1.91kB/s]
step_0000286.npy: 100%|██████████| 384/384 [00:00<00:00, 944B/s]

step_0000292.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000293.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000291.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]


Upload 689 LFS files:  42%|████▏     | 287/689 [00:23<00:35, 11.40it/s][A[A[A[Astep_0000294.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000292.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]
step_0000293.npy: 100%|██████████| 384/384 [00:00<00:00, 2.12kB/s]
step_0000294.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]
step_0000295.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000296.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  42%|████▏     | 290/689 [00:23<00:35, 11.36it/s][A[A[A[A

step_0000297.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000298.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  43%|████▎     | 294/689 [00:23<00:26, 14.90it/s][A[A[A[A


step_0000299.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000295.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000296.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000297.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000298.npy: 100%|██████████| 384/384 [00:00<00:00, 2.11kB/s]
step_0000299.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000300.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000301.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000302.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  43%|████▎     | 297/689 [00:24<00:31, 12.32it/s][A[A[A[A


step_0000303.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000304.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000301.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]
step_0000302.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000300.npy: 100%|██████████| 384/384 [00:00<00:00, 1.54kB/s]
step_0000303.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000304.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000305.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000306.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  44%|████▎     | 300/689 [00:24<00:34, 11.38it/s][A[A[A[A

step_0000307.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000308.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000309.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000306.npy: 100%|██████████| 384/384 [00:00<00:00, 2.06kB/s]
step_0000305.npy: 100%|██████████| 384/384 [00:00<00:00, 1.74kB/s]
step_0000307.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000308.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000309.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]
step_0000310.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000311.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000312.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000310.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000313.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000312.npy: 100%|██████████| 384/384 [00:00<00:00, 1.78kB/s]


Upload 689 LFS files:  44%|████▍     | 305/689 [00:25<00:39,  9.75it/s][A[A[A[Astep_0000311.npy: 100%|██████████| 384/384 [00:00<00:00, 1.43kB/s]

step_0000314.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  45%|████▍     | 310/689 [00:25<00:27, 13.56it/s][A[A[A[A

step_0000315.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000313.npy: 100%|██████████| 384/384 [00:00<00:00, 2.15kB/s]
step_0000316.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000314.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]

step_0000317.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000316.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000318.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  45%|████▌     | 313/689 [00:25<00:29, 12.54it/s][A[A[A[A


step_0000319.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000320.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000315.npy: 100%|██████████| 384/384 [00:00<00:00, 938B/s]
step_0000318.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000317.npy: 100%|██████████| 384/384 [00:00<00:00, 927B/s]
step_0000319.npy: 100%|██████████| 384/384 [00:00<00:00, 1.62kB/s]
step_0000320.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]


Upload 689 LFS files:  46%|████▌     | 315/689 [00:25<00:34, 10.83it/s][A[A[A[Astep_0000321.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000322.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000323.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  46%|████▋     | 319/689 [00:26<00:26, 14.16it/s][A[A[A[A


step_0000324.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000321.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000325.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000323.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000324.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]
step_0000325.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]
step_0000326.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000327.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000328.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000322.npy: 100%|██████████| 384/384 [00:00<00:00, 861B/s]

step_0000329.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000327.npy: 100%|██████████| 384/384 [00:00<00:00, 2.02kB/s]
step_0000326.npy: 100%|██████████| 384/384 [00:00<00:00, 1.49kB/s]
step_0000328.npy: 100%|██████████| 384/384 [00:00<00:00, 2.30kB/s]


Upload 689 LFS files:  47%|████▋     | 322/689 [00:26<00:36,  9.97it/s][A[A[A[Astep_0000330.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000329.npy: 100%|██████████| 384/384 [00:00<00:00, 2.11kB/s]

step_0000331.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000332.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000330.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000332.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]


Upload 689 LFS files:  47%|████▋     | 326/689 [00:26<00:36, 10.03it/s][A[A[A[Astep_0000333.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000334.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000331.npy: 100%|██████████| 384/384 [00:00<00:00, 1.21kB/s]

step_0000335.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000336.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000333.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000334.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]


Upload 689 LFS files:  48%|████▊     | 331/689 [00:27<00:28, 12.72it/s][A[A[A[Astep_0000337.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000335.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000336.npy: 100%|██████████| 384/384 [00:00<00:00, 2.04kB/s]


Upload 689 LFS files:  48%|████▊     | 333/689 [00:27<00:26, 13.56it/s][A[A[A[A
step_0000338.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000339.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000340.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000337.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]


Upload 689 LFS files:  49%|████▉     | 336/689 [00:27<00:22, 15.90it/s][A[A[A[Astep_0000341.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000338.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000339.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]

step_0000342.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000340.npy: 100%|██████████| 384/384 [00:00<00:00, 1.97kB/s]
step_0000341.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]
step_0000343.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  49%|████▉     | 339/689 [00:27<00:22, 15.39it/s][A[A[A[A

step_0000344.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000342.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000345.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  49%|████▉     | 341/689 [00:27<00:22, 15.71it/s][A[A[A[A


step_0000346.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000343.npy: 100%|██████████| 384/384 [00:00<00:00, 2.73kB/s]
step_0000344.npy: 100%|██████████| 384/384 [00:00<00:00, 2.02kB/s]
step_0000347.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000345.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]


Upload 689 LFS files:  50%|████▉     | 343/689 [00:27<00:23, 14.74it/s][A[A[A[A
step_0000348.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000346.npy: 100%|██████████| 384/384 [00:00<00:00, 1.92kB/s]


step_0000349.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000347.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  50%|█████     | 345/689 [00:28<00:23, 14.62it/s][A[A[A[Astep_0000350.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000348.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000349.npy: 100%|██████████| 384/384 [00:00<00:00, 2.08kB/s]

step_0000351.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000350.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]


Upload 689 LFS files:  50%|█████     | 347/689 [00:28<00:24, 13.72it/s][A[A[A[Astep_0000352.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000353.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000351.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]

step_0000354.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000352.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000353.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]


Upload 689 LFS files:  51%|█████     | 349/689 [00:28<00:28, 11.77it/s][A[A[A[Astep_0000355.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000356.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000354.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]

step_0000357.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  51%|█████     | 353/689 [00:28<00:20, 16.04it/s][A[A[A[A


step_0000358.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000355.npy: 100%|██████████| 384/384 [00:00<00:00, 2.68kB/s]
step_0000356.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000359.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000357.npy: 100%|██████████| 384/384 [00:00<00:00, 1.99kB/s]


Upload 689 LFS files:  52%|█████▏    | 355/689 [00:28<00:22, 15.12it/s][A[A[A[A
step_0000360.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000358.npy: 100%|██████████| 384/384 [00:00<00:00, 2.19kB/s]


step_0000361.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000359.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]


Upload 689 LFS files:  52%|█████▏    | 357/689 [00:28<00:22, 14.89it/s][A[A[A[Astep_0000362.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000363.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000360.npy: 100%|██████████| 384/384 [00:00<00:00, 2.15kB/s]
step_0000361.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000364.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  52%|█████▏    | 360/689 [00:29<00:21, 15.29it/s][A[A[A[Astep_0000362.npy: 100%|██████████| 384/384 [00:00<00:00, 2.06kB/s]
step_0000365.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000363.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


step_0000366.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000364.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]

step_0000367.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  53%|█████▎    | 362/689 [00:29<00:22, 14.51it/s][A[A[A[A


step_0000368.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000365.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000366.npy: 100%|██████████| 384/384 [00:00<00:00, 1.95kB/s]
step_0000369.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000368.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000367.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]


Upload 689 LFS files:  53%|█████▎    | 365/689 [00:29<00:21, 14.81it/s][A[A[A[A
step_0000370.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000371.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000369.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]


Upload 689 LFS files:  53%|█████▎    | 367/689 [00:29<00:21, 14.99it/s][A[A[A[Astep_0000372.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000373.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000370.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000371.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]

step_0000374.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000373.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000372.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]
step_0000375.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  54%|█████▎    | 370/689 [00:29<00:22, 14.40it/s][A[A[A[A

step_0000376.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000374.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]

step_0000377.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  54%|█████▍    | 372/689 [00:29<00:20, 15.19it/s][A[A[A[A


step_0000378.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000375.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000379.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000376.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]
step_0000377.npy: 100%|██████████| 384/384 [00:00<00:00, 2.12kB/s]
step_0000378.npy: 100%|██████████| 384/384 [00:00<00:00, 1.97kB/s]
step_0000379.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]


Upload 689 LFS files:  54%|█████▍    | 375/689 [00:30<00:22, 14.18it/s][A[A[A[Astep_0000380.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000381.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000382.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000383.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  55%|█████▍    | 378/689 [00:30<00:19, 15.88it/s][A[A[A[A


step_0000384.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000380.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]
step_0000381.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]
step_0000382.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000383.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]
step_0000384.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


Upload 689 LFS files:  55%|█████▌    | 380/689 [00:30<00:21, 14.61it/s][A[A[A[Astep_0000385.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000386.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000387.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  56%|█████▌    | 383/689 [00:30<00:17, 17.02it/s][A[A[A[A


step_0000388.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000389.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000385.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000386.npy: 100%|██████████| 384/384 [00:00<00:00, 1.92kB/s]
step_0000387.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]
step_0000388.npy: 100%|██████████| 384/384 [00:00<00:00, 2.14kB/s]
step_0000389.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]


Upload 689 LFS files:  56%|█████▌    | 385/689 [00:30<00:22, 13.62it/s][A[A[A[Astep_0000390.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000391.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000392.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000393.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  56%|█████▋    | 389/689 [00:30<00:17, 16.86it/s][A[A[A[A


step_0000394.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000391.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000392.npy: 100%|██████████| 384/384 [00:00<00:00, 2.69kB/s]
step_0000390.npy: 100%|██████████| 384/384 [00:00<00:00, 1.76kB/s]
step_0000393.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000395.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000394.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000396.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  57%|█████▋    | 391/689 [00:31<00:21, 14.11it/s][A[A[A[A

step_0000397.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000398.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000395.npy: 100%|██████████| 384/384 [00:00<00:00, 2.19kB/s]


Upload 689 LFS files:  57%|█████▋    | 394/689 [00:31<00:18, 16.30it/s][A[A[A[Astep_0000399.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000396.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]
step_0000397.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000398.npy: 100%|██████████| 384/384 [00:00<00:00, 2.13kB/s]

step_0000400.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000401.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000399.npy: 100%|██████████| 384/384 [00:00<00:00, 1.85kB/s]
step_0000400.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000402.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000401.npy: 100%|██████████| 384/384 [00:00<00:00, 2.00kB/s]

step_0000403.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  57%|█████▋    | 396/689 [00:31<00:28, 10.42it/s][A[A[A[A

step_0000404.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000405.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000402.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]


Upload 689 LFS files:  58%|█████▊    | 401/689 [00:31<00:18, 15.23it/s][A[A[A[Astep_0000406.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000404.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000403.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000405.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]

step_0000407.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000406.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]


Upload 689 LFS files:  58%|█████▊    | 403/689 [00:32<00:19, 14.38it/s][A[A[A[Astep_0000408.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000409.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000407.npy: 100%|██████████| 384/384 [00:00<00:00, 2.67kB/s]

step_0000410.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  59%|█████▉    | 406/689 [00:32<00:17, 15.78it/s][A[A[A[A


step_0000411.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000408.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]
step_0000412.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000409.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000410.npy: 100%|██████████| 384/384 [00:00<00:00, 2.13kB/s]
step_0000411.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000412.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000413.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  59%|█████▉    | 408/689 [00:32<00:20, 13.77it/s][A[A[A[A
step_0000414.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000415.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  60%|█████▉    | 411/689 [00:32<00:17, 16.26it/s][A[A[A[A


step_0000416.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000414.npy: 100%|██████████| 384/384 [00:00<00:00, 2.84kB/s]
step_0000413.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000415.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000417.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000416.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]


Upload 689 LFS files:  60%|█████▉    | 413/689 [00:32<00:18, 14.79it/s][A[A[A[A
step_0000418.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000419.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000420.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000417.npy: 100%|██████████| 384/384 [00:00<00:00, 2.14kB/s]


Upload 689 LFS files:  60%|██████    | 416/689 [00:32<00:16, 16.30it/s][A[A[A[Astep_0000421.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000418.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]
step_0000420.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000419.npy: 100%|██████████| 384/384 [00:00<00:00, 2.12kB/s]

step_0000422.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000421.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000423.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  61%|██████    | 418/689 [00:32<00:18, 14.68it/s][A[A[A[A

step_0000424.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000422.npy: 100%|██████████| 384/384 [00:00<00:00, 2.67kB/s]
step_0000424.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]

step_0000425.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000423.npy: 100%|██████████| 384/384 [00:00<00:00, 2.11kB/s]
step_0000426.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  61%|██████    | 420/689 [00:33<00:22, 11.91it/s][A[A[A[A

step_0000427.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000428.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000429.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000425.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000426.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]
step_0000427.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000428.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000429.npy: 100%|██████████| 384/384 [00:00<00:00, 2.62kB/s]


Upload 689 LFS files:  62%|██████▏   | 425/689 [00:33<00:18, 14.56it/s][A[A[A[Astep_0000430.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000431.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000432.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000433.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000434.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000431.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000432.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000434.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]

step_0000435.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000433.npy: 100%|██████████| 384/384 [00:00<00:00, 1.48kB/s]


step_0000436.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000430.npy: 100%|██████████| 384/384 [00:00<00:00, 987B/s]
step_0000437.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000435.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]

step_0000438.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000436.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]


Upload 689 LFS files:  62%|██████▏   | 430/689 [00:34<00:21, 11.99it/s][A[A[A[A

step_0000439.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000437.npy: 100%|██████████| 384/384 [00:00<00:00, 2.74kB/s]
step_0000438.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000440.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  63%|██████▎   | 435/689 [00:34<00:16, 15.42it/s][A[A[A[A
step_0000441.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000439.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]


step_0000442.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000440.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000443.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  64%|██████▎   | 438/689 [00:34<00:15, 16.17it/s][A[A[A[A


step_0000444.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000442.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000441.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]


Upload 689 LFS files:  64%|██████▍   | 440/689 [00:34<00:15, 16.32it/s][A[A[A[A
step_0000445.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000446.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000444.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


step_0000447.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000443.npy: 100%|██████████| 384/384 [00:00<00:00, 1.87kB/s]
step_0000448.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000446.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000445.npy: 100%|██████████| 384/384 [00:00<00:00, 1.89kB/s]
step_0000447.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  64%|██████▍   | 443/689 [00:34<00:16, 15.33it/s][A[A[A[A
step_0000449.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  65%|██████▍   | 445/689 [00:34<00:15, 15.53it/s][A[A[A[A

step_0000450.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000448.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000451.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000449.npy: 100%|██████████| 384/384 [00:00<00:00, 2.05kB/s]
step_0000450.npy: 100%|██████████| 384/384 [00:00<00:00, 2.73kB/s]

step_0000452.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000451.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000453.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  65%|██████▍   | 447/689 [00:35<00:19, 12.62it/s][A[A[A[A

step_0000454.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000455.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000452.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]


Upload 689 LFS files:  65%|██████▌   | 451/689 [00:35<00:13, 17.23it/s][A[A[A[A
step_0000456.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000453.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000454.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]
step_0000456.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000455.npy: 100%|██████████| 384/384 [00:00<00:00, 1.52kB/s]
step_0000457.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000458.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  66%|██████▌   | 454/689 [00:35<00:14, 16.00it/s][A[A[A[A

step_0000459.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000457.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000460.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  66%|██████▌   | 456/689 [00:35<00:14, 15.89it/s][A[A[A[A


step_0000461.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000458.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000459.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000462.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000460.npy: 100%|██████████| 384/384 [00:00<00:00, 2.60kB/s]


Upload 689 LFS files:  66%|██████▋   | 458/689 [00:35<00:15, 14.94it/s][A[A[A[A
step_0000463.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000464.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000461.npy: 100%|██████████| 384/384 [00:00<00:00, 1.88kB/s]
step_0000462.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


Upload 689 LFS files:  67%|██████▋   | 460/689 [00:35<00:16, 14.12it/s][A[A[A[Astep_0000465.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000463.npy: 100%|██████████| 384/384 [00:00<00:00, 2.31kB/s]
step_0000464.npy: 100%|██████████| 384/384 [00:00<00:00, 2.53kB/s]

step_0000466.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  67%|██████▋   | 462/689 [00:35<00:15, 14.49it/s][A[A[A[A

step_0000467.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000468.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000465.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000469.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000466.npy: 100%|██████████| 384/384 [00:00<00:00, 1.62kB/s]


Upload 689 LFS files:  67%|██████▋   | 465/689 [00:36<00:14, 15.33it/s][A[A[A[A
step_0000470.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000468.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000467.npy: 100%|██████████| 384/384 [00:00<00:00, 1.85kB/s]
step_0000469.npy: 100%|██████████| 384/384 [00:00<00:00, 2.13kB/s]
step_0000471.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000470.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000472.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  68%|██████▊   | 467/689 [00:36<00:16, 13.76it/s][A[A[A[A

step_0000473.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000474.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000471.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]


Upload 689 LFS files:  68%|██████▊   | 470/689 [00:36<00:13, 16.04it/s][A[A[A[Astep_0000475.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000472.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000473.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000474.npy: 100%|██████████| 384/384 [00:00<00:00, 1.95kB/s]

step_0000476.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000475.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]


Upload 689 LFS files:  69%|██████▊   | 472/689 [00:36<00:14, 14.50it/s][A[A[A[Astep_0000477.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000478.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000476.npy: 100%|██████████| 384/384 [00:00<00:00, 2.19kB/s]

step_0000479.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000477.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]
step_0000478.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]
step_0000480.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000479.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]


Upload 689 LFS files:  69%|██████▉   | 474/689 [00:36<00:20, 10.61it/s][A[A[A[A
step_0000481.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000482.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000483.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000480.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]
step_0000484.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  70%|██████▉   | 479/689 [00:37<00:12, 16.64it/s][A[A[A[Astep_0000481.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000483.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000482.npy: 100%|██████████| 384/384 [00:00<00:00, 1.81kB/s]

step_0000485.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000486.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000487.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  70%|██████▉   | 482/689 [00:37<00:14, 14.46it/s][A[A[A[A


step_0000488.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000485.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000486.npy: 100%|██████████| 384/384 [00:00<00:00, 2.89kB/s]
step_0000487.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000484.npy: 100%|██████████| 384/384 [00:00<00:00, 951B/s]
step_0000488.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000489.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000490.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000491.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  70%|███████   | 484/689 [00:37<00:18, 11.34it/s][A[A[A[A


step_0000492.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000489.npy: 100%|██████████| 384/384 [00:00<00:00, 2.60kB/s]
step_0000493.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000490.npy: 100%|██████████| 384/384 [00:00<00:00, 2.64kB/s]
step_0000491.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]


Upload 689 LFS files:  71%|███████   | 489/689 [00:37<00:12, 16.09it/s][A[A[A[A
step_0000494.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000492.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000493.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000495.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000496.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000494.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]


Upload 689 LFS files:  71%|███████▏  | 492/689 [00:38<00:12, 16.03it/s][A[A[A[A
step_0000497.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


step_0000498.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000495.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000496.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]


Upload 689 LFS files:  72%|███████▏  | 494/689 [00:38<00:12, 15.72it/s][A[A[A[Astep_0000499.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000497.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000498.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]

step_0000500.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000501.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  72%|███████▏  | 496/689 [00:38<00:12, 15.39it/s][A[A[A[Astep_0000499.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000502.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000503.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000500.npy: 100%|██████████| 384/384 [00:00<00:00, 2.14kB/s]


Upload 689 LFS files:  72%|███████▏  | 499/689 [00:38<00:11, 15.96it/s][A[A[A[A
step_0000504.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000501.npy: 100%|██████████| 384/384 [00:00<00:00, 1.78kB/s]
step_0000503.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000502.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000505.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000504.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]


Upload 689 LFS files:  73%|███████▎  | 501/689 [00:38<00:13, 14.00it/s][A[A[A[A
step_0000506.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000507.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000508.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000505.npy: 100%|██████████| 384/384 [00:00<00:00, 2.30kB/s]
step_0000509.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000506.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000507.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000508.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]


Upload 689 LFS files:  73%|███████▎  | 505/689 [00:38<00:11, 15.50it/s][A[A[A[A
step_0000510.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000509.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000511.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000512.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  74%|███████▎  | 507/689 [00:39<00:11, 15.19it/s][A[A[A[A


step_0000513.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000510.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]

step_0000514.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000511.npy: 100%|██████████| 384/384 [00:00<00:00, 2.55kB/s]


Upload 689 LFS files:  74%|███████▍  | 510/689 [00:39<00:10, 16.52it/s][A[A[A[Astep_0000515.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000512.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000513.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000514.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]

step_0000516.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  74%|███████▍  | 512/689 [00:39<00:11, 15.63it/s][A[A[A[A

step_0000517.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000515.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000517.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000516.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000518.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  75%|███████▍  | 514/689 [00:39<00:13, 12.55it/s][A[A[A[A
step_0000519.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000520.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000518.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000519.npy: 100%|██████████| 384/384 [00:00<00:00, 2.52kB/s]
step_0000520.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000521.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  75%|███████▍  | 516/689 [00:39<00:14, 11.84it/s][A[A[A[A
step_0000522.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000521.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000522.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]


Upload 689 LFS files:  75%|███████▌  | 518/689 [00:39<00:14, 11.58it/s][A[A[A[Astep_0000523.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000524.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000523.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000524.npy: 100%|██████████| 384/384 [00:00<00:00, 2.15kB/s]
step_0000525.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  75%|███████▌  | 520/689 [00:40<00:16, 10.30it/s][A[A[A[A
step_0000526.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000527.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000525.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000528.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  76%|███████▌  | 523/689 [00:40<00:14, 11.79it/s][A[A[A[Astep_0000526.npy: 100%|██████████| 384/384 [00:00<00:00, 1.98kB/s]

step_0000529.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000528.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]


Upload 689 LFS files:  76%|███████▌  | 525/689 [00:40<00:15, 10.82it/s][A[A[A[Astep_0000530.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000527.npy: 100%|██████████| 384/384 [00:00<00:00, 882B/s]
step_0000529.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]

step_0000531.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000532.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000530.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000531.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]


Upload 689 LFS files:  76%|███████▋  | 527/689 [00:40<00:16,  9.85it/s][A[A[A[Astep_0000533.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000532.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  77%|███████▋  | 529/689 [00:40<00:14, 11.02it/s][A[A[A[A
step_0000534.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000533.npy: 100%|██████████| 384/384 [00:00<00:00, 2.33kB/s]
step_0000535.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  77%|███████▋  | 531/689 [00:41<00:12, 12.64it/s][A[A[A[A

step_0000536.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000534.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]

step_0000537.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000535.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]


Upload 689 LFS files:  77%|███████▋  | 533/689 [00:41<00:13, 11.78it/s][A[A[A[Astep_0000538.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000536.npy: 100%|██████████| 384/384 [00:00<00:00, 1.88kB/s]
step_0000537.npy: 100%|██████████| 384/384 [00:00<00:00, 2.65kB/s]

step_0000539.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000538.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]
step_0000540.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  78%|███████▊  | 535/689 [00:41<00:13, 11.27it/s][A[A[A[A

step_0000541.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000539.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000540.npy: 100%|██████████| 384/384 [00:00<00:00, 2.86kB/s]


Upload 689 LFS files:  78%|███████▊  | 537/689 [00:41<00:12, 11.71it/s][A[A[A[Astep_0000542.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000541.npy: 100%|██████████| 384/384 [00:00<00:00, 2.65kB/s]

step_0000543.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000542.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000544.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  78%|███████▊  | 539/689 [00:41<00:15,  9.95it/s][A[A[A[A

step_0000545.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000543.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]

step_0000546.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000544.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]
step_0000545.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]


Upload 689 LFS files:  79%|███████▊  | 542/689 [00:42<00:12, 11.70it/s][A[A[A[Astep_0000547.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000548.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000546.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000547.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]
step_0000548.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000549.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  79%|███████▉  | 544/689 [00:42<00:13, 10.58it/s][A[A[A[A
step_0000550.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  79%|███████▉  | 546/689 [00:42<00:11, 11.93it/s][A[A[A[A

step_0000551.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000549.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000552.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000551.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]


Upload 689 LFS files:  80%|███████▉  | 548/689 [00:42<00:12, 11.72it/s][A[A[A[A

step_0000553.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000550.npy: 100%|██████████| 384/384 [00:00<00:00, 1.67kB/s]
step_0000552.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000554.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000553.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]

step_0000555.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000554.npy: 100%|██████████| 384/384 [00:00<00:00, 2.53kB/s]


Upload 689 LFS files:  80%|███████▉  | 550/689 [00:42<00:15,  9.14it/s][A[A[A[Astep_0000556.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000557.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000555.npy: 100%|██████████| 384/384 [00:00<00:00, 2.48kB/s]

step_0000558.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  80%|████████  | 553/689 [00:43<00:11, 12.02it/s][A[A[A[Astep_0000556.npy: 100%|██████████| 384/384 [00:00<00:00, 2.81kB/s]
step_0000559.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000558.npy: 100%|██████████| 384/384 [00:00<00:00, 1.85kB/s]
step_0000559.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


Upload 689 LFS files:  81%|████████  | 555/689 [00:43<00:12, 10.97it/s][A[A[A[Astep_0000560.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000561.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000557.npy: 100%|██████████| 384/384 [00:00<00:00, 936B/s]
step_0000560.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000561.npy: 100%|██████████| 384/384 [00:00<00:00, 1.92kB/s]
step_0000562.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000563.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000564.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  81%|████████  | 557/689 [00:43<00:15,  8.54it/s][A[A[A[Astep_0000563.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000562.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]
step_0000565.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000566.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000564.npy: 100%|██████████| 384/384 [00:00<00:00, 2.25kB/s]
step_0000566.npy: 100%|██████████| 384/384 [00:00<00:00, 2.67kB/s]
step_0000565.npy: 100%|██████████| 384/384 [00:00<00:00, 1.84kB/s]
step_0000567.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  82%|████████▏ | 562/689 [00:44<00:11, 10.82it/s][A[A[A[A
step_0000568.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000569.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000570.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000567.npy: 100%|██████████| 384/384 [00:00<00:00, 1.91kB/s]
step_0000568.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]


Upload 689 LFS files:  82%|████████▏ | 565/689 [00:44<00:10, 11.55it/s][A[A[A[Astep_0000571.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000569.npy: 100%|██████████| 384/384 [00:00<00:00, 1.94kB/s]
step_0000570.npy: 100%|██████████| 384/384 [00:00<00:00, 1.64kB/s]


Upload 689 LFS files:  82%|████████▏ | 567/689 [00:44<00:10, 11.78it/s][A[A[A[A
step_0000572.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000571.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]
step_0000573.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  83%|████████▎ | 569/689 [00:44<00:09, 12.40it/s][A[A[A[A

step_0000574.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000572.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]

step_0000575.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000573.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]


Upload 689 LFS files:  83%|████████▎ | 571/689 [00:44<00:08, 13.12it/s][A[A[A[Astep_0000576.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000574.npy: 100%|██████████| 384/384 [00:00<00:00, 2.23kB/s]
step_0000575.npy: 100%|██████████| 384/384 [00:00<00:00, 1.96kB/s]
step_0000576.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000577.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  83%|████████▎ | 573/689 [00:44<00:09, 12.01it/s][A[A[A[A
step_0000578.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000579.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  83%|████████▎ | 575/689 [00:45<00:08, 12.70it/s][A[A[A[A


step_0000580.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000577.npy: 100%|██████████| 384/384 [00:00<00:00, 2.60kB/s]
step_0000578.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]
step_0000579.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000581.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000580.npy: 100%|██████████| 384/384 [00:00<00:00, 2.22kB/s]


Upload 689 LFS files:  84%|████████▎ | 577/689 [00:45<00:10, 10.45it/s][A[A[A[A
step_0000582.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000583.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000584.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000582.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000583.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]


Upload 689 LFS files:  84%|████████▍ | 580/689 [00:45<00:09, 11.56it/s][A[A[A[A
step_0000585.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000581.npy: 100%|██████████| 384/384 [00:00<00:00, 948B/s]
step_0000584.npy: 100%|██████████| 384/384 [00:00<00:00, 2.18kB/s]
step_0000585.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000586.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  84%|████████▍ | 582/689 [00:45<00:10, 10.61it/s][A[A[A[A
step_0000587.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000588.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000589.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000589.npy: 100%|██████████| 384/384 [00:00<00:00, 2.64kB/s]
step_0000586.npy: 100%|██████████| 384/384 [00:00<00:00, 2.03kB/s]
step_0000587.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]
step_0000588.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]


Upload 689 LFS files:  85%|████████▍ | 585/689 [00:45<00:09, 11.54it/s][A[A[A[Astep_0000590.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000590.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000591.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000592.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000593.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000594.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


Upload 689 LFS files:  85%|████████▌ | 587/689 [00:46<00:09, 10.40it/s][A[A[A[Astep_0000591.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]
step_0000592.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000593.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]


Upload 689 LFS files:  86%|████████▌ | 590/689 [00:46<00:07, 12.82it/s][A[A[A[Astep_0000595.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000594.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000596.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000595.npy: 100%|██████████| 384/384 [00:00<00:00, 1.69kB/s]
step_0000597.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  86%|████████▌ | 592/689 [00:46<00:08, 11.26it/s][A[A[A[A

step_0000598.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000599.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000596.npy: 100%|██████████| 384/384 [00:00<00:00, 1.96kB/s]
step_0000598.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]
step_0000597.npy: 100%|██████████| 384/384 [00:00<00:00, 2.14kB/s]
step_0000599.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]


Upload 689 LFS files:  86%|████████▋ | 595/689 [00:46<00:08, 11.34it/s][A[A[A[Astep_0000600.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000601.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  87%|████████▋ | 597/689 [00:46<00:08, 11.50it/s][A[A[A[A

step_0000602.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000600.npy: 100%|██████████| 384/384 [00:00<00:00, 2.08kB/s]
step_0000603.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


step_0000604.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000601.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000602.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000603.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]
step_0000604.npy: 100%|██████████| 384/384 [00:00<00:00, 2.21kB/s]


Upload 689 LFS files:  87%|████████▋ | 600/689 [00:47<00:07, 11.41it/s][A[A[A[Astep_0000605.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000606.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000605.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]


Upload 689 LFS files:  87%|████████▋ | 602/689 [00:47<00:07, 11.46it/s][A[A[A[Astep_0000607.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000608.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000609.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000606.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000607.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000608.npy: 100%|██████████| 384/384 [00:00<00:00, 2.83kB/s]


Upload 689 LFS files:  88%|████████▊ | 605/689 [00:47<00:06, 12.30it/s][A[A[A[Astep_0000610.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000609.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]
step_0000610.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000611.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  88%|████████▊ | 607/689 [00:47<00:06, 11.82it/s][A[A[A[A
step_0000612.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000613.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000614.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000611.npy: 100%|██████████| 384/384 [00:00<00:00, 2.51kB/s]
step_0000612.npy: 100%|██████████| 384/384 [00:00<00:00, 2.11kB/s]
step_0000613.npy: 100%|██████████| 384/384 [00:00<00:00, 2.26kB/s]


Upload 689 LFS files:  89%|████████▊ | 610/689 [00:48<00:06, 12.62it/s][A[A[A[Astep_0000615.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000614.npy: 100%|██████████| 384/384 [00:00<00:00, 2.20kB/s]
step_0000615.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000616.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000617.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000618.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


Upload 689 LFS files:  89%|████████▉ | 612/689 [00:48<00:07,  9.84it/s][A[A[A[A


step_0000619.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000620.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000616.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000617.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000618.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]
step_0000619.npy: 100%|██████████| 384/384 [00:00<00:00, 2.41kB/s]
step_0000620.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]


Upload 689 LFS files:  89%|████████▉ | 616/689 [00:48<00:07, 10.18it/s][A[A[A[Astep_0000621.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000622.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000623.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000624.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A


step_0000625.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[A[A[Astep_0000621.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000622.npy: 100%|██████████| 384/384 [00:00<00:00, 2.69kB/s]
step_0000624.npy: 100%|██████████| 384/384 [00:00<00:00, 2.37kB/s]
step_0000623.npy: 100%|██████████| 384/384 [00:00<00:00, 2.09kB/s]
step_0000625.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]


Upload 689 LFS files:  90%|█████████ | 621/689 [00:49<00:06, 11.07it/s][A[A[A[Astep_0000626.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000627.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000628.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000629.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000627.npy: 100%|██████████| 384/384 [00:00<00:00, 2.36kB/s]
step_0000626.npy: 100%|██████████| 384/384 [00:00<00:00, 1.88kB/s]
step_0000629.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]


Upload 689 LFS files:  91%|█████████ | 624/689 [00:49<00:05, 11.33it/s][A[A[A[Astep_0000628.npy: 100%|██████████| 384/384 [00:00<00:00, 2.09kB/s]
step_0000630.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000630.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000631.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000632.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000633.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000631.npy: 100%|██████████| 384/384 [00:00<00:00, 2.63kB/s]
step_0000632.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000633.npy: 100%|██████████| 384/384 [00:00<00:00, 2.47kB/s]


Upload 689 LFS files:  91%|█████████ | 626/689 [00:49<00:07,  8.83it/s][A[A[A[Astep_0000634.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000634.npy: 100%|██████████| 384/384 [00:00<00:00, 2.58kB/s]
step_0000635.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000636.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000637.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000635.npy: 100%|██████████| 384/384 [00:00<00:00, 2.70kB/s]
step_0000636.npy: 100%|██████████| 384/384 [00:00<00:00, 2.59kB/s]


Upload 689 LFS files:  91%|█████████▏| 630/689 [00:50<00:06,  9.83it/s][A[A[A[Astep_0000638.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000639.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000637.npy: 100%|██████████| 384/384 [00:00<00:00, 2.27kB/s]
step_0000638.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000640.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000639.npy: 100%|██████████| 384/384 [00:00<00:00, 1.82kB/s]


Upload 689 LFS files:  92%|█████████▏| 635/689 [00:50<00:04, 12.02it/s][A[A[A[A
step_0000641.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000640.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]
step_0000642.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  92%|█████████▏| 637/689 [00:50<00:04, 12.54it/s][A[A[A[A

step_0000643.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000641.npy: 100%|██████████| 384/384 [00:00<00:00, 2.39kB/s]

step_0000644.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000643.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]
step_0000642.npy: 100%|██████████| 384/384 [00:00<00:00, 2.07kB/s]


Upload 689 LFS files:  93%|█████████▎| 640/689 [00:50<00:03, 12.55it/s][A[A[A[Astep_0000645.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000646.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A


step_0000647.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000645.npy: 100%|██████████| 384/384 [00:00<00:00, 1.68kB/s]
step_0000646.npy: 100%|██████████| 384/384 [00:00<00:00, 2.24kB/s]
step_0000644.npy: 100%|██████████| 384/384 [00:00<00:00, 967B/s]
step_0000648.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  93%|█████████▎| 642/689 [00:51<00:04, 10.62it/s][A[A[A[Astep_0000647.npy: 100%|██████████| 384/384 [00:00<00:00, 1.32kB/s]

step_0000649.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000648.npy: 100%|██████████| 384/384 [00:00<00:00, 2.10kB/s]
step_0000650.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  93%|█████████▎| 644/689 [00:51<00:04, 10.07it/s][A[A[A[A

step_0000651.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000649.npy: 100%|██████████| 384/384 [00:00<00:00, 2.69kB/s]
step_0000650.npy: 100%|██████████| 384/384 [00:00<00:00, 2.32kB/s]


Upload 689 LFS files:  94%|█████████▍| 647/689 [00:51<00:03, 12.13it/s][A[A[A[Astep_0000652.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000651.npy: 100%|██████████| 384/384 [00:00<00:00, 2.49kB/s]

step_0000653.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000652.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]


Upload 689 LFS files:  94%|█████████▍| 649/689 [00:51<00:03, 11.45it/s][A[A[A[Astep_0000654.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000653.npy: 100%|██████████| 384/384 [00:00<00:00, 2.34kB/s]

step_0000655.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  94%|█████████▍| 651/689 [00:51<00:02, 12.81it/s][A[A[A[A

step_0000656.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000654.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000657.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  95%|█████████▍| 653/689 [00:51<00:02, 13.46it/s][A[A[A[A


step_0000658.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[A[Astep_0000656.npy: 100%|██████████| 384/384 [00:00<00:00, 2.46kB/s]
step_0000655.npy: 100%|██████████| 384/384 [00:00<00:00, 1.51kB/s]
step_0000657.npy: 100%|██████████| 384/384 [00:00<00:00, 2.17kB/s]
step_0000658.npy: 100%|██████████| 384/384 [00:00<00:00, 2.53kB/s]
step_0000659.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000660.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000659.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]
step_0000661.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  95%|█████████▌| 655/689 [00:52<00:03,  8.90it/s][A[A[A[A

step_0000662.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000660.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]

step_0000663.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000661.npy: 100%|██████████| 384/384 [00:00<00:00, 2.66kB/s]
step_0000662.npy: 100%|██████████| 384/384 [00:00<00:00, 2.54kB/s]


Upload 689 LFS files:  96%|█████████▌| 659/689 [00:52<00:02, 12.52it/s][A[A[A[Astep_0000664.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000663.npy: 100%|██████████| 384/384 [00:00<00:00, 2.44kB/s]

step_0000665.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000664.npy: 100%|██████████| 384/384 [00:00<00:00, 2.53kB/s]


Upload 689 LFS files:  96%|█████████▌| 661/689 [00:52<00:02, 12.56it/s][A[A[A[Astep_0000666.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]

step_0000667.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000665.npy: 100%|██████████| 384/384 [00:00<00:00, 2.50kB/s]
step_0000666.npy: 100%|██████████| 384/384 [00:00<00:00, 2.42kB/s]


Upload 689 LFS files:  96%|█████████▌| 663/689 [00:52<00:02, 11.43it/s][A[A[A[Astep_0000668.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]
step_0000669.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000667.npy: 100%|██████████| 384/384 [00:00<00:00, 2.35kB/s]


Upload 689 LFS files:  97%|█████████▋| 665/689 [00:52<00:01, 12.39it/s][A[A[A[A

step_0000670.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000669.npy: 100%|██████████| 384/384 [00:00<00:00, 2.40kB/s]
step_0000668.npy: 100%|██████████| 384/384 [00:00<00:00, 2.01kB/s]
step_0000671.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  97%|█████████▋| 667/689 [00:53<00:01, 13.07it/s][A[A[A[A
step_0000672.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000670.npy: 100%|██████████| 384/384 [00:00<00:00, 1.99kB/s]
step_0000671.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000672.npy: 100%|██████████| 384/384 [00:00<00:00, 2.45kB/s]
step_0000673.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  97%|█████████▋| 669/689 [00:53<00:01, 11.25it/s][A[A[A[A
step_0000674.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A

step_0000675.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A[Astep_0000673.npy: 100%|██████████| 384/384 [00:00<00:00, 2.28kB/s]
step_0000674.npy: 100%|██████████| 384/384 [00:00<00:00, 2.65kB/s]
step_0000676.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  97%|█████████▋| 671/689 [00:53<00:01, 10.86it/s][A[A[A[A
step_0000677.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000675.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]
step_0000676.npy: 100%|██████████| 384/384 [00:00<00:00, 2.38kB/s]
step_0000678.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]


Upload 689 LFS files:  98%|█████████▊| 673/689 [00:53<00:01, 11.82it/s][A[A[A[Astep_0000677.npy: 100%|██████████| 384/384 [00:00<00:00, 2.67kB/s]

step_0000679.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][Astep_0000678.npy: 100%|██████████| 384/384 [00:00<00:00, 2.43kB/s]


Upload 689 LFS files:  98%|█████████▊| 675/689 [00:53<00:01, 11.75it/s][A[A[A[Astep_0000680.npy:   0%|          | 0.00/384 [00:00<?, ?B/s]step_0000679.npy: 100%|██████████| 384/384 [00:00<00:00, 2.79kB/s]

step_0000681.npy:   0%|          | 0.00/384 [00:00<?, ?B/s][A


Upload 689 LFS files:  98%|█████████▊| 677/689 [00:53<00:00, 12.99it/s][A[A[A[A

model-00001-of-00007.safetensors:   0%|          | 0.00/4.89G [00:00<?, ?B/s][A[Astep_0000680.npy: 100%|██████████| 384/384 [00:00<00:00, 2.57kB/s]
step_0000681.npy: 100%|██████████| 384/384 [00:00<00:00, 2.29kB/s]
model-00002-of-00007.safetensors:   0%|          | 0.00/4.83G [00:00<?, ?B/s]

model-00001-of-00007.safetensors:   0%|          | 1.25M/4.89G [00:00<07:46, 10.5MB/s][A[A


Upload 689 LFS files:  99%|█████████▊| 679/689 [00:54<00:00, 12.34it/s][A[A[A[A
model-00003-of-00007.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s][A

model-00001-of-00007.safetensors:   0%|          | 12.1M/4.89G [00:00<01:16, 63.5MB/s][A[Amodel-00002-of-00007.safetensors:   0%|          | 1.25M/4.83G [00:00<07:47, 10.3MB/s]
model-00003-of-00007.safetensors:   0%|          | 1.25M/5.00G [00:00<08:30, 9.79MB/s][A


Upload 689 LFS files:  99%|█████████▉| 681/689 [00:54<00:00, 12.09it/s][A[A[A[A


model-00004-of-00007.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s][A[A[A


model-00005-of-00007.safetensors:   0%|          | 0.00/4.83G [00:00<?, ?B/s][A[A[A[A[Amodel-00002-of-00007.safetensors:   0%|          | 11.4M/4.83G [00:00<01:31, 52.9MB/s]
model-00003-of-00007.safetensors:   0%|          | 12.4M/5.00G [00:00<01:37, 51.3MB/s][A


model-00004-of-00007.safetensors:   0%|          | 1.25M/5.00G [00:00<10:07, 8.23MB/s][A[A[A


model-00005-of-00007.safetensors:   0%|          | 1.25M/4.83G [00:00<10:08, 7.94MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:   0%|          | 12.6M/5.00G [00:00<01:28, 56.1MB/s][A[A[A


model-00005-of-00007.safetensors:   0%|          | 12.2M/4.83G [00:00<01:31, 52.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   0%|          | 18.8M/4.89G [00:00<03:34, 22.7MB/s][A[Amodel-00002-of-00007.safetensors:   0%|          | 16.6M/4.83G [00:00<04:18, 18.6MB/s]
model-00003-of-00007.safetensors:   0%|          | 17.3M/5.00G [00:00<04:32, 18.3MB/s][A


model-00004-of-00007.safetensors:   0%|          | 18.9M/5.00G [00:00<04:14, 19.6MB/s][A[A[A


model-00005-of-00007.safetensors:   0%|          | 18.2M/4.83G [00:00<04:50, 16.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   1%|          | 32.0M/4.89G [00:01<03:56, 20.5MB/s][A[Amodel-00002-of-00007.safetensors:   1%|          | 32.0M/4.83G [00:01<03:57, 20.2MB/s]
model-00003-of-00007.safetensors:   1%|          | 32.0M/5.00G [00:01<04:40, 17.7MB/s][A

model-00001-of-00007.safetensors:   1%|          | 48.0M/4.89G [00:01<03:20, 24.2MB/s][A[Amodel-00002-of-00007.safetensors:   1%|          | 48.0M/4.83G [00:01<03:02, 26.2MB/s]


model-00004-of-00007.safetensors:   1%|          | 32.0M/5.00G [00:01<04:56, 16.8MB/s][A[A[A


model-00005-of-00007.safetensors:   1%|          | 32.0M/4.83G [00:01<05:10, 15.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   1%|          | 48.0M/5.00G [00:02<03:26, 24.0MB/s][A

model-00001-of-00007.safetensors:   1%|▏         | 64.0M/4.89G [00:02<02:37, 30.6MB/s][A[A

model-00001-of-00007.safetensors:   2%|▏         | 80.0M/4.89G [00:02<02:18, 34.6MB/s][A[A

model-00001-of-00007.safetensors:   2%|▏         | 96.0M/4.89G [00:02<02:03, 38.9MB/s][A[Amodel-00002-of-00007.safetensors:   1%|▏         | 64.0M/4.83G [00:02<03:51, 20.6MB/s]
model-00003-of-00007.safetensors:   1%|▏         | 64.0M/5.00G [00:02<03:44, 21.9MB/s][A


model-00005-of-00007.safetensors:   1%|          | 48.0M/4.83G [00:02<04:51, 16.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:   1%|          | 48.0M/5.00G [00:02<05:32, 14.9MB/s][A[A[A
model-00003-of-00007.safetensors:   2%|▏         | 80.0M/5.00G [00:03<03:10, 25.9MB/s][Amodel-00002-of-00007.safetensors:   2%|▏         | 80.0M/4.83G [00:03<03:17, 24.1MB/s]


model-00005-of-00007.safetensors:   1%|▏         | 64.0M/4.83G [00:03<03:48, 20.9MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:   1%|▏         | 64.0M/5.00G [00:03<04:14, 19.4MB/s][A[A[A
model-00003-of-00007.safetensors:   2%|▏         | 96.0M/5.00G [00:03<02:50, 28.8MB/s][A

model-00001-of-00007.safetensors:   2%|▏         | 112M/4.89G [00:03<03:00, 26.4MB/s] [A[A


model-00005-of-00007.safetensors:   2%|▏         | 80.0M/4.83G [00:03<03:11, 24.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   2%|▏         | 112M/5.00G [00:04<02:34, 31.6MB/s] [A

model-00001-of-00007.safetensors:   3%|▎         | 128M/4.89G [00:04<02:46, 28.6MB/s][A[Amodel-00002-of-00007.safetensors:   2%|▏         | 96.0M/4.83G [00:04<03:51, 20.5MB/s]


model-00004-of-00007.safetensors:   2%|▏         | 80.0M/5.00G [00:04<04:13, 19.4MB/s][A[A[A


model-00005-of-00007.safetensors:   2%|▏         | 96.0M/4.83G [00:04<03:33, 22.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:   2%|▏         | 112M/4.83G [00:04<03:22, 23.3MB/s] 

model-00001-of-00007.safetensors:   3%|▎         | 144M/4.89G [00:05<02:50, 27.8MB/s][A[A


model-00004-of-00007.safetensors:   2%|▏         | 96.0M/5.00G [00:04<03:35, 22.7MB/s][A[A[A
model-00003-of-00007.safetensors:   3%|▎         | 128M/5.00G [00:05<03:08, 25.9MB/s][A


model-00005-of-00007.safetensors:   2%|▏         | 112M/4.83G [00:04<03:00, 26.2MB/s] [A[A[A[A[Amodel-00002-of-00007.safetensors:   3%|▎         | 128M/4.83G [00:05<02:55, 26.7MB/s]


model-00004-of-00007.safetensors:   2%|▏         | 112M/5.00G [00:05<03:02, 26.8MB/s] [A[A[A
model-00003-of-00007.safetensors:   3%|▎         | 144M/5.00G [00:05<02:47, 29.1MB/s][A


model-00005-of-00007.safetensors:   3%|▎         | 128M/4.83G [00:05<02:40, 29.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   3%|▎         | 160M/4.89G [00:05<03:06, 25.3MB/s][A[Amodel-00002-of-00007.safetensors:   3%|▎         | 144M/4.83G [00:05<02:34, 30.3MB/s]


model-00004-of-00007.safetensors:   3%|▎         | 128M/5.00G [00:05<02:49, 28.7MB/s][A[A[A
model-00003-of-00007.safetensors:   3%|▎         | 160M/5.00G [00:05<02:34, 31.3MB/s][A


model-00005-of-00007.safetensors:   3%|▎         | 144M/4.83G [00:05<02:32, 30.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   4%|▎         | 176M/4.89G [00:06<02:49, 27.8MB/s][A[A


model-00004-of-00007.safetensors:   3%|▎         | 144M/5.00G [00:05<02:34, 31.5MB/s][A[A[Amodel-00002-of-00007.safetensors:   3%|▎         | 160M/4.83G [00:06<02:39, 29.3MB/s]
model-00003-of-00007.safetensors:   4%|▎         | 176M/5.00G [00:06<02:21, 34.1MB/s][A


model-00005-of-00007.safetensors:   3%|▎         | 160M/4.83G [00:06<02:24, 32.3MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:   4%|▎         | 176M/4.83G [00:06<02:24, 32.2MB/s]

model-00001-of-00007.safetensors:   4%|▍         | 192M/4.89G [00:06<02:48, 27.9MB/s][A[A
model-00003-of-00007.safetensors:   4%|▍         | 192M/5.00G [00:06<02:15, 35.6MB/s][A


model-00004-of-00007.safetensors:   3%|▎         | 160M/5.00G [00:06<02:37, 30.6MB/s][A[A[A


model-00005-of-00007.safetensors:   4%|▎         | 176M/4.83G [00:06<02:18, 33.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   4%|▍         | 208M/4.89G [00:07<02:26, 31.9MB/s][A[Amodel-00002-of-00007.safetensors:   4%|▍         | 192M/4.83G [00:07<02:18, 33.6MB/s]
model-00003-of-00007.safetensors:   4%|▍         | 208M/5.00G [00:07<02:09, 37.1MB/s][A


model-00005-of-00007.safetensors:   4%|▍         | 192M/4.83G [00:07<02:14, 34.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   4%|▍         | 224M/5.00G [00:07<01:59, 39.8MB/s][Amodel-00002-of-00007.safetensors:   4%|▍         | 208M/4.83G [00:07<02:07, 36.2MB/s]

model-00001-of-00007.safetensors:   5%|▍         | 224M/4.89G [00:07<02:19, 33.4MB/s][A[A


model-00004-of-00007.safetensors:   4%|▎         | 176M/5.00G [00:07<03:20, 24.1MB/s][A[A[A


model-00005-of-00007.safetensors:   4%|▍         | 208M/4.83G [00:07<02:06, 36.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   5%|▍         | 240M/5.00G [00:07<01:56, 40.9MB/s][A

model-00001-of-00007.safetensors:   5%|▍         | 240M/4.89G [00:08<02:16, 34.0MB/s][A[Amodel-00002-of-00007.safetensors:   5%|▍         | 224M/4.83G [00:08<02:16, 33.8MB/s]


model-00004-of-00007.safetensors:   4%|▍         | 192M/5.00G [00:07<02:49, 28.3MB/s][A[A[A


model-00005-of-00007.safetensors:   5%|▍         | 224M/4.83G [00:07<02:00, 38.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   5%|▌         | 256M/5.00G [00:08<02:05, 37.8MB/s][Amodel-00002-of-00007.safetensors:   5%|▍         | 240M/4.83G [00:08<02:05, 36.7MB/s]


model-00004-of-00007.safetensors:   4%|▍         | 208M/5.00G [00:08<02:32, 31.4MB/s][A[A[A

model-00001-of-00007.safetensors:   5%|▌         | 256M/4.89G [00:08<02:28, 31.2MB/s][A[A


model-00005-of-00007.safetensors:   5%|▍         | 240M/4.83G [00:08<01:57, 39.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   5%|▌         | 272M/5.00G [00:08<02:00, 39.1MB/s][Amodel-00002-of-00007.safetensors:   5%|▌         | 256M/4.83G [00:08<01:58, 38.7MB/s]


model-00004-of-00007.safetensors:   4%|▍         | 224M/5.00G [00:08<02:20, 33.9MB/s][A[A[A


model-00005-of-00007.safetensors:   5%|▌         | 256M/4.83G [00:08<01:49, 41.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   6%|▌         | 272M/4.89G [00:09<02:14, 34.3MB/s][A[Amodel-00002-of-00007.safetensors:   6%|▌         | 272M/4.83G [00:09<01:59, 38.3MB/s]
model-00003-of-00007.safetensors:   6%|▌         | 288M/5.00G [00:09<02:10, 36.0MB/s][A

model-00001-of-00007.safetensors:   6%|▌         | 288M/4.89G [00:09<02:02, 37.6MB/s][A[A


model-00004-of-00007.safetensors:   5%|▍         | 240M/5.00G [00:08<02:12, 36.0MB/s][A[A[Amodel-00002-of-00007.safetensors:   6%|▌         | 288M/4.83G [00:09<01:53, 40.2MB/s]


model-00005-of-00007.safetensors:   6%|▌         | 272M/4.83G [00:09<02:15, 33.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   6%|▌         | 304M/5.00G [00:09<02:03, 37.9MB/s][A

model-00001-of-00007.safetensors:   6%|▌         | 304M/4.89G [00:09<01:57, 39.1MB/s][A[A


model-00004-of-00007.safetensors:   5%|▌         | 256M/5.00G [00:09<02:05, 37.8MB/s][A[A[Amodel-00002-of-00007.safetensors:   6%|▋         | 304M/4.83G [00:09<01:48, 41.6MB/s]
model-00003-of-00007.safetensors:   6%|▋         | 320M/5.00G [00:09<01:53, 41.1MB/s][A

model-00001-of-00007.safetensors:   7%|▋         | 320M/4.89G [00:10<01:47, 42.3MB/s][A[A


model-00005-of-00007.safetensors:   6%|▌         | 288M/4.83G [00:09<02:12, 34.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:   5%|▌         | 272M/5.00G [00:09<02:03, 38.3MB/s][A[A[Amodel-00002-of-00007.safetensors:   7%|▋         | 320M/4.83G [00:10<01:45, 42.7MB/s]
model-00003-of-00007.safetensors:   7%|▋         | 336M/5.00G [00:10<01:47, 43.2MB/s][A

model-00001-of-00007.safetensors:   7%|▋         | 336M/4.89G [00:10<01:49, 41.6MB/s][A[A


model-00004-of-00007.safetensors:   6%|▌         | 288M/5.00G [00:10<01:57, 40.1MB/s][A[A[A


model-00005-of-00007.safetensors:   6%|▋         | 304M/4.83G [00:10<02:11, 34.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:   7%|▋         | 336M/4.83G [00:10<01:43, 43.5MB/s]
model-00003-of-00007.safetensors:   7%|▋         | 352M/5.00G [00:10<02:06, 36.7MB/s][A


model-00004-of-00007.safetensors:   6%|▌         | 304M/5.00G [00:10<02:02, 38.4MB/s][A[A[A


model-00005-of-00007.safetensors:   7%|▋         | 320M/4.83G [00:10<02:04, 36.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   7%|▋         | 352M/4.89G [00:11<02:19, 32.5MB/s][A[Amodel-00002-of-00007.safetensors:   7%|▋         | 352M/4.83G [00:11<01:54, 39.0MB/s]


model-00004-of-00007.safetensors:   6%|▋         | 320M/5.00G [00:10<01:54, 40.7MB/s][A[A[A


model-00005-of-00007.safetensors:   7%|▋         | 336M/4.83G [00:11<02:00, 37.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   7%|▋         | 368M/5.00G [00:11<02:07, 36.4MB/s][Amodel-00002-of-00007.safetensors:   8%|▊         | 368M/4.83G [00:11<01:46, 41.7MB/s]

model-00001-of-00007.safetensors:   8%|▊         | 368M/4.89G [00:11<02:17, 32.9MB/s][A[A


model-00005-of-00007.safetensors:   7%|▋         | 352M/4.83G [00:11<01:55, 38.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   8%|▊         | 384M/5.00G [00:11<02:00, 38.2MB/s][A


model-00004-of-00007.safetensors:   7%|▋         | 336M/5.00G [00:11<02:01, 38.3MB/s][A[A[A


Upload 689 LFS files:  99%|█████████▉| 681/689 [01:05<00:00, 12.09it/s][A[A[A[Amodel-00002-of-00007.safetensors:   8%|▊         | 384M/4.83G [00:11<01:45, 42.0MB/s]


model-00005-of-00007.safetensors:   8%|▊         | 368M/4.83G [00:11<01:50, 40.5MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   8%|▊         | 400M/5.00G [00:11<01:54, 40.3MB/s][A


model-00004-of-00007.safetensors:   7%|▋         | 352M/5.00G [00:11<01:57, 39.7MB/s][A[A[A

model-00001-of-00007.safetensors:   8%|▊         | 384M/4.89G [00:12<02:19, 32.3MB/s][A[Amodel-00002-of-00007.safetensors:   8%|▊         | 400M/4.83G [00:12<01:42, 43.1MB/s]
model-00003-of-00007.safetensors:   8%|▊         | 416M/5.00G [00:12<01:48, 42.2MB/s][A


model-00004-of-00007.safetensors:   7%|▋         | 368M/5.00G [00:12<01:51, 41.6MB/s][A[A[A


model-00005-of-00007.safetensors:   8%|▊         | 384M/4.83G [00:12<01:49, 40.8MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   8%|▊         | 400M/4.89G [00:12<02:20, 32.0MB/s][A[Amodel-00002-of-00007.safetensors:   9%|▊         | 416M/4.83G [00:12<01:47, 41.1MB/s]
model-00003-of-00007.safetensors:   9%|▊         | 432M/5.00G [00:12<01:43, 44.0MB/s][A


model-00004-of-00007.safetensors:   8%|▊         | 384M/5.00G [00:12<01:46, 43.3MB/s][A[A[Amodel-00002-of-00007.safetensors:   9%|▉         | 432M/4.83G [00:12<01:47, 41.0MB/s]


model-00004-of-00007.safetensors:   8%|▊         | 400M/5.00G [00:12<01:44, 43.8MB/s][A[A[A


model-00005-of-00007.safetensors:   8%|▊         | 400M/4.83G [00:12<02:12, 33.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   9%|▉         | 448M/5.00G [00:13<01:49, 41.6MB/s][A

model-00001-of-00007.safetensors:   9%|▊         | 416M/4.89G [00:13<02:33, 29.0MB/s][A[Amodel-00002-of-00007.safetensors:   9%|▉         | 448M/4.83G [00:13<01:48, 40.3MB/s]


model-00004-of-00007.safetensors:   8%|▊         | 416M/5.00G [00:13<01:42, 44.9MB/s][A[A[A


model-00005-of-00007.safetensors:   9%|▊         | 416M/4.83G [00:13<02:04, 35.5MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:   9%|▉         | 464M/5.00G [00:13<01:48, 41.8MB/s][A

model-00001-of-00007.safetensors:   9%|▉         | 432M/4.89G [00:13<02:18, 32.3MB/s][A[Amodel-00002-of-00007.safetensors:  10%|▉         | 464M/4.83G [00:13<01:43, 42.0MB/s]


model-00004-of-00007.safetensors:   9%|▊         | 432M/5.00G [00:13<01:42, 44.4MB/s][A[A[A
model-00003-of-00007.safetensors:  10%|▉         | 480M/5.00G [00:13<01:41, 44.4MB/s][A


model-00005-of-00007.safetensors:   9%|▉         | 432M/4.83G [00:13<02:01, 36.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   9%|▉         | 448M/4.89G [00:14<02:02, 36.2MB/s][A[Amodel-00002-of-00007.safetensors:  10%|▉         | 480M/4.83G [00:14<01:44, 41.7MB/s]
model-00003-of-00007.safetensors:  10%|▉         | 496M/5.00G [00:14<01:39, 45.3MB/s][A


model-00004-of-00007.safetensors:   9%|▉         | 448M/5.00G [00:13<01:46, 42.7MB/s][A[A[A


model-00005-of-00007.safetensors:   9%|▉         | 448M/4.83G [00:14<01:57, 37.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:   9%|▉         | 464M/4.89G [00:14<01:58, 37.3MB/s][A[Amodel-00002-of-00007.safetensors:  10%|█         | 496M/4.83G [00:14<01:41, 42.6MB/s]
model-00003-of-00007.safetensors:  10%|█         | 512M/5.00G [00:14<01:40, 44.8MB/s][A


model-00004-of-00007.safetensors:   9%|▉         | 464M/5.00G [00:14<01:49, 41.5MB/s][A[A[A

model-00001-of-00007.safetensors:  10%|▉         | 480M/4.89G [00:14<01:51, 39.4MB/s][A[Amodel-00002-of-00007.safetensors:  11%|█         | 512M/4.83G [00:14<01:35, 45.2MB/s]


model-00005-of-00007.safetensors:  10%|▉         | 464M/4.83G [00:14<02:07, 34.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  11%|█         | 528M/5.00G [00:14<01:40, 44.3MB/s][A


model-00004-of-00007.safetensors:  10%|▉         | 480M/5.00G [00:14<01:44, 43.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  11%|█         | 528M/4.83G [00:15<01:33, 45.8MB/s]

model-00001-of-00007.safetensors:  10%|█         | 496M/4.89G [00:15<01:59, 36.8MB/s][A[A
model-00003-of-00007.safetensors:  11%|█         | 544M/5.00G [00:15<01:38, 45.3MB/s][A


model-00005-of-00007.safetensors:  10%|▉         | 480M/4.83G [00:14<01:58, 36.6MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  10%|▉         | 496M/5.00G [00:15<01:42, 44.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  11%|█▏        | 544M/4.83G [00:15<01:33, 45.8MB/s]

model-00001-of-00007.safetensors:  10%|█         | 512M/4.89G [00:15<01:52, 38.9MB/s][A[A


model-00005-of-00007.safetensors:  10%|█         | 496M/4.83G [00:15<01:52, 38.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  11%|█         | 560M/5.00G [00:15<01:42, 43.4MB/s][A


model-00004-of-00007.safetensors:  10%|█         | 512M/5.00G [00:15<01:44, 42.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  12%|█▏        | 560M/4.83G [00:15<01:32, 46.4MB/s]


model-00005-of-00007.safetensors:  11%|█         | 512M/4.83G [00:15<01:48, 39.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  12%|█▏        | 576M/5.00G [00:15<01:43, 42.9MB/s][A

model-00001-of-00007.safetensors:  11%|█         | 528M/4.89G [00:16<02:01, 35.8MB/s][A[A


model-00004-of-00007.safetensors:  11%|█         | 528M/5.00G [00:15<01:47, 41.6MB/s][A[A[Amodel-00002-of-00007.safetensors:  12%|█▏        | 576M/4.83G [00:16<01:30, 46.8MB/s]
model-00003-of-00007.safetensors:  12%|█▏        | 592M/5.00G [00:16<01:39, 44.3MB/s][A


model-00005-of-00007.safetensors:  11%|█         | 528M/4.83G [00:16<01:49, 39.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  11%|█         | 544M/5.00G [00:16<01:44, 42.5MB/s][A[A[A

model-00001-of-00007.safetensors:  11%|█         | 544M/4.89G [00:16<01:59, 36.4MB/s][A[Amodel-00002-of-00007.safetensors:  12%|█▏        | 592M/4.83G [00:16<01:32, 45.8MB/s]


model-00005-of-00007.safetensors:  11%|█▏        | 544M/4.83G [00:16<01:44, 41.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  11%|█         | 560M/5.00G [00:16<01:42, 43.4MB/s][A[A[Amodel-00002-of-00007.safetensors:  13%|█▎        | 608M/4.83G [00:16<01:30, 46.7MB/s]
model-00003-of-00007.safetensors:  12%|█▏        | 608M/5.00G [00:16<01:54, 38.4MB/s][A

model-00001-of-00007.safetensors:  11%|█▏        | 560M/4.89G [00:17<01:58, 36.5MB/s][A[A


model-00005-of-00007.safetensors:  12%|█▏        | 560M/4.83G [00:16<01:42, 41.8MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  13%|█▎        | 624M/4.83G [00:17<01:30, 46.3MB/s]


model-00004-of-00007.safetensors:  12%|█▏        | 576M/5.00G [00:17<01:51, 39.5MB/s][A[A[A

model-00001-of-00007.safetensors:  12%|█▏        | 576M/4.89G [00:17<01:52, 38.3MB/s][A[A
model-00003-of-00007.safetensors:  12%|█▏        | 624M/5.00G [00:17<02:06, 34.6MB/s][A


model-00005-of-00007.safetensors:  12%|█▏        | 576M/4.83G [00:17<01:42, 41.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  13%|█▎        | 640M/4.83G [00:17<01:30, 46.3MB/s]

model-00001-of-00007.safetensors:  12%|█▏        | 592M/4.89G [00:17<01:48, 39.5MB/s][A[A


model-00004-of-00007.safetensors:  12%|█▏        | 592M/5.00G [00:17<01:53, 39.0MB/s][A[A[A
model-00003-of-00007.safetensors:  13%|█▎        | 640M/5.00G [00:17<01:55, 37.6MB/s][Amodel-00002-of-00007.safetensors:  14%|█▎        | 656M/4.83G [00:17<01:32, 45.2MB/s]


model-00005-of-00007.safetensors:  12%|█▏        | 592M/4.83G [00:17<01:46, 39.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  12%|█▏        | 608M/4.89G [00:18<01:42, 41.9MB/s][A[A
model-00003-of-00007.safetensors:  13%|█▎        | 656M/5.00G [00:18<01:50, 39.2MB/s][A


model-00004-of-00007.safetensors:  12%|█▏        | 608M/5.00G [00:17<01:55, 38.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  14%|█▍        | 672M/4.83G [00:18<01:31, 45.4MB/s]


model-00005-of-00007.safetensors:  13%|█▎        | 608M/4.83G [00:18<01:47, 39.4MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  13%|█▎        | 624M/4.89G [00:18<01:38, 43.1MB/s][A[A


model-00004-of-00007.safetensors:  12%|█▏        | 624M/5.00G [00:18<01:49, 40.1MB/s][A[A[A
model-00003-of-00007.safetensors:  13%|█▎        | 672M/5.00G [00:18<01:52, 38.5MB/s][Amodel-00002-of-00007.safetensors:  14%|█▍        | 688M/4.83G [00:18<01:32, 44.7MB/s]


model-00005-of-00007.safetensors:  13%|█▎        | 624M/4.83G [00:18<01:40, 41.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  13%|█▎        | 640M/4.89G [00:18<01:34, 45.0MB/s][A[Amodel-00002-of-00007.safetensors:  15%|█▍        | 704M/4.83G [00:18<01:32, 44.8MB/s]

model-00001-of-00007.safetensors:  13%|█▎        | 656M/4.89G [00:19<01:32, 45.8MB/s][A[A


model-00004-of-00007.safetensors:  13%|█▎        | 640M/5.00G [00:18<01:57, 37.0MB/s][A[A[A


model-00005-of-00007.safetensors:  13%|█▎        | 640M/4.83G [00:18<01:43, 40.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  14%|█▍        | 688M/5.00G [00:19<02:08, 33.4MB/s][Amodel-00002-of-00007.safetensors:  15%|█▍        | 720M/4.83G [00:19<01:30, 45.7MB/s]

model-00001-of-00007.safetensors:  14%|█▍        | 672M/4.89G [00:19<01:32, 45.4MB/s][A[A


model-00005-of-00007.safetensors:  14%|█▎        | 656M/4.83G [00:19<01:42, 40.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  13%|█▎        | 656M/5.00G [00:19<02:02, 35.6MB/s][A[A[A
model-00003-of-00007.safetensors:  14%|█▍        | 704M/5.00G [00:19<01:59, 36.1MB/s][A

model-00001-of-00007.safetensors:  14%|█▍        | 688M/4.89G [00:19<01:31, 46.1MB/s][A[Amodel-00002-of-00007.safetensors:  15%|█▌        | 736M/4.83G [00:19<01:34, 43.3MB/s]


model-00005-of-00007.safetensors:  14%|█▍        | 672M/4.83G [00:19<01:39, 41.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  13%|█▎        | 672M/5.00G [00:19<01:57, 36.9MB/s][A[A[A
model-00003-of-00007.safetensors:  14%|█▍        | 720M/5.00G [00:19<01:53, 37.8MB/s][Amodel-00002-of-00007.safetensors:  16%|█▌        | 752M/4.83G [00:19<01:29, 45.6MB/s]

model-00001-of-00007.safetensors:  14%|█▍        | 704M/4.89G [00:20<01:37, 42.9MB/s][A[A


model-00005-of-00007.safetensors:  14%|█▍        | 688M/4.83G [00:19<01:37, 42.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  14%|█▍        | 688M/5.00G [00:19<01:50, 39.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  16%|█▌        | 768M/4.83G [00:20<01:35, 42.4MB/s]
model-00003-of-00007.safetensors:  15%|█▍        | 736M/5.00G [00:20<02:01, 35.2MB/s][A

model-00001-of-00007.safetensors:  15%|█▍        | 720M/4.89G [00:20<01:37, 42.8MB/s][A[A


model-00005-of-00007.safetensors:  15%|█▍        | 704M/4.83G [00:20<01:34, 43.6MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  14%|█▍        | 704M/5.00G [00:20<01:44, 41.0MB/s][A[A[A
model-00003-of-00007.safetensors:  15%|█▌        | 752M/5.00G [00:20<01:52, 37.9MB/s][Amodel-00002-of-00007.safetensors:  16%|█▌        | 784M/4.83G [00:20<01:34, 43.0MB/s]


model-00005-of-00007.safetensors:  15%|█▍        | 720M/4.83G [00:20<01:29, 46.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  15%|█▌        | 736M/4.89G [00:20<01:37, 42.5MB/s][A[A


model-00004-of-00007.safetensors:  14%|█▍        | 720M/5.00G [00:20<01:55, 37.1MB/s][A[A[A


model-00005-of-00007.safetensors:  15%|█▌        | 736M/4.83G [00:20<01:25, 48.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  17%|█▋        | 800M/4.83G [00:21<01:30, 44.4MB/s]
model-00003-of-00007.safetensors:  15%|█▌        | 768M/5.00G [00:21<01:48, 38.9MB/s][A

model-00001-of-00007.safetensors:  15%|█▌        | 752M/4.89G [00:21<01:37, 42.3MB/s][A[A


model-00005-of-00007.safetensors:  16%|█▌        | 752M/4.83G [00:21<01:24, 48.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  17%|█▋        | 816M/4.83G [00:21<01:40, 40.1MB/s]

model-00001-of-00007.safetensors:  16%|█▌        | 768M/4.89G [00:21<01:39, 41.3MB/s][A[A


model-00004-of-00007.safetensors:  15%|█▍        | 736M/5.00G [00:21<02:06, 33.8MB/s][A[A[A
model-00003-of-00007.safetensors:  16%|█▌        | 784M/5.00G [00:21<01:59, 35.3MB/s][A


model-00005-of-00007.safetensors:  16%|█▌        | 768M/4.83G [00:21<01:36, 41.9MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  17%|█▋        | 832M/4.83G [00:22<01:38, 40.6MB/s]


model-00004-of-00007.safetensors:  15%|█▌        | 752M/5.00G [00:21<01:55, 36.9MB/s][A[A[A

model-00001-of-00007.safetensors:  16%|█▌        | 784M/4.89G [00:22<01:39, 41.2MB/s][A[A
model-00003-of-00007.safetensors:  16%|█▌        | 800M/5.00G [00:22<02:01, 34.7MB/s][Amodel-00002-of-00007.safetensors:  18%|█▊        | 848M/4.83G [00:22<01:31, 43.5MB/s]


model-00005-of-00007.safetensors:  16%|█▌        | 784M/4.83G [00:22<01:38, 41.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  15%|█▌        | 768M/5.00G [00:22<01:49, 38.8MB/s][A[A[A

model-00001-of-00007.safetensors:  16%|█▋        | 800M/4.89G [00:22<01:38, 41.7MB/s][A[Amodel-00002-of-00007.safetensors:  18%|█▊        | 864M/4.83G [00:22<01:28, 44.9MB/s]
model-00003-of-00007.safetensors:  16%|█▋        | 816M/5.00G [00:22<02:02, 34.1MB/s][A

model-00001-of-00007.safetensors:  17%|█▋        | 816M/4.89G [00:22<01:38, 41.5MB/s][A[A


model-00005-of-00007.safetensors:  17%|█▋        | 800M/4.83G [00:22<01:47, 37.6MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  16%|█▌        | 784M/5.00G [00:22<02:05, 33.6MB/s][A[A[Amodel-00002-of-00007.safetensors:  18%|█▊        | 880M/4.83G [00:23<01:28, 44.6MB/s]
model-00003-of-00007.safetensors:  17%|█▋        | 832M/5.00G [00:23<02:06, 33.0MB/s][A

model-00001-of-00007.safetensors:  17%|█▋        | 832M/4.89G [00:23<01:41, 40.0MB/s][A[A


model-00005-of-00007.safetensors:  17%|█▋        | 816M/4.83G [00:23<01:47, 37.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  16%|█▌        | 800M/5.00G [00:23<01:56, 36.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  19%|█▊        | 896M/4.83G [00:23<01:30, 43.4MB/s]

model-00001-of-00007.safetensors:  17%|█▋        | 848M/4.89G [00:23<01:34, 42.6MB/s][A[Amodel-00002-of-00007.safetensors:  19%|█▉        | 912M/4.83G [00:23<01:27, 44.6MB/s]


model-00005-of-00007.safetensors:  17%|█▋        | 832M/4.83G [00:23<01:58, 33.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  18%|█▊        | 864M/4.89G [00:24<01:35, 42.3MB/s][A[A


model-00004-of-00007.safetensors:  16%|█▋        | 816M/5.00G [00:23<02:08, 32.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  19%|█▉        | 928M/4.83G [00:24<01:29, 43.6MB/s]
model-00003-of-00007.safetensors:  17%|█▋        | 848M/5.00G [00:24<02:38, 26.1MB/s][A


model-00005-of-00007.safetensors:  18%|█▊        | 848M/4.83G [00:23<01:47, 37.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  17%|█▋        | 832M/5.00G [00:24<01:59, 35.0MB/s][A[A[A

model-00001-of-00007.safetensors:  18%|█▊        | 880M/4.89G [00:24<01:44, 38.3MB/s][A[A
model-00003-of-00007.safetensors:  17%|█▋        | 864M/5.00G [00:24<02:16, 30.3MB/s][Amodel-00002-of-00007.safetensors:  20%|█▉        | 944M/4.83G [00:24<01:30, 42.8MB/s]


model-00005-of-00007.safetensors:  18%|█▊        | 864M/4.83G [00:24<01:41, 39.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  17%|█▋        | 848M/5.00G [00:24<01:50, 37.6MB/s][A[A[A

model-00001-of-00007.safetensors:  18%|█▊        | 896M/4.89G [00:24<01:37, 40.8MB/s][A[A
model-00003-of-00007.safetensors:  18%|█▊        | 880M/5.00G [00:24<02:01, 33.9MB/s][Amodel-00002-of-00007.safetensors:  20%|█▉        | 960M/4.83G [00:24<01:28, 43.5MB/s]


model-00005-of-00007.safetensors:  18%|█▊        | 880M/4.83G [00:24<01:37, 40.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  17%|█▋        | 864M/5.00G [00:24<01:45, 39.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  20%|██        | 976M/4.83G [00:25<01:25, 45.2MB/s]


model-00005-of-00007.safetensors:  19%|█▊        | 896M/4.83G [00:24<01:32, 42.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  19%|█▊        | 912M/4.89G [00:25<01:44, 37.9MB/s][A[A


model-00004-of-00007.safetensors:  18%|█▊        | 880M/5.00G [00:25<01:36, 42.6MB/s][A[A[A
model-00003-of-00007.safetensors:  18%|█▊        | 896M/5.00G [00:25<02:15, 30.3MB/s][Amodel-00002-of-00007.safetensors:  21%|██        | 992M/4.83G [00:25<01:25, 45.1MB/s]

model-00001-of-00007.safetensors:  19%|█▉        | 928M/4.89G [00:25<01:37, 40.6MB/s][A[A


model-00004-of-00007.safetensors:  18%|█▊        | 896M/5.00G [00:25<01:34, 43.4MB/s][A[A[A


model-00005-of-00007.safetensors:  19%|█▉        | 912M/4.83G [00:25<01:39, 39.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  18%|█▊        | 912M/5.00G [00:25<02:01, 33.6MB/s][Amodel-00002-of-00007.safetensors:  21%|██        | 1.01G/4.83G [00:25<01:25, 44.8MB/s]

model-00001-of-00007.safetensors:  19%|█▉        | 944M/4.89G [00:26<01:37, 40.5MB/s][A[A


model-00005-of-00007.safetensors:  19%|█▉        | 928M/4.83G [00:25<01:35, 41.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  19%|█▊        | 928M/5.00G [00:26<01:48, 37.6MB/s][A


model-00004-of-00007.safetensors:  18%|█▊        | 912M/5.00G [00:25<01:41, 40.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  21%|██        | 1.02G/4.83G [00:26<01:24, 44.9MB/s]

model-00001-of-00007.safetensors:  20%|█▉        | 960M/4.89G [00:26<01:32, 42.4MB/s][A[A


model-00005-of-00007.safetensors:  20%|█▉        | 944M/4.83G [00:26<01:33, 41.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  19%|█▉        | 944M/5.00G [00:26<01:43, 39.2MB/s][A

model-00001-of-00007.safetensors:  20%|█▉        | 976M/4.89G [00:26<01:27, 44.8MB/s][A[A


model-00004-of-00007.safetensors:  19%|█▊        | 928M/5.00G [00:26<01:47, 37.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  22%|██▏       | 1.04G/4.83G [00:26<01:30, 42.0MB/s]


model-00005-of-00007.safetensors:  20%|█▉        | 960M/4.83G [00:26<01:28, 44.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  19%|█▉        | 960M/5.00G [00:26<01:41, 39.8MB/s][A


model-00004-of-00007.safetensors:  19%|█▉        | 944M/5.00G [00:26<01:45, 38.6MB/s][A[A[A

model-00001-of-00007.safetensors:  20%|██        | 992M/4.89G [00:27<01:41, 38.5MB/s][A[A
model-00003-of-00007.safetensors:  20%|█▉        | 976M/5.00G [00:27<01:38, 40.8MB/s][Amodel-00002-of-00007.safetensors:  22%|██▏       | 1.06G/4.83G [00:27<01:43, 36.5MB/s]


model-00005-of-00007.safetensors:  20%|██        | 976M/4.83G [00:27<01:42, 37.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  19%|█▉        | 960M/5.00G [00:27<01:38, 41.0MB/s][A[A[A

model-00001-of-00007.safetensors:  21%|██        | 1.01G/4.89G [00:27<01:37, 39.6MB/s][A[A
model-00003-of-00007.safetensors:  20%|█▉        | 992M/5.00G [00:27<01:37, 41.2MB/s][A


model-00005-of-00007.safetensors:  21%|██        | 992M/4.83G [00:27<01:37, 39.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  22%|██▏       | 1.07G/4.83G [00:27<01:42, 36.6MB/s]

model-00001-of-00007.safetensors:  21%|██        | 1.02G/4.89G [00:28<01:31, 42.1MB/s][A[A
model-00003-of-00007.safetensors:  20%|██        | 1.01G/5.00G [00:27<01:38, 40.6MB/s][Amodel-00002-of-00007.safetensors:  23%|██▎       | 1.09G/4.83G [00:28<01:37, 38.5MB/s]


model-00005-of-00007.safetensors:  21%|██        | 1.01G/4.83G [00:27<01:37, 39.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  21%|██▏       | 1.04G/4.89G [00:28<01:28, 43.5MB/s][A[A


model-00004-of-00007.safetensors:  20%|█▉        | 976M/5.00G [00:28<02:15, 29.6MB/s][A[A[A
model-00003-of-00007.safetensors:  20%|██        | 1.02G/5.00G [00:28<01:35, 41.7MB/s][A


model-00005-of-00007.safetensors:  21%|██        | 1.02G/4.83G [00:28<01:33, 40.9MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  23%|██▎       | 1.10G/4.83G [00:28<01:39, 37.5MB/s]


model-00004-of-00007.safetensors:  20%|█▉        | 992M/5.00G [00:28<02:02, 32.6MB/s][A[A[A


model-00005-of-00007.safetensors:  22%|██▏       | 1.04G/4.83G [00:28<01:30, 41.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  22%|██▏       | 1.06G/4.89G [00:28<01:43, 37.0MB/s][A[Amodel-00002-of-00007.safetensors:  23%|██▎       | 1.12G/4.83G [00:28<01:35, 38.8MB/s]
model-00003-of-00007.safetensors:  21%|██        | 1.04G/5.00G [00:28<01:47, 36.9MB/s][A


model-00004-of-00007.safetensors:  20%|██        | 1.01G/5.00G [00:28<01:52, 35.4MB/s][A[A[A


model-00005-of-00007.safetensors:  22%|██▏       | 1.06G/4.83G [00:28<01:28, 42.8MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  24%|██▎       | 1.14G/4.83G [00:29<01:33, 39.5MB/s]
model-00003-of-00007.safetensors:  21%|██        | 1.06G/5.00G [00:29<01:42, 38.6MB/s][A


model-00004-of-00007.safetensors:  20%|██        | 1.02G/5.00G [00:29<01:54, 34.7MB/s][A[A[A

model-00001-of-00007.safetensors:  22%|██▏       | 1.07G/4.89G [00:29<02:01, 31.3MB/s][A[Amodel-00002-of-00007.safetensors:  24%|██▍       | 1.15G/4.83G [00:29<01:30, 40.8MB/s]
model-00003-of-00007.safetensors:  21%|██▏       | 1.07G/5.00G [00:29<01:37, 40.1MB/s][A


model-00005-of-00007.safetensors:  22%|██▏       | 1.07G/4.83G [00:29<01:37, 38.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  22%|██▏       | 1.09G/4.89G [00:29<01:48, 35.2MB/s][A[A


model-00004-of-00007.safetensors:  21%|██        | 1.04G/5.00G [00:29<01:53, 34.8MB/s][A[A[A


model-00005-of-00007.safetensors:  23%|██▎       | 1.09G/4.83G [00:29<01:32, 40.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  24%|██▍       | 1.17G/4.83G [00:30<01:32, 39.8MB/s]

model-00001-of-00007.safetensors:  23%|██▎       | 1.10G/4.89G [00:30<01:38, 38.4MB/s][A[A
model-00003-of-00007.safetensors:  22%|██▏       | 1.09G/5.00G [00:30<01:50, 35.3MB/s][Amodel-00002-of-00007.safetensors:  25%|██▍       | 1.18G/4.83G [00:30<01:27, 41.9MB/s]


model-00004-of-00007.safetensors:  21%|██        | 1.06G/5.00G [00:30<02:00, 32.8MB/s][A[A[A

model-00001-of-00007.safetensors:  23%|██▎       | 1.12G/4.89G [00:30<01:33, 40.4MB/s][A[A


model-00005-of-00007.safetensors:  23%|██▎       | 1.10G/4.83G [00:30<01:38, 37.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  25%|██▍       | 1.20G/4.83G [00:30<01:26, 42.2MB/s]
model-00003-of-00007.safetensors:  22%|██▏       | 1.10G/5.00G [00:30<01:57, 33.0MB/s][A

model-00001-of-00007.safetensors:  23%|██▎       | 1.14G/4.89G [00:31<01:31, 41.1MB/s][A[A


model-00005-of-00007.safetensors:  23%|██▎       | 1.12G/4.83G [00:30<01:42, 36.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  21%|██▏       | 1.07G/5.00G [00:30<02:03, 31.7MB/s][A[A[A

model-00001-of-00007.safetensors:  24%|██▎       | 1.15G/4.89G [00:31<01:27, 42.5MB/s][A[A
model-00003-of-00007.safetensors:  22%|██▏       | 1.12G/5.00G [00:31<01:55, 33.6MB/s][Amodel-00002-of-00007.safetensors:  25%|██▌       | 1.22G/4.83G [00:31<01:34, 38.3MB/s]


model-00005-of-00007.safetensors:  24%|██▎       | 1.14G/4.83G [00:31<01:43, 35.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  22%|██▏       | 1.09G/5.00G [00:31<02:02, 31.9MB/s][A[A[A
model-00003-of-00007.safetensors:  23%|██▎       | 1.14G/5.00G [00:31<01:46, 36.3MB/s][Amodel-00002-of-00007.safetensors:  25%|██▌       | 1.23G/4.83G [00:31<01:31, 39.4MB/s]

model-00001-of-00007.safetensors:  24%|██▍       | 1.17G/4.89G [00:31<01:32, 40.1MB/s][A[A


model-00005-of-00007.safetensors:  24%|██▍       | 1.15G/4.83G [00:31<01:34, 38.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  22%|██▏       | 1.10G/5.00G [00:31<01:49, 35.7MB/s][A[A[A
model-00003-of-00007.safetensors:  23%|██▎       | 1.15G/5.00G [00:31<01:38, 39.0MB/s][Amodel-00002-of-00007.safetensors:  26%|██▌       | 1.25G/4.83G [00:32<01:37, 36.6MB/s]

model-00001-of-00007.safetensors:  24%|██▍       | 1.18G/4.89G [00:32<01:38, 37.5MB/s][A[A


model-00005-of-00007.safetensors:  24%|██▍       | 1.17G/4.83G [00:31<01:33, 39.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  22%|██▏       | 1.12G/5.00G [00:31<01:41, 38.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  26%|██▌       | 1.26G/4.83G [00:32<01:18, 45.7MB/s]

model-00001-of-00007.safetensors:  24%|██▍       | 1.20G/4.89G [00:32<01:21, 45.4MB/s][A[A


model-00005-of-00007.safetensors:  24%|██▍       | 1.18G/4.83G [00:32<01:14, 49.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  23%|██▎       | 1.17G/5.00G [00:32<01:33, 40.9MB/s][A


model-00005-of-00007.safetensors:  25%|██▍       | 1.19G/4.83G [00:32<01:27, 41.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  25%|██▍       | 1.20G/4.89G [00:32<01:38, 37.4MB/s][A[A
model-00003-of-00007.safetensors:  24%|██▎       | 1.18G/5.00G [00:32<01:28, 43.1MB/s][Amodel-00002-of-00007.safetensors:  26%|██▋       | 1.27G/4.83G [00:32<01:37, 36.7MB/s]


model-00004-of-00007.safetensors:  23%|██▎       | 1.14G/5.00G [00:32<01:46, 36.4MB/s][A[A[A


model-00005-of-00007.safetensors:  25%|██▍       | 1.20G/4.83G [00:32<01:32, 39.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  26%|██▋       | 1.28G/4.83G [00:33<01:43, 34.3MB/s]

model-00001-of-00007.safetensors:  25%|██▍       | 1.22G/4.89G [00:33<01:44, 35.0MB/s][A[A


model-00004-of-00007.safetensors:  23%|██▎       | 1.15G/5.00G [00:32<01:40, 38.1MB/s][A[A[A
model-00003-of-00007.safetensors:  24%|██▍       | 1.20G/5.00G [00:33<01:34, 40.0MB/s][A


model-00005-of-00007.safetensors:  25%|██▌       | 1.22G/4.83G [00:32<01:26, 42.0MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  25%|██▌       | 1.23G/4.89G [00:33<01:36, 37.8MB/s][A[A


model-00004-of-00007.safetensors:  23%|██▎       | 1.17G/5.00G [00:33<01:36, 39.7MB/s][A[A[A
model-00003-of-00007.safetensors:  24%|██▍       | 1.22G/5.00G [00:33<01:37, 38.8MB/s][Amodel-00002-of-00007.safetensors:  27%|██▋       | 1.30G/4.83G [00:33<02:01, 29.1MB/s]


model-00005-of-00007.safetensors:  25%|██▌       | 1.23G/4.83G [00:33<01:36, 37.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  24%|██▎       | 1.18G/5.00G [00:33<01:32, 41.2MB/s][A[A[A

model-00001-of-00007.safetensors:  26%|██▌       | 1.25G/4.89G [00:33<01:33, 38.7MB/s][A[A
model-00003-of-00007.safetensors:  25%|██▍       | 1.23G/5.00G [00:33<01:44, 36.2MB/s][A

model-00001-of-00007.safetensors:  26%|██▌       | 1.26G/4.89G [00:34<01:26, 42.0MB/s][A[A


model-00005-of-00007.safetensors:  26%|██▌       | 1.25G/4.83G [00:33<01:31, 39.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  24%|██▍       | 1.20G/5.00G [00:33<01:32, 40.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  27%|██▋       | 1.31G/4.83G [00:34<02:10, 27.0MB/s]
model-00003-of-00007.safetensors:  25%|██▍       | 1.25G/5.00G [00:34<01:40, 37.4MB/s][A


model-00005-of-00007.safetensors:  26%|██▌       | 1.26G/4.83G [00:34<01:29, 39.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  26%|██▌       | 1.28G/4.89G [00:34<01:28, 41.0MB/s][A[A


model-00004-of-00007.safetensors:  24%|██▍       | 1.22G/5.00G [00:34<01:28, 42.8MB/s][A[A[A
model-00003-of-00007.safetensors:  25%|██▌       | 1.26G/5.00G [00:34<01:32, 40.2MB/s][Amodel-00002-of-00007.safetensors:  27%|██▋       | 1.33G/4.83G [00:34<01:55, 30.4MB/s]

model-00001-of-00007.safetensors:  27%|██▋       | 1.30G/4.89G [00:34<01:25, 42.2MB/s][A[A


model-00004-of-00007.safetensors:  25%|██▍       | 1.23G/5.00G [00:34<01:28, 42.7MB/s][A[A[A


model-00005-of-00007.safetensors:  26%|██▋       | 1.28G/4.83G [00:34<01:33, 37.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  26%|██▌       | 1.28G/5.00G [00:35<01:27, 42.4MB/s][Amodel-00002-of-00007.safetensors:  28%|██▊       | 1.34G/4.83G [00:35<01:39, 34.9MB/s]

model-00001-of-00007.safetensors:  27%|██▋       | 1.31G/4.89G [00:35<01:22, 43.5MB/s][A[A


model-00004-of-00007.safetensors:  25%|██▍       | 1.25G/5.00G [00:35<01:26, 43.3MB/s][A[A[A


model-00005-of-00007.safetensors:  27%|██▋       | 1.30G/4.83G [00:35<01:40, 35.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  26%|██▌       | 1.30G/5.00G [00:35<01:32, 40.0MB/s][A

model-00001-of-00007.safetensors:  27%|██▋       | 1.33G/4.89G [00:35<01:25, 41.4MB/s][A[A


model-00004-of-00007.safetensors:  25%|██▌       | 1.26G/5.00G [00:35<01:36, 38.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  28%|██▊       | 1.36G/4.83G [00:35<01:57, 29.5MB/s]
model-00003-of-00007.safetensors:  26%|██▌       | 1.31G/5.00G [00:35<01:25, 43.3MB/s][A


model-00005-of-00007.safetensors:  27%|██▋       | 1.31G/4.83G [00:35<01:37, 36.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  28%|██▊       | 1.34G/4.89G [00:36<01:22, 42.8MB/s][A[A


model-00004-of-00007.safetensors:  26%|██▌       | 1.28G/5.00G [00:35<01:32, 40.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  28%|██▊       | 1.38G/4.83G [00:36<01:46, 32.4MB/s]

model-00001-of-00007.safetensors:  28%|██▊       | 1.36G/4.89G [00:36<01:19, 44.2MB/s][A[A
model-00003-of-00007.safetensors:  27%|██▋       | 1.33G/5.00G [00:36<01:39, 36.7MB/s][A


model-00005-of-00007.safetensors:  27%|██▋       | 1.33G/4.83G [00:36<01:46, 32.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  26%|██▌       | 1.30G/5.00G [00:36<01:31, 40.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  29%|██▉       | 1.39G/4.83G [00:36<01:36, 35.7MB/s]

model-00001-of-00007.safetensors:  28%|██▊       | 1.38G/4.89G [00:36<01:21, 43.0MB/s][A[A
model-00003-of-00007.safetensors:  27%|██▋       | 1.34G/5.00G [00:36<01:33, 39.3MB/s][A


model-00004-of-00007.safetensors:  26%|██▌       | 1.31G/5.00G [00:36<01:26, 42.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  29%|██▉       | 1.41G/4.83G [00:36<01:29, 38.3MB/s]


model-00005-of-00007.safetensors:  28%|██▊       | 1.34G/4.83G [00:36<01:42, 34.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  28%|██▊       | 1.39G/4.89G [00:37<01:18, 44.5MB/s][A[A
model-00003-of-00007.safetensors:  27%|██▋       | 1.36G/5.00G [00:37<01:34, 38.5MB/s][Amodel-00002-of-00007.safetensors:  29%|██▉       | 1.42G/4.83G [00:37<01:24, 40.3MB/s]


model-00005-of-00007.safetensors:  28%|██▊       | 1.36G/4.83G [00:37<01:33, 37.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  27%|██▋       | 1.33G/5.00G [00:37<01:35, 38.4MB/s][A[A[A

model-00001-of-00007.safetensors:  29%|██▉       | 1.41G/4.89G [00:37<01:21, 42.7MB/s][A[A
model-00003-of-00007.safetensors:  28%|██▊       | 1.38G/5.00G [00:37<01:29, 40.7MB/s][A


model-00005-of-00007.safetensors:  28%|██▊       | 1.38G/4.83G [00:37<01:28, 39.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  27%|██▋       | 1.34G/5.00G [00:37<01:35, 38.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  30%|██▉       | 1.44G/4.83G [00:37<01:33, 36.5MB/s]
model-00003-of-00007.safetensors:  28%|██▊       | 1.39G/5.00G [00:37<01:23, 43.4MB/s][A

model-00001-of-00007.safetensors:  29%|██▉       | 1.42G/4.89G [00:38<01:29, 38.6MB/s][A[A


model-00005-of-00007.safetensors:  29%|██▉       | 1.39G/4.83G [00:37<01:28, 38.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  27%|██▋       | 1.36G/5.00G [00:37<01:27, 41.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  30%|███       | 1.46G/4.83G [00:38<01:30, 37.2MB/s]

model-00001-of-00007.safetensors:  29%|██▉       | 1.44G/4.89G [00:38<01:28, 38.9MB/s][A[A


model-00004-of-00007.safetensors:  28%|██▊       | 1.38G/5.00G [00:38<01:24, 42.8MB/s][A[A[A


model-00005-of-00007.safetensors:  29%|██▉       | 1.41G/4.83G [00:38<01:28, 38.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  28%|██▊       | 1.41G/5.00G [00:38<01:42, 35.0MB/s][Amodel-00002-of-00007.safetensors:  30%|███       | 1.47G/4.83G [00:38<01:25, 39.4MB/s]

model-00001-of-00007.safetensors:  30%|██▉       | 1.46G/4.89G [00:38<01:24, 40.6MB/s][A[A


model-00005-of-00007.safetensors:  29%|██▉       | 1.42G/4.83G [00:38<01:22, 41.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  28%|██▊       | 1.39G/5.00G [00:38<01:25, 42.2MB/s][A[A[A
model-00003-of-00007.safetensors:  28%|██▊       | 1.42G/5.00G [00:38<01:35, 37.3MB/s][Amodel-00002-of-00007.safetensors:  31%|███       | 1.49G/4.83G [00:38<01:22, 40.6MB/s]

model-00001-of-00007.safetensors:  30%|███       | 1.47G/4.89G [00:39<01:21, 41.8MB/s][A[A


model-00005-of-00007.safetensors:  30%|██▉       | 1.44G/4.83G [00:38<01:19, 42.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  28%|██▊       | 1.41G/5.00G [00:38<01:23, 43.2MB/s][A[A[A
model-00003-of-00007.safetensors:  29%|██▉       | 1.44G/5.00G [00:39<01:29, 39.9MB/s][Amodel-00002-of-00007.safetensors:  31%|███       | 1.50G/4.83G [00:39<01:18, 42.6MB/s]

model-00001-of-00007.safetensors:  30%|███       | 1.49G/4.89G [00:39<01:21, 41.8MB/s][A[A


model-00005-of-00007.safetensors:  30%|███       | 1.46G/4.83G [00:39<01:16, 44.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  28%|██▊       | 1.42G/5.00G [00:39<01:18, 45.8MB/s][A[A[A
model-00003-of-00007.safetensors:  29%|██▉       | 1.46G/5.00G [00:39<01:21, 43.3MB/s][Amodel-00002-of-00007.safetensors:  31%|███▏      | 1.52G/4.83G [00:39<01:14, 44.5MB/s]


model-00005-of-00007.safetensors:  30%|███       | 1.47G/4.83G [00:39<01:13, 45.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  31%|███       | 1.50G/4.89G [00:39<01:19, 42.3MB/s][A[A


model-00004-of-00007.safetensors:  29%|██▉       | 1.44G/5.00G [00:39<01:20, 44.4MB/s][A[A[A
model-00003-of-00007.safetensors:  29%|██▉       | 1.47G/5.00G [00:39<01:19, 44.3MB/s][Amodel-00002-of-00007.safetensors:  32%|███▏      | 1.54G/4.83G [00:39<01:12, 45.5MB/s]

model-00001-of-00007.safetensors:  31%|███       | 1.52G/4.89G [00:40<01:18, 42.6MB/s][A[A
model-00003-of-00007.safetensors:  30%|██▉       | 1.49G/5.00G [00:40<01:18, 44.9MB/s][A


model-00004-of-00007.safetensors:  29%|██▉       | 1.46G/5.00G [00:39<01:20, 44.1MB/s][A[A[A

model-00001-of-00007.safetensors:  31%|███▏      | 1.54G/4.89G [00:40<01:17, 43.1MB/s][A[A
model-00003-of-00007.safetensors:  30%|███       | 1.50G/5.00G [00:40<01:20, 43.5MB/s][A


model-00004-of-00007.safetensors:  29%|██▉       | 1.47G/5.00G [00:40<01:30, 39.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  32%|███▏      | 1.55G/4.83G [00:40<01:56, 28.2MB/s]
model-00003-of-00007.safetensors:  30%|███       | 1.52G/5.00G [00:40<01:20, 43.2MB/s][A


model-00005-of-00007.safetensors:  31%|███       | 1.49G/4.83G [00:40<02:10, 25.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  32%|███▏      | 1.55G/4.89G [00:41<01:27, 38.2MB/s][A[A


model-00004-of-00007.safetensors:  30%|██▉       | 1.49G/5.00G [00:40<01:27, 40.0MB/s][A[A[A
model-00003-of-00007.safetensors:  31%|███       | 1.54G/5.00G [00:41<01:19, 43.7MB/s][Amodel-00002-of-00007.safetensors:  32%|███▏      | 1.57G/4.83G [00:41<01:44, 31.2MB/s]


model-00005-of-00007.safetensors:  31%|███       | 1.50G/4.83G [00:41<01:52, 29.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  32%|███▏      | 1.57G/4.89G [00:41<01:21, 40.9MB/s][A[A


model-00004-of-00007.safetensors:  30%|███       | 1.50G/5.00G [00:41<01:22, 42.2MB/s][A[A[A
model-00003-of-00007.safetensors:  31%|███       | 1.55G/5.00G [00:41<01:18, 43.8MB/s][Amodel-00002-of-00007.safetensors:  33%|███▎      | 1.58G/4.83G [00:41<01:33, 34.8MB/s]


model-00005-of-00007.safetensors:  31%|███▏      | 1.52G/4.83G [00:41<01:39, 33.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  30%|███       | 1.52G/5.00G [00:41<01:27, 39.7MB/s][A[A[A

model-00001-of-00007.safetensors:  32%|███▏      | 1.58G/4.89G [00:42<01:34, 35.0MB/s][A[A
model-00003-of-00007.safetensors:  31%|███▏      | 1.57G/5.00G [00:42<01:18, 43.9MB/s][A


model-00005-of-00007.safetensors:  32%|███▏      | 1.54G/4.83G [00:41<01:30, 36.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  31%|███       | 1.54G/5.00G [00:42<01:29, 38.7MB/s][A[A[A

model-00001-of-00007.safetensors:  33%|███▎      | 1.60G/4.89G [00:42<01:26, 37.9MB/s][A[Amodel-00002-of-00007.safetensors:  33%|███▎      | 1.60G/4.83G [00:42<01:55, 28.0MB/s]
model-00003-of-00007.safetensors:  32%|███▏      | 1.58G/5.00G [00:42<01:27, 39.1MB/s][A


model-00005-of-00007.safetensors:  32%|███▏      | 1.55G/4.83G [00:42<01:33, 34.9MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  31%|███       | 1.55G/5.00G [00:42<01:26, 39.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  33%|███▎      | 1.62G/4.83G [00:42<01:38, 32.7MB/s]
model-00003-of-00007.safetensors:  32%|███▏      | 1.60G/5.00G [00:42<01:23, 40.8MB/s][A

model-00001-of-00007.safetensors:  33%|███▎      | 1.62G/4.89G [00:43<01:42, 32.1MB/s][A[A


model-00005-of-00007.safetensors:  32%|███▏      | 1.57G/4.83G [00:42<01:34, 34.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  34%|███▍      | 1.63G/4.83G [00:43<01:29, 35.6MB/s]


model-00004-of-00007.safetensors:  31%|███▏      | 1.57G/5.00G [00:43<01:40, 34.1MB/s][A[A[A


model-00005-of-00007.safetensors:  33%|███▎      | 1.58G/4.83G [00:43<01:26, 37.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  34%|███▍      | 1.65G/4.83G [00:43<01:23, 37.9MB/s]
model-00003-of-00007.safetensors:  32%|███▏      | 1.62G/5.00G [00:43<01:40, 33.8MB/s][A


model-00004-of-00007.safetensors:  32%|███▏      | 1.58G/5.00G [00:43<01:33, 36.3MB/s][A[A[A


model-00005-of-00007.safetensors:  33%|███▎      | 1.60G/4.83G [00:43<01:24, 38.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  34%|███▍      | 1.66G/4.83G [00:43<01:20, 39.5MB/s]
model-00003-of-00007.safetensors:  33%|███▎      | 1.63G/5.00G [00:43<01:32, 36.4MB/s][A


model-00004-of-00007.safetensors:  32%|███▏      | 1.60G/5.00G [00:43<01:33, 36.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  35%|███▍      | 1.68G/4.83G [00:44<01:14, 42.1MB/s]


model-00005-of-00007.safetensors:  33%|███▎      | 1.62G/4.83G [00:44<01:27, 36.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  33%|███▎      | 1.65G/5.00G [00:44<01:32, 36.3MB/s][Amodel-00002-of-00007.safetensors:  35%|███▌      | 1.70G/4.83G [00:44<01:13, 42.9MB/s]


model-00005-of-00007.safetensors:  34%|███▍      | 1.63G/4.83G [00:44<01:20, 39.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  32%|███▏      | 1.62G/5.00G [00:44<01:42, 33.1MB/s][A[A[A
model-00003-of-00007.safetensors:  33%|███▎      | 1.66G/5.00G [00:44<01:28, 37.8MB/s][A

model-00001-of-00007.safetensors:  33%|███▎      | 1.63G/4.89G [00:44<02:58, 18.3MB/s][A[Amodel-00002-of-00007.safetensors:  35%|███▌      | 1.71G/4.83G [00:44<01:12, 43.1MB/s]


model-00005-of-00007.safetensors:  34%|███▍      | 1.65G/4.83G [00:44<01:18, 40.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  34%|███▎      | 1.65G/4.89G [00:45<02:24, 22.5MB/s][A[A
model-00003-of-00007.safetensors:  34%|███▎      | 1.68G/5.00G [00:45<01:23, 39.6MB/s][A


model-00004-of-00007.safetensors:  33%|███▎      | 1.63G/5.00G [00:44<01:40, 33.6MB/s][A[A[A


model-00005-of-00007.safetensors:  34%|███▍      | 1.66G/4.83G [00:45<01:16, 41.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  36%|███▌      | 1.73G/4.83G [00:45<01:13, 42.0MB/s]

model-00001-of-00007.safetensors:  34%|███▍      | 1.66G/4.89G [00:45<02:00, 26.8MB/s][A[A


model-00004-of-00007.safetensors:  33%|███▎      | 1.65G/5.00G [00:45<01:37, 34.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  36%|███▌      | 1.74G/4.83G [00:45<01:09, 44.3MB/s]
model-00003-of-00007.safetensors:  34%|███▍      | 1.70G/5.00G [00:45<01:32, 35.7MB/s][A


model-00005-of-00007.safetensors:  35%|███▍      | 1.68G/4.83G [00:45<01:13, 42.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  34%|███▍      | 1.68G/4.89G [00:45<01:46, 30.2MB/s][A[A


model-00004-of-00007.safetensors:  33%|███▎      | 1.66G/5.00G [00:45<01:29, 37.4MB/s][A[A[Amodel-00002-of-00007.safetensors:  36%|███▋      | 1.76G/4.83G [00:46<01:07, 45.7MB/s]


model-00005-of-00007.safetensors:  35%|███▌      | 1.70G/4.83G [00:45<01:13, 42.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  34%|███▍      | 1.71G/5.00G [00:46<01:31, 36.0MB/s][A

model-00001-of-00007.safetensors:  35%|███▍      | 1.70G/4.89G [00:46<01:36, 33.0MB/s][A[A


model-00005-of-00007.safetensors:  35%|███▌      | 1.71G/4.83G [00:46<01:08, 45.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  34%|███▎      | 1.68G/5.00G [00:46<01:27, 38.1MB/s][A[A[A
model-00003-of-00007.safetensors:  35%|███▍      | 1.73G/5.00G [00:46<01:23, 39.4MB/s][Amodel-00002-of-00007.safetensors:  37%|███▋      | 1.78G/4.83G [00:46<01:15, 40.7MB/s]

model-00001-of-00007.safetensors:  35%|███▌      | 1.71G/4.89G [00:46<01:26, 36.7MB/s][A[A


model-00005-of-00007.safetensors:  36%|███▌      | 1.73G/4.83G [00:46<01:05, 47.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  34%|███▍      | 1.70G/5.00G [00:46<01:24, 39.2MB/s][A[A[A
model-00003-of-00007.safetensors:  35%|███▍      | 1.74G/5.00G [00:46<01:19, 40.8MB/s][A

model-00001-of-00007.safetensors:  35%|███▌      | 1.73G/4.89G [00:47<01:21, 38.8MB/s][A[Amodel-00002-of-00007.safetensors:  37%|███▋      | 1.79G/4.83G [00:47<01:22, 37.1MB/s]
model-00003-of-00007.safetensors:  35%|███▌      | 1.76G/5.00G [00:47<01:18, 41.0MB/s][A


model-00004-of-00007.safetensors:  34%|███▍      | 1.71G/5.00G [00:46<01:24, 38.8MB/s][A[A[A


model-00005-of-00007.safetensors:  36%|███▌      | 1.74G/4.83G [00:46<01:16, 40.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  37%|███▋      | 1.81G/4.83G [00:47<01:17, 39.3MB/s]

model-00001-of-00007.safetensors:  36%|███▌      | 1.74G/4.89G [00:47<01:28, 35.4MB/s][A[A


model-00004-of-00007.safetensors:  35%|███▍      | 1.73G/5.00G [00:47<01:19, 41.4MB/s][A[A[A
model-00003-of-00007.safetensors:  36%|███▌      | 1.78G/5.00G [00:47<01:16, 42.0MB/s][A


model-00005-of-00007.safetensors:  36%|███▋      | 1.76G/4.83G [00:47<01:13, 41.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  38%|███▊      | 1.82G/4.83G [00:47<01:14, 40.4MB/s]


model-00004-of-00007.safetensors:  35%|███▍      | 1.74G/5.00G [00:47<01:13, 44.5MB/s][A[A[A
model-00003-of-00007.safetensors:  36%|███▌      | 1.79G/5.00G [00:47<01:16, 42.0MB/s][A

model-00001-of-00007.safetensors:  36%|███▌      | 1.76G/4.89G [00:48<01:36, 32.3MB/s][A[A


model-00005-of-00007.safetensors:  37%|███▋      | 1.78G/4.83G [00:47<01:18, 39.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  38%|███▊      | 1.84G/4.83G [00:48<01:12, 41.3MB/s]


model-00004-of-00007.safetensors:  35%|███▌      | 1.76G/5.00G [00:47<01:14, 43.3MB/s][A[A[A
model-00003-of-00007.safetensors:  36%|███▌      | 1.81G/5.00G [00:48<01:13, 43.3MB/s][A

model-00001-of-00007.safetensors:  36%|███▋      | 1.78G/4.89G [00:48<01:27, 35.5MB/s][A[A


model-00005-of-00007.safetensors:  37%|███▋      | 1.79G/4.83G [00:48<01:15, 40.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  38%|███▊      | 1.86G/4.83G [00:48<01:12, 40.9MB/s]
model-00003-of-00007.safetensors:  36%|███▋      | 1.82G/5.00G [00:48<01:12, 43.8MB/s][A


model-00004-of-00007.safetensors:  36%|███▌      | 1.78G/5.00G [00:48<01:17, 41.6MB/s][A[A[A


model-00005-of-00007.safetensors:  37%|███▋      | 1.81G/4.83G [00:48<01:12, 41.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  37%|███▋      | 1.79G/4.89G [00:48<01:26, 35.8MB/s][A[Amodel-00002-of-00007.safetensors:  39%|███▊      | 1.87G/4.83G [00:48<01:08, 43.1MB/s]
model-00003-of-00007.safetensors:  37%|███▋      | 1.84G/5.00G [00:48<01:14, 42.3MB/s][A


model-00005-of-00007.safetensors:  38%|███▊      | 1.82G/4.83G [00:48<01:10, 42.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  37%|███▋      | 1.81G/4.89G [00:49<01:22, 37.5MB/s][A[A


model-00004-of-00007.safetensors:  36%|███▌      | 1.79G/5.00G [00:49<01:33, 34.4MB/s][A[A[A
model-00003-of-00007.safetensors:  37%|███▋      | 1.86G/5.00G [00:49<01:15, 41.6MB/s][A


model-00005-of-00007.safetensors:  38%|███▊      | 1.84G/4.83G [00:49<01:07, 44.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  37%|███▋      | 1.82G/4.89G [00:49<01:16, 40.3MB/s][A[A


model-00004-of-00007.safetensors:  36%|███▌      | 1.81G/5.00G [00:49<01:26, 37.0MB/s][A[A[A


model-00005-of-00007.safetensors:  38%|███▊      | 1.86G/4.83G [00:49<01:04, 46.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  37%|███▋      | 1.87G/5.00G [00:49<01:13, 42.3MB/s][Amodel-00002-of-00007.safetensors:  39%|███▉      | 1.89G/4.83G [00:49<01:45, 27.9MB/s]

model-00001-of-00007.safetensors:  38%|███▊      | 1.84G/4.89G [00:50<01:14, 40.8MB/s][A[A


model-00005-of-00007.safetensors:  39%|███▊      | 1.87G/4.83G [00:49<01:05, 45.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  36%|███▋      | 1.82G/5.00G [00:49<01:29, 35.7MB/s][A[A[A
model-00003-of-00007.safetensors:  38%|███▊      | 1.89G/5.00G [00:50<01:13, 42.4MB/s][Amodel-00002-of-00007.safetensors:  39%|███▉      | 1.90G/4.83G [00:50<01:31, 31.8MB/s]

model-00001-of-00007.safetensors:  38%|███▊      | 1.86G/4.89G [00:50<01:12, 42.0MB/s][A[A


model-00005-of-00007.safetensors:  39%|███▉      | 1.89G/4.83G [00:50<01:06, 44.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  38%|███▊      | 1.90G/5.00G [00:50<01:12, 42.7MB/s][Amodel-00002-of-00007.safetensors:  40%|███▉      | 1.92G/4.83G [00:50<01:23, 35.0MB/s]


model-00004-of-00007.safetensors:  37%|███▋      | 1.84G/5.00G [00:50<01:29, 35.5MB/s][A[A[A

model-00001-of-00007.safetensors:  38%|███▊      | 1.87G/4.89G [00:50<01:11, 42.1MB/s][A[A


model-00005-of-00007.safetensors:  39%|███▉      | 1.90G/4.83G [00:50<01:06, 44.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  37%|███▋      | 1.86G/5.00G [00:50<01:24, 37.4MB/s][A[A[A

model-00001-of-00007.safetensors:  39%|███▊      | 1.89G/4.89G [00:51<01:11, 42.1MB/s][A[A
model-00003-of-00007.safetensors:  38%|███▊      | 1.92G/5.00G [00:50<01:20, 38.3MB/s][Amodel-00002-of-00007.safetensors:  40%|████      | 1.94G/4.83G [00:51<01:30, 32.0MB/s]


model-00005-of-00007.safetensors:  40%|███▉      | 1.92G/4.83G [00:51<01:08, 42.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  37%|███▋      | 1.87G/5.00G [00:51<01:20, 38.9MB/s][A[A[A

model-00001-of-00007.safetensors:  39%|███▉      | 1.90G/4.89G [00:51<01:07, 44.0MB/s][A[A
model-00003-of-00007.safetensors:  39%|███▊      | 1.94G/5.00G [00:51<01:15, 40.4MB/s][Amodel-00002-of-00007.safetensors:  40%|████      | 1.95G/4.83G [00:51<01:23, 34.6MB/s]


model-00005-of-00007.safetensors:  40%|████      | 1.94G/4.83G [00:51<01:05, 44.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  38%|███▊      | 1.89G/5.00G [00:51<01:17, 40.2MB/s][A[A[A
model-00003-of-00007.safetensors:  39%|███▉      | 1.95G/5.00G [00:51<01:09, 43.6MB/s][A

model-00001-of-00007.safetensors:  39%|███▉      | 1.92G/4.89G [00:51<01:07, 44.0MB/s][A[Amodel-00002-of-00007.safetensors:  41%|████      | 1.97G/4.83G [00:51<01:16, 37.5MB/s]


model-00004-of-00007.safetensors:  38%|███▊      | 1.90G/5.00G [00:51<01:12, 43.0MB/s][A[A[A


model-00005-of-00007.safetensors:  40%|████      | 1.95G/4.83G [00:51<01:08, 42.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  40%|███▉      | 1.94G/4.89G [00:52<01:05, 44.7MB/s][A[A
model-00003-of-00007.safetensors:  39%|███▉      | 1.97G/5.00G [00:51<01:08, 44.0MB/s][Amodel-00002-of-00007.safetensors:  41%|████      | 1.98G/4.83G [00:52<01:11, 39.7MB/s]


model-00004-of-00007.safetensors:  38%|███▊      | 1.92G/5.00G [00:52<01:08, 45.0MB/s][A[A[A


model-00005-of-00007.safetensors:  41%|████      | 1.97G/4.83G [00:52<01:04, 44.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  40%|███▉      | 1.98G/5.00G [00:52<01:07, 44.7MB/s][A

model-00001-of-00007.safetensors:  40%|███▉      | 1.95G/4.89G [00:52<01:05, 44.6MB/s][A[Amodel-00002-of-00007.safetensors:  41%|████▏     | 2.00G/4.83G [00:52<01:09, 40.8MB/s]


model-00004-of-00007.safetensors:  39%|███▊      | 1.94G/5.00G [00:52<01:06, 45.7MB/s][A[A[A


model-00005-of-00007.safetensors:  41%|████      | 1.98G/4.83G [00:52<01:03, 44.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  40%|████      | 1.97G/4.89G [00:52<01:05, 44.9MB/s][A[A


model-00004-of-00007.safetensors:  39%|███▉      | 1.95G/5.00G [00:52<01:06, 45.8MB/s][A[A[A
model-00003-of-00007.safetensors:  40%|████      | 2.00G/5.00G [00:53<01:25, 35.1MB/s][Amodel-00002-of-00007.safetensors:  42%|████▏     | 2.02G/4.83G [00:53<01:17, 36.4MB/s]


model-00005-of-00007.safetensors:  41%|████▏     | 2.00G/4.83G [00:52<01:08, 41.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  41%|████      | 1.98G/4.89G [00:53<01:13, 39.6MB/s][A[A


model-00004-of-00007.safetensors:  39%|███▉      | 1.97G/5.00G [00:53<01:04, 47.2MB/s][A[A[A
model-00003-of-00007.safetensors:  40%|████      | 2.02G/5.00G [00:53<01:19, 37.4MB/s][Amodel-00002-of-00007.safetensors:  42%|████▏     | 2.03G/4.83G [00:53<01:11, 39.2MB/s]


model-00005-of-00007.safetensors:  42%|████▏     | 2.02G/4.83G [00:53<01:11, 39.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  41%|████      | 2.00G/4.89G [00:53<01:09, 41.6MB/s][A[A


model-00004-of-00007.safetensors:  40%|███▉      | 1.98G/5.00G [00:53<01:05, 45.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  42%|████▏     | 2.05G/4.83G [00:53<01:08, 40.7MB/s]
model-00003-of-00007.safetensors:  41%|████      | 2.03G/5.00G [00:53<01:22, 35.8MB/s][A


model-00005-of-00007.safetensors:  42%|████▏     | 2.03G/4.83G [00:53<01:10, 39.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  40%|████      | 2.00G/5.00G [00:53<01:04, 46.4MB/s][A[A[A

model-00001-of-00007.safetensors:  41%|████▏     | 2.02G/4.89G [00:54<01:12, 39.8MB/s][A[Amodel-00002-of-00007.safetensors:  43%|████▎     | 2.06G/4.83G [00:54<01:10, 39.4MB/s]


model-00005-of-00007.safetensors:  42%|████▏     | 2.05G/4.83G [00:54<01:04, 43.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  41%|████      | 2.05G/5.00G [00:54<01:18, 37.8MB/s][A


model-00004-of-00007.safetensors:  40%|████      | 2.02G/5.00G [00:54<01:04, 46.1MB/s][A[A[A

model-00001-of-00007.safetensors:  42%|████▏     | 2.03G/4.89G [00:54<01:12, 39.3MB/s][A[A


model-00005-of-00007.safetensors:  43%|████▎     | 2.06G/4.83G [00:54<01:01, 45.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  41%|████▏     | 2.06G/5.00G [00:54<01:13, 39.9MB/s][A


model-00004-of-00007.safetensors:  41%|████      | 2.03G/5.00G [00:54<01:01, 47.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  43%|████▎     | 2.08G/4.83G [00:54<01:11, 38.5MB/s]

model-00001-of-00007.safetensors:  42%|████▏     | 2.05G/4.89G [00:54<01:11, 39.6MB/s][A[A


model-00005-of-00007.safetensors:  43%|████▎     | 2.08G/4.83G [00:54<01:01, 44.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  41%|████      | 2.05G/5.00G [00:54<01:02, 47.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  43%|████▎     | 2.10G/4.83G [00:55<01:09, 39.3MB/s]
model-00003-of-00007.safetensors:  42%|████▏     | 2.08G/5.00G [00:55<01:20, 36.1MB/s][A

model-00001-of-00007.safetensors:  42%|████▏     | 2.06G/4.89G [00:55<01:09, 40.5MB/s][A[A


model-00004-of-00007.safetensors:  41%|████▏     | 2.06G/5.00G [00:55<01:04, 45.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  44%|████▎     | 2.11G/4.83G [00:55<01:06, 40.7MB/s]


model-00005-of-00007.safetensors:  43%|████▎     | 2.10G/4.83G [00:55<01:12, 37.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  42%|████▏     | 2.10G/5.00G [00:55<01:16, 37.9MB/s][A

model-00001-of-00007.safetensors:  43%|████▎     | 2.08G/4.89G [00:55<01:06, 42.1MB/s][A[A


model-00004-of-00007.safetensors:  42%|████▏     | 2.08G/5.00G [00:55<01:02, 46.7MB/s][A[A[A
model-00003-of-00007.safetensors:  42%|████▏     | 2.11G/5.00G [00:55<01:12, 39.7MB/s][A


model-00005-of-00007.safetensors:  44%|████▎     | 2.11G/4.83G [00:55<01:10, 38.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  43%|████▎     | 2.10G/4.89G [00:56<01:06, 41.9MB/s][A[Amodel-00002-of-00007.safetensors:  44%|████▍     | 2.13G/4.83G [00:56<01:16, 35.5MB/s]


model-00004-of-00007.safetensors:  42%|████▏     | 2.10G/5.00G [00:56<01:13, 39.3MB/s][A[A[A


model-00005-of-00007.safetensors:  44%|████▍     | 2.13G/4.83G [00:56<01:08, 39.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  43%|████▎     | 2.13G/5.00G [00:56<01:13, 39.1MB/s][Amodel-00002-of-00007.safetensors:  44%|████▍     | 2.14G/4.83G [00:56<01:12, 37.2MB/s]

model-00001-of-00007.safetensors:  43%|████▎     | 2.11G/4.89G [00:56<01:19, 35.1MB/s][A[A


model-00005-of-00007.safetensors:  44%|████▍     | 2.14G/4.83G [00:56<01:03, 42.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  42%|████▏     | 2.11G/5.00G [00:56<01:11, 40.3MB/s][A[A[A
model-00003-of-00007.safetensors:  43%|████▎     | 2.14G/5.00G [00:56<01:10, 40.6MB/s][Amodel-00002-of-00007.safetensors:  45%|████▍     | 2.16G/4.83G [00:56<01:06, 40.3MB/s]


model-00005-of-00007.safetensors:  45%|████▍     | 2.16G/4.83G [00:56<01:02, 42.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  44%|████▎     | 2.13G/4.89G [00:57<01:17, 35.6MB/s][A[Amodel-00002-of-00007.safetensors:  45%|████▌     | 2.18G/4.83G [00:57<01:01, 43.2MB/s]
model-00003-of-00007.safetensors:  43%|████▎     | 2.16G/5.00G [00:57<01:07, 41.8MB/s][A


model-00004-of-00007.safetensors:  43%|████▎     | 2.13G/5.00G [00:56<01:12, 39.8MB/s][A[A[A


model-00005-of-00007.safetensors:  45%|████▌     | 2.18G/4.83G [00:57<00:59, 44.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  44%|████▍     | 2.14G/4.89G [00:57<01:09, 39.3MB/s][A[Amodel-00002-of-00007.safetensors:  45%|████▌     | 2.19G/4.83G [00:57<00:59, 44.2MB/s]
model-00003-of-00007.safetensors:  44%|████▎     | 2.18G/5.00G [00:57<01:06, 42.5MB/s][A


model-00004-of-00007.safetensors:  43%|████▎     | 2.14G/5.00G [00:57<01:14, 38.5MB/s][A[A[A


model-00005-of-00007.safetensors:  45%|████▌     | 2.19G/4.83G [00:57<01:00, 43.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  46%|████▌     | 2.21G/4.83G [00:57<01:01, 42.9MB/s]

model-00001-of-00007.safetensors:  44%|████▍     | 2.16G/4.89G [00:57<01:12, 37.5MB/s][A[A


model-00004-of-00007.safetensors:  43%|████▎     | 2.16G/5.00G [00:57<01:10, 40.6MB/s][A[A[A
model-00003-of-00007.safetensors:  44%|████▍     | 2.19G/5.00G [00:57<01:11, 39.4MB/s][A


model-00005-of-00007.safetensors:  46%|████▌     | 2.21G/4.83G [00:57<00:57, 45.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  45%|████▍     | 2.18G/4.89G [00:58<01:07, 39.9MB/s][A[A


model-00004-of-00007.safetensors:  44%|████▎     | 2.18G/5.00G [00:58<01:12, 38.8MB/s][A[A[A


model-00005-of-00007.safetensors:  46%|████▌     | 2.22G/4.83G [00:58<00:56, 46.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  44%|████▍     | 2.21G/5.00G [00:58<01:19, 35.0MB/s][A

model-00001-of-00007.safetensors:  45%|████▍     | 2.19G/4.89G [00:58<01:06, 40.6MB/s][A[A


model-00004-of-00007.safetensors:  44%|████▍     | 2.19G/5.00G [00:58<01:10, 39.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  46%|████▌     | 2.22G/4.83G [00:58<01:27, 29.7MB/s]


model-00005-of-00007.safetensors:  46%|████▋     | 2.24G/4.83G [00:58<00:57, 45.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  44%|████▍     | 2.22G/5.00G [00:58<01:13, 38.0MB/s][A

model-00001-of-00007.safetensors:  45%|████▌     | 2.21G/4.89G [00:59<01:03, 42.1MB/s][A[A


model-00005-of-00007.safetensors:  47%|████▋     | 2.26G/4.83G [00:58<00:54, 47.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  44%|████▍     | 2.21G/5.00G [00:58<01:12, 38.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  46%|████▋     | 2.24G/4.83G [00:59<01:22, 31.4MB/s]
model-00003-of-00007.safetensors:  45%|████▍     | 2.24G/5.00G [00:59<01:12, 38.2MB/s][A

model-00001-of-00007.safetensors:  46%|████▌     | 2.22G/4.89G [00:59<01:05, 40.7MB/s][A[A


model-00005-of-00007.safetensors:  47%|████▋     | 2.27G/4.83G [00:59<00:54, 47.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  47%|████▋     | 2.26G/4.83G [00:59<01:13, 35.1MB/s]


model-00004-of-00007.safetensors:  44%|████▍     | 2.22G/5.00G [00:59<01:09, 39.9MB/s][A[A[A
model-00003-of-00007.safetensors:  45%|████▌     | 2.26G/5.00G [00:59<01:08, 40.0MB/s][A


model-00005-of-00007.safetensors:  47%|████▋     | 2.29G/4.83G [00:59<00:53, 47.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  46%|████▌     | 2.24G/4.89G [00:59<01:09, 38.0MB/s][A[A


model-00004-of-00007.safetensors:  45%|████▍     | 2.24G/5.00G [00:59<01:05, 42.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  47%|████▋     | 2.27G/4.83G [00:59<01:10, 36.5MB/s]
model-00003-of-00007.safetensors:  45%|████▌     | 2.27G/5.00G [00:59<01:04, 42.2MB/s][A


model-00005-of-00007.safetensors:  48%|████▊     | 2.30G/4.83G [00:59<00:57, 44.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  46%|████▌     | 2.26G/4.89G [01:00<01:07, 39.2MB/s][A[A


model-00004-of-00007.safetensors:  45%|████▌     | 2.26G/5.00G [01:00<01:07, 40.4MB/s][A[A[Amodel-00002-of-00007.safetensors:  47%|████▋     | 2.29G/4.83G [01:00<01:08, 37.0MB/s]
model-00003-of-00007.safetensors:  46%|████▌     | 2.29G/5.00G [01:00<01:07, 40.0MB/s][A


model-00005-of-00007.safetensors:  48%|████▊     | 2.32G/4.83G [01:00<00:55, 45.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  46%|████▋     | 2.27G/4.89G [01:00<01:04, 40.8MB/s][A[A


model-00004-of-00007.safetensors:  45%|████▌     | 2.27G/5.00G [01:00<01:06, 40.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  48%|████▊     | 2.30G/4.83G [01:00<01:05, 38.8MB/s]
model-00003-of-00007.safetensors:  46%|████▌     | 2.30G/5.00G [01:00<01:03, 42.6MB/s][A


model-00005-of-00007.safetensors:  48%|████▊     | 2.34G/4.83G [01:00<00:54, 46.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  47%|████▋     | 2.29G/4.89G [01:01<01:06, 39.3MB/s][A[A
model-00003-of-00007.safetensors:  46%|████▋     | 2.32G/5.00G [01:00<01:00, 44.1MB/s][A


model-00004-of-00007.safetensors:  46%|████▌     | 2.29G/5.00G [01:00<01:06, 40.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  48%|████▊     | 2.32G/4.83G [01:01<01:05, 38.6MB/s]


model-00005-of-00007.safetensors:  49%|████▊     | 2.35G/4.83G [01:00<00:55, 44.4MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  47%|████▋     | 2.30G/4.89G [01:01<01:02, 41.4MB/s][A[A


model-00004-of-00007.safetensors:  46%|████▌     | 2.30G/5.00G [01:01<01:05, 41.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  48%|████▊     | 2.34G/4.83G [01:01<01:06, 37.6MB/s]
model-00003-of-00007.safetensors:  47%|████▋     | 2.34G/5.00G [01:01<01:13, 36.3MB/s][A

model-00001-of-00007.safetensors:  47%|████▋     | 2.32G/4.89G [01:01<00:59, 43.1MB/s][A[A


model-00004-of-00007.safetensors:  46%|████▋     | 2.32G/5.00G [01:01<01:03, 42.5MB/s][A[A[A


model-00005-of-00007.safetensors:  49%|████▉     | 2.37G/4.83G [01:01<01:06, 37.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  49%|████▊     | 2.35G/4.83G [01:01<01:01, 40.3MB/s]

model-00001-of-00007.safetensors:  48%|████▊     | 2.34G/4.89G [01:02<00:57, 44.7MB/s][A[A
model-00003-of-00007.safetensors:  47%|████▋     | 2.35G/5.00G [01:01<01:09, 38.3MB/s][A


model-00004-of-00007.safetensors:  47%|████▋     | 2.34G/5.00G [01:01<00:59, 44.6MB/s][A[A[A


model-00005-of-00007.safetensors:  49%|████▉     | 2.38G/4.83G [01:01<01:02, 39.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  49%|████▉     | 2.37G/4.83G [01:02<00:57, 42.6MB/s]

model-00001-of-00007.safetensors:  48%|████▊     | 2.35G/4.89G [01:02<00:56, 44.9MB/s][A[A
model-00003-of-00007.safetensors:  47%|████▋     | 2.37G/5.00G [01:02<01:05, 40.0MB/s][A


model-00004-of-00007.safetensors:  47%|████▋     | 2.35G/5.00G [01:02<01:00, 43.9MB/s][A[A[A


model-00005-of-00007.safetensors:  50%|████▉     | 2.40G/4.83G [01:02<01:00, 40.3MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  48%|████▊     | 2.37G/4.89G [01:02<01:01, 41.0MB/s][A[A
model-00003-of-00007.safetensors:  48%|████▊     | 2.38G/5.00G [01:02<01:07, 38.6MB/s][A


model-00005-of-00007.safetensors:  50%|█████     | 2.42G/4.83G [01:02<00:56, 42.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  47%|████▋     | 2.37G/5.00G [01:02<01:00, 43.5MB/s][A[A[A
model-00003-of-00007.safetensors:  48%|████▊     | 2.40G/5.00G [01:02<00:56, 46.4MB/s][Amodel-00002-of-00007.safetensors:  49%|████▉     | 2.38G/4.83G [01:03<01:17, 31.6MB/s]

model-00001-of-00007.safetensors:  49%|████▉     | 2.38G/4.89G [01:03<00:59, 42.2MB/s][A[A


model-00005-of-00007.safetensors:  50%|█████     | 2.43G/4.83G [01:02<00:54, 44.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  48%|████▊     | 2.40G/5.00G [01:03<01:07, 38.6MB/s][Amodel-00002-of-00007.safetensors:  50%|████▉     | 2.40G/4.83G [01:03<01:10, 34.7MB/s]


model-00004-of-00007.safetensors:  48%|████▊     | 2.38G/5.00G [01:03<01:12, 36.3MB/s][A[A[A


model-00005-of-00007.safetensors:  51%|█████     | 2.45G/4.83G [01:03<00:52, 45.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  48%|████▊     | 2.42G/5.00G [01:03<01:07, 38.2MB/s][A

model-00001-of-00007.safetensors:  49%|████▉     | 2.40G/4.89G [01:03<01:07, 36.7MB/s][A[Amodel-00002-of-00007.safetensors:  50%|█████     | 2.42G/4.83G [01:03<01:04, 37.3MB/s]


model-00004-of-00007.safetensors:  48%|████▊     | 2.40G/5.00G [01:03<01:08, 38.2MB/s][A[A[A


model-00005-of-00007.safetensors:  51%|█████     | 2.46G/4.83G [01:03<00:52, 44.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  49%|████▊     | 2.43G/5.00G [01:03<01:09, 37.2MB/s][Amodel-00002-of-00007.safetensors:  50%|█████     | 2.43G/4.83G [01:04<01:00, 39.4MB/s]

model-00001-of-00007.safetensors:  49%|████▉     | 2.42G/4.89G [01:04<01:08, 36.2MB/s][A[A


model-00004-of-00007.safetensors:  48%|████▊     | 2.42G/5.00G [01:03<01:05, 39.5MB/s][A[A[A


model-00005-of-00007.safetensors:  51%|█████▏    | 2.48G/4.83G [01:04<00:53, 44.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  50%|████▉     | 2.43G/4.89G [01:04<01:01, 39.8MB/s][A[A


model-00005-of-00007.safetensors:  52%|█████▏    | 2.50G/4.83G [01:04<00:52, 44.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  49%|████▊     | 2.43G/5.00G [01:04<01:15, 34.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  51%|█████     | 2.45G/4.83G [01:04<01:19, 30.0MB/s]


model-00005-of-00007.safetensors:  52%|█████▏    | 2.51G/4.83G [01:04<00:50, 46.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  50%|█████     | 2.45G/4.89G [01:05<01:03, 38.4MB/s][A[A


model-00004-of-00007.safetensors:  49%|████▉     | 2.45G/5.00G [01:04<01:07, 37.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  51%|█████     | 2.46G/4.83G [01:05<01:12, 32.8MB/s]


model-00005-of-00007.safetensors:  52%|█████▏    | 2.53G/4.83G [01:05<00:51, 44.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  50%|█████     | 2.46G/4.89G [01:05<01:01, 39.2MB/s][A[A
model-00003-of-00007.safetensors:  49%|████▉     | 2.45G/5.00G [01:05<02:09, 19.7MB/s][A


model-00005-of-00007.safetensors:  53%|█████▎    | 2.54G/4.83G [01:05<00:50, 45.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  51%|█████▏    | 2.48G/4.83G [01:05<01:05, 35.7MB/s]

model-00001-of-00007.safetensors:  51%|█████     | 2.48G/4.89G [01:05<01:03, 38.2MB/s][A[A


model-00004-of-00007.safetensors:  49%|████▉     | 2.46G/5.00G [01:05<01:19, 31.7MB/s][A[A[A
model-00003-of-00007.safetensors:  49%|████▉     | 2.46G/5.00G [01:05<01:45, 24.0MB/s][A


model-00005-of-00007.safetensors:  53%|█████▎    | 2.56G/4.83G [01:05<00:49, 46.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  52%|█████▏    | 2.50G/4.83G [01:06<01:02, 37.5MB/s]

model-00001-of-00007.safetensors:  51%|█████     | 2.50G/4.89G [01:06<01:00, 39.8MB/s][A[A


model-00004-of-00007.safetensors:  50%|████▉     | 2.48G/5.00G [01:05<01:12, 34.9MB/s][A[A[A
model-00003-of-00007.safetensors:  50%|████▉     | 2.48G/5.00G [01:06<01:35, 26.3MB/s][A

model-00001-of-00007.safetensors:  51%|█████▏    | 2.51G/4.89G [01:06<00:56, 41.7MB/s][A[A


model-00005-of-00007.safetensors:  53%|█████▎    | 2.58G/4.83G [01:06<00:56, 40.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  52%|█████▏    | 2.51G/4.83G [01:06<01:08, 33.9MB/s]


model-00004-of-00007.safetensors:  50%|████▉     | 2.50G/5.00G [01:06<01:13, 33.9MB/s][A[A[A
model-00003-of-00007.safetensors:  50%|████▉     | 2.50G/5.00G [01:06<01:23, 29.9MB/s][A

model-00001-of-00007.safetensors:  52%|█████▏    | 2.53G/4.89G [01:06<00:56, 41.8MB/s][A[A


model-00005-of-00007.safetensors:  54%|█████▎    | 2.59G/4.83G [01:06<00:54, 41.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  52%|█████▏    | 2.53G/4.83G [01:06<01:04, 35.8MB/s]


model-00004-of-00007.safetensors:  50%|█████     | 2.51G/5.00G [01:06<01:08, 36.2MB/s][A[A[A
model-00003-of-00007.safetensors:  50%|█████     | 2.51G/5.00G [01:07<01:14, 33.6MB/s][A

model-00001-of-00007.safetensors:  52%|█████▏    | 2.54G/4.89G [01:07<00:54, 43.2MB/s][A[A


model-00005-of-00007.safetensors:  54%|█████▍    | 2.61G/4.83G [01:06<00:52, 42.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  53%|█████▎    | 2.54G/4.83G [01:07<00:59, 38.6MB/s]


model-00004-of-00007.safetensors:  51%|█████     | 2.53G/5.00G [01:07<01:02, 39.4MB/s][A[A[A

model-00001-of-00007.safetensors:  52%|█████▏    | 2.56G/4.89G [01:07<00:52, 43.9MB/s][A[A
model-00003-of-00007.safetensors:  51%|█████     | 2.53G/5.00G [01:07<01:09, 35.5MB/s][A


model-00005-of-00007.safetensors:  54%|█████▍    | 2.62G/4.83G [01:07<00:53, 41.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  53%|█████▎    | 2.56G/4.83G [01:07<00:55, 41.1MB/s]


model-00004-of-00007.safetensors:  51%|█████     | 2.54G/5.00G [01:07<01:03, 38.5MB/s][A[A[A

model-00001-of-00007.safetensors:  53%|█████▎    | 2.58G/4.89G [01:08<00:53, 43.4MB/s][A[A


model-00005-of-00007.safetensors:  55%|█████▍    | 2.64G/4.83G [01:07<00:51, 42.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  51%|█████     | 2.54G/5.00G [01:08<01:13, 33.5MB/s][Amodel-00002-of-00007.safetensors:  53%|█████▎    | 2.58G/4.83G [01:08<01:00, 37.0MB/s]


model-00004-of-00007.safetensors:  51%|█████     | 2.56G/5.00G [01:08<01:04, 38.0MB/s][A[A[A


model-00005-of-00007.safetensors:  55%|█████▍    | 2.66G/4.83G [01:08<00:49, 43.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  51%|█████     | 2.56G/5.00G [01:08<01:06, 36.6MB/s][A

model-00001-of-00007.safetensors:  53%|█████▎    | 2.59G/4.89G [01:08<01:04, 35.4MB/s][A[Amodel-00002-of-00007.safetensors:  54%|█████▎    | 2.59G/4.83G [01:08<00:58, 38.0MB/s]


model-00005-of-00007.safetensors:  55%|█████▌    | 2.67G/4.83G [01:08<00:47, 45.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  52%|█████▏    | 2.58G/5.00G [01:08<01:03, 38.3MB/s][A[A[A
model-00003-of-00007.safetensors:  52%|█████▏    | 2.58G/5.00G [01:08<01:03, 37.9MB/s][Amodel-00002-of-00007.safetensors:  54%|█████▍    | 2.61G/4.83G [01:08<00:56, 39.5MB/s]

model-00001-of-00007.safetensors:  53%|█████▎    | 2.61G/4.89G [01:09<01:03, 36.0MB/s][A[A


model-00004-of-00007.safetensors:  52%|█████▏    | 2.59G/5.00G [01:08<01:01, 39.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  54%|█████▍    | 2.62G/4.83G [01:09<00:53, 41.5MB/s]
model-00003-of-00007.safetensors:  52%|█████▏    | 2.59G/5.00G [01:09<01:07, 35.6MB/s][A


model-00004-of-00007.safetensors:  52%|█████▏    | 2.61G/5.00G [01:09<00:58, 40.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  55%|█████▍    | 2.64G/4.83G [01:09<00:51, 42.7MB/s]


model-00005-of-00007.safetensors:  56%|█████▌    | 2.69G/4.83G [01:09<01:14, 28.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  52%|█████▏    | 2.62G/5.00G [01:09<01:00, 39.3MB/s][A[A[A

model-00001-of-00007.safetensors:  54%|█████▎    | 2.62G/4.89G [01:10<01:25, 26.4MB/s][A[Amodel-00002-of-00007.safetensors:  55%|█████▍    | 2.66G/4.83G [01:09<00:49, 43.7MB/s]


model-00005-of-00007.safetensors:  56%|█████▌    | 2.70G/4.83G [01:09<01:05, 32.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  53%|█████▎    | 2.64G/5.00G [01:09<00:57, 40.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  55%|█████▌    | 2.67G/4.83G [01:10<00:50, 43.2MB/s]


model-00005-of-00007.safetensors:  56%|█████▋    | 2.72G/4.83G [01:10<01:01, 34.5MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  52%|█████▏    | 2.61G/5.00G [01:10<01:38, 24.3MB/s][A


model-00004-of-00007.safetensors:  53%|█████▎    | 2.66G/5.00G [01:10<00:59, 39.6MB/s][A[A[Amodel-00002-of-00007.safetensors:  56%|█████▌    | 2.69G/4.83G [01:10<00:49, 43.5MB/s]

model-00001-of-00007.safetensors:  54%|█████▍    | 2.64G/4.89G [01:10<01:31, 24.5MB/s][A[A


model-00005-of-00007.safetensors:  57%|█████▋    | 2.74G/4.83G [01:10<00:56, 36.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  52%|█████▏    | 2.62G/5.00G [01:10<01:26, 27.4MB/s][A


model-00004-of-00007.safetensors:  53%|█████▎    | 2.67G/5.00G [01:10<01:01, 38.0MB/s][A[A[A


model-00005-of-00007.safetensors:  57%|█████▋    | 2.75G/4.83G [01:10<00:52, 39.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  56%|█████▌    | 2.70G/4.83G [01:11<00:50, 42.5MB/s]
model-00003-of-00007.safetensors:  53%|█████▎    | 2.64G/5.00G [01:11<01:16, 30.9MB/s][A

model-00001-of-00007.safetensors:  54%|█████▍    | 2.66G/4.89G [01:11<01:36, 23.1MB/s][A[A


model-00004-of-00007.safetensors:  54%|█████▍    | 2.69G/5.00G [01:11<01:01, 37.6MB/s][A[A[A
model-00003-of-00007.safetensors:  53%|█████▎    | 2.66G/5.00G [01:11<01:08, 34.2MB/s][Amodel-00002-of-00007.safetensors:  56%|█████▋    | 2.72G/4.83G [01:11<00:57, 36.4MB/s]


model-00005-of-00007.safetensors:  57%|█████▋    | 2.77G/4.83G [01:11<01:02, 33.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  55%|█████▍    | 2.67G/4.89G [01:12<01:22, 26.9MB/s][A[A


model-00004-of-00007.safetensors:  54%|█████▍    | 2.70G/5.00G [01:11<00:59, 38.5MB/s][A[A[A
model-00003-of-00007.safetensors:  53%|█████▎    | 2.67G/5.00G [01:11<01:06, 34.8MB/s][Amodel-00002-of-00007.safetensors:  57%|█████▋    | 2.74G/4.83G [01:12<00:55, 38.0MB/s]


model-00005-of-00007.safetensors:  58%|█████▊    | 2.78G/4.83G [01:11<01:00, 33.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  55%|█████▌    | 2.69G/4.89G [01:12<01:12, 30.5MB/s][A[A


model-00004-of-00007.safetensors:  54%|█████▍    | 2.72G/5.00G [01:12<00:56, 40.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  57%|█████▋    | 2.75G/4.83G [01:12<00:52, 39.7MB/s]
model-00003-of-00007.safetensors:  54%|█████▍    | 2.69G/5.00G [01:12<01:05, 35.2MB/s][A


model-00005-of-00007.safetensors:  58%|█████▊    | 2.80G/4.83G [01:12<00:55, 36.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  55%|█████▌    | 2.70G/4.89G [01:12<01:04, 33.6MB/s][A[A


model-00004-of-00007.safetensors:  55%|█████▍    | 2.74G/5.00G [01:12<00:55, 41.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  57%|█████▋    | 2.77G/4.83G [01:12<00:50, 40.6MB/s]
model-00003-of-00007.safetensors:  54%|█████▍    | 2.70G/5.00G [01:12<01:07, 33.9MB/s][A


model-00004-of-00007.safetensors:  55%|█████▌    | 2.75G/5.00G [01:12<00:54, 41.4MB/s][A[A[A

model-00001-of-00007.safetensors:  56%|█████▌    | 2.72G/4.89G [01:13<01:04, 33.8MB/s][A[A


model-00005-of-00007.safetensors:  58%|█████▊    | 2.82G/4.83G [01:12<00:58, 34.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  58%|█████▊    | 2.78G/4.83G [01:13<00:48, 41.8MB/s]


model-00004-of-00007.safetensors:  55%|█████▌    | 2.77G/5.00G [01:13<00:51, 43.0MB/s][A[A[A

model-00001-of-00007.safetensors:  56%|█████▌    | 2.74G/4.89G [01:13<00:56, 38.0MB/s][A[A


model-00005-of-00007.safetensors:  59%|█████▊    | 2.83G/4.83G [01:13<00:56, 35.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  58%|█████▊    | 2.80G/4.83G [01:13<00:46, 43.3MB/s]
model-00003-of-00007.safetensors:  54%|█████▍    | 2.72G/5.00G [01:13<01:11, 31.7MB/s][A


model-00004-of-00007.safetensors:  56%|█████▌    | 2.78G/5.00G [01:13<00:49, 44.4MB/s][A[A[A

model-00001-of-00007.safetensors:  56%|█████▋    | 2.75G/4.89G [01:13<00:54, 39.2MB/s][A[A


model-00005-of-00007.safetensors:  59%|█████▉    | 2.85G/4.83G [01:13<00:51, 38.3MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  58%|█████▊    | 2.82G/4.83G [01:13<00:46, 43.6MB/s]
model-00003-of-00007.safetensors:  55%|█████▍    | 2.74G/5.00G [01:13<01:07, 33.7MB/s][A


model-00004-of-00007.safetensors:  56%|█████▌    | 2.80G/5.00G [01:13<00:48, 45.6MB/s][A[A[Amodel-00002-of-00007.safetensors:  59%|█████▊    | 2.83G/4.83G [01:14<00:43, 45.9MB/s]


model-00005-of-00007.safetensors:  59%|█████▉    | 2.86G/4.83G [01:14<00:49, 39.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  56%|█████▋    | 2.82G/5.00G [01:14<00:46, 47.4MB/s][A[A[A
model-00003-of-00007.safetensors:  55%|█████▌    | 2.75G/5.00G [01:14<01:00, 37.0MB/s][A

model-00001-of-00007.safetensors:  57%|█████▋    | 2.77G/4.89G [01:14<01:03, 33.3MB/s][A[A


model-00005-of-00007.safetensors:  60%|█████▉    | 2.88G/4.83G [01:14<00:47, 40.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  55%|█████▌    | 2.77G/5.00G [01:14<00:56, 39.3MB/s][Amodel-00002-of-00007.safetensors:  59%|█████▉    | 2.85G/4.83G [01:14<00:49, 40.2MB/s]


model-00004-of-00007.safetensors:  57%|█████▋    | 2.83G/5.00G [01:14<00:47, 45.8MB/s][A[A[A

model-00001-of-00007.safetensors:  57%|█████▋    | 2.78G/4.89G [01:14<00:56, 37.0MB/s][A[A
model-00003-of-00007.safetensors:  56%|█████▌    | 2.78G/5.00G [01:14<00:53, 41.0MB/s][Amodel-00002-of-00007.safetensors:  59%|█████▉    | 2.86G/4.83G [01:15<00:47, 41.6MB/s]


model-00004-of-00007.safetensors:  57%|█████▋    | 2.85G/5.00G [01:14<00:48, 43.9MB/s][A[A[A


model-00005-of-00007.safetensors:  60%|█████▉    | 2.90G/4.83G [01:14<00:55, 34.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  57%|█████▋    | 2.80G/4.89G [01:15<01:03, 33.0MB/s][A[A
model-00003-of-00007.safetensors:  56%|█████▌    | 2.80G/5.00G [01:15<00:53, 41.0MB/s][Amodel-00002-of-00007.safetensors:  60%|█████▉    | 2.88G/4.83G [01:15<00:49, 39.1MB/s]


model-00004-of-00007.safetensors:  57%|█████▋    | 2.86G/5.00G [01:15<00:51, 41.5MB/s][A[A[A


model-00005-of-00007.safetensors:  60%|██████    | 2.91G/4.83G [01:15<01:00, 31.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  58%|█████▊    | 2.88G/5.00G [01:15<00:48, 43.4MB/s][A[A[A

model-00001-of-00007.safetensors:  58%|█████▊    | 2.82G/4.89G [01:16<01:05, 31.5MB/s][A[A
model-00003-of-00007.safetensors:  56%|█████▋    | 2.82G/5.00G [01:15<00:58, 37.6MB/s][Amodel-00002-of-00007.safetensors:  60%|█████▉    | 2.90G/4.83G [01:16<00:52, 36.9MB/s]


model-00005-of-00007.safetensors:  61%|██████    | 2.93G/4.83G [01:15<00:55, 34.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  57%|█████▋    | 2.83G/5.00G [01:16<00:54, 39.8MB/s][A


model-00004-of-00007.safetensors:  58%|█████▊    | 2.90G/5.00G [01:16<00:52, 39.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  60%|██████    | 2.91G/4.83G [01:16<00:52, 36.7MB/s]

model-00001-of-00007.safetensors:  58%|█████▊    | 2.83G/4.89G [01:16<01:14, 27.7MB/s][A[A


model-00005-of-00007.safetensors:  61%|██████    | 2.94G/4.83G [01:16<00:54, 34.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  57%|█████▋    | 2.85G/5.00G [01:16<00:54, 39.2MB/s][A


model-00004-of-00007.safetensors:  58%|█████▊    | 2.91G/5.00G [01:16<00:51, 40.6MB/s][A[A[Amodel-00002-of-00007.safetensors:  61%|██████    | 2.93G/4.83G [01:16<00:47, 40.4MB/s]

model-00001-of-00007.safetensors:  58%|█████▊    | 2.85G/4.89G [01:17<01:04, 31.7MB/s][A[A
model-00003-of-00007.safetensors:  57%|█████▋    | 2.86G/5.00G [01:16<00:51, 41.6MB/s][A


model-00004-of-00007.safetensors:  59%|█████▊    | 2.93G/5.00G [01:16<00:48, 42.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  61%|██████    | 2.94G/4.83G [01:17<00:43, 43.0MB/s]

model-00001-of-00007.safetensors:  59%|█████▊    | 2.86G/4.89G [01:17<00:57, 35.3MB/s][A[Amodel-00002-of-00007.safetensors:  61%|██████▏   | 2.96G/4.83G [01:17<00:42, 44.4MB/s]


model-00005-of-00007.safetensors:  61%|██████▏   | 2.96G/4.83G [01:17<01:05, 28.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  58%|█████▊    | 2.88G/5.00G [01:17<00:57, 37.1MB/s][A


model-00004-of-00007.safetensors:  59%|█████▉    | 2.94G/5.00G [01:17<00:56, 36.7MB/s][A[A[Amodel-00002-of-00007.safetensors:  62%|██████▏   | 2.98G/4.83G [01:17<00:40, 45.4MB/s]


model-00005-of-00007.safetensors:  62%|██████▏   | 2.98G/4.83G [01:17<00:59, 31.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  58%|█████▊    | 2.90G/5.00G [01:17<00:53, 39.0MB/s][A


model-00004-of-00007.safetensors:  59%|█████▉    | 2.96G/5.00G [01:17<00:56, 36.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  62%|██████▏   | 2.99G/4.83G [01:18<00:40, 45.0MB/s]


model-00005-of-00007.safetensors:  62%|██████▏   | 2.99G/4.83G [01:18<00:55, 33.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  58%|█████▊    | 2.91G/5.00G [01:18<00:51, 40.6MB/s][A

model-00001-of-00007.safetensors:  59%|█████▉    | 2.88G/4.89G [01:18<01:17, 25.8MB/s][A[A


model-00004-of-00007.safetensors:  60%|█████▉    | 2.98G/5.00G [01:18<00:52, 38.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  62%|██████▏   | 3.01G/4.83G [01:18<00:41, 44.3MB/s]
model-00003-of-00007.safetensors:  59%|█████▊    | 2.93G/5.00G [01:18<00:50, 41.3MB/s][Amodel-00002-of-00007.safetensors:  63%|██████▎   | 3.02G/4.83G [01:18<00:39, 45.3MB/s]

model-00001-of-00007.safetensors:  59%|█████▉    | 2.90G/4.89G [01:18<01:13, 27.0MB/s][A[A


model-00004-of-00007.safetensors:  60%|█████▉    | 2.99G/5.00G [01:18<00:51, 38.7MB/s][A[A[A


model-00005-of-00007.safetensors:  62%|██████▏   | 3.01G/4.83G [01:18<01:06, 27.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  63%|██████▎   | 3.04G/4.83G [01:19<00:39, 44.9MB/s]


model-00004-of-00007.safetensors:  60%|██████    | 3.01G/5.00G [01:18<00:49, 40.5MB/s][A[A[A

model-00001-of-00007.safetensors:  60%|█████▉    | 2.91G/4.89G [01:19<01:04, 30.5MB/s][A[A


model-00005-of-00007.safetensors:  63%|██████▎   | 3.02G/4.83G [01:19<00:58, 30.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  63%|██████▎   | 3.06G/4.83G [01:19<00:42, 41.7MB/s]

model-00001-of-00007.safetensors:  60%|█████▉    | 2.93G/4.89G [01:19<01:08, 28.8MB/s][A[A


model-00004-of-00007.safetensors:  60%|██████    | 3.02G/5.00G [01:19<00:58, 34.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  64%|██████▎   | 3.07G/4.83G [01:19<00:40, 43.9MB/s]


model-00005-of-00007.safetensors:  63%|██████▎   | 3.04G/4.83G [01:19<00:58, 30.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  60%|██████    | 2.94G/4.89G [01:20<00:59, 32.7MB/s][A[A


model-00005-of-00007.safetensors:  63%|██████▎   | 3.06G/4.83G [01:20<00:52, 34.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  61%|██████    | 3.04G/5.00G [01:20<00:58, 33.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  64%|██████▍   | 3.09G/4.83G [01:20<00:44, 39.3MB/s]

model-00001-of-00007.safetensors:  61%|██████    | 2.96G/4.89G [01:20<00:58, 32.7MB/s][A[A


model-00004-of-00007.safetensors:  61%|██████    | 3.06G/5.00G [01:20<00:55, 34.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  64%|██████▍   | 3.10G/4.83G [01:20<00:41, 41.4MB/s]


model-00004-of-00007.safetensors:  61%|██████▏   | 3.07G/5.00G [01:20<00:50, 38.4MB/s][A[A[Amodel-00002-of-00007.safetensors:  65%|██████▍   | 3.12G/4.83G [01:21<00:39, 43.4MB/s]

model-00001-of-00007.safetensors:  61%|██████    | 2.98G/4.89G [01:21<00:58, 32.8MB/s][A[A


model-00005-of-00007.safetensors:  64%|██████▎   | 3.07G/4.83G [01:21<01:12, 24.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  62%|██████▏   | 3.09G/5.00G [01:21<00:47, 40.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  65%|██████▍   | 3.14G/4.83G [01:21<00:38, 43.9MB/s]

model-00001-of-00007.safetensors:  61%|██████    | 2.99G/4.89G [01:21<00:55, 34.3MB/s][A[A


model-00005-of-00007.safetensors:  64%|██████▍   | 3.09G/4.83G [01:21<01:03, 27.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  65%|██████▌   | 3.15G/4.83G [01:21<00:39, 42.3MB/s]

model-00001-of-00007.safetensors:  62%|██████▏   | 3.01G/4.89G [01:22<00:52, 36.0MB/s][A[A


model-00004-of-00007.safetensors:  62%|██████▏   | 3.10G/5.00G [01:21<00:52, 35.9MB/s][A[A[A


model-00005-of-00007.safetensors:  64%|██████▍   | 3.10G/4.83G [01:21<00:55, 31.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  62%|██████▏   | 3.02G/4.89G [01:22<00:48, 38.4MB/s][A[A


model-00004-of-00007.safetensors:  62%|██████▏   | 3.12G/5.00G [01:22<00:54, 34.5MB/s][A[A[A

model-00001-of-00007.safetensors:  62%|██████▏   | 3.04G/4.89G [01:22<00:44, 41.9MB/s][A[A


model-00005-of-00007.safetensors:  65%|██████▍   | 3.12G/4.83G [01:22<00:56, 30.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  63%|██████▎   | 3.14G/5.00G [01:22<00:50, 37.0MB/s][A[A[A

model-00001-of-00007.safetensors:  63%|██████▎   | 3.06G/4.89G [01:23<00:42, 43.1MB/s][A[Amodel-00002-of-00007.safetensors:  66%|██████▌   | 3.17G/4.83G [01:22<01:01, 27.1MB/s]


model-00005-of-00007.safetensors:  65%|██████▍   | 3.14G/4.83G [01:22<00:51, 32.9MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  63%|██████▎   | 3.15G/5.00G [01:23<00:50, 36.7MB/s][A[A[A

model-00001-of-00007.safetensors:  63%|██████▎   | 3.07G/4.89G [01:23<00:42, 43.0MB/s][A[Amodel-00002-of-00007.safetensors:  66%|██████▌   | 3.18G/4.83G [01:23<00:56, 29.4MB/s]


model-00005-of-00007.safetensors:  65%|██████▌   | 3.15G/4.83G [01:23<00:51, 32.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  63%|██████▎   | 3.17G/5.00G [01:23<00:47, 38.6MB/s][A[A[A

model-00001-of-00007.safetensors:  63%|██████▎   | 3.09G/4.89G [01:23<00:42, 42.6MB/s][A[Amodel-00002-of-00007.safetensors:  66%|██████▌   | 3.20G/4.83G [01:23<00:51, 31.7MB/s]


model-00005-of-00007.safetensors:  66%|██████▌   | 3.17G/4.83G [01:23<00:46, 35.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  59%|█████▉    | 2.94G/5.00G [01:23<04:01, 8.51MB/s][A

model-00001-of-00007.safetensors:  64%|██████▎   | 3.10G/4.89G [01:24<00:45, 39.5MB/s][A[Amodel-00002-of-00007.safetensors:  67%|██████▋   | 3.22G/4.83G [01:24<00:47, 33.9MB/s]


model-00004-of-00007.safetensors:  64%|██████▎   | 3.18G/5.00G [01:23<00:51, 35.3MB/s][A[A[A
model-00003-of-00007.safetensors:  59%|█████▉    | 2.96G/5.00G [01:24<03:00, 11.3MB/s][A


model-00005-of-00007.safetensors:  66%|██████▌   | 3.18G/4.83G [01:24<00:45, 36.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  67%|██████▋   | 3.23G/4.83G [01:24<00:44, 36.2MB/s]

model-00001-of-00007.safetensors:  64%|██████▍   | 3.12G/4.89G [01:24<00:44, 39.3MB/s][A[A


model-00004-of-00007.safetensors:  64%|██████▍   | 3.20G/5.00G [01:24<00:50, 35.3MB/s][A[A[A


model-00005-of-00007.safetensors:  66%|██████▌   | 3.20G/4.83G [01:24<00:41, 39.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  60%|█████▉    | 2.98G/5.00G [01:24<02:24, 14.0MB/s][A

model-00001-of-00007.safetensors:  64%|██████▍   | 3.14G/4.89G [01:25<00:43, 40.1MB/s][A[A


model-00004-of-00007.safetensors:  64%|██████▍   | 3.22G/5.00G [01:24<00:48, 36.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  67%|██████▋   | 3.25G/4.83G [01:25<00:45, 34.9MB/s]


model-00005-of-00007.safetensors:  67%|██████▋   | 3.22G/4.83G [01:24<00:40, 40.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  65%|██████▍   | 3.15G/4.89G [01:25<00:41, 42.1MB/s][A[Amodel-00002-of-00007.safetensors:  68%|██████▊   | 3.26G/4.83G [01:25<00:42, 36.9MB/s]
model-00003-of-00007.safetensors:  60%|█████▉    | 2.99G/5.00G [01:25<02:02, 16.4MB/s][A


model-00005-of-00007.safetensors:  67%|██████▋   | 3.23G/4.83G [01:25<00:41, 38.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  65%|██████▍   | 3.17G/4.89G [01:25<00:40, 42.2MB/s][A[Amodel-00002-of-00007.safetensors:  68%|██████▊   | 3.28G/4.83G [01:25<00:40, 37.9MB/s]


model-00005-of-00007.safetensors:  67%|██████▋   | 3.25G/4.83G [01:25<00:40, 38.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  60%|██████    | 3.01G/5.00G [01:25<01:44, 19.1MB/s][A

model-00001-of-00007.safetensors:  65%|██████▌   | 3.18G/4.89G [01:26<00:42, 39.6MB/s][A[A
model-00003-of-00007.safetensors:  60%|██████    | 3.02G/5.00G [01:26<01:25, 23.2MB/s][Amodel-00002-of-00007.safetensors:  68%|██████▊   | 3.30G/4.83G [01:26<00:41, 36.6MB/s]


model-00005-of-00007.safetensors:  68%|██████▊   | 3.26G/4.83G [01:26<00:40, 39.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  61%|██████    | 3.04G/5.00G [01:26<01:11, 27.4MB/s][A


model-00005-of-00007.safetensors:  68%|██████▊   | 3.28G/4.83G [01:26<00:38, 40.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  65%|██████▌   | 3.20G/4.89G [01:26<00:50, 33.7MB/s][A[Amodel-00002-of-00007.safetensors:  69%|██████▊   | 3.31G/4.83G [01:26<00:45, 33.2MB/s]
model-00003-of-00007.safetensors:  61%|██████    | 3.06G/5.00G [01:26<01:02, 31.2MB/s][A


model-00005-of-00007.safetensors:  68%|██████▊   | 3.30G/4.83G [01:26<00:37, 41.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  66%|██████▌   | 3.22G/4.89G [01:27<00:51, 32.3MB/s][A[Amodel-00002-of-00007.safetensors:  69%|██████▉   | 3.33G/4.83G [01:27<00:44, 34.1MB/s]
model-00003-of-00007.safetensors:  61%|██████▏   | 3.07G/5.00G [01:27<01:00, 31.9MB/s][A


model-00005-of-00007.safetensors:  69%|██████▊   | 3.31G/4.83G [01:27<00:38, 39.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  66%|██████▌   | 3.23G/4.89G [01:27<00:48, 34.2MB/s][A[Amodel-00002-of-00007.safetensors:  69%|██████▉   | 3.34G/4.83G [01:27<00:42, 35.1MB/s]
model-00003-of-00007.safetensors:  62%|██████▏   | 3.09G/5.00G [01:27<00:54, 35.4MB/s][A


model-00005-of-00007.safetensors:  69%|██████▉   | 3.33G/4.83G [01:27<00:35, 42.4MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  66%|██████▋   | 3.25G/4.89G [01:28<00:44, 36.5MB/s][A[Amodel-00002-of-00007.safetensors:  70%|██████▉   | 3.36G/4.83G [01:28<00:38, 37.8MB/s]
model-00003-of-00007.safetensors:  62%|██████▏   | 3.10G/5.00G [01:28<00:50, 37.5MB/s][A


model-00005-of-00007.safetensors:  69%|██████▉   | 3.34G/4.83G [01:27<00:35, 42.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  70%|██████▉   | 3.38G/4.83G [01:28<00:36, 39.6MB/s]


model-00005-of-00007.safetensors:  70%|██████▉   | 3.36G/4.83G [01:28<00:34, 42.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  62%|██████▏   | 3.12G/5.00G [01:28<00:51, 36.8MB/s][A

model-00001-of-00007.safetensors:  67%|██████▋   | 3.26G/4.89G [01:28<00:46, 34.6MB/s][A[Amodel-00002-of-00007.safetensors:  70%|███████   | 3.39G/4.83G [01:28<00:36, 39.1MB/s]


model-00005-of-00007.safetensors:  70%|██████▉   | 3.38G/4.83G [01:28<00:33, 43.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  63%|██████▎   | 3.14G/5.00G [01:28<00:48, 38.7MB/s][A

model-00001-of-00007.safetensors:  67%|██████▋   | 3.28G/4.89G [01:29<00:46, 34.6MB/s][A[Amodel-00002-of-00007.safetensors:  71%|███████   | 3.41G/4.83G [01:29<00:34, 40.7MB/s]


model-00005-of-00007.safetensors:  70%|███████   | 3.39G/4.83G [01:29<00:33, 42.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  63%|██████▎   | 3.15G/5.00G [01:29<00:48, 38.1MB/s][A

model-00001-of-00007.safetensors:  67%|██████▋   | 3.30G/4.89G [01:29<00:42, 37.6MB/s][A[Amodel-00002-of-00007.safetensors:  71%|███████   | 3.42G/4.83G [01:29<00:32, 43.0MB/s]


model-00005-of-00007.safetensors:  71%|███████   | 3.41G/4.83G [01:29<00:33, 42.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  68%|██████▊   | 3.31G/4.89G [01:29<00:40, 38.5MB/s][A[A
model-00003-of-00007.safetensors:  63%|██████▎   | 3.17G/5.00G [01:29<00:47, 38.3MB/s][Amodel-00002-of-00007.safetensors:  71%|███████   | 3.44G/4.83G [01:29<00:31, 43.9MB/s]


model-00005-of-00007.safetensors:  71%|███████   | 3.42G/4.83G [01:29<00:33, 42.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  68%|██████▊   | 3.33G/4.89G [01:30<00:37, 41.0MB/s][A[A
model-00003-of-00007.safetensors:  64%|██████▎   | 3.18G/5.00G [01:30<00:45, 39.5MB/s][Amodel-00002-of-00007.safetensors:  72%|███████▏  | 3.46G/4.83G [01:30<00:32, 42.7MB/s]


model-00004-of-00007.safetensors:  65%|██████▍   | 3.23G/5.00G [01:30<03:32, 8.34MB/s][A[A[A
model-00003-of-00007.safetensors:  64%|██████▍   | 3.20G/5.00G [01:30<00:42, 42.8MB/s][A


model-00005-of-00007.safetensors:  71%|███████   | 3.44G/4.83G [01:30<00:34, 40.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  68%|██████▊   | 3.34G/4.89G [01:30<00:42, 36.4MB/s][A[Amodel-00002-of-00007.safetensors:  72%|███████▏  | 3.47G/4.83G [01:30<00:34, 39.5MB/s]


model-00004-of-00007.safetensors:  65%|██████▍   | 3.25G/5.00G [01:30<02:39, 11.0MB/s][A[A[A
model-00003-of-00007.safetensors:  64%|██████▍   | 3.22G/5.00G [01:30<00:41, 42.9MB/s][A


model-00005-of-00007.safetensors:  72%|███████▏  | 3.46G/4.83G [01:30<00:35, 39.0MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  69%|██████▉   | 3.36G/4.89G [01:31<00:38, 39.3MB/s][A[Amodel-00002-of-00007.safetensors:  72%|███████▏  | 3.49G/4.83G [01:31<00:32, 41.4MB/s]


model-00004-of-00007.safetensors:  65%|██████▌   | 3.26G/5.00G [01:30<02:02, 14.2MB/s][A[A[A
model-00003-of-00007.safetensors:  65%|██████▍   | 3.23G/5.00G [01:31<00:39, 45.3MB/s][A


model-00005-of-00007.safetensors:  72%|███████▏  | 3.47G/4.83G [01:31<00:32, 42.0MB/s][A[A[A[A[A


model-00005-of-00007.safetensors:  72%|███████▏  | 3.49G/4.83G [01:31<00:31, 42.9MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  66%|██████▌   | 3.28G/5.00G [01:31<01:40, 17.2MB/s][A[A[A
model-00003-of-00007.safetensors:  65%|██████▍   | 3.25G/5.00G [01:31<00:44, 39.5MB/s][Amodel-00002-of-00007.safetensors:  73%|███████▎  | 3.50G/4.83G [01:31<00:38, 34.3MB/s]


model-00005-of-00007.safetensors:  73%|███████▎  | 3.50G/4.83G [01:31<00:30, 43.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  66%|██████▌   | 3.30G/5.00G [01:31<01:21, 21.0MB/s][A[A[A
model-00003-of-00007.safetensors:  65%|██████▌   | 3.26G/5.00G [01:31<00:41, 41.7MB/s][A

model-00001-of-00007.safetensors:  69%|██████▉   | 3.38G/4.89G [01:32<00:57, 26.4MB/s][A[Amodel-00002-of-00007.safetensors:  73%|███████▎  | 3.52G/4.83G [01:32<00:35, 37.0MB/s]


model-00005-of-00007.safetensors:  73%|███████▎  | 3.52G/4.83G [01:32<00:29, 44.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  66%|██████▌   | 3.28G/5.00G [01:32<00:39, 43.4MB/s][A


model-00004-of-00007.safetensors:  66%|██████▌   | 3.31G/5.00G [01:32<01:13, 23.0MB/s][A[A[A
model-00003-of-00007.safetensors:  66%|██████▌   | 3.30G/5.00G [01:32<00:37, 45.8MB/s][A


model-00005-of-00007.safetensors:  73%|███████▎  | 3.54G/4.83G [01:32<00:28, 45.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  73%|███████▎  | 3.54G/4.83G [01:32<00:37, 34.3MB/s]
model-00003-of-00007.safetensors:  66%|██████▌   | 3.31G/5.00G [01:32<00:36, 45.6MB/s][A


model-00005-of-00007.safetensors:  74%|███████▎  | 3.55G/4.83G [01:32<00:28, 45.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  74%|███████▎  | 3.55G/4.83G [01:33<00:34, 36.8MB/s]


model-00004-of-00007.safetensors:  67%|██████▋   | 3.33G/5.00G [01:32<01:07, 24.9MB/s][A[A[A
model-00003-of-00007.safetensors:  67%|██████▋   | 3.33G/5.00G [01:33<00:35, 47.7MB/s][A


model-00004-of-00007.safetensors:  67%|██████▋   | 3.34G/5.00G [01:33<01:02, 26.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  74%|███████▍  | 3.57G/4.83G [01:33<00:37, 33.8MB/s]


model-00005-of-00007.safetensors:  74%|███████▍  | 3.57G/4.83G [01:33<00:33, 37.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  67%|██████▋   | 3.34G/5.00G [01:33<00:33, 49.0MB/s][A


model-00005-of-00007.safetensors:  74%|███████▍  | 3.58G/4.83G [01:33<00:31, 39.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  67%|██████▋   | 3.36G/5.00G [01:34<00:41, 39.6MB/s][A


model-00004-of-00007.safetensors:  67%|██████▋   | 3.36G/5.00G [01:34<01:04, 25.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  74%|███████▍  | 3.58G/4.83G [01:34<00:45, 27.7MB/s]
model-00003-of-00007.safetensors:  68%|██████▊   | 3.38G/5.00G [01:34<00:39, 41.5MB/s][A


model-00004-of-00007.safetensors:  68%|██████▊   | 3.38G/5.00G [01:34<00:56, 28.5MB/s][A[A[Amodel-00002-of-00007.safetensors:  75%|███████▍  | 3.60G/4.83G [01:34<00:39, 31.0MB/s]

model-00001-of-00007.safetensors:  69%|██████▉   | 3.39G/4.89G [01:34<01:55, 12.9MB/s][A[A
model-00003-of-00007.safetensors:  68%|██████▊   | 3.39G/5.00G [01:34<00:39, 40.5MB/s][A


model-00004-of-00007.safetensors:  68%|██████▊   | 3.39G/5.00G [01:34<00:49, 32.3MB/s][A[A[A


model-00005-of-00007.safetensors:  75%|███████▍  | 3.60G/4.83G [01:34<00:48, 25.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  75%|███████▍  | 3.62G/4.83G [01:35<00:37, 32.7MB/s]
model-00003-of-00007.safetensors:  68%|██████▊   | 3.41G/5.00G [01:35<00:36, 43.4MB/s][A


model-00004-of-00007.safetensors:  68%|██████▊   | 3.41G/5.00G [01:35<00:45, 35.2MB/s][A[A[A

model-00001-of-00007.safetensors:  70%|██████▉   | 3.41G/4.89G [01:35<01:41, 14.6MB/s][A[A


model-00005-of-00007.safetensors:  75%|███████▍  | 3.62G/4.83G [01:35<00:44, 27.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  68%|██████▊   | 3.42G/5.00G [01:35<00:36, 43.2MB/s][Amodel-00002-of-00007.safetensors:  75%|███████▌  | 3.63G/4.83G [01:35<00:37, 32.4MB/s]


model-00004-of-00007.safetensors:  68%|██████▊   | 3.42G/5.00G [01:35<00:47, 33.1MB/s][A[A[A
model-00003-of-00007.safetensors:  69%|██████▉   | 3.44G/5.00G [01:35<00:34, 45.2MB/s][A


model-00005-of-00007.safetensors:  75%|███████▌  | 3.63G/4.83G [01:35<00:39, 30.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  70%|███████   | 3.42G/4.89G [01:36<01:21, 17.9MB/s][A[Amodel-00002-of-00007.safetensors:  75%|███████▌  | 3.65G/4.83G [01:36<00:33, 35.5MB/s]


model-00004-of-00007.safetensors:  69%|██████▉   | 3.44G/5.00G [01:36<00:43, 35.6MB/s][A[A[A
model-00003-of-00007.safetensors:  69%|██████▉   | 3.46G/5.00G [01:36<00:33, 46.1MB/s][A

model-00001-of-00007.safetensors:  70%|███████   | 3.44G/4.89G [01:36<01:05, 22.1MB/s][A[A


model-00005-of-00007.safetensors:  75%|███████▌  | 3.65G/4.83G [01:36<00:35, 33.7MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  76%|███████▌  | 3.66G/4.83G [01:36<00:32, 35.5MB/s]


model-00004-of-00007.safetensors:  69%|██████▉   | 3.46G/5.00G [01:36<00:39, 39.5MB/s][A[A[A
model-00003-of-00007.safetensors:  69%|██████▉   | 3.47G/5.00G [01:36<00:32, 46.8MB/s][A

model-00001-of-00007.safetensors:  71%|███████   | 3.46G/4.89G [01:36<00:55, 25.8MB/s][A[A


model-00005-of-00007.safetensors:  76%|███████▌  | 3.66G/4.83G [01:36<00:32, 36.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  76%|███████▌  | 3.68G/4.83G [01:36<00:30, 37.4MB/s]
model-00003-of-00007.safetensors:  70%|██████▉   | 3.49G/5.00G [01:36<00:31, 47.5MB/s][A

model-00001-of-00007.safetensors:  71%|███████   | 3.47G/4.89G [01:37<00:47, 29.5MB/s][A[A


model-00005-of-00007.safetensors:  76%|███████▌  | 3.68G/4.83G [01:36<00:30, 38.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  70%|███████   | 3.50G/5.00G [01:37<00:31, 47.6MB/s][Amodel-00002-of-00007.safetensors:  76%|███████▋  | 3.70G/4.83G [01:37<00:29, 38.0MB/s]


model-00005-of-00007.safetensors:  76%|███████▋  | 3.70G/4.83G [01:37<00:27, 41.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  71%|███████▏  | 3.49G/4.89G [01:37<00:44, 31.5MB/s][A[A


model-00004-of-00007.safetensors:  69%|██████▉   | 3.47G/5.00G [01:37<00:53, 28.7MB/s][A[A[A
model-00003-of-00007.safetensors:  70%|███████   | 3.52G/5.00G [01:37<00:31, 47.4MB/s][Amodel-00002-of-00007.safetensors:  77%|███████▋  | 3.71G/4.83G [01:37<00:28, 40.0MB/s]

model-00001-of-00007.safetensors:  72%|███████▏  | 3.50G/4.89G [01:37<00:39, 35.2MB/s][A[A


model-00004-of-00007.safetensors:  70%|██████▉   | 3.49G/5.00G [01:37<00:45, 33.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  77%|███████▋  | 3.73G/4.83G [01:38<00:26, 41.3MB/s]


model-00005-of-00007.safetensors:  77%|███████▋  | 3.71G/4.83G [01:37<00:32, 34.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  72%|███████▏  | 3.52G/4.89G [01:38<00:35, 38.1MB/s][A[A


model-00004-of-00007.safetensors:  70%|███████   | 3.50G/5.00G [01:37<00:41, 35.7MB/s][A[A[A
model-00003-of-00007.safetensors:  71%|███████   | 3.54G/5.00G [01:38<00:39, 37.1MB/s][Amodel-00002-of-00007.safetensors:  77%|███████▋  | 3.74G/4.83G [01:38<00:25, 42.9MB/s]


model-00005-of-00007.safetensors:  77%|███████▋  | 3.73G/4.83G [01:38<00:32, 34.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  70%|███████   | 3.52G/5.00G [01:38<00:38, 38.3MB/s][A[A[A
model-00003-of-00007.safetensors:  71%|███████   | 3.55G/5.00G [01:38<00:37, 38.6MB/s][Amodel-00002-of-00007.safetensors:  78%|███████▊  | 3.76G/4.83G [01:38<00:25, 41.8MB/s]

model-00001-of-00007.safetensors:  72%|███████▏  | 3.54G/4.89G [01:39<00:43, 31.0MB/s][A[A
model-00003-of-00007.safetensors:  71%|███████▏  | 3.57G/5.00G [01:38<00:34, 41.2MB/s][A


model-00004-of-00007.safetensors:  71%|███████   | 3.54G/5.00G [01:38<00:40, 36.2MB/s][A[A[A


model-00005-of-00007.safetensors:  77%|███████▋  | 3.74G/4.83G [01:38<00:33, 32.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  78%|███████▊  | 3.78G/4.83G [01:39<00:24, 42.6MB/s]
model-00003-of-00007.safetensors:  72%|███████▏  | 3.58G/5.00G [01:39<00:33, 42.6MB/s][A


model-00004-of-00007.safetensors:  71%|███████   | 3.55G/5.00G [01:39<00:37, 38.7MB/s][A[A[A

model-00001-of-00007.safetensors:  73%|███████▎  | 3.55G/4.89G [01:39<00:44, 30.3MB/s][A[Amodel-00002-of-00007.safetensors:  78%|███████▊  | 3.79G/4.83G [01:39<00:24, 43.0MB/s]


model-00005-of-00007.safetensors:  78%|███████▊  | 3.76G/4.83G [01:39<00:33, 31.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  72%|███████▏  | 3.60G/5.00G [01:39<00:31, 45.1MB/s][A


model-00004-of-00007.safetensors:  71%|███████▏  | 3.57G/5.00G [01:39<00:34, 41.9MB/s][A[A[A

model-00001-of-00007.safetensors:  73%|███████▎  | 3.57G/4.89G [01:39<00:39, 33.4MB/s][A[Amodel-00002-of-00007.safetensors:  79%|███████▉  | 3.81G/4.83G [01:39<00:23, 43.9MB/s]


model-00005-of-00007.safetensors:  78%|███████▊  | 3.78G/4.83G [01:39<00:30, 35.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  72%|███████▏  | 3.58G/5.00G [01:39<00:33, 42.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  79%|███████▉  | 3.82G/4.83G [01:40<00:21, 45.9MB/s]
model-00003-of-00007.safetensors:  72%|███████▏  | 3.62G/5.00G [01:40<00:34, 39.7MB/s][A


model-00005-of-00007.safetensors:  78%|███████▊  | 3.79G/4.83G [01:40<00:29, 35.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  72%|███████▏  | 3.60G/5.00G [01:40<00:32, 43.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  79%|███████▉  | 3.84G/4.83G [01:40<00:21, 45.1MB/s]
model-00003-of-00007.safetensors:  73%|███████▎  | 3.63G/5.00G [01:40<00:34, 40.2MB/s][A

model-00001-of-00007.safetensors:  73%|███████▎  | 3.58G/4.89G [01:40<00:45, 28.4MB/s][A[A


model-00005-of-00007.safetensors:  79%|███████▉  | 3.81G/4.83G [01:40<00:28, 36.3MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  80%|███████▉  | 3.86G/4.83G [01:40<00:21, 45.6MB/s]


model-00004-of-00007.safetensors:  72%|███████▏  | 3.62G/5.00G [01:40<00:34, 40.6MB/s][A[A[A
model-00003-of-00007.safetensors:  73%|███████▎  | 3.65G/5.00G [01:40<00:32, 41.3MB/s][A

model-00001-of-00007.safetensors:  74%|███████▎  | 3.60G/4.89G [01:41<00:40, 31.9MB/s][A[A


model-00005-of-00007.safetensors:  79%|███████▉  | 3.82G/4.83G [01:40<00:25, 38.8MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  73%|███████▎  | 3.63G/5.00G [01:40<00:32, 41.7MB/s][A[A[A
model-00003-of-00007.safetensors:  73%|███████▎  | 3.66G/5.00G [01:41<00:31, 42.9MB/s][A

model-00001-of-00007.safetensors:  74%|███████▍  | 3.62G/4.89G [01:41<00:36, 35.0MB/s][A[Amodel-00002-of-00007.safetensors:  80%|████████  | 3.87G/4.83G [01:41<00:23, 41.7MB/s]


model-00005-of-00007.safetensors:  79%|███████▉  | 3.84G/4.83G [01:41<00:24, 40.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  74%|███████▎  | 3.68G/5.00G [01:41<00:29, 45.4MB/s][Amodel-00002-of-00007.safetensors:  80%|████████  | 3.89G/4.83G [01:41<00:22, 42.3MB/s]


model-00004-of-00007.safetensors:  73%|███████▎  | 3.65G/5.00G [01:41<00:34, 39.0MB/s][A[A[A

model-00001-of-00007.safetensors:  74%|███████▍  | 3.63G/4.89G [01:41<00:34, 36.2MB/s][A[A
model-00003-of-00007.safetensors:  74%|███████▍  | 3.70G/5.00G [01:41<00:27, 47.4MB/s][A


model-00004-of-00007.safetensors:  73%|███████▎  | 3.66G/5.00G [01:41<00:32, 41.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  81%|████████  | 3.90G/4.83G [01:42<00:21, 43.0MB/s]

model-00001-of-00007.safetensors:  75%|███████▍  | 3.65G/4.89G [01:42<00:32, 38.0MB/s][A[A


model-00005-of-00007.safetensors:  80%|███████▉  | 3.86G/4.83G [01:41<00:27, 35.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  74%|███████▍  | 3.71G/5.00G [01:42<00:28, 45.5MB/s][A


model-00004-of-00007.safetensors:  74%|███████▎  | 3.68G/5.00G [01:42<00:30, 42.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  81%|████████  | 3.92G/4.83G [01:42<00:21, 42.7MB/s]

model-00001-of-00007.safetensors:  75%|███████▍  | 3.66G/4.89G [01:42<00:30, 39.7MB/s][A[A


model-00005-of-00007.safetensors:  80%|████████  | 3.87G/4.83G [01:42<00:25, 38.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  75%|███████▍  | 3.73G/5.00G [01:42<00:28, 45.1MB/s][A


model-00005-of-00007.safetensors:  80%|████████  | 3.89G/4.83G [01:42<00:23, 40.0MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  81%|████████▏ | 3.94G/4.83G [01:42<00:21, 41.8MB/s]

model-00001-of-00007.safetensors:  75%|███████▌  | 3.68G/4.89G [01:42<00:30, 39.3MB/s][A[A


model-00004-of-00007.safetensors:  74%|███████▍  | 3.70G/5.00G [01:42<00:33, 39.4MB/s][A[A[A
model-00003-of-00007.safetensors:  75%|███████▍  | 3.74G/5.00G [01:42<00:28, 44.5MB/s][A


model-00005-of-00007.safetensors:  81%|████████  | 3.90G/4.83G [01:42<00:22, 40.8MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  82%|████████▏ | 3.95G/4.83G [01:43<00:20, 42.2MB/s]

model-00001-of-00007.safetensors:  76%|███████▌  | 3.70G/4.89G [01:43<00:29, 40.9MB/s][A[A


model-00004-of-00007.safetensors:  74%|███████▍  | 3.71G/5.00G [01:43<00:32, 39.0MB/s][A[A[A
model-00003-of-00007.safetensors:  75%|███████▌  | 3.76G/5.00G [01:43<00:28, 44.3MB/s][Amodel-00002-of-00007.safetensors:  82%|████████▏ | 3.97G/4.83G [01:43<00:19, 44.4MB/s]


model-00005-of-00007.safetensors:  81%|████████  | 3.92G/4.83G [01:43<00:21, 41.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  76%|███████▌  | 3.71G/4.89G [01:43<00:28, 40.5MB/s][A[A


model-00004-of-00007.safetensors:  75%|███████▍  | 3.73G/5.00G [01:43<00:31, 40.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  82%|████████▏ | 3.98G/4.83G [01:43<00:18, 45.4MB/s]
model-00003-of-00007.safetensors:  76%|███████▌  | 3.78G/5.00G [01:43<00:32, 37.9MB/s][A


model-00004-of-00007.safetensors:  75%|███████▍  | 3.74G/5.00G [01:43<00:29, 42.7MB/s][A[A[A


model-00005-of-00007.safetensors:  81%|████████▏ | 3.94G/4.83G [01:43<00:22, 39.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  76%|███████▌  | 3.79G/5.00G [01:44<00:29, 40.3MB/s][A

model-00001-of-00007.safetensors:  76%|███████▋  | 3.73G/4.89G [01:44<00:35, 32.6MB/s][A[A


model-00004-of-00007.safetensors:  75%|███████▌  | 3.76G/5.00G [01:44<00:28, 42.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  83%|████████▎ | 4.00G/4.83G [01:44<00:22, 36.4MB/s]
model-00003-of-00007.safetensors:  76%|███████▌  | 3.81G/5.00G [01:44<00:28, 41.7MB/s][Amodel-00002-of-00007.safetensors:  83%|████████▎ | 4.02G/4.83G [01:44<00:20, 39.6MB/s]

model-00001-of-00007.safetensors:  77%|███████▋  | 3.74G/4.89G [01:44<00:35, 32.0MB/s][A[A
model-00003-of-00007.safetensors:  76%|███████▋  | 3.82G/5.00G [01:44<00:26, 43.6MB/s][A


model-00005-of-00007.safetensors:  82%|████████▏ | 3.95G/4.83G [01:44<00:31, 27.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  77%|███████▋  | 3.76G/4.89G [01:45<00:32, 34.8MB/s][A[A
model-00003-of-00007.safetensors:  77%|███████▋  | 3.84G/5.00G [01:45<00:25, 45.2MB/s][A


model-00004-of-00007.safetensors:  76%|███████▌  | 3.78G/5.00G [01:45<00:42, 29.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  83%|████████▎ | 4.03G/4.83G [01:45<00:21, 37.0MB/s]

model-00001-of-00007.safetensors:  77%|███████▋  | 3.78G/4.89G [01:45<00:28, 38.4MB/s][A[A


model-00005-of-00007.safetensors:  82%|████████▏ | 3.97G/4.83G [01:45<00:31, 27.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  84%|████████▍ | 4.05G/4.83G [01:45<00:19, 40.0MB/s]


model-00004-of-00007.safetensors:  76%|███████▌  | 3.79G/5.00G [01:45<00:39, 30.6MB/s][A[A[A

model-00001-of-00007.safetensors:  78%|███████▊  | 3.79G/4.89G [01:46<00:27, 39.4MB/s][A[A


model-00005-of-00007.safetensors:  82%|████████▏ | 3.98G/4.83G [01:45<00:27, 30.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  84%|████████▍ | 4.06G/4.83G [01:46<00:19, 40.3MB/s]
model-00003-of-00007.safetensors:  77%|███████▋  | 3.86G/5.00G [01:46<00:40, 28.4MB/s][A


model-00005-of-00007.safetensors:  83%|████████▎ | 4.00G/4.83G [01:46<00:24, 33.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  78%|███████▊  | 3.81G/4.89G [01:46<00:28, 38.3MB/s][A[A


model-00004-of-00007.safetensors:  76%|███████▌  | 3.81G/5.00G [01:46<00:45, 26.1MB/s][A[A[A


model-00005-of-00007.safetensors:  83%|████████▎ | 4.02G/4.83G [01:46<00:22, 36.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  78%|███████▊  | 3.82G/4.89G [01:46<00:26, 40.7MB/s][A[Amodel-00002-of-00007.safetensors:  84%|████████▍ | 4.08G/4.83G [01:46<00:22, 33.6MB/s]
model-00003-of-00007.safetensors:  77%|███████▋  | 3.87G/5.00G [01:46<00:36, 30.6MB/s][A


model-00005-of-00007.safetensors:  83%|████████▎ | 4.03G/4.83G [01:46<00:20, 39.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  76%|███████▋  | 3.82G/5.00G [01:46<00:41, 28.4MB/s][A[A[A

model-00001-of-00007.safetensors:  79%|███████▊  | 3.84G/4.89G [01:47<00:24, 42.0MB/s][A[A
model-00003-of-00007.safetensors:  78%|███████▊  | 3.89G/5.00G [01:47<00:32, 34.2MB/s][Amodel-00002-of-00007.safetensors:  85%|████████▍ | 4.10G/4.83G [01:47<00:23, 30.8MB/s]
model-00003-of-00007.safetensors:  78%|███████▊  | 3.90G/5.00G [01:47<00:29, 37.5MB/s][A

model-00001-of-00007.safetensors:  79%|███████▉  | 3.86G/4.89G [01:47<00:24, 41.9MB/s][A[A


model-00005-of-00007.safetensors:  84%|████████▍ | 4.05G/4.83G [01:47<00:21, 36.6MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  85%|████████▌ | 4.11G/4.83G [01:47<00:21, 33.3MB/s]
model-00003-of-00007.safetensors:  78%|███████▊  | 3.92G/5.00G [01:47<00:27, 39.9MB/s][A


model-00004-of-00007.safetensors:  77%|███████▋  | 3.84G/5.00G [01:47<00:44, 26.0MB/s][A[A[A

model-00001-of-00007.safetensors:  79%|███████▉  | 3.87G/4.89G [01:47<00:23, 42.3MB/s][A[A


model-00005-of-00007.safetensors:  84%|████████▍ | 4.06G/4.83G [01:47<00:20, 37.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  77%|███████▋  | 3.86G/5.00G [01:47<00:38, 29.5MB/s][A[A[A
model-00003-of-00007.safetensors:  79%|███████▊  | 3.94G/5.00G [01:48<00:26, 40.0MB/s][A

model-00001-of-00007.safetensors:  80%|███████▉  | 3.89G/4.89G [01:48<00:25, 38.9MB/s][A[Amodel-00002-of-00007.safetensors:  85%|████████▌ | 4.13G/4.83G [01:48<00:23, 29.6MB/s]


model-00004-of-00007.safetensors:  77%|███████▋  | 3.87G/5.00G [01:48<00:34, 32.7MB/s][A[A[A
model-00003-of-00007.safetensors:  79%|███████▉  | 3.95G/5.00G [01:48<00:25, 40.7MB/s][A

model-00001-of-00007.safetensors:  80%|███████▉  | 3.90G/4.89G [01:48<00:24, 40.7MB/s][A[A


model-00005-of-00007.safetensors:  84%|████████▍ | 4.08G/4.83G [01:48<00:24, 31.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  86%|████████▌ | 4.14G/4.83G [01:48<00:21, 31.4MB/s]
model-00003-of-00007.safetensors:  79%|███████▉  | 3.97G/5.00G [01:48<00:24, 41.4MB/s][A


model-00005-of-00007.safetensors:  85%|████████▍ | 4.10G/4.83G [01:48<00:21, 34.1MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  80%|████████  | 3.92G/4.89G [01:49<00:23, 40.9MB/s][A[A


model-00004-of-00007.safetensors:  78%|███████▊  | 3.89G/5.00G [01:48<00:37, 30.0MB/s][A[A[Amodel-00002-of-00007.safetensors:  86%|████████▌ | 4.16G/4.83G [01:49<00:19, 34.6MB/s]
model-00003-of-00007.safetensors:  80%|███████▉  | 3.98G/5.00G [01:49<00:23, 42.4MB/s][A


model-00005-of-00007.safetensors:  85%|████████▌ | 4.11G/4.83G [01:49<00:19, 36.8MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  86%|████████▋ | 4.18G/4.83G [01:49<00:17, 36.9MB/s]

model-00001-of-00007.safetensors:  81%|████████  | 3.94G/4.89G [01:49<00:26, 36.4MB/s][A[A


model-00004-of-00007.safetensors:  78%|███████▊  | 3.90G/5.00G [01:49<00:34, 31.6MB/s][A[A[A
model-00003-of-00007.safetensors:  80%|████████  | 4.00G/5.00G [01:49<00:23, 42.1MB/s][A


model-00005-of-00007.safetensors:  85%|████████▌ | 4.13G/4.83G [01:49<00:18, 38.3MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  80%|████████  | 4.02G/5.00G [01:49<00:24, 40.8MB/s][A

model-00001-of-00007.safetensors:  81%|████████  | 3.95G/4.89G [01:50<00:28, 32.9MB/s][A[A

model-00001-of-00007.safetensors:  81%|████████  | 3.97G/4.89G [01:50<00:26, 35.0MB/s][A[A


model-00004-of-00007.safetensors:  78%|███████▊  | 3.92G/5.00G [01:50<00:44, 24.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  87%|████████▋ | 4.19G/4.83G [01:50<00:25, 25.5MB/s]


model-00005-of-00007.safetensors:  86%|████████▌ | 4.14G/4.83G [01:50<00:25, 26.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  81%|████████  | 4.03G/5.00G [01:50<00:34, 28.0MB/s][A


model-00004-of-00007.safetensors:  79%|███████▊  | 3.94G/5.00G [01:50<00:39, 26.9MB/s][A[A[Amodel-00002-of-00007.safetensors:  87%|████████▋ | 4.21G/4.83G [01:51<00:22, 27.7MB/s]


model-00005-of-00007.safetensors:  86%|████████▌ | 4.16G/4.83G [01:51<00:24, 28.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  79%|███████▉  | 3.95G/5.00G [01:51<00:34, 30.3MB/s][A[A[A

model-00001-of-00007.safetensors:  82%|████████▏ | 3.98G/4.89G [01:51<00:32, 27.5MB/s][A[Amodel-00002-of-00007.safetensors:  87%|████████▋ | 4.22G/4.83G [01:51<00:19, 30.8MB/s]
model-00003-of-00007.safetensors:  81%|████████  | 4.05G/5.00G [01:51<00:32, 29.1MB/s][A


model-00005-of-00007.safetensors:  86%|████████▋ | 4.18G/4.83G [01:51<00:21, 31.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  79%|███████▉  | 3.97G/5.00G [01:51<00:30, 33.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  88%|████████▊ | 4.24G/4.83G [01:51<00:17, 34.4MB/s]

model-00001-of-00007.safetensors:  82%|████████▏ | 4.00G/4.89G [01:51<00:29, 30.4MB/s][A[A
model-00003-of-00007.safetensors:  81%|████████▏ | 4.06G/5.00G [01:51<00:28, 33.1MB/s][A


model-00005-of-00007.safetensors:  87%|████████▋ | 4.19G/4.83G [01:51<00:19, 32.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  80%|███████▉  | 3.98G/5.00G [01:51<00:27, 36.3MB/s][A[A[A

model-00001-of-00007.safetensors:  82%|████████▏ | 4.02G/4.89G [01:52<00:25, 34.4MB/s][A[Amodel-00002-of-00007.safetensors:  88%|████████▊ | 4.26G/4.83G [01:52<00:16, 35.4MB/s]
model-00003-of-00007.safetensors:  82%|████████▏ | 4.08G/5.00G [01:52<00:25, 35.4MB/s][A


model-00005-of-00007.safetensors:  87%|████████▋ | 4.21G/4.83G [01:52<00:18, 34.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  80%|████████  | 4.00G/5.00G [01:52<00:26, 37.3MB/s][A[A[A

model-00001-of-00007.safetensors:  83%|████████▎ | 4.03G/4.89G [01:52<00:23, 36.3MB/s][A[A
model-00003-of-00007.safetensors:  82%|████████▏ | 4.10G/5.00G [01:52<00:23, 38.0MB/s][Amodel-00002-of-00007.safetensors:  88%|████████▊ | 4.27G/4.83G [01:52<00:15, 36.4MB/s]


model-00004-of-00007.safetensors:  80%|████████  | 4.02G/5.00G [01:52<00:25, 39.1MB/s][A[A[Amodel-00002-of-00007.safetensors:  89%|████████▊ | 4.29G/4.83G [01:52<00:14, 38.8MB/s]

model-00001-of-00007.safetensors:  83%|████████▎ | 4.05G/4.89G [01:53<00:23, 35.8MB/s][A[A


model-00005-of-00007.safetensors:  87%|████████▋ | 4.22G/4.83G [01:52<00:19, 30.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  82%|████████▏ | 4.11G/5.00G [01:53<00:25, 34.3MB/s][A


model-00004-of-00007.safetensors:  81%|████████  | 4.03G/5.00G [01:52<00:22, 42.6MB/s][A[A[A

model-00001-of-00007.safetensors:  83%|████████▎ | 4.06G/4.89G [01:53<00:20, 39.7MB/s][A[Amodel-00002-of-00007.safetensors:  89%|████████▉ | 4.30G/4.83G [01:53<00:13, 39.9MB/s]


model-00005-of-00007.safetensors:  88%|████████▊ | 4.24G/4.83G [01:53<00:17, 33.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  83%|████████▎ | 4.13G/5.00G [01:53<00:23, 37.5MB/s][A


model-00004-of-00007.safetensors:  81%|████████  | 4.05G/5.00G [01:53<00:22, 43.2MB/s][A[A[Amodel-00002-of-00007.safetensors:  89%|████████▉ | 4.32G/4.83G [01:53<00:11, 43.1MB/s]

model-00001-of-00007.safetensors:  83%|████████▎ | 4.08G/4.89G [01:53<00:20, 40.1MB/s][A[A
model-00003-of-00007.safetensors:  83%|████████▎ | 4.14G/5.00G [01:53<00:21, 40.0MB/s][A


model-00005-of-00007.safetensors:  88%|████████▊ | 4.26G/4.83G [01:53<00:15, 36.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  84%|████████▍ | 4.10G/4.89G [01:54<00:19, 41.2MB/s][A[Amodel-00002-of-00007.safetensors:  90%|████████▉ | 4.34G/4.83G [01:54<00:11, 42.0MB/s]


model-00004-of-00007.safetensors:  81%|████████▏ | 4.06G/5.00G [01:53<00:24, 38.3MB/s][A[A[A
model-00003-of-00007.safetensors:  83%|████████▎ | 4.16G/5.00G [01:54<00:19, 42.4MB/s][A


model-00005-of-00007.safetensors:  88%|████████▊ | 4.27G/4.83G [01:53<00:14, 38.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  82%|████████▏ | 4.08G/5.00G [01:54<00:22, 40.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  90%|█████████ | 4.35G/4.83G [01:54<00:11, 42.0MB/s]

model-00001-of-00007.safetensors:  84%|████████▍ | 4.11G/4.89G [01:54<00:20, 38.6MB/s][A[A
model-00003-of-00007.safetensors:  84%|████████▎ | 4.18G/5.00G [01:54<00:19, 42.5MB/s][A


model-00005-of-00007.safetensors:  89%|████████▊ | 4.29G/4.83G [01:54<00:13, 40.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  82%|████████▏ | 4.10G/5.00G [01:54<00:21, 42.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  90%|█████████ | 4.37G/4.83G [01:54<00:10, 42.2MB/s]


model-00005-of-00007.safetensors:  89%|████████▉ | 4.30G/4.83G [01:54<00:12, 41.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  82%|████████▏ | 4.11G/5.00G [01:54<00:21, 42.0MB/s][A[A[A

model-00001-of-00007.safetensors:  84%|████████▍ | 4.13G/4.89G [01:55<00:23, 32.9MB/s][A[A
model-00003-of-00007.safetensors:  84%|████████▍ | 4.19G/5.00G [01:55<00:24, 33.5MB/s][Amodel-00002-of-00007.safetensors:  91%|█████████ | 4.38G/4.83G [01:55<00:11, 39.8MB/s]


model-00004-of-00007.safetensors:  83%|████████▎ | 4.13G/5.00G [01:55<00:19, 44.7MB/s][A[A[A

model-00001-of-00007.safetensors:  85%|████████▍ | 4.14G/4.89G [01:55<00:21, 35.3MB/s][A[A


model-00005-of-00007.safetensors:  89%|████████▉ | 4.32G/4.83G [01:55<00:14, 34.9MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  91%|█████████ | 4.40G/4.83G [01:55<00:10, 42.2MB/s]
model-00003-of-00007.safetensors:  84%|████████▍ | 4.21G/5.00G [01:55<00:22, 35.8MB/s][A


model-00005-of-00007.safetensors:  90%|████████▉ | 4.34G/4.83G [01:55<00:13, 37.6MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  84%|████████▍ | 4.22G/5.00G [01:55<00:19, 39.6MB/s][A

model-00001-of-00007.safetensors:  85%|████████▌ | 4.16G/4.89G [01:56<00:19, 36.8MB/s][A[Amodel-00002-of-00007.safetensors:  91%|█████████▏| 4.42G/4.83G [01:55<00:09, 42.0MB/s]


model-00004-of-00007.safetensors:  83%|████████▎ | 4.14G/5.00G [01:55<00:22, 37.9MB/s][A[A[A
model-00003-of-00007.safetensors:  85%|████████▍ | 4.24G/5.00G [01:56<00:18, 41.9MB/s][A

model-00001-of-00007.safetensors:  85%|████████▌ | 4.18G/4.89G [01:56<00:17, 39.5MB/s][A[A


model-00005-of-00007.safetensors:  90%|█████████ | 4.35G/4.83G [01:56<00:12, 38.9MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  83%|████████▎ | 4.16G/5.00G [01:56<00:20, 40.3MB/s][A[A[Amodel-00002-of-00007.safetensors:  92%|█████████▏| 4.43G/4.83G [01:56<00:10, 36.9MB/s]
model-00003-of-00007.safetensors:  85%|████████▌ | 4.26G/5.00G [01:56<00:17, 42.6MB/s][A


model-00005-of-00007.safetensors:  90%|█████████ | 4.37G/4.83G [01:56<00:11, 40.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  86%|████████▌ | 4.19G/4.89G [01:56<00:17, 40.5MB/s][A[A


model-00004-of-00007.safetensors:  84%|████████▎ | 4.18G/5.00G [01:56<00:19, 41.8MB/s][A[A[Amodel-00002-of-00007.safetensors:  92%|█████████▏| 4.45G/4.83G [01:56<00:09, 40.1MB/s]


model-00005-of-00007.safetensors:  91%|█████████ | 4.38G/4.83G [01:56<00:10, 42.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  86%|████████▌ | 4.21G/4.89G [01:57<00:16, 42.0MB/s][A[A
model-00003-of-00007.safetensors:  85%|████████▌ | 4.27G/5.00G [01:57<00:18, 38.7MB/s][Amodel-00002-of-00007.safetensors:  92%|█████████▏| 4.46G/4.83G [01:57<00:08, 41.6MB/s]

model-00001-of-00007.safetensors:  86%|████████▋ | 4.22G/4.89G [01:57<00:16, 39.2MB/s][A[A


model-00005-of-00007.safetensors:  91%|█████████ | 4.40G/4.83G [01:57<00:11, 38.5MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  86%|████████▌ | 4.29G/5.00G [01:57<00:17, 39.8MB/s][Amodel-00002-of-00007.safetensors:  93%|█████████▎| 4.48G/4.83G [01:57<00:09, 36.6MB/s]


model-00005-of-00007.safetensors:  91%|█████████▏| 4.42G/4.83G [01:57<00:10, 41.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  86%|████████▌ | 4.30G/5.00G [01:57<00:16, 42.0MB/s][A


model-00004-of-00007.safetensors:  84%|████████▍ | 4.19G/5.00G [01:57<00:33, 24.0MB/s][A[A[A

model-00001-of-00007.safetensors:  87%|████████▋ | 4.24G/4.89G [01:58<00:19, 33.2MB/s][A[Amodel-00002-of-00007.safetensors:  93%|█████████▎| 4.50G/4.83G [01:58<00:08, 37.5MB/s]
model-00003-of-00007.safetensors:  86%|████████▋ | 4.32G/5.00G [01:58<00:16, 42.5MB/s][A

model-00001-of-00007.safetensors:  87%|████████▋ | 4.26G/4.89G [01:58<00:17, 36.2MB/s][A[A


model-00004-of-00007.safetensors:  84%|████████▍ | 4.21G/5.00G [01:58<00:29, 26.5MB/s][A[A[A


model-00005-of-00007.safetensors:  92%|█████████▏| 4.43G/4.83G [01:58<00:11, 33.5MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  93%|█████████▎| 4.51G/4.83G [01:58<00:07, 40.2MB/s]
model-00003-of-00007.safetensors:  87%|████████▋ | 4.34G/5.00G [01:58<00:14, 44.3MB/s][A


model-00005-of-00007.safetensors:  92%|█████████▏| 4.45G/4.83G [01:58<00:08, 42.9MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  94%|█████████▎| 4.53G/4.83G [01:58<00:05, 51.6MB/s]

model-00001-of-00007.safetensors:  87%|████████▋ | 4.27G/4.89G [01:58<00:16, 38.2MB/s][A[Amodel-00002-of-00007.safetensors:  94%|█████████▍| 4.54G/4.83G [01:58<00:06, 45.0MB/s]
model-00003-of-00007.safetensors:  87%|████████▋ | 4.35G/5.00G [01:58<00:14, 44.2MB/s][A


model-00005-of-00007.safetensors:  92%|█████████▏| 4.45G/4.83G [01:58<00:10, 37.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  84%|████████▍ | 4.22G/5.00G [01:58<00:28, 27.3MB/s][A[A[A
model-00003-of-00007.safetensors:  87%|████████▋ | 4.37G/5.00G [01:59<00:13, 45.6MB/s][A


model-00005-of-00007.safetensors:  92%|█████████▏| 4.46G/4.83G [01:58<00:10, 36.0MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  88%|████████▊ | 4.29G/4.89G [01:59<00:16, 37.3MB/s][A[A


model-00004-of-00007.safetensors:  85%|████████▍ | 4.24G/5.00G [01:59<00:24, 30.7MB/s][A[A[A
model-00003-of-00007.safetensors:  88%|████████▊ | 4.38G/5.00G [01:59<00:14, 43.6MB/s][A


model-00005-of-00007.safetensors:  93%|█████████▎| 4.48G/4.83G [01:59<00:09, 36.7MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  85%|████████▌ | 4.26G/5.00G [01:59<00:21, 34.0MB/s][A[A[A

model-00001-of-00007.safetensors:  88%|████████▊ | 4.30G/4.89G [01:59<00:16, 34.3MB/s][A[A
model-00003-of-00007.safetensors:  88%|████████▊ | 4.40G/5.00G [01:59<00:13, 43.0MB/s][A


model-00005-of-00007.safetensors:  93%|█████████▎| 4.50G/4.83G [01:59<00:08, 39.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  85%|████████▌ | 4.27G/5.00G [01:59<00:19, 36.8MB/s][A[A[A

model-00001-of-00007.safetensors:  88%|████████▊ | 4.32G/4.89G [02:00<00:15, 36.2MB/s][A[A
model-00003-of-00007.safetensors:  88%|████████▊ | 4.42G/5.00G [02:00<00:12, 45.5MB/s][A
model-00003-of-00007.safetensors:  89%|████████▊ | 4.43G/5.00G [02:00<00:12, 44.3MB/s][A

model-00001-of-00007.safetensors:  89%|████████▊ | 4.34G/4.89G [02:00<00:15, 35.7MB/s][A[A


model-00004-of-00007.safetensors:  86%|████████▌ | 4.29G/5.00G [02:00<00:21, 32.8MB/s][A[A[A


model-00005-of-00007.safetensors:  93%|█████████▎| 4.51G/4.83G [02:00<00:10, 29.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  89%|████████▉ | 4.45G/5.00G [02:00<00:12, 45.4MB/s][A

model-00001-of-00007.safetensors:  89%|████████▉ | 4.35G/4.89G [02:01<00:13, 38.8MB/s][A[A


model-00004-of-00007.safetensors:  86%|████████▌ | 4.30G/5.00G [02:00<00:19, 35.3MB/s][A[A[A


model-00005-of-00007.safetensors:  94%|█████████▎| 4.53G/4.83G [02:00<00:09, 32.9MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  89%|████████▉ | 4.37G/4.89G [02:01<00:13, 39.8MB/s][A[A
model-00003-of-00007.safetensors:  89%|████████▉ | 4.46G/5.00G [02:01<00:12, 42.7MB/s][A


model-00004-of-00007.safetensors:  86%|████████▋ | 4.32G/5.00G [02:01<00:18, 37.3MB/s][A[A[A


model-00005-of-00007.safetensors:  94%|█████████▍| 4.54G/4.83G [02:01<00:08, 35.6MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  90%|████████▉ | 4.38G/4.89G [02:01<00:12, 40.2MB/s][A[A


model-00004-of-00007.safetensors:  87%|████████▋ | 4.34G/5.00G [02:01<00:17, 36.9MB/s][A[A[A


model-00005-of-00007.safetensors:  94%|█████████▍| 4.56G/4.83G [02:01<00:08, 33.7MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  90%|█████████ | 4.40G/4.89G [02:02<00:12, 39.7MB/s][A[A


model-00004-of-00007.safetensors:  87%|████████▋ | 4.35G/5.00G [02:02<00:17, 37.5MB/s][A[A[A
model-00003-of-00007.safetensors:  90%|████████▉ | 4.48G/5.00G [02:02<00:18, 28.3MB/s][A


model-00005-of-00007.safetensors:  95%|█████████▍| 4.58G/4.83G [02:02<00:07, 35.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  87%|████████▋ | 4.37G/5.00G [02:02<00:16, 38.6MB/s][A[A[A

model-00001-of-00007.safetensors:  90%|█████████ | 4.42G/4.89G [02:03<00:14, 32.0MB/s][A[A

model-00001-of-00007.safetensors:  91%|█████████ | 4.43G/4.89G [02:03<00:13, 34.0MB/s][A[A


model-00004-of-00007.safetensors:  88%|████████▊ | 4.38G/5.00G [02:03<00:19, 32.4MB/s][A[A[A


model-00005-of-00007.safetensors:  95%|█████████▌| 4.59G/4.83G [02:03<00:08, 27.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  90%|████████▉ | 4.50G/5.00G [02:03<00:21, 22.9MB/s][A

model-00001-of-00007.safetensors:  91%|█████████ | 4.45G/4.89G [02:03<00:11, 36.9MB/s][A[A


model-00005-of-00007.safetensors:  95%|█████████▌| 4.61G/4.83G [02:03<00:07, 30.8MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  91%|█████████▏| 4.46G/4.89G [02:04<00:10, 38.7MB/s][A[Amodel-00002-of-00007.safetensors:  94%|█████████▍| 4.54G/4.83G [02:04<00:42, 6.81MB/s]


model-00005-of-00007.safetensors:  96%|█████████▌| 4.62G/4.83G [02:03<00:06, 34.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  90%|█████████ | 4.51G/5.00G [02:04<00:20, 23.5MB/s][A

model-00001-of-00007.safetensors:  92%|█████████▏| 4.48G/4.89G [02:04<00:08, 48.5MB/s][A[Amodel-00002-of-00007.safetensors:  94%|█████████▍| 4.56G/4.83G [02:04<00:27, 9.98MB/s]


model-00004-of-00007.safetensors:  88%|████████▊ | 4.40G/5.00G [02:04<00:23, 25.0MB/s][A[A[A


model-00005-of-00007.safetensors:  96%|█████████▌| 4.64G/4.83G [02:04<00:05, 36.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  91%|█████████ | 4.53G/5.00G [02:04<00:17, 26.5MB/s][Amodel-00002-of-00007.safetensors:  95%|█████████▍| 4.58G/4.83G [02:04<00:19, 13.4MB/s]


model-00005-of-00007.safetensors:  96%|█████████▋| 4.66G/4.83G [02:04<00:04, 39.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  88%|████████▊ | 4.42G/5.00G [02:04<00:21, 26.9MB/s][A[A[A
model-00003-of-00007.safetensors:  91%|█████████ | 4.54G/5.00G [02:04<00:15, 30.0MB/s][A

model-00001-of-00007.safetensors:  92%|█████████▏| 4.49G/4.89G [02:05<00:14, 28.3MB/s][A[Amodel-00002-of-00007.safetensors:  95%|█████████▌| 4.59G/4.83G [02:05<00:13, 17.7MB/s]


model-00005-of-00007.safetensors:  97%|█████████▋| 4.67G/4.83G [02:04<00:04, 39.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  89%|████████▊ | 4.43G/5.00G [02:04<00:18, 30.4MB/s][A[A[A

model-00001-of-00007.safetensors:  92%|█████████▏| 4.50G/4.89G [02:05<00:14, 27.7MB/s][A[A
model-00003-of-00007.safetensors:  91%|█████████ | 4.56G/5.00G [02:05<00:14, 31.4MB/s][Amodel-00002-of-00007.safetensors:  95%|█████████▌| 4.61G/4.83G [02:05<00:10, 22.0MB/s]


model-00004-of-00007.safetensors:  89%|████████▉ | 4.45G/5.00G [02:05<00:16, 33.4MB/s][A[A[A


model-00005-of-00007.safetensors:  97%|█████████▋| 4.69G/4.83G [02:05<00:03, 39.5MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  92%|█████████▏| 4.58G/5.00G [02:05<00:12, 34.6MB/s][Amodel-00002-of-00007.safetensors:  96%|█████████▌| 4.62G/4.83G [02:05<00:07, 26.5MB/s]

model-00001-of-00007.safetensors:  92%|█████████▏| 4.51G/4.89G [02:06<00:13, 27.8MB/s][A[A


model-00004-of-00007.safetensors:  89%|████████▉ | 4.46G/5.00G [02:05<00:15, 35.7MB/s][A[A[A
model-00003-of-00007.safetensors:  92%|█████████▏| 4.59G/5.00G [02:05<00:10, 38.0MB/s][A


model-00005-of-00007.safetensors:  97%|█████████▋| 4.70G/4.83G [02:05<00:03, 37.2MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  92%|█████████▏| 4.61G/5.00G [02:06<00:09, 41.3MB/s][A


model-00005-of-00007.safetensors:  98%|█████████▊| 4.72G/4.83G [02:06<00:02, 38.4MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  92%|█████████▏| 4.62G/5.00G [02:06<00:09, 39.7MB/s][Amodel-00002-of-00007.safetensors:  96%|█████████▌| 4.64G/4.83G [02:06<00:09, 21.0MB/s]

model-00001-of-00007.safetensors:  93%|█████████▎| 4.53G/4.89G [02:07<00:16, 21.7MB/s][A[A
model-00003-of-00007.safetensors:  93%|█████████▎| 4.64G/5.00G [02:07<00:08, 40.6MB/s][A


model-00005-of-00007.safetensors:  98%|█████████▊| 4.74G/4.83G [02:06<00:02, 32.2MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  93%|█████████▎| 4.54G/4.89G [02:07<00:13, 25.7MB/s][A[Amodel-00002-of-00007.safetensors:  96%|█████████▋| 4.66G/4.83G [02:07<00:07, 23.7MB/s]
model-00003-of-00007.safetensors:  93%|█████████▎| 4.66G/5.00G [02:07<00:08, 40.9MB/s][A


model-00005-of-00007.safetensors:  98%|█████████▊| 4.75G/4.83G [02:07<00:02, 35.1MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  97%|█████████▋| 4.67G/4.83G [02:07<00:06, 26.2MB/s]

model-00001-of-00007.safetensors:  93%|█████████▎| 4.56G/4.89G [02:07<00:11, 27.5MB/s][A[A


model-00005-of-00007.safetensors:  99%|█████████▊| 4.77G/4.83G [02:07<00:01, 37.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  90%|████████▉ | 4.48G/5.00G [02:07<00:29, 17.8MB/s][A[A[A
model-00003-of-00007.safetensors:  93%|█████████▎| 4.67G/5.00G [02:07<00:08, 37.6MB/s][A

model-00001-of-00007.safetensors:  94%|█████████▎| 4.58G/4.89G [02:08<00:09, 31.2MB/s][A[A


model-00005-of-00007.safetensors:  99%|█████████▉| 4.78G/4.83G [02:07<00:01, 40.4MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  97%|█████████▋| 4.69G/4.83G [02:08<00:05, 28.5MB/s]


model-00004-of-00007.safetensors:  90%|████████▉ | 4.50G/5.00G [02:08<00:23, 21.6MB/s][A[A[A
model-00003-of-00007.safetensors:  94%|█████████▍| 4.69G/5.00G [02:08<00:08, 36.5MB/s][A

model-00001-of-00007.safetensors:  94%|█████████▍| 4.59G/4.89G [02:08<00:08, 35.0MB/s][A[Amodel-00002-of-00007.safetensors:  97%|█████████▋| 4.70G/4.83G [02:08<00:03, 32.8MB/s]


model-00004-of-00007.safetensors:  90%|█████████ | 4.51G/5.00G [02:08<00:19, 25.4MB/s][A[A[A


model-00005-of-00007.safetensors:  99%|█████████▉| 4.80G/4.83G [02:08<00:00, 39.2MB/s][A[A[A[A[Amodel-00002-of-00007.safetensors:  98%|█████████▊| 4.72G/4.83G [02:08<00:03, 35.7MB/s]

model-00001-of-00007.safetensors:  94%|█████████▍| 4.61G/4.89G [02:09<00:07, 36.4MB/s][A[A


model-00004-of-00007.safetensors:  91%|█████████ | 4.53G/5.00G [02:08<00:16, 29.1MB/s][A[A[A


model-00005-of-00007.safetensors: 100%|█████████▉| 4.82G/4.83G [02:08<00:00, 40.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  94%|█████████▍| 4.70G/5.00G [02:09<00:09, 31.7MB/s][A

model-00001-of-00007.safetensors:  95%|█████████▍| 4.62G/4.89G [02:09<00:06, 38.4MB/s][A[A


model-00004-of-00007.safetensors:  91%|█████████ | 4.54G/5.00G [02:09<00:14, 30.9MB/s][A[A[A


model-00005-of-00007.safetensors: 100%|██████████| 4.83G/4.83G [02:09<00:00, 39.1MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  94%|█████████▍| 4.72G/5.00G [02:09<00:07, 35.0MB/s][Amodel-00002-of-00007.safetensors:  98%|█████████▊| 4.74G/4.83G [02:09<00:03, 30.8MB/s]model-00005-of-00007.safetensors: 100%|██████████| 4.83G/4.83G [02:09<00:00, 37.3MB/s]


model-00001-of-00007.safetensors:  95%|█████████▍| 4.64G/4.89G [02:09<00:06, 36.2MB/s][A[A


model-00004-of-00007.safetensors:  91%|█████████ | 4.56G/5.00G [02:09<00:12, 34.4MB/s][A[A[A
model-00003-of-00007.safetensors:  95%|█████████▍| 4.74G/5.00G [02:09<00:07, 36.2MB/s][Amodel-00002-of-00007.safetensors:  98%|█████████▊| 4.75G/4.83G [02:10<00:02, 32.9MB/s]


model-00006-of-00007.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s][A[A[A[A[A

model-00001-of-00007.safetensors:  95%|█████████▌| 4.66G/4.89G [02:10<00:06, 34.0MB/s][A[A
model-00003-of-00007.safetensors:  95%|█████████▌| 4.75G/5.00G [02:10<00:06, 36.0MB/s][Amodel-00002-of-00007.safetensors:  99%|█████████▊| 4.77G/4.83G [02:10<00:01, 36.0MB/s]


model-00004-of-00007.safetensors:  92%|█████████▏| 4.58G/5.00G [02:10<00:13, 32.3MB/s][A[A[A


model-00006-of-00007.safetensors:   0%|          | 16.0M/5.00G [00:00<01:53, 44.0MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  95%|█████████▌| 4.76G/5.00G [02:10<00:05, 41.7MB/s][Amodel-00002-of-00007.safetensors:  99%|█████████▉| 4.78G/4.83G [02:10<00:01, 42.9MB/s]


model-00004-of-00007.safetensors:  92%|█████████▏| 4.59G/5.00G [02:10<00:10, 38.3MB/s][A[A[A


model-00006-of-00007.safetensors:   1%|          | 27.7M/5.00G [00:00<01:17, 64.4MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  96%|█████████▌| 4.67G/4.89G [02:10<00:05, 36.8MB/s][A[Amodel-00002-of-00007.safetensors:  99%|█████████▉| 4.79G/4.83G [02:10<00:01, 37.5MB/s]
model-00003-of-00007.safetensors:  95%|█████████▌| 4.77G/5.00G [02:10<00:06, 36.2MB/s][A


model-00006-of-00007.safetensors:   1%|          | 36.4M/5.00G [00:00<01:55, 43.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  92%|█████████▏| 4.59G/5.00G [02:10<00:12, 31.9MB/s][A[A[A
model-00003-of-00007.safetensors:  96%|█████████▌| 4.78G/5.00G [02:11<00:05, 40.5MB/s][Amodel-00002-of-00007.safetensors:  99%|█████████▉| 4.80G/4.83G [02:11<00:00, 38.9MB/s]


model-00006-of-00007.safetensors:   1%|          | 48.0M/5.00G [00:01<02:10, 38.0MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  96%|█████████▌| 4.69G/4.89G [02:11<00:05, 33.8MB/s][A[A


model-00004-of-00007.safetensors:  92%|█████████▏| 4.61G/5.00G [02:11<00:12, 31.4MB/s][A[A[A
model-00003-of-00007.safetensors:  96%|█████████▌| 4.80G/5.00G [02:11<00:04, 42.8MB/s][Amodel-00002-of-00007.safetensors: 100%|█████████▉| 4.82G/4.83G [02:11<00:00, 40.0MB/s]

model-00001-of-00007.safetensors:  96%|█████████▋| 4.70G/4.89G [02:11<00:05, 35.3MB/s][A[A


model-00006-of-00007.safetensors:   1%|▏         | 64.0M/5.00G [00:01<02:19, 35.4MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  92%|█████████▏| 4.62G/5.00G [02:11<00:10, 34.8MB/s][A[A[A
model-00003-of-00007.safetensors:  96%|█████████▋| 4.82G/5.00G [02:11<00:04, 43.3MB/s][Amodel-00002-of-00007.safetensors: 100%|██████████| 4.83G/4.83G [02:11<00:00, 38.0MB/s]
model-00003-of-00007.safetensors:  97%|█████████▋| 4.83G/5.00G [02:12<00:03, 46.1MB/s][A


model-00006-of-00007.safetensors:   2%|▏         | 80.0M/5.00G [00:02<02:15, 36.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  93%|█████████▎| 4.64G/5.00G [02:11<00:09, 36.0MB/s][A[A[A

model-00001-of-00007.safetensors:  97%|█████████▋| 4.72G/4.89G [02:12<00:05, 33.1MB/s][A[Amodel-00002-of-00007.safetensors: 100%|██████████| 4.83G/4.83G [02:12<00:00, 36.5MB/s]


model-00004-of-00007.safetensors:  93%|█████████▎| 4.66G/5.00G [02:12<00:09, 36.9MB/s][A[A[A

model-00001-of-00007.safetensors:  97%|█████████▋| 4.74G/4.89G [02:12<00:04, 36.2MB/s][A[Amodel-00007-of-00007.safetensors:   0%|          | 0.00/2.57G [00:00<?, ?B/s]
model-00003-of-00007.safetensors:  97%|█████████▋| 4.85G/5.00G [02:12<00:04, 33.4MB/s][A


model-00006-of-00007.safetensors:   2%|▏         | 96.0M/5.00G [00:02<02:50, 28.8MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  97%|█████████▋| 4.75G/4.89G [02:13<00:03, 37.3MB/s][A[A


model-00004-of-00007.safetensors:  93%|█████████▎| 4.67G/5.00G [02:12<00:09, 33.8MB/s][A[A[Amodel-00007-of-00007.safetensors:   1%|          | 16.0M/2.57G [00:00<00:57, 44.7MB/s]


model-00006-of-00007.safetensors:   2%|▏         | 112M/5.00G [00:03<02:27, 33.2MB/s] [A[A[A[A[A
model-00003-of-00007.safetensors:  97%|█████████▋| 4.86G/5.00G [02:13<00:03, 34.6MB/s][A

model-00001-of-00007.safetensors:  98%|█████████▊| 4.77G/4.89G [02:13<00:03, 38.9MB/s][A[A


model-00004-of-00007.safetensors:  94%|█████████▍| 4.69G/5.00G [02:13<00:08, 36.9MB/s][A[A[A

model-00001-of-00007.safetensors:  98%|█████████▊| 4.78G/4.89G [02:13<00:02, 38.3MB/s][A[A


model-00004-of-00007.safetensors:  94%|█████████▍| 4.70G/5.00G [02:13<00:07, 39.0MB/s][A[A[A


model-00006-of-00007.safetensors:   3%|▎         | 128M/5.00G [00:03<02:44, 29.7MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  98%|█████████▊| 4.88G/5.00G [02:13<00:03, 30.8MB/s][Amodel-00007-of-00007.safetensors:   1%|          | 32.0M/2.57G [00:01<01:41, 25.0MB/s]

model-00001-of-00007.safetensors:  98%|█████████▊| 4.80G/4.89G [02:14<00:02, 39.3MB/s][A[A


model-00004-of-00007.safetensors:  94%|█████████▍| 4.72G/5.00G [02:13<00:06, 40.1MB/s][A[A[A


model-00006-of-00007.safetensors:   3%|▎         | 144M/5.00G [00:04<02:23, 33.8MB/s][A[A[A[A[A
model-00003-of-00007.safetensors:  98%|█████████▊| 4.90G/5.00G [02:14<00:03, 33.8MB/s][A


model-00004-of-00007.safetensors:  95%|█████████▍| 4.74G/5.00G [02:14<00:06, 41.1MB/s][A[A[A
model-00003-of-00007.safetensors:  98%|█████████▊| 4.91G/5.00G [02:14<00:02, 37.7MB/s][A


model-00006-of-00007.safetensors:   3%|▎         | 160M/5.00G [00:04<02:22, 34.0MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  99%|█████████▊| 4.82G/4.89G [02:14<00:01, 35.6MB/s][A[Amodel-00007-of-00007.safetensors:   2%|▏         | 48.0M/2.57G [00:01<01:45, 23.8MB/s]
model-00003-of-00007.safetensors:  99%|█████████▊| 4.93G/5.00G [02:14<00:01, 40.4MB/s][A


model-00004-of-00007.safetensors:  95%|█████████▌| 4.75G/5.00G [02:14<00:06, 40.9MB/s][A[A[Amodel-00007-of-00007.safetensors:   2%|▏         | 64.0M/2.57G [00:02<01:27, 28.7MB/s]

model-00001-of-00007.safetensors:  99%|█████████▉| 4.83G/4.89G [02:15<00:01, 35.0MB/s][A[A


model-00006-of-00007.safetensors:   4%|▎         | 176M/5.00G [00:05<02:34, 31.2MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  95%|█████████▌| 4.77G/5.00G [02:15<00:05, 41.2MB/s][A[A[A
model-00003-of-00007.safetensors:  99%|█████████▉| 4.94G/5.00G [02:15<00:01, 38.9MB/s][Amodel-00007-of-00007.safetensors:   3%|▎         | 80.0M/2.57G [00:02<01:14, 33.5MB/s]
model-00003-of-00007.safetensors:  99%|█████████▉| 4.96G/5.00G [02:15<00:00, 40.7MB/s][A


model-00004-of-00007.safetensors:  96%|█████████▌| 4.78G/5.00G [02:15<00:05, 40.8MB/s][A[A[A


model-00006-of-00007.safetensors:   4%|▍         | 192M/5.00G [00:05<02:32, 31.5MB/s][A[A[A[A[A

model-00001-of-00007.safetensors:  99%|█████████▉| 4.85G/4.89G [02:15<00:01, 30.1MB/s][A[Amodel-00007-of-00007.safetensors:   4%|▎         | 96.0M/2.57G [00:03<01:16, 32.5MB/s]
model-00003-of-00007.safetensors: 100%|█████████▉| 4.98G/5.00G [02:15<00:00, 42.6MB/s][A


model-00004-of-00007.safetensors:  96%|█████████▌| 4.80G/5.00G [02:15<00:04, 42.5MB/s][A[A[A

model-00001-of-00007.safetensors: 100%|█████████▉| 4.86G/4.89G [02:16<00:00, 33.5MB/s][A[Amodel-00007-of-00007.safetensors:   4%|▍         | 112M/2.57G [00:03<01:09, 35.3MB/s] 


model-00006-of-00007.safetensors:   4%|▍         | 208M/5.00G [00:06<02:40, 29.9MB/s][A[A[A[A[A
model-00003-of-00007.safetensors: 100%|█████████▉| 4.99G/5.00G [02:16<00:00, 44.0MB/s][A


model-00004-of-00007.safetensors:  96%|█████████▋| 4.82G/5.00G [02:16<00:04, 43.2MB/s][A[A[A

model-00001-of-00007.safetensors: 100%|█████████▉| 4.88G/4.89G [02:16<00:00, 36.8MB/s][A[Amodel-00003-of-00007.safetensors: 100%|██████████| 5.00G/5.00G [02:16<00:00, 36.6MB/s]


model-00006-of-00007.safetensors:   4%|▍         | 224M/5.00G [00:06<02:23, 33.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  97%|█████████▋| 4.83G/5.00G [02:16<00:03, 44.4MB/s][A[A[Amodel-00007-of-00007.safetensors:   5%|▍         | 128M/2.57G [00:03<01:09, 35.2MB/s]model-00001-of-00007.safetensors: 100%|██████████| 4.89G/4.89G [02:16<00:00, 35.7MB/s]


model-00006-of-00007.safetensors:   5%|▍         | 240M/5.00G [00:07<02:11, 36.1MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  97%|█████████▋| 4.85G/5.00G [02:16<00:03, 45.7MB/s][A[A[A
tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s][Amodel-00007-of-00007.safetensors:   6%|▌         | 144M/2.57G [00:04<01:05, 36.9MB/s]


Upload 689 LFS files:  99%|█████████▉| 682/689 [03:11<02:48, 24.13s/it][A[A[A[A


model-00006-of-00007.safetensors:   5%|▌         | 256M/5.00G [00:07<02:03, 38.5MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  97%|█████████▋| 4.86G/5.00G [02:17<00:03, 45.1MB/s][A[A[Amodel-00007-of-00007.safetensors:   6%|▌         | 160M/2.57G [00:04<01:00, 40.0MB/s]
tokenizer.json:  93%|█████████▎| 16.0M/17.2M [00:00<00:00, 35.4MB/s][A


model-00006-of-00007.safetensors:   5%|▌         | 272M/5.00G [00:07<01:52, 42.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  98%|█████████▊| 4.88G/5.00G [02:17<00:02, 47.1MB/s][A[A[Atokenizer.json: 100%|██████████| 17.2M/17.2M [00:00<00:00, 25.7MB/s]
model-00007-of-00007.safetensors:   7%|▋         | 176M/2.57G [00:05<00:57, 41.5MB/s]


model-00006-of-00007.safetensors:   6%|▌         | 288M/5.00G [00:08<01:46, 44.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  98%|█████████▊| 4.90G/5.00G [02:17<00:02, 48.4MB/s][A[A[Amodel-00007-of-00007.safetensors:   7%|▋         | 192M/2.57G [00:05<00:57, 41.2MB/s]


model-00006-of-00007.safetensors:   6%|▌         | 304M/5.00G [00:08<01:43, 45.6MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  98%|█████████▊| 4.91G/5.00G [02:18<00:01, 46.9MB/s][A[A[Amodel-00007-of-00007.safetensors:   8%|▊         | 208M/2.57G [00:05<00:55, 42.2MB/s]


model-00006-of-00007.safetensors:   6%|▋         | 320M/5.00G [00:08<01:41, 46.0MB/s][A[A[A[A[A


model-00004-of-00007.safetensors:  99%|█████████▊| 4.93G/5.00G [02:18<00:01, 39.4MB/s][A[A[A


model-00006-of-00007.safetensors:   7%|▋         | 336M/5.00G [00:09<01:40, 46.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:   9%|▊         | 224M/2.57G [00:06<01:00, 38.8MB/s]


model-00004-of-00007.safetensors:  99%|█████████▉| 4.94G/5.00G [02:19<00:01, 39.9MB/s][A[A[Amodel-00007-of-00007.safetensors:   9%|▉         | 240M/2.57G [00:06<00:56, 41.0MB/s]


model-00006-of-00007.safetensors:   7%|▋         | 352M/5.00G [00:09<01:48, 42.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  10%|▉         | 256M/2.57G [00:06<00:53, 43.0MB/s]


model-00004-of-00007.safetensors:  99%|█████████▉| 4.96G/5.00G [02:19<00:01, 39.5MB/s][A[A[A


model-00006-of-00007.safetensors:   7%|▋         | 368M/5.00G [00:09<01:45, 43.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  11%|█         | 272M/2.57G [00:07<00:53, 43.4MB/s]


model-00006-of-00007.safetensors:   8%|▊         | 384M/5.00G [00:10<02:01, 38.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  11%|█         | 288M/2.57G [00:07<00:52, 43.6MB/s]


model-00004-of-00007.safetensors: 100%|█████████▉| 4.98G/5.00G [02:20<00:00, 26.9MB/s][A[A[Amodel-00007-of-00007.safetensors:  12%|█▏        | 304M/2.57G [00:08<00:52, 43.5MB/s]


model-00006-of-00007.safetensors:   8%|▊         | 400M/5.00G [00:10<02:16, 33.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  12%|█▏        | 320M/2.57G [00:08<00:51, 44.0MB/s]


model-00006-of-00007.safetensors:   8%|▊         | 416M/5.00G [00:11<02:02, 37.3MB/s][A[A[A[A[A


model-00004-of-00007.safetensors: 100%|█████████▉| 4.99G/5.00G [02:21<00:00, 27.1MB/s][A[A[Amodel-00007-of-00007.safetensors:  13%|█▎        | 336M/2.57G [00:08<00:51, 43.3MB/s]


model-00006-of-00007.safetensors:   9%|▊         | 432M/5.00G [00:11<01:55, 39.6MB/s][A[A[A[A[Amodel-00004-of-00007.safetensors: 100%|██████████| 5.00G/5.00G [02:21<00:00, 35.3MB/s]
model-00007-of-00007.safetensors:  14%|█▎        | 352M/2.57G [00:09<00:52, 42.6MB/s]


model-00006-of-00007.safetensors:   9%|▉         | 448M/5.00G [00:12<01:56, 39.0MB/s][A[A[A[A[A


Upload 689 LFS files:  99%|█████████▉| 685/689 [03:16<00:57, 14.46s/it][A[A[A[Amodel-00007-of-00007.safetensors:  14%|█▍        | 368M/2.57G [00:09<00:49, 44.7MB/s]


model-00006-of-00007.safetensors:   9%|▉         | 464M/5.00G [00:12<01:48, 41.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  10%|▉         | 480M/5.00G [00:12<01:53, 39.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  15%|█▍        | 384M/2.57G [00:10<01:01, 35.3MB/s]


model-00006-of-00007.safetensors:  10%|▉         | 496M/5.00G [00:13<01:50, 40.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  16%|█▌        | 400M/2.57G [00:10<00:58, 37.1MB/s]


model-00006-of-00007.safetensors:  10%|█         | 512M/5.00G [00:13<01:47, 41.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  16%|█▌        | 416M/2.57G [00:10<00:55, 38.6MB/s]


model-00006-of-00007.safetensors:  11%|█         | 528M/5.00G [00:13<01:48, 41.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  17%|█▋        | 432M/2.57G [00:11<00:55, 38.6MB/s]


model-00006-of-00007.safetensors:  11%|█         | 544M/5.00G [00:14<01:43, 43.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  17%|█▋        | 448M/2.57G [00:11<00:53, 39.9MB/s]


model-00006-of-00007.safetensors:  11%|█         | 560M/5.00G [00:14<02:00, 36.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  18%|█▊        | 464M/2.57G [00:12<00:53, 39.7MB/s]model-00007-of-00007.safetensors:  19%|█▊        | 480M/2.57G [00:12<00:49, 41.9MB/s]


model-00006-of-00007.safetensors:  12%|█▏        | 576M/5.00G [00:15<02:03, 35.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  19%|█▉        | 496M/2.57G [00:12<00:48, 42.8MB/s]


model-00006-of-00007.safetensors:  12%|█▏        | 592M/5.00G [00:15<01:54, 38.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  20%|█▉        | 512M/2.57G [00:13<00:48, 42.9MB/s]


model-00006-of-00007.safetensors:  12%|█▏        | 608M/5.00G [00:15<01:47, 41.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  21%|██        | 528M/2.57G [00:13<00:47, 43.0MB/s]


model-00006-of-00007.safetensors:  12%|█▏        | 624M/5.00G [00:16<01:49, 39.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  21%|██        | 544M/2.57G [00:13<00:47, 42.3MB/s]


model-00006-of-00007.safetensors:  13%|█▎        | 640M/5.00G [00:16<01:44, 41.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  22%|██▏       | 560M/2.57G [00:14<00:46, 42.9MB/s]


model-00006-of-00007.safetensors:  13%|█▎        | 656M/5.00G [00:17<01:48, 40.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  13%|█▎        | 672M/5.00G [00:17<01:45, 41.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  22%|██▏       | 576M/2.57G [00:14<00:58, 34.2MB/s]


model-00006-of-00007.safetensors:  14%|█▍        | 688M/5.00G [00:18<01:50, 39.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  23%|██▎       | 592M/2.57G [00:15<00:54, 36.1MB/s]


model-00006-of-00007.safetensors:  14%|█▍        | 704M/5.00G [00:18<01:47, 40.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  24%|██▎       | 608M/2.57G [00:16<01:02, 31.2MB/s]


model-00006-of-00007.safetensors:  14%|█▍        | 720M/5.00G [00:18<01:47, 39.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  24%|██▍       | 624M/2.57G [00:16<01:01, 31.8MB/s]


model-00006-of-00007.safetensors:  15%|█▍        | 736M/5.00G [00:19<02:00, 35.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  25%|██▍       | 640M/2.57G [00:16<00:55, 35.0MB/s]


model-00006-of-00007.safetensors:  15%|█▌        | 752M/5.00G [00:19<01:57, 36.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  26%|██▌       | 656M/2.57G [00:17<00:52, 36.8MB/s]


model-00006-of-00007.safetensors:  15%|█▌        | 768M/5.00G [00:20<01:50, 38.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  26%|██▌       | 672M/2.57G [00:17<00:54, 34.6MB/s]


model-00006-of-00007.safetensors:  16%|█▌        | 784M/5.00G [00:20<01:57, 35.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  27%|██▋       | 688M/2.57G [00:18<00:50, 37.3MB/s]


model-00006-of-00007.safetensors:  16%|█▌        | 800M/5.00G [00:21<01:51, 37.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  27%|██▋       | 704M/2.57G [00:18<00:48, 38.6MB/s]


model-00006-of-00007.safetensors:  16%|█▋        | 816M/5.00G [00:21<01:55, 36.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  28%|██▊       | 720M/2.57G [00:18<00:45, 40.9MB/s]


model-00006-of-00007.safetensors:  17%|█▋        | 832M/5.00G [00:21<01:48, 38.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  29%|██▊       | 736M/2.57G [00:19<00:52, 35.2MB/s]


model-00006-of-00007.safetensors:  17%|█▋        | 848M/5.00G [00:22<01:55, 36.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  29%|██▉       | 752M/2.57G [00:19<00:47, 38.0MB/s]


model-00006-of-00007.safetensors:  17%|█▋        | 864M/5.00G [00:22<01:44, 39.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  30%|██▉       | 768M/2.57G [00:20<00:44, 40.3MB/s]


model-00006-of-00007.safetensors:  18%|█▊        | 880M/5.00G [00:23<01:38, 41.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  30%|███       | 784M/2.57G [00:20<00:41, 42.8MB/s]model-00007-of-00007.safetensors:  31%|███       | 800M/2.57G [00:20<00:41, 42.9MB/s]model-00007-of-00007.safetensors:  32%|███▏      | 816M/2.57G [00:21<00:47, 36.9MB/s]model-00007-of-00007.safetensors:  32%|███▏      | 832M/2.57G [00:21<00:44, 38.9MB/s]model-00007-of-00007.safetensors:  33%|███▎      | 848M/2.57G [00:22<00:42, 40.1MB/s]


model-00006-of-00007.safetensors:  18%|█▊        | 896M/5.00G [00:25<03:45, 18.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  34%|███▎      | 864M/2.57G [00:22<00:40, 41.8MB/s]model-00007-of-00007.safetensors:  34%|███▍      | 880M/2.57G [00:22<00:38, 44.4MB/s]


model-00006-of-00007.safetensors:  18%|█▊        | 912M/5.00G [00:25<03:21, 20.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  35%|███▍      | 896M/2.57G [00:23<00:38, 43.5MB/s]


model-00006-of-00007.safetensors:  19%|█▊        | 928M/5.00G [00:26<02:49, 24.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  19%|█▉        | 944M/5.00G [00:26<02:23, 28.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  35%|███▌      | 912M/2.57G [00:23<00:43, 38.1MB/s]


model-00006-of-00007.safetensors:  19%|█▉        | 960M/5.00G [00:26<02:09, 31.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  36%|███▌      | 928M/2.57G [00:24<00:44, 36.6MB/s]


model-00006-of-00007.safetensors:  20%|█▉        | 976M/5.00G [00:27<02:03, 32.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  37%|███▋      | 944M/2.57G [00:24<00:41, 39.5MB/s]


model-00006-of-00007.safetensors:  20%|█▉        | 992M/5.00G [00:27<01:55, 34.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  37%|███▋      | 960M/2.57G [00:24<00:39, 41.2MB/s]model-00007-of-00007.safetensors:  38%|███▊      | 976M/2.57G [00:25<00:38, 41.6MB/s]


model-00006-of-00007.safetensors:  20%|██        | 1.01G/5.00G [00:28<01:54, 34.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  39%|███▊      | 992M/2.57G [00:25<00:37, 42.6MB/s]


model-00006-of-00007.safetensors:  20%|██        | 1.02G/5.00G [00:28<01:48, 36.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  21%|██        | 1.04G/5.00G [00:28<01:43, 38.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  21%|██        | 1.06G/5.00G [00:29<01:39, 39.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  39%|███▉      | 1.01G/2.57G [00:26<00:56, 27.7MB/s]


model-00006-of-00007.safetensors:  21%|██▏       | 1.07G/5.00G [00:29<01:36, 40.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  40%|███▉      | 1.02G/2.57G [00:27<00:51, 30.0MB/s]


model-00006-of-00007.safetensors:  22%|██▏       | 1.09G/5.00G [00:29<01:37, 40.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  40%|████      | 1.04G/2.57G [00:27<00:45, 33.8MB/s]


model-00006-of-00007.safetensors:  22%|██▏       | 1.10G/5.00G [00:30<01:36, 40.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  41%|████      | 1.06G/2.57G [00:27<00:40, 37.0MB/s]


model-00006-of-00007.safetensors:  22%|██▏       | 1.12G/5.00G [00:30<01:32, 41.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  42%|████▏     | 1.07G/2.57G [00:28<00:38, 39.1MB/s]


model-00006-of-00007.safetensors:  23%|██▎       | 1.14G/5.00G [00:31<01:26, 44.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  42%|████▏     | 1.09G/2.57G [00:28<00:37, 40.0MB/s]


model-00006-of-00007.safetensors:  23%|██▎       | 1.15G/5.00G [00:31<01:24, 45.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  43%|████▎     | 1.10G/2.57G [00:28<00:34, 42.2MB/s]


model-00006-of-00007.safetensors:  23%|██▎       | 1.17G/5.00G [00:31<01:25, 45.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  44%|████▎     | 1.12G/2.57G [00:29<00:32, 44.9MB/s]


model-00006-of-00007.safetensors:  24%|██▎       | 1.18G/5.00G [00:32<01:30, 42.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  44%|████▍     | 1.14G/2.57G [00:29<00:32, 43.5MB/s]


model-00006-of-00007.safetensors:  24%|██▍       | 1.20G/5.00G [00:32<01:27, 43.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  45%|████▍     | 1.15G/2.57G [00:29<00:33, 42.6MB/s]


model-00006-of-00007.safetensors:  24%|██▍       | 1.22G/5.00G [00:32<01:26, 43.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  25%|██▍       | 1.23G/5.00G [00:33<01:24, 44.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  45%|████▌     | 1.17G/2.57G [00:30<00:39, 35.4MB/s]


model-00006-of-00007.safetensors:  25%|██▍       | 1.25G/5.00G [00:33<01:25, 44.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  46%|████▌     | 1.18G/2.57G [00:30<00:37, 36.9MB/s]


model-00006-of-00007.safetensors:  25%|██▌       | 1.26G/5.00G [00:33<01:27, 42.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  47%|████▋     | 1.20G/2.57G [00:31<00:34, 39.4MB/s]


model-00006-of-00007.safetensors:  26%|██▌       | 1.28G/5.00G [00:34<01:29, 41.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  47%|████▋     | 1.22G/2.57G [00:31<00:38, 35.0MB/s]


model-00006-of-00007.safetensors:  26%|██▌       | 1.30G/5.00G [00:34<01:26, 43.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  26%|██▌       | 1.31G/5.00G [00:35<01:26, 42.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  48%|████▊     | 1.23G/2.57G [00:32<00:40, 33.4MB/s]


model-00006-of-00007.safetensors:  27%|██▋       | 1.33G/5.00G [00:35<01:32, 39.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  49%|████▊     | 1.25G/2.57G [00:33<00:43, 30.5MB/s]


model-00006-of-00007.safetensors:  27%|██▋       | 1.34G/5.00G [00:35<01:25, 42.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  27%|██▋       | 1.36G/5.00G [00:36<01:25, 42.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  49%|████▉     | 1.26G/2.57G [00:33<00:41, 31.6MB/s]model-00007-of-00007.safetensors:  50%|████▉     | 1.28G/2.57G [00:34<00:42, 30.6MB/s]


model-00006-of-00007.safetensors:  28%|██▊       | 1.38G/5.00G [00:36<01:42, 35.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  50%|█████     | 1.30G/2.57G [00:34<00:36, 35.0MB/s]


model-00006-of-00007.safetensors:  28%|██▊       | 1.39G/5.00G [00:37<01:35, 37.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  28%|██▊       | 1.41G/5.00G [00:37<01:29, 40.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  28%|██▊       | 1.42G/5.00G [00:37<01:23, 42.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  51%|█████     | 1.31G/2.57G [00:35<00:47, 26.6MB/s]


model-00006-of-00007.safetensors:  29%|██▉       | 1.44G/5.00G [00:38<01:22, 43.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  52%|█████▏    | 1.33G/2.57G [00:35<00:40, 30.3MB/s]


model-00006-of-00007.safetensors:  29%|██▉       | 1.46G/5.00G [00:38<01:21, 43.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  52%|█████▏    | 1.34G/2.57G [00:35<00:36, 33.3MB/s]model-00007-of-00007.safetensors:  53%|█████▎    | 1.36G/2.57G [00:36<00:35, 34.5MB/s]


model-00006-of-00007.safetensors:  29%|██▉       | 1.47G/5.00G [00:39<01:36, 36.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  30%|██▉       | 1.49G/5.00G [00:39<01:27, 40.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  54%|█████▎    | 1.38G/2.57G [00:36<00:32, 37.1MB/s]model-00007-of-00007.safetensors:  54%|█████▍    | 1.39G/2.57G [00:37<00:30, 38.7MB/s]model-00007-of-00007.safetensors:  55%|█████▍    | 1.41G/2.57G [00:37<00:29, 39.8MB/s]model-00007-of-00007.safetensors:  55%|█████▌    | 1.42G/2.57G [00:37<00:29, 39.1MB/s]model-00007-of-00007.safetensors:  56%|█████▌    | 1.44G/2.57G [00:38<00:28, 40.4MB/s]model-00007-of-00007.safetensors:  57%|█████▋    | 1.46G/2.57G [00:38<00:28, 38.6MB/s]


model-00006-of-00007.safetensors:  30%|███       | 1.50G/5.00G [00:41<03:38, 16.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  57%|█████▋    | 1.47G/2.57G [00:39<00:30, 35.5MB/s]


model-00006-of-00007.safetensors:  30%|███       | 1.52G/5.00G [00:42<03:12, 18.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  58%|█████▊    | 1.49G/2.57G [00:39<00:33, 32.1MB/s]model-00007-of-00007.safetensors:  58%|█████▊    | 1.50G/2.57G [00:40<00:30, 35.2MB/s]


model-00006-of-00007.safetensors:  31%|███       | 1.54G/5.00G [00:43<02:47, 20.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  31%|███       | 1.55G/5.00G [00:43<02:19, 24.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  59%|█████▉    | 1.52G/2.57G [00:40<00:30, 34.0MB/s]


model-00006-of-00007.safetensors:  31%|███▏      | 1.57G/5.00G [00:43<02:02, 28.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  60%|█████▉    | 1.54G/2.57G [00:41<00:32, 32.3MB/s]


model-00006-of-00007.safetensors:  32%|███▏      | 1.58G/5.00G [00:44<01:45, 32.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  60%|██████    | 1.55G/2.57G [00:41<00:28, 35.5MB/s]


model-00006-of-00007.safetensors:  32%|███▏      | 1.60G/5.00G [00:44<01:35, 35.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  32%|███▏      | 1.62G/5.00G [00:44<01:32, 36.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  61%|██████    | 1.57G/2.57G [00:42<00:28, 34.9MB/s]


model-00006-of-00007.safetensors:  33%|███▎      | 1.63G/5.00G [00:45<01:25, 39.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  62%|██████▏   | 1.58G/2.57G [00:42<00:28, 35.0MB/s]


model-00006-of-00007.safetensors:  33%|███▎      | 1.65G/5.00G [00:45<01:31, 36.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  62%|██████▏   | 1.60G/2.57G [00:42<00:26, 37.2MB/s]


model-00006-of-00007.safetensors:  33%|███▎      | 1.66G/5.00G [00:46<01:26, 38.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  63%|██████▎   | 1.62G/2.57G [00:43<00:23, 40.0MB/s]model-00007-of-00007.safetensors:  63%|██████▎   | 1.63G/2.57G [00:43<00:22, 42.6MB/s]


model-00006-of-00007.safetensors:  34%|███▎      | 1.68G/5.00G [00:46<01:29, 37.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  34%|███▍      | 1.70G/5.00G [00:46<01:22, 40.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  64%|██████▍   | 1.65G/2.57G [00:44<00:28, 32.6MB/s]


model-00006-of-00007.safetensors:  34%|███▍      | 1.71G/5.00G [00:47<01:17, 42.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  35%|███▍      | 1.73G/5.00G [00:47<01:12, 45.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  65%|██████▍   | 1.66G/2.57G [00:44<00:26, 34.1MB/s]model-00007-of-00007.safetensors:  65%|██████▌   | 1.68G/2.57G [00:45<00:26, 34.2MB/s]


model-00006-of-00007.safetensors:  35%|███▍      | 1.74G/5.00G [00:48<01:27, 37.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  35%|███▌      | 1.76G/5.00G [00:48<01:22, 39.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  66%|██████▌   | 1.70G/2.57G [00:45<00:27, 31.8MB/s]


model-00006-of-00007.safetensors:  36%|███▌      | 1.78G/5.00G [00:48<01:21, 39.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  67%|██████▋   | 1.71G/2.57G [00:46<00:25, 33.2MB/s]


model-00006-of-00007.safetensors:  36%|███▌      | 1.79G/5.00G [00:49<01:19, 40.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  36%|███▌      | 1.81G/5.00G [00:49<01:17, 41.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  67%|██████▋   | 1.73G/2.57G [00:46<00:26, 31.8MB/s]model-00007-of-00007.safetensors:  68%|██████▊   | 1.74G/2.57G [00:47<00:23, 35.1MB/s]


model-00006-of-00007.safetensors:  36%|███▋      | 1.82G/5.00G [00:50<01:25, 37.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  68%|██████▊   | 1.76G/2.57G [00:47<00:21, 37.2MB/s]


model-00006-of-00007.safetensors:  37%|███▋      | 1.84G/5.00G [00:50<01:27, 36.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  69%|██████▉   | 1.78G/2.57G [00:47<00:20, 38.9MB/s]


model-00006-of-00007.safetensors:  37%|███▋      | 1.86G/5.00G [00:50<01:22, 38.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  70%|██████▉   | 1.79G/2.57G [00:48<00:19, 40.1MB/s]


model-00006-of-00007.safetensors:  37%|███▋      | 1.87G/5.00G [00:51<01:17, 40.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  70%|███████   | 1.81G/2.57G [00:48<00:18, 42.1MB/s]


model-00006-of-00007.safetensors:  38%|███▊      | 1.89G/5.00G [00:51<01:14, 41.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  71%|███████   | 1.82G/2.57G [00:48<00:16, 44.5MB/s]


model-00006-of-00007.safetensors:  38%|███▊      | 1.90G/5.00G [00:52<01:12, 42.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  72%|███████▏  | 1.84G/2.57G [00:49<00:18, 40.5MB/s]


model-00006-of-00007.safetensors:  38%|███▊      | 1.92G/5.00G [00:52<01:15, 41.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  72%|███████▏  | 1.86G/2.57G [00:49<00:16, 42.4MB/s]


model-00006-of-00007.safetensors:  39%|███▊      | 1.94G/5.00G [00:52<01:11, 42.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  73%|███████▎  | 1.87G/2.57G [00:50<00:16, 42.2MB/s]


model-00006-of-00007.safetensors:  39%|███▉      | 1.95G/5.00G [00:53<01:14, 40.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  73%|███████▎  | 1.89G/2.57G [00:50<00:15, 44.0MB/s]


model-00006-of-00007.safetensors:  39%|███▉      | 1.97G/5.00G [00:53<01:11, 42.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  74%|███████▍  | 1.90G/2.57G [00:51<00:18, 36.8MB/s]


model-00006-of-00007.safetensors:  40%|███▉      | 1.98G/5.00G [00:53<01:07, 44.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  75%|███████▍  | 1.92G/2.57G [00:51<00:16, 39.9MB/s]


model-00006-of-00007.safetensors:  40%|████      | 2.00G/5.00G [00:54<01:15, 39.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  75%|███████▌  | 1.94G/2.57G [00:51<00:15, 42.2MB/s]model-00007-of-00007.safetensors:  76%|███████▌  | 1.95G/2.57G [00:52<00:14, 43.5MB/s]


model-00006-of-00007.safetensors:  40%|████      | 2.02G/5.00G [00:54<01:23, 35.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  77%|███████▋  | 1.97G/2.57G [00:52<00:13, 45.9MB/s]


model-00006-of-00007.safetensors:  41%|████      | 2.03G/5.00G [00:55<01:17, 38.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  77%|███████▋  | 1.98G/2.57G [00:52<00:13, 44.7MB/s]model-00007-of-00007.safetensors:  78%|███████▊  | 2.00G/2.57G [00:53<00:12, 46.2MB/s]


model-00006-of-00007.safetensors:  41%|████      | 2.05G/5.00G [00:55<01:27, 33.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  41%|████▏     | 2.06G/5.00G [00:56<01:26, 33.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  78%|███████▊  | 2.02G/2.57G [00:53<00:14, 37.1MB/s]


model-00006-of-00007.safetensors:  42%|████▏     | 2.08G/5.00G [00:56<01:21, 35.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  79%|███████▉  | 2.03G/2.57G [00:54<00:14, 36.1MB/s]


model-00006-of-00007.safetensors:  42%|████▏     | 2.10G/5.00G [00:57<01:31, 31.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  80%|███████▉  | 2.05G/2.57G [00:54<00:14, 35.7MB/s]


model-00006-of-00007.safetensors:  42%|████▏     | 2.11G/5.00G [00:57<01:22, 35.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  80%|████████  | 2.06G/2.57G [00:54<00:13, 38.0MB/s]


model-00006-of-00007.safetensors:  43%|████▎     | 2.13G/5.00G [00:58<01:17, 37.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  81%|████████  | 2.08G/2.57G [00:55<00:12, 38.4MB/s]


model-00006-of-00007.safetensors:  43%|████▎     | 2.14G/5.00G [00:58<01:14, 38.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  82%|████████▏ | 2.10G/2.57G [00:55<00:11, 40.5MB/s]


model-00006-of-00007.safetensors:  43%|████▎     | 2.16G/5.00G [00:58<01:08, 41.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  82%|████████▏ | 2.11G/2.57G [00:56<00:11, 41.2MB/s]model-00007-of-00007.safetensors:  83%|████████▎ | 2.13G/2.57G [00:56<00:10, 40.9MB/s]


model-00006-of-00007.safetensors:  44%|████▎     | 2.18G/5.00G [00:59<01:15, 37.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  83%|████████▎ | 2.14G/2.57G [00:56<00:09, 43.1MB/s]


model-00006-of-00007.safetensors:  44%|████▍     | 2.19G/5.00G [00:59<01:09, 40.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  84%|████████▍ | 2.16G/2.57G [00:57<00:09, 41.5MB/s]


model-00006-of-00007.safetensors:  44%|████▍     | 2.21G/5.00G [01:00<01:17, 36.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  85%|████████▍ | 2.18G/2.57G [00:57<00:09, 40.1MB/s]


model-00006-of-00007.safetensors:  44%|████▍     | 2.22G/5.00G [01:00<01:20, 34.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  45%|████▍     | 2.24G/5.00G [01:01<01:11, 38.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  85%|████████▌ | 2.19G/2.57G [00:58<00:11, 32.1MB/s]


model-00006-of-00007.safetensors:  45%|████▌     | 2.26G/5.00G [01:01<01:12, 37.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  86%|████████▌ | 2.21G/2.57G [00:58<00:10, 35.5MB/s]


model-00006-of-00007.safetensors:  45%|████▌     | 2.27G/5.00G [01:01<01:11, 38.1MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  86%|████████▋ | 2.22G/2.57G [00:59<00:09, 36.9MB/s]


model-00006-of-00007.safetensors:  46%|████▌     | 2.29G/5.00G [01:02<01:13, 36.7MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  87%|████████▋ | 2.24G/2.57G [00:59<00:09, 34.1MB/s]


model-00006-of-00007.safetensors:  46%|████▌     | 2.30G/5.00G [01:02<01:11, 37.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  88%|████████▊ | 2.26G/2.57G [01:00<00:09, 34.6MB/s]


model-00006-of-00007.safetensors:  46%|████▋     | 2.32G/5.00G [01:03<01:08, 38.9MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  88%|████████▊ | 2.27G/2.57G [01:00<00:09, 33.2MB/s]


model-00006-of-00007.safetensors:  47%|████▋     | 2.34G/5.00G [01:03<01:05, 40.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  89%|████████▉ | 2.29G/2.57G [01:01<00:09, 30.8MB/s]


model-00006-of-00007.safetensors:  47%|████▋     | 2.35G/5.00G [01:04<01:29, 29.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  90%|████████▉ | 2.30G/2.57G [01:01<00:09, 28.8MB/s]


model-00006-of-00007.safetensors:  47%|████▋     | 2.37G/5.00G [01:04<01:21, 32.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  90%|█████████ | 2.32G/2.57G [01:02<00:07, 31.9MB/s]


model-00006-of-00007.safetensors:  48%|████▊     | 2.38G/5.00G [01:05<01:13, 35.4MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  91%|█████████ | 2.34G/2.57G [01:02<00:06, 35.2MB/s]


model-00006-of-00007.safetensors:  48%|████▊     | 2.40G/5.00G [01:05<01:07, 38.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  48%|████▊     | 2.42G/5.00G [01:05<01:04, 40.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  91%|█████████▏| 2.35G/2.57G [01:03<00:06, 34.0MB/s]


model-00006-of-00007.safetensors:  49%|████▊     | 2.43G/5.00G [01:06<01:01, 41.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  92%|█████████▏| 2.37G/2.57G [01:03<00:06, 31.8MB/s]


model-00006-of-00007.safetensors:  49%|████▉     | 2.45G/5.00G [01:06<01:02, 40.6MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  93%|█████████▎| 2.38G/2.57G [01:04<00:05, 34.8MB/s]


model-00006-of-00007.safetensors:  49%|████▉     | 2.46G/5.00G [01:06<00:59, 42.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  93%|█████████▎| 2.40G/2.57G [01:04<00:04, 35.9MB/s]


model-00006-of-00007.safetensors:  50%|████▉     | 2.48G/5.00G [01:07<01:03, 39.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  50%|████▉     | 2.50G/5.00G [01:07<00:59, 42.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  94%|█████████▍| 2.42G/2.57G [01:04<00:04, 36.5MB/s]model-00007-of-00007.safetensors:  95%|█████████▍| 2.43G/2.57G [01:05<00:03, 37.0MB/s]


model-00006-of-00007.safetensors:  50%|█████     | 2.51G/5.00G [01:08<01:08, 36.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  95%|█████████▌| 2.45G/2.57G [01:05<00:03, 38.9MB/s]model-00007-of-00007.safetensors:  96%|█████████▌| 2.46G/2.57G [01:06<00:02, 39.7MB/s]


model-00006-of-00007.safetensors:  51%|█████     | 2.53G/5.00G [01:08<01:15, 32.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  96%|█████████▋| 2.48G/2.57G [01:06<00:02, 40.3MB/s]


model-00006-of-00007.safetensors:  51%|█████     | 2.54G/5.00G [01:09<01:09, 35.3MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  97%|█████████▋| 2.50G/2.57G [01:06<00:01, 42.2MB/s]


model-00006-of-00007.safetensors:  51%|█████     | 2.56G/5.00G [01:09<01:05, 37.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  52%|█████▏    | 2.58G/5.00G [01:09<01:01, 39.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  98%|█████████▊| 2.51G/2.57G [01:07<00:01, 40.2MB/s]


model-00006-of-00007.safetensors:  52%|█████▏    | 2.59G/5.00G [01:10<00:58, 41.2MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  98%|█████████▊| 2.53G/2.57G [01:07<00:01, 41.6MB/s]


model-00006-of-00007.safetensors:  52%|█████▏    | 2.61G/5.00G [01:10<00:56, 42.0MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors:  99%|█████████▉| 2.54G/2.57G [01:08<00:00, 39.6MB/s]


model-00006-of-00007.safetensors:  52%|█████▏    | 2.62G/5.00G [01:11<01:00, 39.5MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors: 100%|█████████▉| 2.56G/2.57G [01:08<00:00, 38.9MB/s]


model-00006-of-00007.safetensors:  53%|█████▎    | 2.64G/5.00G [01:11<01:00, 38.8MB/s][A[A[A[A[Amodel-00007-of-00007.safetensors: 100%|██████████| 2.57G/2.57G [01:08<00:00, 37.3MB/s]


model-00006-of-00007.safetensors:  53%|█████▎    | 2.66G/5.00G [01:12<01:04, 36.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  53%|█████▎    | 2.67G/5.00G [01:12<00:59, 38.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  54%|█████▍    | 2.69G/5.00G [01:12<00:57, 40.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  54%|█████▍    | 2.70G/5.00G [01:13<00:56, 40.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  54%|█████▍    | 2.72G/5.00G [01:13<01:01, 37.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  55%|█████▍    | 2.74G/5.00G [01:14<01:01, 37.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  55%|█████▌    | 2.75G/5.00G [01:14<00:58, 38.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  55%|█████▌    | 2.77G/5.00G [01:14<00:57, 38.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  56%|█████▌    | 2.78G/5.00G [01:15<00:55, 39.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  56%|█████▌    | 2.80G/5.00G [01:15<00:54, 40.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  56%|█████▋    | 2.82G/5.00G [01:16<00:52, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  57%|█████▋    | 2.83G/5.00G [01:16<00:50, 42.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  57%|█████▋    | 2.85G/5.00G [01:16<00:48, 44.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  57%|█████▋    | 2.86G/5.00G [01:17<00:46, 45.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  58%|█████▊    | 2.88G/5.00G [01:17<00:47, 44.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  58%|█████▊    | 2.90G/5.00G [01:17<00:47, 43.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  58%|█████▊    | 2.91G/5.00G [01:18<00:50, 41.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  59%|█████▊    | 2.93G/5.00G [01:18<00:46, 44.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  59%|█████▉    | 2.94G/5.00G [01:18<00:43, 46.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  59%|█████▉    | 2.96G/5.00G [01:19<00:44, 46.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  60%|█████▉    | 2.98G/5.00G [01:19<00:43, 46.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  60%|█████▉    | 2.99G/5.00G [01:19<00:44, 45.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  60%|██████    | 3.01G/5.00G [01:20<00:43, 45.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  60%|██████    | 3.02G/5.00G [01:20<00:43, 45.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  61%|██████    | 3.04G/5.00G [01:20<00:43, 44.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  61%|██████    | 3.06G/5.00G [01:21<00:47, 40.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  61%|██████▏   | 3.07G/5.00G [01:21<00:44, 43.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  62%|██████▏   | 3.09G/5.00G [01:22<00:41, 45.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  62%|██████▏   | 3.10G/5.00G [01:22<00:40, 46.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  62%|██████▏   | 3.12G/5.00G [01:22<00:43, 43.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  63%|██████▎   | 3.14G/5.00G [01:23<00:42, 43.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  63%|██████▎   | 3.15G/5.00G [01:23<00:40, 45.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  63%|██████▎   | 3.17G/5.00G [01:23<00:38, 47.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  64%|██████▎   | 3.18G/5.00G [01:24<00:38, 46.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  64%|██████▍   | 3.20G/5.00G [01:24<00:40, 44.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  64%|██████▍   | 3.22G/5.00G [01:24<00:40, 43.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  65%|██████▍   | 3.23G/5.00G [01:25<00:40, 43.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  65%|██████▍   | 3.25G/5.00G [01:25<00:40, 43.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  65%|██████▌   | 3.26G/5.00G [01:25<00:38, 45.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  66%|██████▌   | 3.28G/5.00G [01:26<00:39, 43.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  66%|██████▌   | 3.30G/5.00G [01:26<00:43, 39.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  66%|██████▌   | 3.31G/5.00G [01:27<00:39, 42.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  67%|██████▋   | 3.33G/5.00G [01:27<00:38, 43.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  67%|██████▋   | 3.34G/5.00G [01:27<00:37, 44.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  67%|██████▋   | 3.36G/5.00G [01:28<00:43, 37.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  68%|██████▊   | 3.38G/5.00G [01:28<00:39, 40.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  68%|██████▊   | 3.39G/5.00G [01:29<00:37, 43.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  68%|██████▊   | 3.41G/5.00G [01:29<00:44, 35.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  68%|██████▊   | 3.42G/5.00G [01:30<00:46, 33.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  69%|██████▉   | 3.44G/5.00G [01:30<00:43, 35.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  69%|██████▉   | 3.46G/5.00G [01:31<00:41, 36.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  69%|██████▉   | 3.47G/5.00G [01:31<00:37, 40.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  70%|██████▉   | 3.49G/5.00G [01:31<00:36, 41.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  70%|███████   | 3.50G/5.00G [01:32<00:35, 42.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  70%|███████   | 3.52G/5.00G [01:32<00:34, 42.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  71%|███████   | 3.54G/5.00G [01:32<00:34, 42.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  71%|███████   | 3.55G/5.00G [01:33<00:40, 35.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  71%|███████▏  | 3.57G/5.00G [01:34<01:09, 20.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  72%|███████▏  | 3.58G/5.00G [01:35<00:57, 24.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  72%|███████▏  | 3.60G/5.00G [01:36<00:59, 23.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  72%|███████▏  | 3.62G/5.00G [01:36<00:50, 27.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  73%|███████▎  | 3.63G/5.00G [01:36<00:43, 31.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  73%|███████▎  | 3.65G/5.00G [01:37<00:38, 35.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  73%|███████▎  | 3.66G/5.00G [01:37<00:36, 36.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  74%|███████▎  | 3.68G/5.00G [01:37<00:33, 39.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  74%|███████▍  | 3.70G/5.00G [01:38<00:31, 41.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  74%|███████▍  | 3.71G/5.00G [01:38<00:30, 41.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  75%|███████▍  | 3.73G/5.00G [01:38<00:30, 42.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  75%|███████▍  | 3.74G/5.00G [01:39<00:29, 43.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  75%|███████▌  | 3.76G/5.00G [01:39<00:33, 36.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  76%|███████▌  | 3.78G/5.00G [01:40<00:31, 39.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  76%|███████▌  | 3.79G/5.00G [01:40<00:30, 39.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  76%|███████▌  | 3.81G/5.00G [01:40<00:29, 41.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  76%|███████▋  | 3.82G/5.00G [01:41<00:29, 39.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  77%|███████▋  | 3.84G/5.00G [01:41<00:30, 38.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  77%|███████▋  | 3.86G/5.00G [01:42<00:28, 40.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  77%|███████▋  | 3.87G/5.00G [01:42<00:27, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  78%|███████▊  | 3.89G/5.00G [01:42<00:25, 44.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  78%|███████▊  | 3.90G/5.00G [01:43<00:24, 44.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  78%|███████▊  | 3.92G/5.00G [01:43<00:23, 45.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  79%|███████▊  | 3.94G/5.00G [01:43<00:22, 46.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  79%|███████▉  | 3.95G/5.00G [01:44<00:23, 45.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  79%|███████▉  | 3.97G/5.00G [01:44<00:23, 43.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  80%|███████▉  | 3.98G/5.00G [01:45<00:26, 38.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  80%|████████  | 4.00G/5.00G [01:45<00:25, 39.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  80%|████████  | 4.02G/5.00G [01:45<00:23, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  81%|████████  | 4.03G/5.00G [01:46<00:22, 43.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  81%|████████  | 4.05G/5.00G [01:46<00:22, 42.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  81%|████████▏ | 4.06G/5.00G [01:47<00:23, 40.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  82%|████████▏ | 4.08G/5.00G [01:47<00:21, 41.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  82%|████████▏ | 4.10G/5.00G [01:47<00:21, 42.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  82%|████████▏ | 4.11G/5.00G [01:48<00:20, 42.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  83%|████████▎ | 4.13G/5.00G [01:48<00:20, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  83%|████████▎ | 4.14G/5.00G [01:49<00:23, 35.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  83%|████████▎ | 4.16G/5.00G [01:49<00:22, 37.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  84%|████████▎ | 4.18G/5.00G [01:49<00:21, 37.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  84%|████████▍ | 4.19G/5.00G [01:50<00:20, 39.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  84%|████████▍ | 4.21G/5.00G [01:50<00:19, 41.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  84%|████████▍ | 4.22G/5.00G [01:51<00:19, 40.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  85%|████████▍ | 4.24G/5.00G [01:51<00:18, 40.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  85%|████████▌ | 4.26G/5.00G [01:51<00:17, 42.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  85%|████████▌ | 4.27G/5.00G [01:52<00:17, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  86%|████████▌ | 4.29G/5.00G [01:52<00:16, 42.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  86%|████████▌ | 4.30G/5.00G [01:53<00:22, 31.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  86%|████████▋ | 4.32G/5.00G [01:53<00:20, 33.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  87%|████████▋ | 4.34G/5.00G [01:54<00:19, 34.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  87%|████████▋ | 4.35G/5.00G [01:54<00:16, 38.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  87%|████████▋ | 4.37G/5.00G [01:54<00:15, 39.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  88%|████████▊ | 4.38G/5.00G [01:55<00:15, 40.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  88%|████████▊ | 4.40G/5.00G [01:55<00:13, 43.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  88%|████████▊ | 4.42G/5.00G [01:56<00:19, 29.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  89%|████████▊ | 4.43G/5.00G [01:57<00:19, 28.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  89%|████████▉ | 4.45G/5.00G [01:57<00:17, 31.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  89%|████████▉ | 4.46G/5.00G [01:58<00:18, 29.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  90%|████████▉ | 4.48G/5.00G [01:58<00:17, 30.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  90%|████████▉ | 4.50G/5.00G [01:58<00:14, 34.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  90%|█████████ | 4.51G/5.00G [01:59<00:15, 31.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  91%|█████████ | 4.53G/5.00G [02:00<00:14, 31.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  91%|█████████ | 4.54G/5.00G [02:00<00:13, 34.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  91%|█████████ | 4.56G/5.00G [02:00<00:12, 35.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  92%|█████████▏| 4.58G/5.00G [02:01<00:11, 37.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  92%|█████████▏| 4.59G/5.00G [02:01<00:10, 40.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  92%|█████████▏| 4.61G/5.00G [02:01<00:09, 40.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  92%|█████████▏| 4.62G/5.00G [02:02<00:09, 39.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  93%|█████████▎| 4.64G/5.00G [02:02<00:08, 41.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  93%|█████████▎| 4.66G/5.00G [02:03<00:08, 42.3MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  93%|█████████▎| 4.67G/5.00G [02:03<00:07, 43.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  94%|█████████▍| 4.69G/5.00G [02:04<00:09, 32.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  94%|█████████▍| 4.70G/5.00G [02:04<00:08, 35.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  94%|█████████▍| 4.72G/5.00G [02:04<00:07, 38.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  95%|█████████▍| 4.74G/5.00G [02:05<00:06, 37.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  95%|█████████▌| 4.75G/5.00G [02:05<00:06, 40.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  95%|█████████▌| 4.77G/5.00G [02:06<00:06, 36.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  96%|█████████▌| 4.78G/5.00G [02:06<00:05, 37.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  96%|█████████▌| 4.80G/5.00G [02:07<00:06, 32.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  96%|█████████▋| 4.82G/5.00G [02:07<00:05, 33.8MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  97%|█████████▋| 4.83G/5.00G [02:08<00:04, 34.1MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  97%|█████████▋| 4.85G/5.00G [02:08<00:04, 37.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  97%|█████████▋| 4.86G/5.00G [02:08<00:03, 38.7MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  98%|█████████▊| 4.88G/5.00G [02:09<00:02, 40.6MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  98%|█████████▊| 4.90G/5.00G [02:09<00:02, 41.2MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  98%|█████████▊| 4.91G/5.00G [02:09<00:02, 42.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  99%|█████████▊| 4.93G/5.00G [02:10<00:01, 40.5MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  99%|█████████▉| 4.94G/5.00G [02:10<00:01, 38.4MB/s][A[A[A[A[A


model-00006-of-00007.safetensors:  99%|█████████▉| 4.96G/5.00G [02:11<00:01, 36.0MB/s][A[A[A[A[A


model-00006-of-00007.safetensors: 100%|█████████▉| 4.98G/5.00G [02:11<00:00, 33.9MB/s][A[A[A[A[A


model-00006-of-00007.safetensors: 100%|█████████▉| 4.99G/5.00G [02:12<00:00, 37.0MB/s][A[A[A[A[Amodel-00006-of-00007.safetensors: 100%|██████████| 5.00G/5.00G [02:12<00:00, 37.7MB/s]


Upload 689 LFS files: 100%|█████████▉| 687/689 [05:17<00:55, 27.79s/it][A[A[A[AUpload 689 LFS files: 100%|██████████| 689/689 [05:17<00:00,  2.17it/s]