enginex-vllm-bi100-qwen36/qwen3_6_scripts at 3ef8227384a546a8dc5d46201df4382c9e7c9c2a - enginex-vllm-bi100-qwen36 - Gitea: Git with a cup of tea

EngineX-Iluvatar/enginex-vllm-bi100-qwen36

Files

History

Lu Xinlong 3ef8227384 initial version of adding chunked attention, ensuring 20K context

2026-05-29 16:49:33 +08:00

..

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

mamba_cache.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_ops.sh

initial version of adding chunked attention, ensuring 20K context

2026-05-29 16:49:33 +08:00

patch_transformers_qwen3_5.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_vllm_qwen3_5.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_xformers_sdpa_batch_kernel.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_xformers_sdpa_batch.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_xformers_sdpa_seq_kernel.py

Qwen3.6-27B iluvatar bi-v100 adaptation

2026-05-21 16:37:24 +08:00

patch_xformers_sdpa_seq.py

initial version of adding chunked attention, ensuring 20K context

2026-05-29 16:49:33 +08:00

qwen3_5.py

initial version of adding chunked attention, ensuring 20K context

2026-05-29 16:49:33 +08:00