sglang/attention at 912788c095c9306daabc996fd06e59cf062a783b - sglang - Gitea: Git with a cup of tea

EngineX-Hygon/sglang

Files

History

Chang Su 912788c095 perf: optimize local_block_table memory allocation (#6273 )

2025-05-13 17:18:38 -07:00

..

Add typo checker in pre-commit (#6179 )

2025-05-11 12:55:00 +08:00

base_attn_backend.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00

cutlass_mla_backend.py

Cutlass MLA decode - fix dtype error (#5868 )

2025-04-28 21:12:58 -07:00

double_sparsity_backend.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00

flashattention_backend.py

perf: optimize local_block_table memory allocation (#6273 )

2025-05-13 17:18:38 -07:00

flashinfer_backend.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00

flashinfer_mla_backend.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00

flashmla_backend.py

[Fix] Fix a bug for flashmla to run R1 model (#5875 )

2025-04-29 01:03:13 -07:00

merge_state.py

feat: Add a unified merge_state API (#5428 )

2025-05-05 10:32:33 -07:00

torch_native_backend.py

Feat/support encoder model (like bert) (#4887 )

2025-04-17 01:50:48 -07:00

triton_backend.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00

utils.py

Log if cuda graph is used & extend cuda graph capture to cuda-graph-max-bs (#6201 )

2025-05-12 00:17:33 -07:00

vision.py

Revert "fix some typos" (#6244 )

2025-05-12 12:53:26 -07:00