Fix fast decode plan for flashinfer v0.4.0rc1 and upgrade sgl-kernel 0.3.11 (#10634)

Co-authored-by: zhyncs <me@zhyncs.com>
2025-09-19 01:25:29 -07:00
parent 4f2055ad56
commit 3fa3c22ae2
5 changed files with 10 additions and 7 deletions
--- a/python/pyproject.toml
+++ b/python/pyproject.toml
@@ -57,12 +57,12 @@ dependencies = [
  "uvicorn",
  "uvloop",
  "xgrammar==0.1.24",
-  "sgl-kernel==0.3.10",
+  "sgl-kernel==0.3.11",
  "torch==2.8.0",
  "torchaudio==2.8.0",
  "torchvision",
  "cuda-python",
-  "flashinfer_python==0.3.1",
+  "flashinfer_python==0.4.0rc1",
  "openai==1.99.1",
  "tiktoken",
  "anthropic>=0.20.0",