sglang/deepseek at d3fe9bae56d2914e50b144b67c0b29f2ce838e22 - sglang - Gitea: Git with a cup of tea

EngineX-Hygon/sglang

Files

History

Xiaoyu Zhang 50f28f65a0 fix typo in deep gemm benchmarking(#3991 )

2025-03-02 00:34:00 -08:00

..

benchmark_deepgemm_fp8_gemm.py

fix typo in deep gemm benchmarking(#3991 )

2025-03-02 00:34:00 -08:00

README.md

add deepgemm and sglang fp8 block-wise gemm benchmark (#3893 )

2025-03-01 23:01:58 -08:00

README.md

DeepSeek kernels benchmark

benchmark_deepgemm_fp8_gemm.py
- You should install DeepGemm from source before run benchmark_deepgemm_fp8_gemm.py.
- You can use the --run_correctness parameter to verify all kernels results's correctness.
- You can use the --tp_size parameter to benchmark all FP8 w8a8 block-wise matrix multiplications involved in DeepSeek V3/R1 under the current tensor parallelism (TP) setting. This benchmark compares DeepSeek's open-source DeepGemm implementation with SGLang's and VLLM Triton implementation.