sglang

Author	SHA1	Message	Date
YanbingJiang	1fe691a429	Fix FP8 block quantization when N or K is not multiples of 128 (#8648 )	2025-08-01 15:57:19 -07:00
YanbingJiang	fcde67b016	CPU: map changes from developing branch in sgl-kernel (#6833 ) Co-authored-by: mingfeima <mingfei.ma@intel.com>	2025-06-10 01:08:15 -07:00
Chunyuan WU	3ded6235c9	Add fp8 fused_experts kernel for CPU in sgl-kernel and add UT (#6404 )	2025-05-23 02:01:55 -07:00
Chunyuan WU	5dd62c3a6f	Add fp8 shared_expert kernel for CPU in sgl-kernel and add UT (#6339 ) Co-authored-by: Jiang, Yanbing <yanbing.jiang@intel.com> Co-authored-by: mingfeima <mingfei.ma@intel.com>	2025-05-18 12:42:15 -07:00
Chunyuan WU	fb4959b2c5	Add fp8 gemm kernel for CPU in sgl-kernel and add gemm UT (#6216 ) Co-authored-by: YanbingJiang <yanbing.jiang@intel.com> Co-authored-by: mingfeima <mingfei.ma@intel.com>	2025-05-15 09:10:40 -07:00