xc-llm-kunlun

Files

Li Wei 515a4eeda9 [dev] support compressed-tensors w8a8 quantization (#75 )

* [dev] support compressed-tensors w8a8 quantization

Co-authored-by: Li Wei <liwei.109@outlook.com>

* [refact]update KunlunScaleMMKernel impl

* [rebase]resolve conflicts and remove redundant code

---------

Co-authored-by: tangshiwen <tangshiwen@baidu.com>

2026-01-06 13:51:53 +08:00

compilation

提交vllm0.11.0开发分支

2025-12-10 17:51:24 +08:00

csrc

Initial commit for vLLM-Kunlun Plugin

2025-12-10 12:05:39 +08:00

distributed

提交vllm0.11.0开发分支

2025-12-10 17:51:24 +08:00

models

[dev] support compressed-tensors w8a8 quantization (#75 )