[dev] support compressed-tensors w8a8 quantization (#75)

* [dev] support compressed-tensors w8a8 quantization

Co-authored-by: Li Wei <liwei.109@outlook.com>

* [refact]update KunlunScaleMMKernel impl

* [rebase]resolve conflicts and remove redundant code

---------

Co-authored-by: tangshiwen <tangshiwen@baidu.com>

This commit is contained in:

Li Wei

2026-01-06 13:51:53 +08:00

committed by

GitHub

parent ee0f50e68f

commit 515a4eeda9

8 changed files with 952 additions and 523 deletions

1028

vllm_kunlun/vllm_utils_wrapper.py

View File

File diff suppressed because it is too large Load Diff

[dev] support compressed-tensors w8a8 quantization (#75)

1028 vllm_kunlun/vllm_utils_wrapper.py View File

1028

vllm_kunlun/vllm_utils_wrapper.py

View File