xc-llm-kunlun

Files

Li Wei 71bd70ad6c [Feature] support compressed-tensors w4a16 quantization (#154 )

- native int4 kimi model inference is supported

Signed-off-by: Li Wei <liwei.109@outlook.com>

2026-01-27 19:56:22 +08:00

__init__.py

2026-01-05 22:55:35 +08:00

kunlun_exllama_linear.py

2026-01-27 19:56:22 +08:00

kunlun_scale_mm.py

2026-01-27 19:56:22 +08:00

quant_ops.py

2026-01-27 19:56:22 +08:00