xc-llm-kunlun

Files

Shiwen Tang 0711c1abfa [Feature] Support AWQ MoE W4A16 Quantization (#142 )

Signed-off-by: tangshiwen <tangshiwen@baidu.com>
Co-authored-by: Li Wei <liwei.109@outlook.com>

2026-01-26 18:56:05 +08:00

2026-01-22 10:29:28 +08:00

2026-01-26 18:56:05 +08:00

__init__.py

2025-12-10 12:05:39 +08:00

awq.py

2026-01-26 18:56:05 +08:00

gptq.py

2026-01-19 20:24:19 +08:00

moe_wna16.py

2026-01-26 18:56:05 +08:00