xc-llm-kunlun/quantization at 6546323c71f419cfd74ade0e52050580ff5232ef - xc-llm-kunlun - Gitea: Git with a cup of tea

EngineX/xc-llm-kunlun

Files

History

Li Wei 6546323c71 [dev] support AWQ/GPTQ quantization for dense models

2025-12-24 13:46:06 +08:00

..

__init__.py

Initial commit for vLLM-Kunlun Plugin

2025-12-10 12:05:39 +08:00

awq.py

[dev] support AWQ/GPTQ quantization for dense models

2025-12-24 13:46:06 +08:00

compressed_tensors_moe.py

提交vllm0.11.0开发分支

2025-12-10 17:51:24 +08:00

gptq.py

[dev] support AWQ/GPTQ quantization for dense models

2025-12-24 13:46:06 +08:00