xc-llm-ascend

Files

wangxiyuan 01a13a9b77 fix nz for quantization (#4943 )

quantization ops rely on NZ by force, we should remove the nz check for it.

Signed-off-by: wangxiyuan <wangxiyuan1007@gmail.com>

2025-12-12 14:54:41 +08:00

__init__.py

2025-02-21 17:07:37 +08:00

quant_config.py

2025-12-09 08:47:19 +08:00

utils.py

2025-12-09 08:47:19 +08:00

w4a4_flatquant_dynamic.py

2025-10-23 21:26:50 +08:00

w4a8_dynamic.py

2025-12-12 14:54:41 +08:00

w8a8_dynamic.py

2025-12-12 14:54:41 +08:00

w8a8.py

2025-12-12 14:54:41 +08:00