xc-llm-kunlun

Files

callmelaoyi b86953acf9 [Kernel] Qwen3-next 优化 recompute_w_u_fwd & chunk_fwd_o (#74 )

Co-authored-by: yuanjizhong <yuanjizhong@baidu.com>

2026-01-05 10:24:51 +08:00

2025-12-10 17:51:24 +08:00

2026-01-05 10:24:51 +08:00

2026-01-04 21:19:49 +08:00

2025-12-12 17:22:35 +08:00

2025-12-24 13:46:06 +08:00

2025-12-10 17:51:24 +08:00

__init__.py

2025-12-31 11:39:37 +08:00

_kunlun_ops.py

2026-01-04 21:19:49 +08:00

activation.py

2025-12-31 11:39:37 +08:00

layernorm.py

2025-12-31 10:16:33 +08:00

linear.py

2025-12-31 10:16:33 +08:00

paged_attn.py

2025-12-31 10:16:33 +08:00

rotary_embedding.py

2026-01-04 21:19:49 +08:00

vocab_parallel_embedding.py

2025-12-31 10:16:33 +08:00