update readme

This commit is contained in:
Chranos
2026-02-11 17:59:08 +08:00
parent b0d16e0b70
commit 6831553caa

View File

@@ -4,7 +4,7 @@
## 版本更新记录 ## 版本更新记录
**v0.0.6.2** — 2026-02-11 · Llama4 模型支持,含 sigmoid routing MoE、QK Norm、交替 dense/MoE 层;由于 MLU370capability=3限制MoE 改为 dense 模式解决 graph capture 兼容性(⚠️ 计算量增大DeepSeek V2/V3 不受影响) **v0.0.6.2** — 2026-02-11 · Llama4 模型支持,含 sigmoid routing MoE、QK Norm、交替 dense/MoE 层;由于 MLU370capability=3限制MoE 改为 dense 模式解决 graph capture 兼容性
**v0.0.6.1** — 2026-02-11 · DeepSeek V3 MTP 推测解码,新建 MTP draft model 复用 DeepseekV2DecoderLayer自动检测并启用 MTP speculative decoding **v0.0.6.1** — 2026-02-11 · DeepSeek V3 MTP 推测解码,新建 MTP draft model 复用 DeepseekV2DecoderLayer自动检测并启用 MTP speculative decoding