[Bug] Fix no apply_top_k_top_p issue. (#101)

2026-01-12 16:38:03 +08:00
parent 18fc1c006e
commit bd90350968
1 changed files with 2 additions and 0 deletions
--- a/vllm_kunlun/v1/sample/ops/topk_topp_sampler.py
+++ b/vllm_kunlun/v1/sample/ops/topk_topp_sampler.py
@@ -11,6 +11,7 @@ from vllm import envs
 from vllm.logger import init_logger
 from vllm.platforms import current_platform
 import xtorch_ops
+import os

 logger = init_logger(__name__)

@@ -28,6 +29,7 @@ class TopKTopPSampler(nn.Module):
        logger.info_once(
            "Using FlashInfer for top-p & top-k sampling.")
        self.forward = self.forward_kunlun
+        self.apply_top_k_top_p = apply_top_k_top_p

    def forward_native(
        self,