Support v0.10.1 (#2584)

### What this PR does / why we need it? This patch also supports v0.10.1 ### Does this PR introduce _any_ user-facing change? No ### How was this patch tested? - CI passed - test 0.10.1: https://github.com/vllm-project/vllm-ascend/pull/2583 - vLLM version: v0.10.1.1 - vLLM main: 321938e9ac Signed-off-by: Yikun Jiang <yikunkero@gmail.com>
2025-08-28 18:47:53 +08:00
parent 6c973361fc
commit 175f6bc445
8 changed files with 40 additions and 38 deletions
--- a/vllm_ascend/sample/sampler.py
+++ b/vllm_ascend/sample/sampler.py
@@ -5,7 +5,7 @@ from vllm.v1.sample.sampler import Sampler

 from vllm_ascend.utils import is_310p, vllm_version_is

-if not vllm_version_is("0.10.1.1"):
+if not (vllm_version_is("0.10.1.1") or vllm_version_is("0.10.1")):
    from vllm.config import LogprobsMode
    DEFAULT_LOGPROBS_MODE = LogprobsMode.RAW_LOGPROBS
 else:
@@ -68,7 +68,7 @@ class AscendTopKTopPSampler(TopKTopPSampler):
    def forward_native(self, logits, generators, k, p):
        """Override pytorch native implementation to torch_npu"""
        logits = self._apply_top_k_top_p(logits, k, p)
-        if not vllm_version_is("0.10.1.1"):
+        if not (vllm_version_is("0.10.1.1") or vllm_version_is("0.10.1")):

            logits_to_return = None
            if self.logprobs_mode == LogprobsMode.PROCESSED_LOGITS:
@@ -79,7 +79,7 @@ class AscendTopKTopPSampler(TopKTopPSampler):

        probs = logits.softmax(dim=-1, dtype=torch.float32)
        output = None
-        if vllm_version_is("0.10.1.1"):
+        if vllm_version_is("0.10.1.1") or vllm_version_is("0.10.1"):
            output = random_sample(probs, generators)
        else:
            output = (random_sample(probs, generators), logits_to_return)