Fix some ci issue and refactor modelrunner (#2445)

### What this PR does / why we need it? Fix some ci issue and refactor modelrunner ### Does this PR introduce _any_ user-facing change? N/A ### How was this patch tested? CI passed with existing test. - vLLM version: v0.10.0 - vLLM main: 4d9c61993a --------- Signed-off-by: wangli <wangli858794774@gmail.com> Signed-off-by: MengqingCao <cmq0113@163.com> Signed-off-by: weiguihua2 <weiguihua2@huawei.com> Co-authored-by: wangli <wangli858794774@gmail.com> Co-authored-by: weiguihua2 <weiguihua2@huawei.com>
2025-08-20 09:01:04 +08:00
parent 955411611c
commit 1327f9be1c
28 changed files with 1612 additions and 1020 deletions
--- a/tests/e2e/singlecard/sample/test_rejection_sampler.py
+++ b/tests/e2e/singlecard/sample/test_rejection_sampler.py
@@ -4,7 +4,7 @@ from typing import Any, Optional
 import pytest
 import torch
 import torch.nn.functional as F
-from vllm.v1.sample.logits_processor import LogitsProcessorManager
+from vllm.v1.sample.logits_processor import LogitsProcessors
 from vllm.v1.sample.metadata import SamplingMetadata
 from vllm.v1.spec_decode.metadata import SpecDecodeMetadata

@@ -66,7 +66,7 @@ def create_sampling_metadata(
                            output_token_ids=[],
                            allowed_token_ids_mask=None,
                            bad_words_token_ids={},
-                            logitsprocs=LogitsProcessorManager())
+                            logitsprocs=LogitsProcessors())


 ########################### Tests for Greedy Sampling ###################