[1/N][CI] Move linting system to pre-commits hooks (#1256)

### What this PR does / why we need it? Follow vllm-project/vllm lint way: https://github.com/vllm-project/vllm/blob/main/.pre-commit-config.yaml Enable pre-commit to avoid some low level error AMAP. This pr is one step of #1241, The purpose is make linting system more clear and convenient, on this step, Mainly did the following things: yapf, actionlint, ruff, typos, isort, mypy, png-lint, signoff-commit, enforce-import-regex-instead-of-re. TODO: - clang-format(check for csrc with google style) need clean code, disable for now - pymarkdown need clean code, disable for now - shellcheck need clean code, disable for now ### Does this PR introduce _any_ user-facing change? Only developer UX change: https://vllm-ascend--1256.org.readthedocs.build/en/1256/developer_guide/contributing.html#run-lint-locally ``` pip install -r requirements-lint.txt && pre-commit install bash format.sh ``` ### How was this patch tested? CI passed with new added/existing test. Co-authored-by: Yikun [yikunkero@gmail.com](mailto:yikunkero@gmail.com) Co-authored-by: wangli [wangli858794774@gmail.com](mailto:wangli858794774@gmail.com) - vLLM version: v0.9.1 - vLLM main: 5358cce5ff --------- Signed-off-by: wangli <wangli858794774@gmail.com>
2025-07-10 14:17:15 +08:00
parent 643e6f5486
commit c7446438a9
28 changed files with 753 additions and 667 deletions
--- a/tests/e2e/singlecard/core/ascend_scheduler/test_ascend_scheduler.py
+++ b/tests/e2e/singlecard/core/ascend_scheduler/test_ascend_scheduler.py
@@ -324,8 +324,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[EOS_TOKEN_ID],
                           [10,
                            11]],  # First request hits EOS, second continues
@@ -374,8 +376,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[10, 42, 12],
                           [13, 14]],  # First request hits stop token
        spec_token_ids=None,
@@ -422,8 +426,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[10, 11, 12],
                           [13]],  # First request exceeds max_tokens
        spec_token_ids=None,
--- a/tests/e2e/singlecard/ops/test_vocabparallelembedding.py
+++ b/tests/e2e/singlecard/ops/test_vocabparallelembedding.py
@@ -21,8 +21,8 @@ def get_masked_input_and_mask_ref(
        added_vocab_start_index: int,
        added_vocab_end_index: int) -> Tuple[torch.Tensor, torch.Tensor]:
    """Reference implementation for verification"""
-    org_vocab_mask = (input_ >= org_vocab_start_index) & (input_ <
-                                                          org_vocab_end_index)
+    org_vocab_mask = (input_ >= org_vocab_start_index) & (
+        input_ < org_vocab_end_index)
    added_vocab_mask = (input_ >= added_vocab_start_index) & (
        input_ < added_vocab_end_index)
    added_offset = added_vocab_start_index - (
--- a/tests/e2e/singlecard/sample/test_rejection_sampler.py
+++ b/tests/e2e/singlecard/sample/test_rejection_sampler.py
@@ -394,8 +394,8 @@ def test_rejection_sampling_approximates_target_distribution():
        distance_wrt_reference)

    expected_improvement_multiplier = 20
-    assert (relative_change_in_distance_wrt_target >
-            relative_change_in_distance_wrt_reference *
+    assert (relative_change_in_distance_wrt_target
+            > relative_change_in_distance_wrt_reference *
            expected_improvement_multiplier)


--- a/tests/e2e/singlecard/test_scheduler.py
+++ b/tests/e2e/singlecard/test_scheduler.py
@@ -231,8 +231,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[EOS_TOKEN_ID],
                           [10,
                            11]],  # First request hits EOS, second continues
@@ -279,8 +281,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[10, 42, 12],
                           [13, 14]],  # First request hits stop token
        spec_token_ids=None,
@@ -325,8 +329,10 @@ def test_stop_via_update_from_output():

    model_output = ModelRunnerOutput(
        req_ids=[req.request_id for req in requests],
-        req_id_to_index={req.request_id: i
-                         for i, req in enumerate(requests)},
+        req_id_to_index={
+            req.request_id: i
+            for i, req in enumerate(requests)
+        },
        sampled_token_ids=[[10, 11, 12],
                           [13]],  # First request exceeds max_tokens
        spec_token_ids=None,