init v0.11.0rc0

2025-10-14 10:38:28 +08:00
parent 67afd0ea78
commit 66dc16f966
278 changed files with 28130 additions and 11708 deletions
--- a/tests/ut/test_platform.py
+++ b/tests/ut/test_platform.py
@@ -36,6 +36,7 @@ class TestNPUPlatform(TestBase):
        mock_ascend_config = MagicMock()
        mock_ascend_config.torchair_graph_config.enabled = False
        mock_ascend_config.ascend_scheduler_config.enabled = False
+        mock_ascend_config.enable_shared_expert_dp = False
        return mock_ascend_config

    def setUp(self):
@@ -363,36 +364,6 @@ class TestNPUPlatform(TestBase):
                CUDAGraphMode.NONE,
            )

-    @patch("vllm_ascend.utils.is_310p", return_value=False)
-    @patch("vllm_ascend.ascend_config.check_ascend_config")
-    @patch("vllm_ascend.ascend_config.init_ascend_config")
-    def test_check_and_update_config_disable_aclgraph_when_ray_enabled(
-            self, mock_init_ascend, mock_check_ascend, mock_is_310p):
-        mock_init_ascend.return_value = TestNPUPlatform.mock_vllm_ascend_config(
-        )
-        vllm_config = TestNPUPlatform.mock_vllm_config()
-        vllm_config.model_config.enforce_eager = False
-        vllm_config.compilation_config.level = CompilationLevel.PIECEWISE
-        vllm_config.parallel_config.distributed_executor_backend = "ray"
-
-        with self.assertLogs(logger="vllm", level="WARNING") as cm:
-            from vllm_ascend import platform
-
-            importlib.reload(platform)
-            self.platform.check_and_update_config(vllm_config)
-            print(30 * "=", f"cm.output: {cm.output}")
-            self.assertTrue(
-                "Ray distributed executor backend is not compatible with ACL Graph mode"
-                in cm.output[0])
-            self.assertEqual(
-                vllm_config.compilation_config.level,
-                CompilationLevel.NO_COMPILATION,
-            )
-            self.assertEqual(
-                vllm_config.compilation_config.cudagraph_mode,
-                CUDAGraphMode.NONE,
-            )
-
    @patch("vllm_ascend.utils.is_310p", return_value=False)
    @patch("vllm_ascend.ascend_config.check_ascend_config")
    @patch("vllm_ascend.ascend_config.init_ascend_config")
@@ -509,6 +480,7 @@ class TestNPUPlatform(TestBase):
    def test_get_attn_backend_cls_use_v1_and_mla(self, mock_get_ascend_config):
        mock_config = MagicMock()
        mock_config.torchair_graph_config.enabled = False
+        mock_config.enable_shared_expert_dp = False

        mock_get_ascend_config.return_value = mock_config

@@ -589,9 +561,8 @@ class TestNPUPlatform(TestBase):

    def test_get_punica_wrapper(self):
        result = self.platform.get_punica_wrapper()
-        self.assertEqual(
-            result,
-            "vllm_ascend.lora.punica_wrapper.punica_npu.PunicaWrapperNPU")
+        self.assertEqual(result,
+                         "vllm_ascend.lora.punica_npu.PunicaWrapperNPU")

    @patch("torch.npu.reset_peak_memory_stats")
    @patch("torch.npu.max_memory_allocated")