[Patch] Remove the patch of ECExampleConnector (#5976)

### What this PR does / why we need it? Part of #5304. https://github.com/vllm-project/vllm/pull/30225 has been merged now. We don't need this patch anymore. - vLLM version: v0.13.0 - vLLM main: 2c24bc6996 Signed-off-by: gcanlin <canlinguosdu@gmail.com>
2026-01-26 17:10:03 +08:00
parent b390e0ef78
commit 2d3b8a51f9
3 changed files with 0 additions and 43 deletions
--- a/vllm_ascend/patch/init.py
+++ b/vllm_ascend/patch/init.py
@@ -42,18 +42,6 @@
 #    Future Plan:
 #       Find a better way to support tensor alignment for 310p without this patch.
 #
-# ** 2. File: platform/patch_ec_connector.py**
-# ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-#   1. `vllm.distributed.ec_transfer.ec_connector.shared_storage_connector.ECSharedStorageConnector.start_load_caches`
-#    Why:
-#       it's hard code to cuda
-#    How：
-#       change the cuda to npu
-#    Related PR (if no, explain why):
-#       https://github.com/vllm-project/vllm/pull/30225
-#    Future Plan:
-#       Remove this patch when vllm merges the PR.
-#
 # ** 3. File: platform/patch_mamba_config.py**
 # ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 #   1. `vllm.model_executor.models.config.HybridAttentionMambaModelConfig.verify_and_update_config`
--- a/vllm_ascend/patch/platform/init.py
+++ b/vllm_ascend/patch/platform/init.py
@@ -17,7 +17,6 @@
 import os

 import vllm_ascend.patch.platform.patch_distributed  # noqa
-import vllm_ascend.patch.platform.patch_ec_connector  # noqa
 import vllm_ascend.patch.platform.patch_mamba_config  # noqa
 import vllm_ascend.patch.platform.patch_sched_yield  # noqa
 from vllm_ascend import envs
--- a/vllm_ascend/patch/platform/patch_ec_connector.py
+++ b/vllm_ascend/patch/platform/patch_ec_connector.py
@@ -1,30 +0,0 @@
-import vllm.distributed.ec_transfer.ec_connector.example_connector
-from safetensors.torch import load_file
-from vllm.distributed.ec_transfer.ec_connector.example_connector import ECConnectorMetadata, ECExampleConnector
-from vllm.logger import logger
-
-
-class AscendECExampleConnector(ECExampleConnector):
-    def start_load_caches(self, encoder_cache, **kwargs) -> None:
-        metadata: ECConnectorMetadata = self._get_connector_metadata()
-        assert isinstance(metadata, ECConnectorMetadata)
-        assert encoder_cache is not None
-        if metadata is None:
-            logger.warning(
-                (
-                    "In connector.start_load_caches, ",
-                    "but the connector metadata is None",
-                )
-            )
-            return
-        # Load the EC for each mm data
-        for mm_data in metadata.mm_datas:
-            if mm_data.mm_hash in encoder_cache:
-                continue
-            filename = self._generate_filename_debug(mm_data.mm_hash)
-            ec_cache = load_file(filename)["ec_cache"].npu()
-            encoder_cache[mm_data.mm_hash] = ec_cache
-            logger.debug("Success load encoder cache for hash %s", mm_data.mm_hash)
-
-
-vllm.distributed.ec_transfer.ec_connector.example_connector.ECExampleConnector = AscendECExampleConnector