[Refactor]Refactor of vllm_ascend/distributed module (#5910)

### What this PR does / why we need it? Based on the RFC:https://github.com/vllm-project/vllm-ascend/issues/5604 This PR is a refactoring of vllm_ascend/distributed. ### Does this PR introduce _any_ user-facing change? NA ### How was this patch tested? - vLLM version: v0.13.0 - vLLM main: 11b6af5280 Signed-off-by: lty <linhebiwen@gmail.com>
2026-01-15 16:26:53 +08:00
parent 72fee47cba
commit 3cb0af0bcf
4 changed files with 2 additions and 2 deletions
--- a/vllm_ascend/distributed/kv_transfer/init.py
+++ b/vllm_ascend/distributed/kv_transfer/init.py
@@ -41,5 +41,5 @@ def register_connector():
        "MooncakeLayerwiseConnector")

    KVConnectorFactory.register_connector(
-        "UCMConnector", "vllm_ascend.distributed.kv_transfer.ucm_connector",
+        "UCMConnector", "vllm_ascend.distributed.kv_transfer.kv_pool.ucm_connector",
        "UCMConnectorV1")
--- a/vllm_ascend/distributed/kv_transfer/kv_pool/cpu_offload/cpu_offload_connector.py
+++ b/vllm_ascend/distributed/kv_transfer/kv_pool/cpu_offload/cpu_offload_connector.py
@@ -23,7 +23,7 @@ from vllm.v1.core.sched.output import SchedulerOutput
 from vllm.v1.kv_cache_interface import (FullAttentionSpec, KVCacheSpec,
                                        MambaSpec, MLAAttentionSpec)

-from vllm_ascend.distributed.kv_transfer.kv_pool.ascend_store.metadata import (
+from vllm_ascend.distributed.kv_transfer.kv_pool.cpu_offload.metadata import (
    MetadataServer, MetadataServerProc, MLAConfig)
 from vllm_ascend.utils import vllm_version_is

--- a/vllm_ascend/distributed/kv_transfer/kv_pool/ascend_store/metadata.py
+++ b/vllm_ascend/distributed/kv_transfer/kv_pool/ascend_store/metadata.py
--- a/vllm_ascend/distributed/kv_transfer/kv_pool/ucm_connector.py
+++ b/vllm_ascend/distributed/kv_transfer/kv_pool/ucm_connector.py