xc-llm-ascend/vllm_ascend/patch/platform/patch_sched_yield.py

import sys

import vllm.distributed.utils
from vllm.platforms import CpuArchEnum, Platform

is_arm = Platform.get_cpu_architecture() == CpuArchEnum.ARM

USE_SCHED_YIELD = (
    (sys.version_info[:3] >= (3, 11, 1)) or (sys.version_info[:2] == (3, 10) and sys.version_info[2] >= 8)
) and not is_arm

vllm.distributed.utils.USE_SCHED_YIELD = USE_SCHED_YIELD