xc-llm-ascend

Files

fems14 ab5d110fcc vllm-ascend support chunked prefill (#1172 )

### What this PR does / why we need it?
vllm-ascend support chunked prefill for MLA


---------

Signed-off-by: fems14 <1804143737@qq.com>

2025-06-14 22:31:16 +08:00

__init__.py

2025-04-19 17:38:18 +08:00

cache_engine.py

2025-06-05 16:28:01 +08:00

draft_model_runner.py

2025-04-30 09:15:50 +08:00

model_runner_v1.py

2025-06-14 22:31:16 +08:00

model_runner.py

2025-06-07 14:28:20 +08:00

mtp_proposer_v1.py

2025-06-09 22:21:42 +08:00

multi_step_runner.py

2025-05-20 09:31:30 +08:00

multi_step_worker.py

2025-06-10 22:26:53 +08:00

pooling_model_runner.py

2025-04-29 18:03:38 +08:00

worker_v1.py

2025-06-09 14:08:18 +08:00

worker.py

2025-06-06 20:25:59 +08:00