xc-llm-ascend

Files

Li Wang a2552e10e4 [Worker][V1] Support sleep mode for v1 (#1084 )

### What this PR does / why we need it?
 Support sleep mode for v1

Signed-off-by: wangli <wangli858794774@gmail.com>

2025-06-06 21:54:02 +08:00

__init__.py

2025-04-19 17:38:18 +08:00

cache_engine.py

2025-06-05 16:28:01 +08:00

draft_model_runner.py

2025-04-30 09:15:50 +08:00

model_runner_v1.py

2025-06-06 21:54:02 +08:00

model_runner.py

2025-06-06 20:21:13 +08:00

mtp_proposer_v1.py

2025-06-03 11:07:33 +08:00

multi_step_runner.py

2025-05-20 09:31:30 +08:00

multi_step_worker.py

2025-03-11 19:20:06 +08:00

pooling_model_runner.py

2025-04-29 18:03:38 +08:00

worker_v1.py

2025-06-06 21:54:02 +08:00

worker.py

2025-06-06 20:25:59 +08:00