This website requires JavaScript.
Explore
Help
Register
Sign In
EngineX-Hygon
/
sglang
Watch
5
Star
0
Fork
0
You've already forked sglang
Code
Issues
Pull Requests
Actions
7
Projects
Releases
Wiki
Activity
Files
38216cf04950f6eb9a354d87ba635cad1c267ec7
sglang
/
test
/
srt
History
Praneth Paruchuri
cb736df854
Support for Phi-1.5 & Phi-2 models (
#7862
)
2025-07-13 18:43:40 -07:00
..
configs
…
cpu
…
models
…
openai_server
…
double-sparsity-config-Llama-3.1-8B-Instruct.json
…
experiment_runner.py
…
kv_cache_scales_llama3_1_8b.json
…
kv_cache_scales_llama3_8b.json
…
kv_cache_scales_qwen2_1_5b.json
…
parse_results.py
…
run_suite.py
…
test_abort.py
…
test_ascend_attention_backend.py
…
test_ascend_mla_backend.py
…
test_awq.py
…
test_bench_one_batch.py
…
test_bench_serving.py
…
test_block_int8.py
…
test_bnb.py
…
test_chunked_prefill.py
…
test_create_kvindices.py
…
test_custom_allreduce.py
…
test_data_parallelism.py
…
test_deepep_internode.py
…
test_deepep_intranode.py
…
test_deepep_large.py
…
test_deepep_low_latency.py
…
test_deepep_small.py
…
test_disaggregation_different_tp.py
…
test_disaggregation.py
…
test_double_sparsity.py
…
test_dp_attention.py
…
test_eagle_infer_a.py
…
test_eagle_infer_b.py
…
test_ebnf_constrained.py
…
test_eplb.py
…
test_eval_accuracy_large.py
…
test_eval_fp8_accuracy.py
…
test_expert_distribution.py
…
test_expert_location_updater.py
…
test_fa3.py
…
test_fim_completion.py
…
test_flashmla.py
…
test_fp8_kernel.py
…
test_fp8_kvcache.py
…
test_full_deepseek_v3.py
…
test_function_call_parser.py
…
test_fused_moe.py
…
test_get_weights_by_name.py
…
test_gguf.py
…
test_gptqmodel_dynamic.py
…
test_health_check.py
…
test_hicache_mla.py
…
test_hicache_page.py
…
test_hicache.py
…
test_hidden_states.py
…
test_hybrid_dp_ep_tp_mtp.py
…
test_input_embeddings.py
…
test_int4_kernel.py
…
test_int8_kernel.py
…
test_intel_amx_attention_backend.py
…
test_io_struct.py
…
test_jinja_template_utils.py
…
test_kv_events.py
…
test_local_attn.py
…
test_metrics.py
…
test_mla_deepseek_v3.py
…
test_mla_flashinfer.py
…
test_mla_fp8.py
…
test_mla_int8_deepseek_v3.py
…
test_mla_tp.py
…
test_mla.py
…
test_modelopt_fp8kvcache.py
…
test_modelopt.py
…
test_models_from_modelscope.py
…
test_moe_deepep_eval_accuracy_large.py
…
test_moe_deepep.py
…
test_moe_ep.py
…
test_moe_eval_accuracy_large.py
…
test_mscclpp.py
…
test_multi_instance_release_memory_occupation.py
…
test_nightly_gsm8k_eval_amd.py
…
test_nightly_gsm8k_eval.py
…
test_no_chunked_prefill.py
…
test_no_overlap_scheduler.py
…
test_page_size.py
…
test_patch_torch.py
…
test_penalty.py
…
test_pp_single_node.py
…
test_pytorch_sampling_backend.py
…
test_radix_attention.py
…
test_reasoning_parser.py
…
test_regex_constrained.py
…
test_release_memory_occupation.py
…
test_retract_decode.py
…
test_rope_rocm.py
…
test_sagemaker_server.py
…
test_schedule_policy.py
…
test_score_api.py
…
test_server_args.py
…
test_session_control.py
…
test_skip_tokenizer_init.py
…
test_srt_endpoint.py
…
test_srt_engine_with_quant_args.py
…
test_srt_engine.py
…
test_start_profile.py
…
test_swa_unittest.py
…
test_torch_compile_moe.py
…
test_torch_compile.py
…
test_torch_native_attention_backend.py
…
test_torch_tp.py
…
test_torchao.py
…
test_triton_attention_backend.py
…
test_triton_attention_kernels.py
…
test_triton_attention_rocm_mla.py
…
test_triton_fused_moe.py
…
test_triton_moe_channel_fp8_kernel.py
…
test_triton_moe_wna16.py
…
test_triton_sliding_window.py
…
test_two_batch_overlap.py
…
test_update_weights_from_disk.py
…
test_update_weights_from_distributed.py
…
test_update_weights_from_tensor.py
…
test_verl_engine_2_gpu.py
…
test_verl_engine_4_gpu.py
…
test_vertex_endpoint.py
…
test_vision_chunked_prefill.py
…
test_vision_openai_server_a.py
…
test_vision_openai_server_b.py
…
test_vision_openai_server_common.py
…
test_vllm_dependency.py
…
test_vlm_accuracy.py
…
test_vlm_input_format.py
…
test_w4a8.py
…
test_w8a8_quantization.py
…