This website requires JavaScript.
Explore
Help
Register
Sign In
EngineX-Hygon
/
sglang
Watch
5
Star
0
Fork
0
You've already forked sglang
Code
Issues
Pull Requests
Actions
7
Projects
Releases
Wiki
Activity
Files
8af7048dcf36d8b0804eb01cf3e58a58052f7271
sglang
/
test
/
srt
History
…
..
configs
…
models
…
sampling
/penaltylib
…
double-sparsity-config-Llama-3.1-8B-Instruct.json
Rename double sparsity config file (
#2188
)
2024-11-25 17:12:08 -08:00
experiment_runner.py
…
kv_cache_scales_llama3_1_8b.json
Support FP8 E4M3 KV Cache (
#2786
)
2025-01-12 21:17:11 -08:00
kv_cache_scales_llama3_8b.json
…
kv_cache_scales_qwen2_1_5b.json
support e4m3 kvcache in qwen2 & add kv scaling facotr json (
#2894
)
2025-01-18 11:43:22 +08:00
run_suite.py
…
test_abort.py
…
test_bench_one_batch.py
…
test_bench_serving.py
…
test_cache_report.py
…
test_chunked_prefill.py
…
test_create_kvindices.py
…
test_custom_allreduce.py
…
test_data_parallelism.py
…
test_double_sparsity.py
…
test_dp_attention.py
…
test_eagle_infer.py
…
test_ebnf_constrained.py
…
test_embedding_openai_server.py
…
test_eval_accuracy_large_chunked_prefill.py
…
test_eval_accuracy_large_mixed_chunked_prefill.py
…
test_eval_accuracy_large.py
…
test_eval_accuracy_mini.py
…
test_fp8_kvcache.py
…
test_fused_moe.py
…
test_get_weights_by_name.py
…
test_gguf.py
…
test_input_embeddings.py
…
test_json_constrained.py
…
test_large_max_new_tokens.py
…
test_matched_stop.py
…
test_metrics.py
…
test_mla_fp8.py
…
test_mla.py
…
test_models_from_modelscope.py
…
test_moe_ep.py
…
test_moe_eval_accuracy_large.py
…
test_nightly_gsm8k_eval.py
…
test_nightly_human_eval.py
…
test_nightly_math_eval.py
…
test_no_chunked_prefill.py
…
test_no_overlap_scheduler.py
…
test_openai_server.py
…
test_pytorch_sampling_backend.py
…
test_radix_attention.py
…
test_release_memory_occupation.py
…
test_request_length_validation.py
…
test_retract_decode.py
…
test_schedule_policy.py
…
test_server_args.py
…
test_session_control.py
…
test_skip_tokenizer_init.py
…
test_srt_endpoint.py
…
test_srt_engine_with_quant_args.py
…
test_srt_engine.py
…
test_torch_compile_moe.py
…
test_torch_compile.py
…
test_torch_native_attention_backend.py
…
test_torch_tp.py
…
test_torchao.py
…
test_triton_attention_backend.py
…
test_triton_attention_kernels.py
…
test_update_weights_from_disk.py
…
test_update_weights_from_distributed.py
…
test_update_weights_from_tensor.py
…
test_vision_chunked_prefill.py
…
test_vision_openai_server.py
…
test_w8a8_quantization.py
…