accomendate reasoning_effort set in chat_template_kwargs (#9458)

2025-08-21 13:22:03 -07:00
parent 9c8e4f69c3
commit 9ba7253094
1 changed files with 8 additions and 0 deletions
--- a/python/sglang/srt/entrypoints/openai/serving_chat.py
+++ b/python/sglang/srt/entrypoints/openai/serving_chat.py
@@ -87,6 +87,14 @@ class OpenAIServingChat(OpenAIServingBase):
        self,
        request: ChatCompletionRequest,
    ) -> tuple[GenerateReqInput, ChatCompletionRequest]:
        reasoning_effort = (
            request.chat_template_kwargs.pop("reasoning_effort", None)
            if request.chat_template_kwargs
            else None
        )
        if reasoning_effort is not None:
            request.reasoning_effort = reasoning_effort
        """Convert OpenAI chat completion request to internal format"""
        is_multimodal = self.tokenizer_manager.model_config.is_multimodal