sglang/python/sglang/srt/openai_protocol.py

"""Pydantic models for OpenAI API protocol"""

import time
from typing import Dict, List, Optional, Union

from pydantic import BaseModel, Field
from typing_extensions import Literal


class ErrorResponse(BaseModel):
    object: str = "error"
    message: str
    type: str
    param: Optional[str] = None
    code: int


class LogProbs(BaseModel):
    text_offset: List[int] = Field(default_factory=list)
    token_logprobs: List[Optional[float]] = Field(default_factory=list)
    tokens: List[str] = Field(default_factory=list)
    top_logprobs: List[Optional[Dict[str, float]]] = Field(default_factory=list)


class UsageInfo(BaseModel):
    prompt_tokens: int = 0
    total_tokens: int = 0
    completion_tokens: Optional[int] = 0


class CompletionRequest(BaseModel):
    # Ordered by official OpenAI API documentation
    # https://platform.openai.com/docs/api-reference/completions/create
    model: str
    prompt: Union[List[int], List[List[int]], str, List[str]]
    best_of: Optional[int] = None
    echo: Optional[bool] = False
    frequency_penalty: Optional[float] = 0.0
    logit_bias: Optional[Dict[str, float]] = None
    logprobs: Optional[int] = None
    max_tokens: Optional[int] = 16
    n: int = 1
    presence_penalty: Optional[float] = 0.0
    seed: Optional[int] = None
    stop: Optional[Union[str, List[str]]] = Field(default_factory=list)
    stream: Optional[bool] = False
    suffix: Optional[str] = None
    temperature: Optional[float] = 1.0
    top_p: Optional[float] = 1.0
    user: Optional[str] = None

    # Extra parameters for SRT backend only and will be ignored by OpenAI models.
    regex: Optional[str] = None


class CompletionResponseChoice(BaseModel):
    index: int
    text: str
    logprobs: Optional[LogProbs] = None
    finish_reason: Optional[str] = None


class CompletionResponse(BaseModel):
    id: str
    object: str = "text_completion"
    created: int = Field(default_factory=lambda: int(time.time()))
    model: str
    choices: List[CompletionResponseChoice]
    usage: UsageInfo


class CompletionResponseStreamChoice(BaseModel):
    index: int
    text: str
    logprobs: Optional[LogProbs] = None
    finish_reason: Optional[str] = None


class CompletionStreamResponse(BaseModel):
    id: str
    object: str = "text_completion"
    created: int = Field(default_factory=lambda: int(time.time()))
    model: str
    choices: List[CompletionResponseStreamChoice]
    usage: UsageInfo


class ChatCompletionMessageGenericParam(BaseModel):
    role: Literal["system", "assistant"]
    content: str


class ChatCompletionMessageContentTextPart(BaseModel):
    type: Literal["text"]
    text: str


class ChatCompletionMessageContentImageURL(BaseModel):
    url: str
    detail: Optional[Literal["auto", "low", "high"]] = "auto"


class ChatCompletionMessageContentImagePart(BaseModel):
    type: Literal["image_url"]
    image_url: ChatCompletionMessageContentImageURL


ChatCompletionMessageContentPart = Union[
    ChatCompletionMessageContentTextPart, ChatCompletionMessageContentImagePart
]


class ChatCompletionMessageUserParam(BaseModel):
    role: Literal["user"]
    content: Union[str, List[ChatCompletionMessageContentPart]]


ChatCompletionMessageParam = Union[
    ChatCompletionMessageGenericParam, ChatCompletionMessageUserParam
]


class ResponseFormat(BaseModel):
    # type must be "json_object" or "text"
    type: Literal["text", "json_object"]


class ChatCompletionRequest(BaseModel):
    # Ordered by official OpenAI API documentation
    # https://platform.openai.com/docs/api-reference/chat/create
    messages: List[ChatCompletionMessageParam]
    model: str
    frequency_penalty: Optional[float] = 0.0
    logit_bias: Optional[Dict[str, float]] = None
    logprobs: Optional[bool] = False
    top_logprobs: Optional[int] = None
    max_tokens: Optional[int] = 16
    n: Optional[int] = 1
    presence_penalty: Optional[float] = 0.0
    response_format: Optional[ResponseFormat] = None
    seed: Optional[int] = None
    stop: Optional[Union[str, List[str]]] = Field(default_factory=list)
    stream: Optional[bool] = False
    temperature: Optional[float] = 0.7
    top_p: Optional[float] = 1.0
    user: Optional[str] = None

    # Extra parameters for SRT backend only and will be ignored by OpenAI models.
    regex: Optional[str] = None


class ChatMessage(BaseModel):
    role: Optional[str] = None
    content: Optional[str] = None


class ChatCompletionResponseChoice(BaseModel):
    index: int
    message: ChatMessage
    logprobs: Optional[LogProbs] = None
    finish_reason: Optional[str] = None


class ChatCompletionResponse(BaseModel):
    id: str
    object: str = "chat.completion"
    created: int = Field(default_factory=lambda: int(time.time()))
    model: str
    choices: List[ChatCompletionResponseChoice]
    usage: UsageInfo


class DeltaMessage(BaseModel):
    role: Optional[str] = None
    content: Optional[str] = None


class ChatCompletionResponseStreamChoice(BaseModel):
    index: int
    delta: DeltaMessage
    logprobs: Optional[LogProbs] = None
    finish_reason: Optional[str] = None


class ChatCompletionStreamResponse(BaseModel):
    id: str
    object: str = "chat.completion.chunk"
    created: int = Field(default_factory=lambda: int(time.time()))
    model: str
    choices: List[ChatCompletionResponseStreamChoice]
Improve doc strings (#518) 2024-06-08 02:06:52 -07:00			`"""Pydantic models for OpenAI API protocol"""`
Format code (#441) 2024-05-14 22:40:46 +08:00
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`import time`
			`from typing import Dict, List, Optional, Union`
release initial code Co-authored-by: Ying Sheng <sqy1415@gmail.com> Co-authored-by: Liangsheng Yin <hnyls2002@gmail.com> Co-authored-by: Zhiqiang Xie <xiezhq@stanford.edu> Co-authored-by: parasol-aser <3848358+parasol-aser@users.noreply.github.com> Co-authored-by: LiviaSun <33578456+ChuyueSun@users.noreply.github.com> Co-authored-by: Cody Yu <hao.yu.cody@gmail.com> 2024-01-08 04:37:50 +00:00
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`from pydantic import BaseModel, Field`
format code 2024-01-30 16:36:10 +00:00			`from typing_extensions import Literal`
release initial code Co-authored-by: Ying Sheng <sqy1415@gmail.com> Co-authored-by: Liangsheng Yin <hnyls2002@gmail.com> Co-authored-by: Zhiqiang Xie <xiezhq@stanford.edu> Co-authored-by: parasol-aser <3848358+parasol-aser@users.noreply.github.com> Co-authored-by: LiviaSun <33578456+ChuyueSun@users.noreply.github.com> Co-authored-by: Cody Yu <hao.yu.cody@gmail.com> 2024-01-08 04:37:50 +00:00
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00
Abort disconnected requests (#457) 2024-05-20 18:41:21 -07:00			`class ErrorResponse(BaseModel):`
			`object: str = "error"`
			`message: str`
			`type: str`
			`param: Optional[str] = None`
			`code: int`


Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`class LogProbs(BaseModel):`
			`text_offset: List[int] = Field(default_factory=list)`
			`token_logprobs: List[Optional[float]] = Field(default_factory=list)`
			`tokens: List[str] = Field(default_factory=list)`
			`top_logprobs: List[Optional[Dict[str, float]]] = Field(default_factory=list)`


			`class UsageInfo(BaseModel):`
			`prompt_tokens: int = 0`
			`total_tokens: int = 0`
			`completion_tokens: Optional[int] = 0`


			`class CompletionRequest(BaseModel):`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`# Ordered by official OpenAI API documentation`
			`# https://platform.openai.com/docs/api-reference/completions/create`
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`model: str`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`prompt: Union[List[int], List[List[int]], str, List[str]]`
			`best_of: Optional[int] = None`
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`echo: Optional[bool] = False`
			`frequency_penalty: Optional[float] = 0.0`
			`logit_bias: Optional[Dict[str, float]] = None`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`logprobs: Optional[int] = None`
			`max_tokens: Optional[int] = 16`
			`n: int = 1`
			`presence_penalty: Optional[float] = 0.0`
			`seed: Optional[int] = None`
			`stop: Optional[Union[str, List[str]]] = Field(default_factory=list)`
			`stream: Optional[bool] = False`
			`suffix: Optional[str] = None`
			`temperature: Optional[float] = 1.0`
			`top_p: Optional[float] = 1.0`
Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00			`user: Optional[str] = None`

Support extra field regex in OpenAI API (#172) 2024-02-10 17:21:33 -08:00			`# Extra parameters for SRT backend only and will be ignored by OpenAI models.`
			`regex: Optional[str] = None`

Support stream=True in v1/completions (#49) 2024-01-18 17:00:56 -08:00
			`class CompletionResponseChoice(BaseModel):`
			`index: int`
			`text: str`
			`logprobs: Optional[LogProbs] = None`
			`finish_reason: Optional[str] = None`


			`class CompletionResponse(BaseModel):`
			`id: str`
			`object: str = "text_completion"`
			`created: int = Field(default_factory=lambda: int(time.time()))`
			`model: str`
			`choices: List[CompletionResponseChoice]`
			`usage: UsageInfo`


			`class CompletionResponseStreamChoice(BaseModel):`
			`index: int`
			`text: str`
			`logprobs: Optional[LogProbs] = None`
			`finish_reason: Optional[str] = None`


			`class CompletionStreamResponse(BaseModel):`
			`id: str`
			`object: str = "text_completion"`
			`created: int = Field(default_factory=lambda: int(time.time()))`
			`model: str`
			`choices: List[CompletionResponseStreamChoice]`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`usage: UsageInfo`


[Feature] Adds basic support for image content in OpenAI chat routes (#113) 2024-01-30 23:12:33 +09:00			`class ChatCompletionMessageGenericParam(BaseModel):`
			`role: Literal["system", "assistant"]`
			`content: str`


			`class ChatCompletionMessageContentTextPart(BaseModel):`
			`type: Literal["text"]`
			`text: str`


			`class ChatCompletionMessageContentImageURL(BaseModel):`
			`url: str`
			`detail: Optional[Literal["auto", "low", "high"]] = "auto"`


			`class ChatCompletionMessageContentImagePart(BaseModel):`
			`type: Literal["image_url"]`
			`image_url: ChatCompletionMessageContentImageURL`


			`ChatCompletionMessageContentPart = Union[`
			`ChatCompletionMessageContentTextPart, ChatCompletionMessageContentImagePart`
			`]`


			`class ChatCompletionMessageUserParam(BaseModel):`
			`role: Literal["user"]`
			`content: Union[str, List[ChatCompletionMessageContentPart]]`


			`ChatCompletionMessageParam = Union[`
			`ChatCompletionMessageGenericParam, ChatCompletionMessageUserParam`
			`]`


Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`class ResponseFormat(BaseModel):`
			`# type must be "json_object" or "text"`
			`type: Literal["text", "json_object"]`


Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`class ChatCompletionRequest(BaseModel):`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`# Ordered by official OpenAI API documentation`
			`# https://platform.openai.com/docs/api-reference/chat/create`
			`messages: List[ChatCompletionMessageParam]`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`model: str`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`frequency_penalty: Optional[float] = 0.0`
			`logit_bias: Optional[Dict[str, float]] = None`
			`logprobs: Optional[bool] = False`
			`top_logprobs: Optional[int] = None`
Fix the default argument of OpenAI Chat completion (#605) 2024-07-09 01:52:55 -07:00			`max_tokens: Optional[int] = 16`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`n: Optional[int] = 1`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`presence_penalty: Optional[float] = 0.0`
			`response_format: Optional[ResponseFormat] = None`
			`seed: Optional[int] = None`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`stop: Optional[Union[str, List[str]]] = Field(default_factory=list)`
			`stream: Optional[bool] = False`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`temperature: Optional[float] = 0.7`
			`top_p: Optional[float] = 1.0`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`user: Optional[str] = None`

Support extra field regex in OpenAI API (#172) 2024-02-10 17:21:33 -08:00			`# Extra parameters for SRT backend only and will be ignored by OpenAI models.`
			`regex: Optional[str] = None`

Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00
			`class ChatMessage(BaseModel):`
			`role: Optional[str] = None`
			`content: Optional[str] = None`


			`class ChatCompletionResponseChoice(BaseModel):`
			`index: int`
			`message: ChatMessage`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`logprobs: Optional[LogProbs] = None`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`finish_reason: Optional[str] = None`


			`class ChatCompletionResponse(BaseModel):`
			`id: str`
			`object: str = "chat.completion"`
			`created: int = Field(default_factory=lambda: int(time.time()))`
			`model: str`
			`choices: List[ChatCompletionResponseChoice]`
			`usage: UsageInfo`


			`class DeltaMessage(BaseModel):`
			`role: Optional[str] = None`
			`content: Optional[str] = None`


			`class ChatCompletionResponseStreamChoice(BaseModel):`
			`index: int`
			`delta: DeltaMessage`
Move openai api server into a separate file (#429) 2024-05-12 06:41:32 -07:00			`logprobs: Optional[LogProbs] = None`
Support v1/chat/completions (#50) 2024-01-18 23:43:09 -08:00			`finish_reason: Optional[str] = None`


			`class ChatCompletionStreamResponse(BaseModel):`
			`id: str`
			`object: str = "chat.completion.chunk"`
			`created: int = Field(default_factory=lambda: int(time.time()))`
			`model: str`
Format code (#441) 2024-05-14 22:40:46 +08:00			`choices: List[ChatCompletionResponseStreamChoice]`