init project files

2026-04-08 06:16:35 +00:00
parent f8f29d178c
commit d2f4885f07
6 changed files with 161 additions and 0 deletions
--- a/12
+++ b/12
@@ -0,0 +1,12 @@
+FROM git.modelhub.org.cn:9443/enginex-iluvatar-bi150/vllm:0.8.3
+
+WORKDIR /workspace
+
+COPY requirements.txt /workspace
+RUN pip install --no-cache-dir -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
+
+ADD . /workspace
+
+EXPOSE 80
+CMD ["sh","-c","python3 transformers_server.py"]
+
--- a/cats_image.jpeg
+++ b/cats_image.jpeg
--- a/docker.sh
+++ b/docker.sh
@@ -0,0 +1,6 @@
+docker stop bi150_ic
+docker rm bi150_ic
+
+docker build . -t bi150_image_classification
+
+docker run -p 17777:8000 -v /mnt/contest_ceph/aiyueqi/image_classification/microsoft/resnet-50/:/model:ro -it --device=/dev/iluvatar0:/dev/iluvatar0  --name bi150_ic -e CONFIG_JSON='{"model_class": "AutoModelForImageClassification", "processer": "AutoImageProcessor", "torch_dtype": "auto"}' bi150_image_classification
--- a/logger.py
+++ b/logger.py
@@ -0,0 +1,13 @@
+# -*- coding: utf-8 -*-
+import logging
+import os
+
+logging.basicConfig(
+    format="%(asctime)s %(name)-12s %(levelname)-4s %(message)s",
+    datefmt="%Y-%m-%d %H:%M:%S",
+    level=os.environ.get("LOGLEVEL", "INFO"),
+)
+
+def get_logger(file):
+    return logging.getLogger(file)
+
--- a/requirements.txt
+++ b/requirements.txt
@@ -0,0 +1,2 @@
+fastapi
+uvicorn
--- a/transformers_server.py
+++ b/transformers_server.py
@@ -0,0 +1,128 @@
+import base64
+import json
+import os
+from io import BytesIO
+
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from PIL import Image
+import torch
+import transformers
+from transformers import AutoImageProcessor, AutoModelForImageClassification
+import uvicorn
+
+import logger
+logger = logger.get_logger(__file__)
+
+app = FastAPI()
+initialized = False
+processor = None
+model = None
+device = None
+
+class ClassifyRequest(BaseModel):
+    image: str
+    image_name: str | None = None
+
+def load_config():
+    default_config = {
+        "model_class": "AutoModelForImageClassification",
+        "processer_class": "AutoImageProcessor",
+        "torch_dtype": "auto",
+    }
+
+    raw_config = os.getenv("CONFIG_JSON")
+    if not raw_config:
+        return default_config
+
+    try:
+        user_config = json.loads(raw_config)
+    except json.JSONDecodeError as exc:
+        raise ValueError("CONFIG_JSON is not valid JSON") from exc
+
+    if not isinstance(user_config, dict):
+        raise ValueError("CONFIG_JSON must decode to an object")
+
+    default_config.update(user_config)
+    if "processor_class" in user_config and "processer_class" not in user_config:
+        default_config["processer_class"] = user_config["processor_class"]
+
+    return default_config
+
+
+def resolve_transformers_class(class_name):
+    try:
+        return getattr(transformers, class_name)
+    except AttributeError as exc:
+        raise ValueError(f"unsupported transformers class: {class_name}") from exc
+
+
+def resolve_torch_dtype(dtype_name):
+    if dtype_name == "auto":
+        return "auto"
+
+    try:
+        return getattr(torch, dtype_name)
+    except AttributeError as exc:
+        raise ValueError(f"unsupported torch dtype: {dtype_name}") from exc
+
+@app.get("/")
+def read_root():
+    return {"message": "Hello, World!"}
+
+@app.on_event("startup")
+def load_model():
+    logger.info("loading model")
+    global initialized, processor, model, device
+
+    config = load_config()
+    processor_class = resolve_transformers_class(config["processer_class"])
+    model_class = resolve_transformers_class(config["model_class"])
+    torch_dtype = resolve_torch_dtype(config["torch_dtype"])
+    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+
+    logger.info(
+        f"model config: model_class={config['model_class']}, "
+        f"processer_class={config['processer_class']}, torch_dtype={config['torch_dtype']}, "
+        f"device={device}"
+    )
+
+    processor = processor_class.from_pretrained("/model")
+    model = model_class.from_pretrained("/model", torch_dtype=torch_dtype)
+    model.to(device)
+    model.eval()
+
+    initialized = True
+    logger.info("model loaded successfully")
+
+@app.get("/v1/models")
+async def get_status():
+    logger.info(f"get status, initialized={initialized}")
+    return initialized
+
+@app.post("/v1/classify")
+async def classify(request: ClassifyRequest):
+    if not initialized or processor is None or model is None or device is None:
+        raise HTTPException(status_code=503, detail="model is not initialized")
+
+    try:
+        image_bytes = base64.b64decode(request.image)
+        image = Image.open(BytesIO(image_bytes)).convert("RGB")
+    except Exception as exc:
+        logger.exception("failed to decode input image")
+        raise HTTPException(status_code=400, detail="invalid image payload") from exc
+
+    try:
+        inputs = processor(images=image, return_tensors="pt")
+        inputs = {key: value.to(device) for key, value in inputs.items()}
+        with torch.no_grad():
+            logits = model(**inputs).logits
+        top5 = torch.topk(logits, k=5, dim=-1).indices[0].tolist()
+        logger.info(f"classify image_name={request.image_name}, labels={top5}")
+        return {"labels": top5}
+    except Exception as exc:
+        logger.exception("image classification failed")
+        raise HTTPException(status_code=500, detail="classification failed") from exc
+
+if __name__ == '__main__':
+    uvicorn.run("transformers_server:app", host="0.0.0.0", port=8000, workers=1, access_log=False)