> ## Documentation Index
> Fetch the complete documentation index at: https://docs.wandb.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# 서빙

> Weave op과 모델을 API 엔드포인트로 노출해 프로덕션에서 예측을 서빙하고 Inference를 실행할 수 있습니다.

이 가이드에서는 `weave serve`를 사용해 W\&B Weave Model을 FastAPI 엔드포인트로 노출하는 방법을 설명합니다. 이를 통해 모델을 대화형으로 쿼리하고 프로덕션 Inference 워크플로에 통합할 수 있습니다.

임의의 Weave Model에 대한 FastAPI 서버를 시작하려면 Weave ref를 `weave serve`에 전달하세요. `[REF]`를 Weave Model ref로 바꾸세요.

```bash theme={null}
weave serve [REF]
```

모델을 대화형으로 쿼리하려면 `http://0.0.0.0:9996/docs`에서 Swagger UI를 여세요."

<div id="install-fastapi">
  ## FastAPI 설치
</div>

`weave serve`는 모델을 호스팅할 때 FastAPI와 Uvicorn을 사용하므로, 서빙하기 전에 두 패키지를 모두 설치해야 합니다.

```bash theme={null}
pip install fastapi uvicorn
```

<div id="serve-model">
  ## 모델 서빙
</div>

의존성을 설치한 후 터미널에서 서버를 시작하세요. `[YOUR-MODEL-REF]`를 Weave Model ref로 교체하세요.

```bash theme={null}
weave serve [YOUR-MODEL-REF]
```

모델로 이동한 다음 UI에서 모델 ref를 복사하세요. 형식은 다음과 같아야 하며, 여기서 `[ENTITY]`는 W\&B entity, `[PROJECT-NAME]`은 프로젝트 이름, `[MODEL-NAME]`은 모델 이름, `[HASH]`는 모델 버전 해시입니다:

```text theme={null}
weave://[ENTITY]/[PROJECT-NAME]/[MODEL-NAME]:[HASH]
```

엔드포인트를 테스트하려면 Swagger UI를 열고 `predict` 엔드포인트를 클릭한 다음 **Try it out**을 클릭하세요. 이제 Weave Model의 예측을 서빙하는 로컬 FastAPI 엔드포인트가 준비되었습니다.