서빙 - Weights & Biases Documentation

이 가이드에서는 weave serve를 사용해 W&B Weave Model을 FastAPI 엔드포인트로 노출하는 방법을 설명합니다. 이를 통해 모델을 대화형으로 쿼리하고 프로덕션 Inference 워크플로에 통합할 수 있습니다. 임의의 Weave Model에 대한 FastAPI 서버를 시작하려면 Weave ref를 weave serve에 전달하세요. [REF]를 Weave Model ref로 바꾸세요.

weave serve [REF]

모델을 대화형으로 쿼리하려면 http://0.0.0.0:9996/docs에서 Swagger UI를 여세요.”

FastAPI 설치

weave serve는 모델을 호스팅할 때 FastAPI와 Uvicorn을 사용하므로, 서빙하기 전에 두 패키지를 모두 설치해야 합니다.

pip install fastapi uvicorn

모델 서빙

의존성을 설치한 후 터미널에서 서버를 시작하세요. [YOUR-MODEL-REF]를 Weave Model ref로 교체하세요.

weave serve [YOUR-MODEL-REF]

모델로 이동한 다음 UI에서 모델 ref를 복사하세요. 형식은 다음과 같아야 하며, 여기서 [ENTITY]는 W&B entity, [PROJECT-NAME]은 프로젝트 이름, [MODEL-NAME]은 모델 이름, [HASH]는 모델 버전 해시입니다:

weave://[ENTITY]/[PROJECT-NAME]/[MODEL-NAME]:[HASH]

엔드포인트를 테스트하려면 Swagger UI를 열고 predict 엔드포인트를 클릭한 다음 Try it out을 클릭하세요. 이제 Weave Model의 예측을 서빙하는 로컬 FastAPI 엔드포인트가 준비되었습니다.

Weights & Biases

Powered by CoreWeave

Platform Details

Resources

서빙

FastAPI 설치

모델 서빙

​FastAPI 설치

​모델 서빙

FastAPI 설치

모델 서빙