Serve - Weights & Biases Documentation

このガイドでは、weave serve を使用して W&B Weave Model を FastAPI エンドポイントとして公開し、モデルをインタラクティブにクエリして本番推論ワークフローに統合する方法を説明します。任意の Weave Model 用の FastAPI サーバーを起動するには、Weave ref を weave serve に渡します。[REF] をご使用の Weave Model ref に置き換えてください。

weave serve [REF]

モデルをインタラクティブにクエリするには、http://0.0.0.0:9996/docs で Swagger UI を開きます。

FastAPIのインストール

weave serve はモデルのホスティングに FastAPI と Uvicorn を使用するため、サーブする前に両方のパッケージをインストールする必要があります。

pip install fastapi uvicorn

モデルをサーブする

依存関係をインストールしたら、ターミナルからサーバーを起動してください。[YOUR-MODEL-REF] は、ご自身の Weave Model ref に置き換えてください。

weave serve [YOUR-MODEL-REF]

モデルに移動し、UI から model ref をコピーして取得します。次のような形式になります。ここで、[ENTITY] は W&B entity、[PROJECT-NAME] はプロジェクト名、[MODEL-NAME] はモデル名、[HASH] はモデルのバージョンハッシュです。

weave://[ENTITY]/[PROJECT-NAME]/[MODEL-NAME]:[HASH]

エンドポイントをテストするには、Swagger UI を開き、predict エンドポイントをクリックしてから、Try it out をクリックします。これで、Weave Model の予測を返すローカルの FastAPI エンドポイントが利用できるようになります。

​FastAPIのインストール

​モデルをサーブする

FastAPIのインストール

モデルをサーブする