weave serve を使用して W&B Weave Model を FastAPI エンドポイントとして公開し、モデルをインタラクティブにクエリして本番推論ワークフローに統合する方法を説明します。
任意の Weave Model 用の FastAPI サーバーを起動するには、Weave ref を weave serve に渡します。[REF] をご使用の Weave Model ref に置き換えてください。
http://0.0.0.0:9996/docs で Swagger UI を開きます。
FastAPIのインストール
weave serve はモデルのホスティングに FastAPI と Uvicorn を使用するため、サーブする前に両方のパッケージをインストールする必要があります。
モデルをサーブする
[YOUR-MODEL-REF] は、ご自身の Weave Model ref に置き換えてください。
[ENTITY] は W&B entity、[PROJECT-NAME] はプロジェクト名、[MODEL-NAME] はモデル名、[HASH] はモデルのバージョンハッシュです。
predict エンドポイントをクリックしてから、Try it out をクリックします。これで、Weave Model の予測を返すローカルの FastAPI エンドポイントが利用できるようになります。