API の概要

このリファレンスでは、Serverless Inference REST API について説明します。この API を使用すると、ご自身のアプリケーションから基盤モデルをプログラムで呼び出せます。モデルのインフラストラクチャーを管理することなく、サービス、スクリプト、ノートブックにホスト型推論を統合する際に使用できます。

ベース URL

Inference サービスには次の URL からアクセスできます：

https://api.inference.wandb.ai/v1

前提条件

Inference APIを呼び出すには、次が必要です。

InferenceクレジットがあるW&Bアカウント。
有効なW&B APIキー。

複数のチームに所属している場合、または使用量をprojectに関連付けたい場合は、チームIDとproject IDも必要です。コード例では、これらは[YOUR-TEAM]/[YOUR-PROJECT]として表示されます。これらを指定しない場合、W&Bはデフォルトのentityとproject名inferenceを使用します。

利用可能なメソッド

Inference API は、基盤モデルとやり取りするための OpenAI 互換エンドポイントを提供します。利用可能なメソッドは次のとおりです。

Chat Completions: 基盤モデルを使用してチャット補完を生成します。
List Models: 利用可能なすべてのモデルとその ID を取得します。

認証

すべての API リクエストには、W&B の APIキーを使用した認証が必要です。wandb.ai/settings で APIキーを作成してください。リクエストヘッダーに APIキーを含めてください:

OpenAI SDK の場合は、api_key パラメーターを設定します。
API を直接呼び出す場合は、Authorization: Bearer [YOUR-API-KEY] を使用します。

エラー処理

すべてのエラーコードとその解決方法については、API errors を参照してください。

次のステップ

APIキーを取得したら、次のいずれかに進んでください:

使用例を試して、API がどのように動作するかを確認してください。
Inference UIでモデルを確認してください。
ご利用のアカウントの使用制限を確認してください。

W&B Models

W&B Weave

Serverless Inference

Serverless Training

ベース URL

前提条件

利用可能なメソッド

認証

エラー処理

次のステップ

​ベース URL

​前提条件

​利用可能なメソッド

​認証

​エラー処理

​次のステップ

ベース URL

前提条件

利用可能なメソッド

認証

エラー処理

次のステップ