メインコンテンツへスキップ
このリファレンスでは、Serverless Inference REST API について説明します。この API を使用すると、ご自身のアプリケーションから基盤モデルをプログラムで呼び出せます。モデルのインフラストラクチャーを管理することなく、サービス、スクリプト、ノートブックにホスト型推論を統合する際に使用できます。

ベース URL

Inference サービスには次の URL からアクセスできます:
https://api.inference.wandb.ai/v1

前提条件

Inference APIを呼び出すには、次が必要です。
  • InferenceクレジットがあるW&Bアカウント。
  • 有効なW&B APIキー。
複数のチームに所属している場合、または使用量をprojectに関連付けたい場合は、チームIDとproject IDも必要です。コード例では、これらは[YOUR-TEAM]/[YOUR-PROJECT]として表示されます。これらを指定しない場合、W&Bはデフォルトのentityとproject名inferenceを使用します。

利用可能なメソッド

Inference API は、基盤モデルとやり取りするための OpenAI 互換エンドポイントを提供します。利用可能なメソッドは次のとおりです。
  • Chat Completions: 基盤モデルを使用してチャット補完を生成します。
  • List Models: 利用可能なすべてのモデルとその ID を取得します。

認証

すべての API リクエストには、W&B の APIキーを使用した認証が必要です。wandb.ai/settings で APIキーを作成してください。 リクエストヘッダーに APIキーを含めてください:
  • OpenAI SDK の場合は、api_key パラメーターを設定します。
  • API を直接呼び出す場合は、Authorization: Bearer [YOUR-API-KEY] を使用します。

エラー処理

すべてのエラーコードとその解決方法については、API errors を参照してください。

次のステップ

APIキーを取得したら、次のいずれかに進んでください:
  • 使用例を試して、API がどのように動作するかを確認してください。
  • Inference UIでモデルを確認してください。
  • ご利用のアカウントの使用制限を確認してください。