これが発生する理由
- モデルでサポートされていないパラメーター: 一部のパラメーター (
frequency_penalty、logprobs、response_formatなど) は、すべてのモデルでサポートされているわけではありません。サポートされていないパラメーターを渡すと、400 または 422 が返されることがあります。 - パラメーター値が範囲外:
temperatureなどの値は、モデルで有効な範囲内 (多くの場合 0–2) でなければなりません。範囲外の値は、多くの場合 HTTP 400 で拒否され、該当するパラメーター名を示すerror.messageが返されます。 - 不正な
messagesペイロード:messagesフィールドは、メッセージオブジェクトのリストである必要があります。型が誤っていたり構造が無効だったりすると、通常は応答本文に検証メッセージを含む HTTP 400 が返されます。 - 無効な
response_formatまたはその他の構造化出力設定: モデルがサポートしていない形式をリクエストすると、エラー応答が返されることがあります。ステータスコードと応答本文を、そのモデルに関する信頼できる情報源として扱ってください。
確認すべきこと
-
エラーメッセージの本文を確認する
- 多くの応答では、
errorオブジェクトにmessageフィールド (場合によってはparamやcodeも含む) が含まれます。一方で、detailフィールドを返すレイヤーもあります。トラブルシューティングを行う前に、応答に含まれているフィールドを確認してください。
- 多くの応答では、
-
使用しているモデルでサポートされるパラメーターを確認する
- 各モデルで受け入れられる具体的なパラメーターと範囲については、利用可能なモデルを確認してください。
-
messages 配列を検証する
- 各メッセージには
role(system、user、またはassistant) とcontentのstringが必要です。tool call メッセージでは追加のフィールドが必要です。正しい schema については、chat completions API リファレンスを参照してください。
- 各メッセージには
-
ベース URL を確認する
- OpenAI-compatible クライアントの接続先は
https://api.inference.wandb.ai/v1にし、https://api.wandb.aiは使用しないでください。Multi-tenant Cloud API ホストは Inference chat completions を提供していません。任意で使用状況の帰属を行うには、list models API リファレンスにあるように、OpenAI-Projectヘッダーをteam/projectに設定してください。
- OpenAI-compatible クライアントの接続先は
-
サポートされていないパラメーターを削除する
- 別の provider のコードを流用している場合は、W&B Inference API リファレンスにないパラメーターを削除してください。モデルがサポートしていない余分なパラメーターがあると、400 または 422 の応答が返されることがあります。
サーバー エラー