429 のレート制限エラーを返す理由と、許可された同時実行制限内でリクエストを成功させるための対処方法について説明します。
レート制限エラー (429) は、同時実行制限を超えると発生します。
エラー: “Concurrency limit reached for requests”
解決方法: このエラーを解消するには、次のいずれかを実行してください。
- 並列リクエスト数を減らします。
- リクエストの間に待機時間を設けます。
- 指数バックオフを実装します。
レート制限を回避するためのベストプラクティス
-
指数バックオフを用いた再試行ロジックを実装する: バックオフにより再試行の間隔が空くため、一時的な
429応答が次の試行前に解消されます。 - 並列リクエストの代わりにバッチ処理を使用する。
- W&B Billing ページで使用状況を確認する。
デフォルトの支出上限
- Pro アカウント: $6,000/月
- Enterprise アカウント: $700,000/年
Inference