ARIA を使って W&B Launch を設定する
User prompt
ARIA の応答
ARIA の応答
Launch の構成要素
- Launch job: ML ワークフロー内のタスクを設定して実行するための、再利用可能な設計図です。
- Launch queue: Kubernetes クラスターなどのコンピュートターゲットにジョブを送信する、先入れ先出しのキューです。
- Launch agent: キューをポーリングし、そのキュー用に設定されたコンピュートターゲットでジョブを実行するプロセスです。
| 手順 | 通常の実施者 | 詳細 |
|---|---|---|
| Launch queue を作成する | ARIA またはチーム管理者 | 必要な権限とターゲットバックエンドが明確であれば、ARIA はキューの作成を支援できます。チーム管理者権限が必要になる場合があります |
| コンピュートバックエンドを選択またはプロビジョニングする | チームメンバーまたはインフラストラクチャー管理者 | ARIA には、Docker ホスト、Kubernetes クラスター、SageMaker 環境、または Vertex AI 環境へのアクセスが必要です。W&B Launch を通じてすでにアクセス可能でない限り、ARIA がインフラストラクチャーをプロビジョニングすることはできません。 |
| Launch agent を起動する | チームメンバーまたはインフラストラクチャー管理者 | Launch agent は、W&B の認証情報を使用して、マシンまたはクラスター上で継続的に実行されている必要があります。 |
| サービスアカウントまたは APIキーを設定する | チーム管理者 | サービスアカウントキーを作成し、安全に保管します。詳細は, Manage secrets を参照してください。 |
| 実験をキューに送信する | ARIA | キューにアクティブなエージェントがあれば、ARIA はジョブを送信し、設定のオーバーライドを適用して Runs を再起動し、結果をモニターし、失敗をデバッグし、メトリクスを比較できます。 |