メインコンテンツへスキップ
W&B にログした機械学習実験の実行中に、GPU 障害や温度異常などのインフラストラクチャアラートを確認できます。W&B run の実行中、CoreWeave Mission Control がコンピュートインフラストラクチャーを監視します。
この機能はプレビュー版で、CoreWeave クラスターでトレーニングする場合にのみ利用できます。アクセスするには、W&B の担当者にお問い合わせください。
エラーが発生すると、CoreWeave はその情報を W&B に送信します。W&B は、プロジェクトの Workspace 内の run プロットにインフラストラクチャー情報を表示します。CoreWeave は一部の問題を自動的に解決しようとし、W&B はその情報を run ページに表示します。