メインコンテンツへスキップ

`AttributeError: module 'wandb' has no attribute ...` のようなエラーを修正するにはどうすればよいですか?

AttributeError: module ‘wandb’ has no attribute ‘init’ や AttributeError: module ‘wandb’ … のようなエラーが発生した場合

sweep 中の `Cuda out of memory` を解決するにはどうすればよいですか?

sweep 中に Cuda out of memory が発生する場合は、プロセスベースの実行を使用するようにコードをリファクタリングしてください。コードを … として書き直してください

wandb を使ってジョブを停止するにはどうすればよいですか?

W&B で計測しているスクリプトを停止するには、Ctrl+D を押します。不要になったトレーニング run をキャンセルするには、この方法を使います。

wandb の run 初期化タイムアウトエラーを解決するにはどうすればよいですか?

run の初期化タイムアウトエラーは、wandb.init() が制限時間内に W&B サービスへの接続を確立できないことを意味します …

wandb がクラッシュした場合、トレーニング run もクラッシュする可能性はありますか?

W&B は別プロセスで実行されるため、W&B がクラッシュしてもトレーニング run は継続します。インターネット障害が発生しても、W&B は再接続を繰り返し …

InitStartError: wandb プロセスとの通信エラー

このエラーは、W&B ライブラリがサーバーにデータを同期するプロセスを起動できないことを示しています。これを解決するには …

UI では私の run の状態が `crashed` になっていますが、マシン上ではまだ実行中です。データを取り戻すにはどうすればよいですか?

この状態は通常、トレーニング中にマシンとの接続が失われたことを意味します。データを復旧するには、wandb sync PATH_ …

Hydra を W&B と一緒に使用すると、プロセスの応答が停止するのはなぜですか?

このページでは、Hydra で W&B と一緒にプロセスを開始したときに発生する、プロセスの応答停止を解決する方法を説明します。 …

分散トレーニングでトレーニングがハングするのはなぜですか?

この記事では、W&B を分散トレーニング フレームワークと一緒に使用したときに発生するトレーニングのハングを解決し、runs を継続して実行できるようにする方法を説明します …

ローカルでは正常にトレーニングしているのに、W&B で run が crashed と表示されるのはなぜですか?

crashed ステータスは通常、接続の問題を示しています。サーバーがインターネット接続を失い、データの同期が停止すると、W&B …

私の run が crashed と表示されるのはなぜですか?

W&B は、プロセスが正常に終了していないにもかかわらず wandb.init() を呼び出したプロセスからのハートビートを受信しなくなると、run を Crashed としてマークします …