分散トレーニングのようなマルチプロセッシングで wandb をどのように使用できますか?

トレーニングプログラムが複数のプロセスを使用する場合、wandb.init() なしでプロセスから wandb メソッド呼び出しを行わないようにプログラムを構築してください。

マルチプロセスのトレーニングを管理するには、以下のアプローチを使用します。

  1. すべてのプロセスで wandb.init を呼び出し、group キーワード引数を使用して共有グループを作成します。各プロセスは独自の wandb run を持ち、UI はトレーニング プロセスを一緒にグループ化します。
  2. ただ一つのプロセスから wandb.init を呼び出し、multiprocessing queues を通じてログ記録するデータを渡します。