Skip to main content
トレーニングプログラムで複数のプロセスを使用する場合、wandb.init() を呼び出していないプロセスから wandb メソッドを呼び出さないようにプログラムを構成してください。 マルチプロセストレーニングを管理するには、以下のいずれかのアプローチを使用します:
  1. 全てのプロセスで wandb.init を呼び出し、group 引数を使用して共有グループを作成します。各プロセスは独自の wandb run を持ち、UI 上でこれらのトレーニングプロセスがグループ化されます。
  2. 1 つのプロセスのみで wandb.init を呼び出し、マルチプロセッシングキュー を介してログに記録するデータを渡します。
Torch DDP を使用したコード例を含む、これらのアプローチの詳細な説明については、Distributed Training Guide を参照してください。