wandb.init() を呼び出していないプロセスから wandb メソッドを呼び出さないようにプログラムを構成してください。
マルチプロセストレーニングを管理するには、以下のいずれかのアプローチを使用します:
- 全てのプロセスで
wandb.initを呼び出し、group 引数を使用して共有グループを作成します。各プロセスは独自の wandb run を持ち、UI 上でこれらのトレーニングプロセスがグループ化されます。 - 1 つのプロセスのみで
wandb.initを呼び出し、マルチプロセッシングキュー を介してログに記録するデータを渡します。
Torch DDP を使用したコード例を含む、これらのアプローチの詳細な説明については、Distributed Training Guide を参照してください。