分散トレーニングのようなマルチプロセッシングで wandb をどのように使用できますか?
Support:
less than a minute
トレーニングプログラムが複数のプロセスを使用する場合、wandb.init()
なしでプロセスから wandb メソッド呼び出しを行わないようにプログラムを構築してください。
マルチプロセスのトレーニングを管理するには、以下のアプローチを使用します。
- すべてのプロセスで
wandb.init
を呼び出し、group キーワード引数を使用して共有グループを作成します。各プロセスは独自の wandb run を持ち、UI はトレーニング プロセスを一緒にグループ化します。 - ただ一つのプロセスから
wandb.init
を呼び出し、multiprocessing queues を通じてログ記録するデータを渡します。
これらのアプローチの詳細な説明と、Torch DDP のコード例を含む 分散トレーニングガイド を参照してください。
フィードバック
このページは役に立ちましたか?
Glad to hear it! If you have further feedback, please let us know.
Sorry to hear that. Please tell us how we can improve.