前提条件
W&B Python SDK をインストール
pip を使用してインストールできます。
W&B にログインして認証する
wandb login CLI コマンドを実行し、表示される案内に従って W&B アカウントにログインします。
wandb login のリファレンスドキュメントを参照してください。
トレーニング スクリプトと依存関係をコピーする
PyTorch トレーニングモデルスクリプト
PyTorch トレーニングモデルスクリプト
以下のコードを 以下のコードを 以下のコードを
requirements.txt という名前のファイルにコピー&ペーストしてください。このファイルには、トレーニングスクリプトに必要な依存関係が含まれています。requirements.txt
hyperparameters.yaml という名前の YAML ファイルにコピー&ペーストしてください。このファイルには、トレーニングスクリプトのハイパーパラメーターが含まれています。hyperparameters.yaml
train.py という名前のファイルにコピー&ペーストしてください。このスクリプトは、UCI Zoo データセットでシンプルな PyTorch モデルをトレーニングし、トレーニング済みのモデルを zoo_wandb.pth という名前のファイルに保存します。train.py
サンドボックスを作成してトレーニングスクリプトを実行する
train.py、requirements.txt、hyperparameters.yaml と同じディレクトリに保存してください。
train_in_sandbox.py
- (6〜9行目) サンドボックスにマウントするファイル (
train.pyとrequirements.txt) を指定します。 - (12行目) サンドボックスを起動します。サンドボックスは、
python:3.13コンテナーイメージを使用し、インターネットアクセスを有効にし、最大有効期間を 3600 秒 (1 時間) に設定しています。 - (18行目)
hyperparameters.yamlファイルをサンドボックスに書き込みます。これにより、トレーニングスクリプト (train.py) の実行時にハイパーパラメーターへアクセスできるようになります。 - (22行目) 依存関係をインストールします。サンドボックス内で
pip install -r requirements.txtコマンドを実行し、トレーニングスクリプトに必要な依存関係をインストールします。 - (26行目) トレーニングスクリプトを実行します。サンドボックス内で
python train.py --config hyperparameters.yamlコマンドを実行して、トレーニングを開始します。このスクリプトは UCI Zoo データセットで PyTorch モデルをトレーニングし、トレーニング済みのモデルをzoo_wandb.pthという名前のファイルに保存します。 - (27〜29行目) 出力と終了コードを表示します。トレーニングスクリプトの実行完了後、デバッグと検証のために、標準出力、標準エラー出力、終了コードをコンソールに表示します。
- (33〜34行目) 生成されたモデルファイルをダウンロードします。
read_file()メソッドを使用してサンドボックスからzoo_wandb.pthファイルを読み取り、ローカルに保存します。