spacy trainと共に使用することで、あなたのspaCyモデルのトレーニングメトリクスを追跡し、モデルとデータセットの保存とバージョン管理も可能になりました。そして、それには設定にほんの数行追加するだけです。
サインアップしてAPIキーを作成
APIキーは、あなたのマシンをW&Bに認証します。ユーザープロフィールからAPIキーを生成できます。より簡潔な方法として、https://wandb.ai/authorizeに直接アクセスしてAPIキーを生成することができます。表示されたAPIキーをコピーし、パスワードマネージャーなど安全な場所に保存してください。
- 右上のユーザープロフィールアイコンをクリック。
- ユーザー設定を選択し、APIキーセクションまでスクロール。
- 表示をクリックし、表示されたAPIキーをコピーします。APIキーを非表示にするには、ページを再読み込みしてください。
wandbライブラリをインストールしてログイン
wandbライブラリをローカルにインストールし、ログインするには:
- Command Line
- Python
- Python notebook
-
WANDB_API_KEY環境変数 をあなたのAPIキーに設定します。 -
wandbライブラリをインストールしてログインします。
WandbLoggerをspaCyの設定ファイルに追加
spaCyの設定ファイルは、ロギングだけでなく、GPUの割り当て、オプティマイザーの選択、データセットのパスなど、トレーニングのすべての側面を指定するために使用されます。[training.logger]の下に、キー @loggers を 値 “spacy.WandbLogger.v3” で、さらに project_name を指定する必要があります。
spaCyのトレーニング設定ファイルの仕組みや、トレーニングをカスタマイズするために渡すことができるその他のオプションについては、spaCyのドキュメントを参照してください。
| 名前 | 説明 |
|---|---|
project_name | str型。W&Bプロジェクトの名前。存在しない場合は、自動的にプロジェクトが作成されます。 |
remove_config_values | List[str]型。W&Bにアップロードする前に設定から除外する値のリスト。デフォルトは[]です。 |
model_log_interval | Optional int型。デフォルトはNoneです。設定すると、モデルのバージョン管理がArtifactsとともに有効になります。モデルチェックポイントをログに記録する間隔のステップ数を渡します。デフォルトはNoneです。 |
log_dataset_dir | Optional str型。パスを渡すと、トレーニング開始時にデータセットはArtifactsとしてアップロードされます。デフォルトはNoneです。 |
entity | Optional str型。指定した場合、run は指定したエンティティで作成されます。 |
run_name | Optional str型。指定された場合、run は指定された名前で作成されます。 |
トレーニングを開始
WandbLoggerをspaCyのトレーニング設定に追加したら、通常通り spacy train を実行できます。
- Command Line
- Python
- Python notebook