spaCy

spaCy は人気のある「産業強度」のNLPライブラリで、迅速かつ高精度なモデルを手間なく利用できます。spaCy v3からは、Weights & Biasesをspacy trainと共に使用することで、あなたのspaCyモデルのトレーニングメトリクスを追跡し、モデルとデータセットの保存とバージョン管理も可能になりました。そして、それには設定にほんの数行追加するだけです。

サインアップしてAPIキーを作成

APIキーは、あなたのマシンをW&Bに認証します。ユーザープロフィールからAPIキーを生成できます。

より簡潔な方法として、https://wandb.ai/authorizeに直接アクセスしてAPIキーを生成することができます。表示されたAPIキーをコピーし、パスワードマネージャーなど安全な場所に保存してください。

右上のユーザープロフィールアイコンをクリック。
ユーザー設定を選択し、APIキーセクションまでスクロール。
表示をクリックし、表示されたAPIキーをコピーします。APIキーを非表示にするには、ページを再読み込みしてください。

`wandb`ライブラリをインストールしてログイン

wandbライブラリをローカルにインストールし、ログインするには:

Command Line
Python
Python notebook

WANDB_API_KEY 環境変数をあなたのAPIキーに設定します。
```
export WANDB_API_KEY=<your_api_key>
```
wandbライブラリをインストールしてログインします。
```
pip install wandb

wandb login
```

pip install wandb

import wandb
wandb.login()

!pip install wandb

import wandb
wandb.login()

`WandbLogger`をspaCyの設定ファイルに追加

spaCyの設定ファイルは、ロギングだけでなく、GPUの割り当て、オプティマイザーの選択、データセットのパスなど、トレーニングのすべての側面を指定するために使用されます。[training.logger]の下に、キー @loggers を 値 “spacy.WandbLogger.v3” で、さらに project_name を指定する必要があります。

spaCyのトレーニング設定ファイルの仕組みや、トレーニングをカスタマイズするために渡すことができるその他のオプションについては、spaCyのドキュメントを参照してください。

[training.logger]
@loggers = "spacy.WandbLogger.v3"
project_name = "my_spacy_project"
remove_config_values = ["paths.train", "paths.dev", "corpora.train.path", "corpora.dev.path"]
log_dataset_dir = "./corpus"
model_log_interval = 1000

名前	説明
`project_name`	`str`型。W&Bプロジェクトの名前。存在しない場合は、自動的にプロジェクトが作成されます。
`remove_config_values`	`List[str]`型。W&Bにアップロードする前に設定から除外する値のリスト。デフォルトは`[]`です。
`model_log_interval`	`Optional int`型。デフォルトは`None`です。設定すると、モデルのバージョン管理がArtifactsとともに有効になります。モデルチェックポイントをログに記録する間隔のステップ数を渡します。デフォルトは`None`です。
`log_dataset_dir`	`Optional str`型。パスを渡すと、トレーニング開始時にデータセットはArtifactsとしてアップロードされます。デフォルトは`None`です。
`entity`	`Optional str`型。指定した場合、run は指定したエンティティで作成されます。
`run_name`	`Optional str`型。指定された場合、run は指定された名前で作成されます。

トレーニングを開始

WandbLoggerをspaCyのトレーニング設定に追加したら、通常通り spacy train を実行できます。

Command Line
Python
Python notebook

python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev

python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev

!python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev

トレーニングが始まると、トレーニングrun のW&Bページへのリンクが出力され、このrun の実験管理ダッシュボードにWeights & BiasesのウェブUIでアクセスできます。

Welcome to W&B

Products

Platform Details

Resources

サインアップしてAPIキーを作成

`wandb`ライブラリをインストールしてログイン

`WandbLogger`をspaCyの設定ファイルに追加

トレーニングを開始

Welcome to W&B

Products

Platform Details

Resources

​サインアップしてAPIキーを作成

​wandbライブラリをインストールしてログイン

​WandbLoggerをspaCyの設定ファイルに追加

​トレーニングを開始

サインアップしてAPIキーを作成

`wandb`ライブラリをインストールしてログイン

`WandbLogger`をspaCyの設定ファイルに追加

トレーニングを開始