Prodigy
Prodigy は、機械学習モデルのトレーニングと評価用データの作成、エラー分析、データ検査 & クリーニングのためのアノテーションツールです。W&B Tablesを使用すると、W&B 内でデータセット (およびその他) をログ、可視化、分析、および共有することができます。
W&B integration with Prodigy は、Prodigy でアノテーションを付けたデータセットを、簡単に W&B に直接アップロードして Tables で使用するための機能を追加します。
以下のようなコードを数行実行します:
import wandb
from wandb.integration.prodigy import upload_dataset
with wandb.init(project="prodigy"):
upload_dataset("news_headlines_ner")
すると、以下のような視覚的でインタラクティブかつ共有可能なテーブルが得られます:
クイックスタート
wandb.integration.prodigy.upload_dataset
を使用して、ローカルの Prodigy データベースから W&B の Table 形式に直接アノテーションされた Prodigy データセットをアップロードします。インストールおよびセットアップを含む Prodigy の詳細については、Prodigy documentation をご参照ください。
W&B は、自動的に画像や実体認識フィールドを wandb.Image
および wandb.Html
に変換しようとします。これらの可視化を含むために、結果のテーブルに追加の列が追加されることがあります。
詳細な例を読み解く
W&B Prodigy integration で生成された例の可視化を確認するには、Visualizing Prodigy Datasets Using W&B Tables をご覧ください。
また、spaCy を使用していますか?
W&B には spaCy とのインテグレーションもあります。詳しくは docs here をご覧ください。