メインコンテンツまでスキップ

PaddleOCR

PaddleOCR は、多言語対応で素晴らしく、最先端で実用的なOCRツールを作成し、ユーザーがより良いモデルをトレーニングし、それを実際に活用することを目指しています。PaddleOCRはOCRに関連するさまざまな最先端のアルゴリズムをサポートし、産業ソリューションを開発しています。現在、PaddleOCRにはWeights & Biasesのインテグレーションが追加されており、トレーニングおよび評価メトリクスをログし、対応するメタデータと一緒にモデルチェックポイントを記録できます。

例: ブログ & Colab

PaddleOCRを使用してICDAR2015データセットでモデルをトレーニングする方法については、こちらのブログをご覧ください。また、Google Colabも用意されており、対応するライブW&Bダッシュボードはこちらで利用できます。このブログの中国語バージョンもこちらにあります: W&B对您的OCR模型进行训练和调试

Weights & BiasesとPaddleOCRの使用

1. サインアップとログイン

無料アカウントにサインアップし、Python 3 環境にwandbライブラリをインストールします。ログインするには、www.wandb.ai でアカウントにサインインする必要があります。次に、認証ページでAPIキーを見つけられます。

pip install wandb

wandb login

2. config.ymlファイルにwandbを追加

PaddleOCRでは、設定変数をyamlファイルで提供する必要があります。設定yamlファイルの末尾に次のスニペットを追加すると、モデルチェックポイントと一緒にすべてのトレーニングおよびバリデーションメトリクスが自動的にW&Bダッシュボードにログされます:

Global:
use_wandb: True

wandb.initに渡したいその他の任意の引数は、yamlファイルのwandbヘッダーの下に追加できます:

wandb:  
project: CoolOCR # (オプション) これはwandbプロジェクト名です
entity: my_team # (オプション) wandbチームを使用している場合は、ここにチーム名を渡すことができます
name: MyOCRModel # (オプション) これはwandb runの名前です

3. config.ymlファイルをtrain.pyに渡す

yamlファイルは、PaddleOCRリポジトリにあるトレーニングスクリプトに引数として提供されます。

python tools/train.py -c config.yml

Weights & Biasesをオンにしてtrain.pyファイルを実行すると、W&Bダッシュボードへのリンクが生成されます:

W&Bダッシュボード テキスト検出モデル

フィードバックや問題がありますか?

Weights & Biasesのインテグレーションに関するフィードバックや問題がありましたら、PaddleOCR GitHubでイシューを作成するか、support@wandb.comまでメールでご連絡ください。

Was this page helpful?👍👎