PaddleOCR
PaddleOCR は、多言語対応で素晴らしく、最先端で実用的なOCRツールを作成し、ユーザーがより良いモデルをトレーニングし、それを実際に活用することを目指しています。PaddleOCRはOCRに関連するさまざまな最先端のアルゴリズムをサポートし、産業ソリューションを開発しています。現在、PaddleOCRにはWeights & Biasesのインテグレーションが追加されており、トレーニングおよび評価メトリクスをログし、対応するメタデータと一緒にモデルチェックポイントを記録できます。
例: ブログ & Colab
PaddleOCRを使用してICDAR2015データセットでモデルをトレーニングする方法については、こちらのブログをご覧ください。また、Google Colabも用意されており、対応するライブW&Bダッシュボードはこちらで利用できます。このブログの中国語バージョンもこちらにあります: W&B对您的OCR模型进行训练和调试
Weights & BiasesとPaddleOCRの使用
1. サインアップとログイン
無料アカウントにサインアップし、Python 3 環境にwandbライブラリをインストールします。ログインするには、www.wandb.ai でアカウントにサインインする必要があります。次に、認証ページでAPIキーを見つけられます。
- Command Line
- Notebook
pip install wandb
wandb login
!pip install wandb
wandb.login()
2. config.yml
ファイルにwandbを追加
PaddleOCRでは、設定変数をyamlファイルで提供する必要があります。設定yamlファイルの末尾に次のスニペットを追加すると、モデルチェックポイントと一緒にすべてのトレーニングおよびバリデーションメトリクスが自動的にW&Bダッシュボードにログされます:
Global:
use_wandb: True
wandb.init
に渡したいその他の任意の引数は、yamlファイルのwandb
ヘッダーの下に追加できます:
wandb:
project: CoolOCR # (オプション) これはwandbプロジェクト名です
entity: my_team # (オプション) wandbチームを使用している場合は、ここにチーム名を渡すことができます
name: MyOCRModel # (オプション) これはwandb runの名前です
3. config.yml
ファイルをtrain.py
に渡す
yamlファイルは、PaddleOCRリポジトリにあるトレーニングスクリプトに引数として提供されます。
python tools/train.py -c config.yml
Weights & Biasesをオンにしてtrain.py
ファイルを実行すると、W&Bダッシュボードへのリンクが生成されます:
フィードバックや問題がありますか?
Weights & Biasesのインテグレーションに関するフィードバックや問題がありましたら、PaddleOCR GitHubでイシューを作成するか、support@wandb.comまでメールでご連絡ください。