PaddleOCR
PaddleOCR は、PaddlePaddleで実装されたマルチ言語、優れた、先導的で実用的なOCRツールを作成することを目指しています。PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムをサポートし、産業ソリューションを開発しました。現在、PaddleOCRはW&Bとの統合が可能で、トレーニングと評価のメトリクスとモデルのチェックポイントと対応するメタデータを記録できます。
例:ブログ & Colab
こちらで、ICDAR2015データセットでPaddleOCRを使用してモデルをトレーニングする方法を読むことができます。この内容は、Google ColabとこちらのライブW&Bダッシュボードも対応しています。このブログの中国語版はこちらW&B对您的OCR模型进行训练和调试。
Weights & BiasesとPaddleOCRを使用する方法
1. W&Bにサインアップしてログインする
こちらで無料アカウントにサインアップし、Python 3 環境でwandbライブラリをインストールしてください。ログインするには、www.wandb.aiでアカウントにサインインしている必要があります。**APIキーは [Authorizeページ](https://wandb.ai/authorize) で見つけることができます。**
- Command Line
- Notebook
pip install wandb
wandb login
!pip install wandb
wandb.login()
2. config.yml
ファイルにwandbを追加する
PaddleOCRは、yamlファイルを使用して設定変数を提供する必要があります。以下のスニペットを設定yamlファイルの最後に追加すると、トレーニングと検証のメトリクスとモデルチェックポイントがすべて自動的にW&Bダッシュボードに記録されます。
Global:
use_wandb: True
yamlファイルのwandb
ヘッダーの下に、wandb.init
に渡したい任意の追加引数を追加することもできます。
wandb:
project: CoolOCR # (任意) これはwandbプロジェクト名です
entity: my_team # (任意) もしwandbチームを使用している場合は、ここにチーム名を入力してください
name: MyOCRModel # (任意) これはwandb runの名前です
3. config.yml
ファイルを train.py
に渡す
yamlファイルは、PaddleOCRリポジトリで利用可能なトレーニングスクリプトの引数として提供されます。
python tools/train.py -c config.yml
Weights & Biases を有効化した状態で train.py
ファイルを実行すると、W&Bダッシュボードにアクセスするためのリンクが生成されます:
フィードバックや問題点は?
Weights & Biases のインテグレーションに関するフィードバックや問題があれば、PaddleOCR GitHub に issue を開いていただくか、support@wandb.com までメールでお問い合わせください。