メインコンテンツまでスキップ

PaddleOCR

PaddleOCR は、PaddlePaddleで実装されたマルチ言語、優れた、先導的で実用的なOCRツールを作成することを目指しています。PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムをサポートし、産業ソリューションを開発しました。現在、PaddleOCRはW&Bとの統合が可能で、トレーニングと評価のメトリクスとモデルのチェックポイントと対応するメタデータを記録できます。

例:ブログ & Colab

こちらで、ICDAR2015データセットでPaddleOCRを使用してモデルをトレーニングする方法を読むことができます。この内容は、Google ColabこちらのライブW&Bダッシュボードも対応しています。このブログの中国語版はこちらW&B对您的OCR模型进行训练和调试

Weights & BiasesとPaddleOCRを使用する方法

1. W&Bにサインアップしてログインする

こちらで無料アカウントにサインアップし、Python 3 環境でwandbライブラリをインストールしてください。ログインするには、www.wandb.aiでアカウントにサインインしている必要があります。**APIキーは [Authorizeページ](https://wandb.ai/authorize) で見つけることができます。**

pip install wandb
wandb login

2. config.ymlファイルにwandbを追加する

PaddleOCRは、yamlファイルを使用して設定変数を提供する必要があります。以下のスニペットを設定yamlファイルの最後に追加すると、トレーニングと検証のメトリクスとモデルチェックポイントがすべて自動的にW&Bダッシュボードに記録されます。

Global:
use_wandb: True

yamlファイルのwandbヘッダーの下に、wandb.initに渡したい任意の追加引数を追加することもできます。

wandb:  
project: CoolOCR # (任意) これはwandbプロジェクト名です
entity: my_team # (任意) もしwandbチームを使用している場合は、ここにチーム名を入力してください
name: MyOCRModel # (任意) これはwandb runの名前です

3. config.ymlファイルを train.py に渡す

yamlファイルは、PaddleOCRリポジトリで利用可能なトレーニングスクリプトの引数として提供されます。

python tools/train.py -c config.yml

Weights & Biases を有効化した状態で train.py ファイルを実行すると、W&Bダッシュボードにアクセスするためのリンクが生成されます:

テキスト検出モデルのW&Bダッシュボード

フィードバックや問題点は?

Weights & Biases のインテグレーションに関するフィードバックや問題があれば、PaddleOCR GitHub に issue を開いていただくか、support@wandb.com までメールでお問い合わせください。

Was this page helpful?👍👎