はじめに
weave.init(project=...) を呼び出すだけです。特定の W&B Team 名にログするには、project 引数に team-name/project-name を指定します。デフォルトの team/entity にログする場合は、project-name を指定してください。
callメタデータのトラッキング
weave.attributes コンテキストマネージャーを使用できます。このコンテキストマネージャーを使うと、パイプラインの実行や評価バッチなど、特定のコードブロックに対してカスタムメタデータを設定できます。
トレース
- パイプライン実行の step
- Judge ユニットの評価
- レイヤー変換
- プーリング操作
- カスタムユニットと変換
パイプラインのトレース例
- メインの Pipeline の実行
- Layer 内の各 JudgeUnit の評価
- MeanPoolUnit の集約ステップ
- 各処理のタイミング情報
設定
weave.init() を呼び出すと、Verdict パイプラインのトレースが自動的に有効になります。このインテグレーションは、Pipeline.__init__() method にパッチを適用して、すべての Trace Data を Weave に転送する VerdictTracer を注入することで機能します。
追加の設定は不要です。Weave は自動的に次を行います。
- すべてのパイプライン操作を取得する
- 実行時間をトラッキングする
- inputs と出力をログする
- トレース階層を維持する
- パイプラインの並行実行を処理する
カスタムトレーサーと Weave
VerdictTracer はそれらと併用できます。
Models と評価
weave.Model を使用すると、プロンプト、パイプラインの設定、評価パラメーターなどの実験の詳細を取得して整理できるため、異なるイテレーションを比較しやすくなります。
次の例では、Verdict パイプラインを WeaveModel でラップする方法を示します。
評価
weave.Evaluation クラスを使用すると、特定のタスクやデータセットに対して Verdict パイプラインがどの程度うまく機能しているかを取得できます。