W&B Weave

W&B Weave は、エージェントと LLM アプリケーションのトラッキング、評価、改善を支援する可観測性および評価のプラットフォームです。Weave を使うと、次のことができます。

エージェントをトレースし、メトリクスを収集する Weave OTel-compatible SDK を使用して一般的な SDK やハーネスで構築された
アプリケーションの LLM Call や任意の関数を手動でインストルメントすることで、アプリケーションをトレースし、バージョン管理し、feedback を収集する
LLM ジャッジモデルと custom scorers を使って、エージェントまたはアプリケーションの応答を評価する

はじめに

ワークロードのタイプを選択してから、以下のドキュメントを使って Weave のツールスイートの基本的な使い方を確認してください。ワークロードの違いの詳細については、Weave とは？をご覧ください。

エージェント SDK またはハーネス向けの組み込みインテグレーションを選択し、Agents ビューでセッション、ターン、LLM Call、ツール呼び出しのトレースを開始します。

Weave SDK を使用してカスタムのマルチターンエージェントをトレースし、セッション、LLM Call、ツール呼び出しを OpenTelemetry のスパンとして取得します。

LLM への基本的な呼び出しをトレースし、入力、出力、コードを W&B アカウントで確認します。

W&B Weave は、Python と TypeScript のライブラリを提供しています。Weave ライブラリをインストールするには、次のコマンドを実行します。

pip install weave

npm install weave

Weave ライブラリの利用を開始するには、Weights & Biases (W&B) アカウントを作成し、User Settings で APIキーを作成します。APIキーを使用すると、W&B アカウントに認証してデータの送信を開始できます。