エージェントをトレースする

W&B Weave SDK を使用してマルチターンのエージェント型アプリケーションを計装し、エージェントの動作を確認、デバッグ、評価する方法を学びます。このガイドは、エージェントを構築または統合し、会話、ターン、LLM Call、ツール実行を構造化された形で可視化したい開発者を対象としています。 Agents 向けの Weave SDK は、マルチターンのエージェント会話のライフサイクル全体をモデル化します。これには、多数の会話を持つエージェント、ターンをグループ化する会話、ユーザーとエージェントの各やり取り (ターン) 、ターン内の LLM Call、そして LLM によってトリガーされるツール実行が含まれます。トレースは Weave プロジェクトの Agents タブに表示されます。各会話には、ネストされたツール呼び出し、トークン使用量、feedback を含むマルチターンのタイムラインが表示されます。 Weave は、分散トレースのオープン標準である OpenTelemetry (OTel) を基盤としています。各ターン、LLM Call、ツール呼び出しはそれぞれ OTel の スパン (1 つの操作を表す構造化レコード) を生成します。各スパンには、gen_ai.agent.name や gen_ai.conversation.id などの GenAI semantic-convention 属性がタグ付けされます。個々の関数を @weave.op デコレーターで Ops としてトレースしている場合は、代わりに LLM アプリケーションをトレースするを参照してください。

始める前に

使い始めるには、weave パッケージをインストールして project を初期化します。この手順により、チームと project が Weave に登録され、SDK がスパンを UI の正しい場所にルーティングできるようになります。

Python
TypeScript

pip install weave

[YOUR-TEAM] は W&B チーム名に、[YOUR-PROJECT] は W&B のプロジェクト名に置き換えてください。

import weave

weave.init("[YOUR-TEAM]/[YOUR-PROJECT]")

start_conversation()、start_turn()、start_llm()、start_tool()、start_subagent() を呼び出す前に、weave.init() を呼び出してください。トレースが無効になっている場合、または init 呼び出しがない場合、すべてのエージェントトレース関数は何もせずに終了します。そのため、インストルメンテーションは本番コードに残したまま、設定で制御できます。

npm install weave

[YOUR-TEAM] は W&B チーム名に、[YOUR-PROJECT] は W&B のプロジェクト名に置き換えてください。

import * as weave from 'weave';

await weave.init('[YOUR-TEAM]/[YOUR-PROJECT]');

startConversation()、startTurn()、startLLM()、startTool()、startSubagent() を呼び出す前に、weave.init() を呼び出してください。トレースが無効になっている場合、または init 呼び出しがない場合、すべてのエージェントトレース関数は何もせずに終了します。そのため、インストルメンテーションは本番コードに残したまま、設定で制御できます。

エージェントのデータモデル

Weave では、エージェントの動作を 1 対多の関係からなる階層としてモデル化します。各エージェントは複数の会話を持つことができ、各会話は複数のターンを持つことができ、各ターンは複数の LLM Call を持つことができ、各 LLM Call は複数のツール呼び出しをトリガーできます。

概念	Weave SDK クラス	OTel スパンタイプ	説明	参照ページ
エージェント	(no class)	(no スパン, grouped by the `agent_name` 属性)	Agents タブ内のエージェント型アプリケーション。1 つ以上の会話を含みます
会話	`Conversation`	(no スパン, turns are grouped by the `conversation_id` 属性)	1 つ以上のターンを含む会話または run	Python TypeScript
ターン	`Turn`	`invoke_agent`	1 つのユーザーメッセージと、それに対するエージェントの完全な応答	Python TypeScript
LLM Call	`LLM`	`chat`	言語モデル API への 1 回の Call	Python TypeScript
ツール呼び出し	`Tool`	`execute_tool`	LLM の応答によってトリガーされる 1 回のツール呼び出し	Python TypeScript
サブエージェント呼び出し	`SubAgent`	`invoke_agent`	ネストされたエージェント呼び出し。通常は、あるエージェントが別のエージェントに委譲する場合に発生します	Python TypeScript

次の図は、1 つのエージェントに複数の会話が含まれ、1 つの会話に複数のターンが含まれ、その後も同様に続くことを示しています。会話は、親スパンではなく、共有された conversation_id 属性によってターンをグループ化します。そのため、各ターンはそれぞれ独立した OTel トレースを開始します。この設計は、分散トレースと並列実行をサポートします。クライアントは、サーバー側での集約を行わずに、スパンを OTel collector に直接送信します。

Claude Agent SDK や Codex などの SDK やハーネスに Weave を統合するには、エージェントインテグレーションを選択を参照してください。Weave は、エージェント構築 SDK やエージェントハーネスのいくつかに自動でパッチを適用するため、すばやく統合できます。

エージェントのトレース API

以下のセクションでは、各トップレベルのトレース関数と、その関数が受け入れる引数について説明します。これらを使用して、前のセクションで説明したデータモデルの会話、turn、LLM Call、およびツール呼び出しの各レイヤーを計測します。 Weave では、次のトップレベル関数を提供しています。各関数は、コンテキストマネージャーとして動作するオブジェクト (Python では with、TypeScript では try/finally を使用) を返すか、.end() を呼び出して手動で終了できます。

会話を開始する

start_conversation() (Python) または startConversation() (TypeScript) は、すべての子スパンに conversation_id 属性を付与し、ターンが Agents タブでグループ化されるようにします。conversation_id / conversationId を渡す場合は、会話のライフタイム全体で不変である必要があります。同じ ID を再利用すると、既存の会話に新しいターンを追加できます。省略した場合は、SDK が UUID を自動的に生成します。アクティブな会話はコンテキスト (Python の ContextVar または Node.js の AsyncLocalStorage) に格納されるため、同じ非同期コンテキストで実行されるコードであれば、会話オブジェクトを明示的に渡さなくても weave.get_current_conversation() / weave.getCurrentConversation() で取得できます。

Python
TypeScript

conversation = weave.start_conversation(
    agent_name="my-agent",    # オプション: UI でエージェントを識別します。省略すると、会話は名前付きエージェントの下にグループ化されません。
    conversation_id="",       # オプション: ターンをグループ化するための安定した ID。空の場合は自動生成されます。
    model="",                 # オプション: この会話内のターンに使用するデフォルトのモデル。
    conversation_name="",     # オプション: UI に表示される、人が読みやすいラベル。
    include_content=True,     # オプション: False に設定すると、スパンからメッセージ本文を除外します。
    continue_parent_trace=False,  # オプション: 新しいトレースを開始せず、既存の OTel トレースに接続します。
)

const conversation = weave.startConversation({
  agentName: 'my-agent',  // オプション: UI でエージェントを識別します。省略すると、会話は名前付きエージェントの下にグループ化されません。
  conversationId: '',     // オプション: ターンをグループ化するための安定した ID。空の場合は自動生成されます。
  model: '',              // オプション: この会話内のターンに使用するデフォルトのモデル。
});

ターンを開始する

start_turn() (Python) と startTurn() (TypeScript) は、新しい OTel トレースのルートとなる invoke_agent スパンを新しく作成します。Weave は、このスパンを使用して、タイムラインビュー内で 1 回の完全なユーザーとエージェントのやり取りを表現します。呼び出し方法は 2 とおりあります。

トップレベル関数として (weave.start_turn(...) / weave.startTurn(...))。以下の例で示す形式です。コンテキストからアクティブな会話を取得し、その会話 ID を継承します。アクティブな会話がない場合、ターンは conversation_id なしで作成され、ほかのターンとグループ化されません。
参照を保持している会話のインスタンスメソッドとして (conversation.start_turn(...) / conversation.startTurn(...))。コンテキストマネージャーブロック内など、スコープ内に明示的な会話オブジェクトがある場合に便利です。以下の「コンテキストマネージャーまたは try-finally パターン」の例では、この形式を使用しています。両方の SDK の Conversation、Turn、LLM、Tool、SubAgent のリファレンスページへの直接リンクについては、上記のデータモデル表を参照してください。

Python
TypeScript

turn = weave.start_turn(
    user_message="What is the weather in Tokyo?",  # ユーザーの入力テキスト。
    agent_name="my-agent",   # 省略可能: 会話レベルのエージェント名を上書きします。
    model="gpt-4o",          # 省略可能: このターンで使用されるモデル。
)

const turn = weave.startTurn({
  agentName: 'my-agent',  // 省略可能: 会話レベルのエージェント名を上書きします。
  model: 'gpt-4o',        // 省略可能: このターンで使用されるモデル。
});

LLM Call を開始する

start_llm() / startLLM() は、現在のターンの下にネストされた chat span を作成します。Weave はこの span を使用して、Agents ビューに token 使用量、モデル名、入力メッセージと出力メッセージ、および推論を表示します。

Python
TypeScript

llm = weave.start_llm(
    model="gpt-4o",             # モデル識別子。
    provider_name="openai",     # 任意: provider 名。例: "openai"、"anthropic"。下記のメモを参照してください。
    system_instructions=["Be concise."],  # 任意: system prompt の文字列。
)

const llm = weave.startLLM({
  model: 'gpt-4o',          // モデル識別子。
  providerName: 'openai',   // 任意: provider 名。例: "openai"、"anthropic"。下記のメモを参照してください。
});

LLM Call が完了したら、閉じる前にレスポンスデータを llm オブジェクトに割り当ててください。

Python
TypeScript

with weave.start_llm(model="gpt-4o", provider_name="openai") as llm:
    response = openai_client.chat.completions.create(...)
    llm.input_messages = [Message(role="user", content="...")]
    llm.output_messages = [Message(role="assistant", content=response.choices[0].message.content)]
    llm.usage = Usage(
        input_tokens=response.usage.prompt_tokens,
        output_tokens=response.usage.completion_tokens,
    )

const llm = weave.startLLM({ model: 'gpt-4o', providerName: 'openai' });
try {
  const response = await openaiClient.chat.completions.create({ ... });
  llm.record({
    inputMessages: [{ role: 'user', content: '...' }],
    outputMessages: [{ role: 'assistant', content: response.choices[0].message.content ?? '' }],
    usage: {
      inputTokens: response.usage?.prompt_tokens,
      outputTokens: response.usage?.completion_tokens,
    },
  });
} finally {
  llm.end();
}

llm.record() は、inputMessages、outputMessages、usage、reasoning を 1 回の呼び出しで割り当てるためのショートカットです。必要に応じて、各プロパティを個別に設定することもできます。Python SDK では、同じメソッドが llm.record(...) として snake_case のキーワード引数付きで提供されています。

provider_name / providerName は明示的に渡してください。Weave はモデル文字列からこれを推測しません。

ツール呼び出しを開始する

start_tool() / startTool() は execute_tool span を作成します。この span は、コンテキスト内でアクティブな OTel span の子になります (通常は、ツール呼び出しを生成した LLM Call の chat span です) 。

Python
TypeScript

tool = weave.start_tool(
    name="get_weather",                  # LLM に宣言したツール名。
    arguments='{"city": "Tokyo"}',       # ツール引数の JSON 文字列。
    tool_call_id="call_abc123",          # 省略可能: LLM レスポンスのツール呼び出し ID。
)

const tool = weave.startTool({
  name: 'get_weather',            // LLM に宣言したツール名。
  args: '{"city": "Tokyo"}',      // 省略可能: ツール引数の JSON 文字列。
  toolCallId: 'call_abc123',      // 省略可能: LLM レスポンスのツール呼び出し ID。
});

閉じる前にツールの結果を設定します。

Python
TypeScript

with weave.start_tool(name="get_weather", arguments='{"city": "Tokyo"}') as tool:
    result = get_weather_api("Tokyo")
    tool.result = result  # dict、list、または string を受け入れます。自動的に JSON エンコードされます。

const tool = weave.startTool({ name: 'get_weather', args: '{"city": "Tokyo"}' });
try {
  tool.result = await getWeatherApi('Tokyo');
} finally {
  tool.end();
}

エージェントトレースの使用パターン

以下のセクションでは、エージェントコードの構造に応じて、これらの関数をどのように組み合わせるかを説明します。以下の例では、Weave SDK の 2 つのタイプを使用します。

Message (Python · TypeScript) は、会話内の 1 つのエントリ (ユーザー入力、アシスタントの応答、system prompt、または tool の結果) を表します。モデルが受け取った内容を記録するには、メッセージのリストを llm.input_messages / llm.inputMessages に割り当て、生成した内容を記録するには llm.output_messages / llm.outputMessages に割り当てます。
Usage (Python · TypeScript) は、LLM の応答から token 数を取得し、llm.usage に割り当てられます。

Weave はこの両方を使用して、各 LLM Call の入力、出力、token 使用量を Agents ビューに表示します。

コンテキストマネージャーまたは try-finally パターン

ほとんどのエージェントでは、Python ではコンテキストマネージャーパターン、TypeScript では try-finally パターンを使用します。スパンは、例外が発生した場合でも、ブロックの最後でクローズされて送信されます。 Weave はアクティブな会話、ターン、LLM Call をコンテキストに保持するため、ブロック内で呼び出される任意の関数は、親への明示的な参照を持たなくても start_llm() / startLLM() または start_tool() / startTool() を呼び出せます。これは、コードが同じ async コンテキスト内で実行されている限り、モジュール境界をまたいでも機能します。コールスタック内のどこからでも現在アクティブなオブジェクトを取得するには、weave.get_current_conversation() / weave.getCurrentConversation()、weave.get_current_turn() / weave.getCurrentTurn()、および weave.get_current_llm() / weave.getCurrentLLM() を使用します。

Python
TypeScript

import weave
from weave.conversation import Message, Usage

# プレースホルダー関数: 実際の実装に置き換えてください。
def call_openai(*args, **kwargs):
    pass  # 実際の LLM クライアント呼び出しに置き換えてください。

def get_weather_api(city: str) -> str:
    return "24°C, sunny"  # 実際の天気 API 呼び出しに置き換えてください。

weave.init("[YOUR-TEAM]/[YOUR-PROJECT]")

with weave.start_conversation(agent_name="weather-bot") as conversation:
    with conversation.start_turn(user_message="What is the weather in Tokyo?") as turn:

        # 1 回目の LLM Call: ツール呼び出しを返します。
        with weave.start_llm(model="gpt-4o", provider_name="openai") as llm:
            response = call_openai(...)
            llm.input_messages = [Message(role="user", content="What is the weather?")]
            llm.think("User wants weather data, I should call get_weather.")
            llm.output("Let me check the weather for you.")
            llm.usage = Usage(input_tokens=100, output_tokens=20)

            # ツール呼び出し: これをリクエストした LLM Call の子です。
            with weave.start_tool(name="get_weather", arguments='{"city":"Tokyo"}') as tool:
                tool.result = get_weather_api("Tokyo")  # "24°C, sunny" を返します。

        # 2 回目の LLM Call: 最終的な回答を生成します。
        with weave.start_llm(model="gpt-4o", provider_name="openai") as llm:
            llm.input_messages = [Message(role="user", content="What is the weather?")]
            llm.output("It is 24°C and sunny in Tokyo today.")
            llm.usage = Usage(input_tokens=150, output_tokens=30)

import * as weave from 'weave';
import type { Message, Usage } from 'weave';

// プレースホルダー関数: 実際の実装に置き換えてください。
async function getWeatherApi(city: string): Promise<string> {
  return '24°C, sunny';  // 実際の天気 API 呼び出しに置き換えてください。
}

await weave.init('[YOUR-TEAM]/[YOUR-PROJECT]');

const conversation = weave.startConversation({ agentName: 'weather-bot' });
try {
  const turn = conversation.startTurn({ agentName: 'weather-bot' });
  try {
    // 1 回目の LLM Call: ツール呼び出しを返します。
    const llm = weave.startLLM({ model: 'gpt-4o', providerName: 'openai' });
    try {
      llm.inputMessages = [{ role: 'user', content: 'What is the weather?' }];
      llm.think('User wants weather data, I should call get_weather.');
      llm.output('Let me check the weather for you.');
      llm.usage = { inputTokens: 100, outputTokens: 20 };

      // ツール呼び出し: これをリクエストした LLM Call の子です。
      const tool = weave.startTool({ name: 'get_weather', args: '{"city":"Tokyo"}' });
      try {
        tool.result = await getWeatherApi('Tokyo');  // "24°C, sunny" を返します。
      } finally {
        tool.end();
      }
    } finally {
      llm.end();
    }

    // 2 回目の LLM Call: 最終的な回答を生成します。
    const llm2 = weave.startLLM({ model: 'gpt-4o', providerName: 'openai' });
    try {
      llm2.inputMessages = [{ role: 'user', content: 'What is the weather?' }];
      llm2.output('It is 24°C and sunny in Tokyo today.');
      llm2.usage = { inputTokens: 150, outputTokens: 30 };
    } finally {
      llm2.end();
    }
  } finally {
    turn.end();
  }
} finally {
  conversation.end();
}

手動で開始・終了するパターン

with ブロックや try/finally を使用できない場合は、.end() を明示的に使用します。たとえば、スパンの開始と終了が別々の関数呼び出しにまたがる場合や、コルーチンの外で非同期ライフサイクルを管理する場合です。作成したすべてのオブジェクトに対して .end() を呼び出し、スパンが終了して collector に flush されるようにする責任はユーザーにあります。

Python
TypeScript

conversation = weave.start_conversation(agent_name="weather-bot")
turn = conversation.start_turn(user_message="What is the weather?")

llm = weave.start_llm(model="gpt-4o", provider_name="openai")
llm.input_messages = [Message(role="user", content="What is the weather?")]
llm.output("Let me check.")
llm.usage = Usage(input_tokens=100, output_tokens=20)

tool = weave.start_tool(name="get_weather", arguments='{"city": "Tokyo"}')
tool.result = "24°C, sunny"
tool.end()   # end() は冪等です。複数回呼び出しても安全です。

llm.end()

llm2 = weave.start_llm(model="gpt-4o", provider_name="openai")
llm2.output("It is 24°C and sunny in Tokyo.")
llm2.usage = Usage(input_tokens=150, output_tokens=30)
llm2.end()

turn.end()
conversation.end()

const conversation = weave.startConversation({ agentName: 'weather-bot' });
const turn = conversation.startTurn({ agentName: 'weather-bot' });

const llm = weave.startLLM({ model: 'gpt-4o', providerName: 'openai' });
llm.inputMessages = [{ role: 'user', content: 'What is the weather?' }];
llm.output('Let me check.');
llm.usage = { inputTokens: 100, outputTokens: 20 };

const tool = weave.startTool({ name: 'get_weather', args: '{"city": "Tokyo"}' });
tool.result = '24°C, sunny';
tool.end();  // end() は冪等です。複数回呼び出しても安全です。

llm.end();

const llm2 = weave.startLLM({ model: 'gpt-4o', providerName: 'openai' });
llm2.output('It is 24°C and sunny in Tokyo.');
llm2.usage = { inputTokens: 150, outputTokens: 30 };
llm2.end();

turn.end();
conversation.end();

セマンティック規約

Weave SDK は、GenAI semantic conventions および GenAI agent span conventions に準拠する OTel span を出力します。Weave はあらゆる OTel span を受け付け、すべての属性を保存し、クエリできるようにします。標準の OTel span API を Weave のトレースオブジェクトと併用して、span に任意の属性を追加できます。

Weave UI でデータがどのように表示されるか

前述のパターンを使ってエージェントをインストルメントし、実行すると、トレースは Weave プロジェクトの Agents タブ (https://wandb.ai/[YOUR-TEAM]/[YOUR-PROJECT]/weave/agents) に表示されます。

Conversations タブには、すべての会話と、ターンのアクティビティを示すミニマップが表示されます。
Conversation detail view は会話をクリックすると開き、すべてのターン、LLM Call、ツール実行、トークン数、関連付けられたフィードバックが表示されます。

Weave で Agents データを表示する方法の詳細については、エージェントのアクティビティを表示するを参照してください。

スタートガイド

ガイド

クックブック

リファレンス

詳細とサポート

始める前に

エージェントのデータモデル

エージェントのトレース API

会話を開始する

ターンを開始する

LLM Call を開始する

ツール呼び出しを開始する

エージェントトレースの使用パターン

コンテキストマネージャーまたは try-finally パターン

手動で開始・終了するパターン

セマンティック規約

Weave UI でデータがどのように表示されるか

​始める前に

​エージェントのデータモデル

​エージェントのトレース API

​会話を開始する

​ターンを開始する

​LLM Call を開始する

​ツール呼び出しを開始する

​エージェント トレースの使用パターン

​コンテキストマネージャーまたは try-finally パターン

​手動で開始・終了するパターン

​セマンティック規約

​Weave UI でデータがどのように表示されるか

始める前に

エージェントのデータモデル

エージェントのトレース API

会話を開始する

ターンを開始する

LLM Call を開始する

ツール呼び出しを開始する

エージェントトレースの使用パターン

コンテキストマネージャーまたは try-finally パターン

手動で開始・終了するパターン

セマンティック規約

Weave UI でデータがどのように表示されるか