メインコンテンツへスキップ
Weave は、統一された API を通じて複数の AI プロバイダの基盤モデルを提供する AWS のマネージドサービスである Amazon Bedrock 経由の LLM Call を、自動的にトラッキングしてログします。このインテグレーションを使用すると、Bedrock の基盤モデルとのインタラクションや converse API の使用状況を取得し、Bedrock ベースのアプリケーションをデバッグ、評価、モニタリングできます。 Amazon Bedrock から Weave に LLM Call をログする方法は複数あります。weave.op を使用すると、Bedrock モデルへのあらゆる Call をトラッキングする再利用可能な op を作成できます。必要に応じて、Anthropic モデルを使用している場合は、Weave に組み込まれている Anthropic インテグレーションを使用することもできます。
最新のチュートリアルについては、W&B on Amazon Web Services をご覧ください。

トレース

クライアントにパッチを適用すると、Weave は Bedrock API Call のトレースを自動的に収集します。Weave を初期化し、クライアントにパッチを適用したら、その後は通常どおり Bedrock クライアントを使用します:
import weave
import boto3
import json
from weave.integrations.bedrock.bedrock_sdk import patch_client

weave.init("my_bedrock_app")

# Bedrock クライアントを作成してパッチを適用する
client = boto3.client("bedrock-runtime")
patch_client(client)

# 通常どおりクライアントを使用する
response = client.invoke_model(
    modelId="anthropic.claude-3-5-sonnet-20240620-v1:0",
    body=json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 100,
        "messages": [
            {"role": "user", "content": "What is the capital of France?"}
        ]
    }),
    contentType='application/json',
    accept='application/json'
)
response_dict = json.loads(response.get('body').read())
print(response_dict["content"][0]["text"])
同じくパッチを適用したクライアントは、converse API の使用時にもトレースを取得します:
messages = [{"role": "user", "content": [{"text": "What is the capital of France?"}]}]

response = client.converse(
    modelId="anthropic.claude-3-5-sonnet-20240620-v1:0",
    system=[{"text": "You are a helpful AI assistant."}],
    messages=messages,
    inferenceConfig={"maxTokens": 100},
)
print(response["output"]["message"]["content"][0]["text"])

独自のopでCallをラップする

関連するロジックをまとめ、custom inputs を取得し、アプリケーション全体で同じトラッキング対象の関数を再利用できるようにするために、Bedrock の Call を独自のopでラップします。@weave.op() デコレータを使うと、再利用可能なopを作成できます。以下は、invoke_model API と converse API の両方を使用する例です。
@weave.op
def call_model_invoke(
    model_id: str,
    prompt: str,
    max_tokens: int = 100,
    temperature: float = 0.7
) -> dict:
    body = json.dumps({
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": max_tokens,
        "temperature": temperature,
        "messages": [
            {"role": "user", "content": prompt}
        ]
    })

    response = client.invoke_model(
        modelId=model_id,
        body=body,
        contentType='application/json',
        accept='application/json'
    )
    return json.loads(response.get('body').read())

@weave.op
def call_model_converse(
    model_id: str,
    messages: str,
    system_message: str,
    max_tokens: int = 100,
) -> dict:
    response = client.converse(
        modelId=model_id,
        system=[{"text": system_message}],
        messages=messages,
        inferenceConfig={"maxTokens": max_tokens},
    )
    return response
Weave での Bedrock Converse インテグレーション、API call トレース、レスポンスデータ

より簡単に試行錯誤できるように Model を作成する

Weave の Model は、設定と予測ロジックをまとめて扱えるため、パラメーターを調整しながら Runs を並べて比較できます。実験をより整理し、パラメーターを取得しやすくするために、Weave の Model を作成します。次の例では converse API を使用します。
class BedrockLLM(weave.Model):
    model_id: str
    max_tokens: int = 100
    system_message: str = "You are a helpful AI assistant."

    @weave.op
    def predict(self, prompt: str) -> str:
        "Generate a response using Bedrock's converse API"
        
        messages = [{
            "role": "user",
            "content": [{"text": prompt}]
        }]

        response = client.converse(
            modelId=self.model_id,
            system=[{"text": self.system_message}],
            messages=messages,
            inferenceConfig={"maxTokens": self.max_tokens},
        )
        return response["output"]["message"]["content"][0]["text"]

# モデルを作成して使用する
model = BedrockLLM(
    model_id="anthropic.claude-3-5-sonnet-20240620-v1:0",
    max_tokens=100,
    system_message="You are an expert software engineer that knows a lot of programming. You prefer short answers."
)
result = model.predict("What is the best way to handle errors in Python?")
print(result)
この方法を使うと、experiments をバージョン管理し、Bedrock ベースのアプリケーションのさまざまな設定をトラッキングできます。

詳しく見る

以下のリソースでは、Amazon Bedrock を Weave で試したり評価したりするための追加の方法を紹介します。

Weave Playground で Bedrock を試す

設定なしで Weave UI から Amazon Bedrock モデルを試すには、LLM Playground をお試しください。

レポート: Weave で Bedrock 上の LLM をテキスト要約タスクで比較する

Amazon Bedrock 上の LLM を評価する レポートでは、要約タスク向けに LLM を評価・比較するために、Bedrock と Weave を組み合わせて使う方法を説明しています。レポートにはコードサンプルが含まれています。