usage フィールドと同じものです。プロバイダの請求ページで異なる数値が表示される場合、その差異はプロバイダ側にあります (たとえば、Call ごとのレポートではなく、ストリーミング chunk 全体でのトークン集計方法が異なる可能性があります) 。
Weave のコスト推定値は静的な pricing 表を使用します
Weave は、各モデルの既知のトークン単価にトークン数を掛けて推定コストを計算します。この表は定期的に更新されますが、プロバイダの pricing の変更反映が遅れることがあります。プロバイダが最近モデルの pricing を変更した場合、表が更新される次回の SDK リリースまでは、Weave の推定値は古いままになります。
Weave が使用しているモデルの pricing を確認するには、Weave source の pricing referenceを参照してください。
custom モデルまたはファインチューニングしたモデルには pricing エントリがない場合があります
ファインチューニングしたモデル、または Weave の pricing 表に含まれていないモデル ID を使用している場合、コスト列には — または $0.00 が表示されます。トークン数は確認できますが、Weave は不明なモデルのコストを推定できません。
サンプリングにより取得されるトークン総数は減少します
op に tracing_sample_rate を設定すると、トレースされるのは Call の一部だけになります。Weave のトークン合計には、実際の総使用量ではなく、サンプリングされた Call のみが反映されます。
usage オブジェクトをそのまま取得するため、プロバイダがレスポンス内で報告していれば、キャッシュされたトークンの料金も反映されるはずです。ただし、Weave の静的な料金表には、各トークン カテゴリの標準価格 (キャッシュなし) が反映されます。プロンプト キャッシュを多用している場合、Weave の見積もりと実際の請求額との差が大きくなる可能性があります。
バッチ API リクエストでは、リアルタイム リクエストとは異なる形でトークン使用量が報告されることがあります。Weave に取得されることを想定している場合は、バッチ応答に標準の usage フィールドが含まれていることを確認してください。
データ取得 トレースデータ