usage que reçoit votre code. Si votre fournisseur affiche un nombre différent sur sa page de facturation, l’écart vient du fournisseur (par exemple, il peut agréger les jetons des fragments de streaming différemment du reporting par appel).
Les estimations de coût de Weave s’appuient sur un tableau de tarification statique
Weave calcule le coût estimé en multipliant le nombre de jetons par les prix par jeton connus pour chaque modèle. Ce tableau est mis à jour périodiquement, mais il peut ne pas refléter immédiatement les changements de tarification du fournisseur. Si un fournisseur a récemment modifié la tarification d’un modèle, l’estimation de Weave sera obsolète jusqu’à la prochaine version du SDK qui mettra à jour le tableau.
Pour vérifier la tarification des modèles utilisée par Weave, consultez la référence de tarification dans le code source de Weave.
Les modèles personnalisés ou affinés peuvent ne pas avoir d’entrée de tarification
Si vous utilisez un modèle affiné ou un ID du modèle qui ne figure pas dans le tableau de tarification de Weave, la colonne de coût affiche — ou $0.00. Vous pouvez voir le nombre de jetons, mais Weave ne peut pas estimer le coût pour les modèles inconnus.
L’échantillonnage réduit le nombre total de jetons capturés
Si vous définissez tracing_sample_rate sur un op, seule une fraction des appels est tracée. Les totaux de jetons dans Weave ne reflètent que les appels échantillonnés, et non votre utilisation complète :
usage tel qu’il est renvoyé par le fournisseur, ce qui devrait refléter la tarification des jetons mis en cache si le fournisseur l’indique dans la réponse. Cependant, le tableau de tarification statique de Weave reflète les prix standard (sans mise en cache) pour chaque catégorie de jetons. Si vous utilisez fortement la mise en cache des prompts, l’écart entre l’estimation de Weave et votre facture réelle peut être plus important.
Les requêtes API par lot peuvent signaler l’utilisation des jetons différemment des requêtes en temps réel ; vérifiez que vos réponses par lot incluent les champs usage standard si vous vous attendez à ce que Weave les capture.
Capture de données Données de trace