weave). Pour le SDK Python W&B Models (package wandb), voir Versions du SDK W&B. Les packages publiés et l’historique commit par commit sont disponibles dans les GitHub Releases for wandb/weave.
Ces entrées résument les changements du SDK et du serveur de traces visibles par les utilisateurs, et omettent les détails sur les travaux internes de test, de CI et de refactorisation. Pour chaque modification fusionnée, consultez l’entrée de version GitHub correspondant à ce tag.
Ajouts
- Les intégrations OpenTelemetry suivent les dernières conventions sémantiques.
- Les calculs de coûts et les intégrations de fournisseurs incluent l’utilisation des jetons de cache.
Modifications
- Amélioration des performances de certaines requêtes d’appels grâce à la possibilité d’ignorer une sous-requête imbriquée.
ClassifierMonitorest exporté depuis le packageweavede premier niveau.- L’API des appels accepte un paramètre
queryfacultatif pour un filtrage plus riche.
Correctifs
- Correction du SQL de l’API des résultats d’évaluation pour certaines combinaisons de filtres.
- Correction d’un bug où le SDK TypeScript pouvait supprimer à tort le schéma d’URL de
WANDB_BASE_URL. - Correction d’un bug où des appels avec plusieurs lignes de feedback pouvaient apparaître plusieurs fois dans les résultats de liste.
- Correction de la gestion des horodatages ISO-8601 pour les requêtes adossées à ClickHouse.
- Correction des mutations ClickHouse distribuées qui ajoutaient à tort un suffixe
_localaux noms de tableau. - Correction des spans manquants lors du tracing des flux OpenAI Agents SDK.
- Correction du tracing Google GenAI lorsque les réponses incluent des éléments non textuels.
- Correction de l’assainissement des chemins pour les artefacts de fichiers de traces en mémoire et de la gestion des noms d’hôte des fournisseurs dans les clients HTTP.
Ajouts
- Les requêtes d’appels peuvent résoudre des noms d’utilisateur lisibles par l’humain.
ref.get()fonctionne sans initialiser explicitement le client dans certains flux.- API et chemins de stockage pour les résultats d’évaluation textuels, y compris une meilleure gestion des grands ensembles d’évaluation.
Modifications
- LiteLLM est épinglé pour assurer la compatibilité avec les intégrations groupées.
- Moonshot est disponible comme fournisseur de modèles.
- L’infrastructure sous-jacente de journal à écriture anticipée améliore la durabilité des écritures de traces.
Correctifs
- Correction d’un bug où l’abandon d’un générateur de streaming pouvait faire remonter
GeneratorExità tort. - Correction de la désérialisation lorsque les objets stockés incluent des champs de métadonnées supplémentaires.
- Correction des filtres de feedback lorsqu’un appel comporte plusieurs lignes de feedback.
- Correction du suivi des coûts d’appels adossé à SQLite et de la gestion des
trace_idinvalides dans les upserts par lot. - Amélioration du comportement des migrations ClickHouse, avec notamment de nouvelles tentatives en cas d’erreurs transitoires et un statut de sortie du migrateur plus explicite.
- Correction d’un bug où les exécutions d’évaluation de plus de 1000 appels pouvaient ne pas se charger pour la prédiction et le scoring.
Ajouts
- Prise en charge du journal à écriture anticipée pour l’ingestion des traces.
- Requêtes de statistiques de feedback pour l’analyse des données de feedback.
Modifications
Ref.uripeut être lu comme une propriété (ref.uri) sans appelerref.uri().- Vous pouvez configurer la taille maximale de l’historique de scoring temporisé via des variables d’environnement.
Correctifs
- Correction du transtypage ClickHouse pour les valeurs de filtre numériques négatives.
- Correction des erreurs du moteur de base de données répliqué lors des migrations sur cluster.
- Correction de
DelegatingTraceServerMixin, qui ne relayait pas certaines méthodes deServiceInterface. - Correction des nouvelles tentatives lors de l’appel à l’API W&B pendant
weave.init(). - Correction d’un bug où
EvaluationLoggerpouvait planter lorsqueWEAVE_DISABLEDest défini. - Correction des cas limites de
RefJSONEncoderet de l’instanciation via méthode de classe pour les sous-classes.
Ajouts
- Méthodes du SDK Python et modèles HTTP pour les tags et alias d’objets.
- Instrumentation pour l’API Realtime d’OpenAI, y compris les appels d’outil ainsi que la capture facultative d’audio, de texte et de voix (voir les exemples TypeScript dans les notes de version amont).
Correctifs
- Correction de l’accumulation des complétions de streaming Anthropic dans les traces.
- Correction des requêtes
PUTauthentifiées dansRemoteHTTPTraceServer. - Correction de la gestion des requêtes de coût pour les projections
calls_complete.
Ajouts
- Prise en charge par le serveur de traces des tags et alias sur les objets stockés.
- Intégration de tracing pour Claude Agents.
- Horodatages et métriques de délai avant le premier jeton pour les sessions Realtime.
- Les moniteurs peuvent utiliser des évaluateurs fusionnés.
Modifications
- Amélioration des performances d’OpenTelemetry grâce à un cache inter-requêtes de références d’opération.
Correctifs
- Correction de plusieurs problèmes dans la construction des requêtes de coût, notamment l’échappement des champs internes et les configurations ClickHouse distribuées.
- Correction de la gestion de l’intégration LangChain pour les objets
Runde Pydantic v2. - Correction de cas limites dans les résolveurs de prédiction et d’évaluateur lorsque les entrées ou les métadonnées sont absentes.
- Correction de l’accumulation de texte dans Vertex AI et de la visibilité des threads dans les requêtes
calls_complete.
Ajouts
- API de backfill des scores pour recalculer les scores stockés.
- Suivi des requêtes Gemini dans le SDK TypeScript.
Modifications
- Partitionnement des tables d’appels distribuées par shard selon
trace_idouproject_idafin d’améliorer les performances des requêtes. - Simplification des plans de requête
calls_completepour réduire la latence.
Correctifs
- Correction d’un bug qui empêchait parfois le rendu des médias Gemini dans l’interface Weave.
- Les insertions par lot OpenTelemetry utilisent désormais des insertions asynchrones dans ClickHouse.
- Correction de la gestion de
NO_PROXYdans les clients HTTP. - Correction du nommage entité/équipe dans certains messages d’erreur.
Ajouts
- Les API d’utilisation exposent les métadonnées des appels non terminés.
- Intégration facultative de
python-magicpour une détection MIME plus riche. - Les threads Realtime sont pris en compte dans les synthèses d’utilisation.
- Prise en charge du schéma pour les tags et alias sur les objets Weave.
- API de requête
eval_resultsstructurée pour les tableaux d’évaluation.
Modifications
- Amélioration de l’indexation en stockant les horodatages sous forme de chaînes dans ClickHouse.
- Réduction du travail dupliqué lors de la création par lots de fichiers pendant l’upsert d’appels.
Correctifs
- Correction d’un bug à cause duquel les générateurs ne respectaient pas les taux d’échantillonnage configurés.
- Correction de la mise en mémoire tampon afin que les flux soient vidés immédiatement à la fin d’un appel.
- Correction des erreurs d’index dans les requêtes de tri et de la sérialisation JSON déterministe pour le calcul de l’empreinte.
- Correction des noms d’affichage OpenTelemetry, de la gestion de
make_safe_nameet de la sérialisation LangChain pour les modèles Pydantic.
Ajouts
- Les attributs de ressource OpenTelemetry peuvent transporter des variables W&B de run et de project.
- L’ORM prend en charge les comparaisons
$ltet$lte. - Les projects OpenTelemetry peuvent écrire directement dans la table
calls_complete. - Améliorations de disponibilité générale pour le tracing OpenAI Realtime.
Modifications
- Amélioration des performances des scans de tables et des requêtes de statistiques d’appels.
Correctifs
- Correction du filtrage des appels par ID de thread, y compris les cas où les filtres étaient incorrectement éliminés par optimisation.
- Correction des mises à jour idempotentes de l’état de la file d’annotation.
- Correction d’un bug à cause duquel
weave.finish()ne vidait pas toujours les données client en attente. - Correction du typage de l’itérateur pour
PaginatedIterator, de la préservation des métadonnées deDataset.selectet des requêtes sur des traces volumineuses qui pouvaient épuiser la mémoire.
Ajouts
- API de statistiques d’utilisation, ainsi que les points de terminaison
/trace/usageet/calls/usagepour l’utilisation agrégée. - Indicateur facultatif de mode performance pour les déploiements à haut débit.
- Correctif pour l’analyse structurée Anthropic.
- Les vues enregistrées prennent en charge un champ
column_order.
Modifications
- Amélioration de l’optimisation
PREWHEREpour les requêtes sur cluster distribué.
Correctifs
- Correction d’un bug à cause duquel des insertions ClickHouse échouées pouvaient laisser fuiter des lignes mises en mémoire tampon.
- Correction d’un bug à cause duquel l’importation d’IPython au chargement pouvait ralentir les démarrages à froid.
- Correction des migrations de mutation synchrones, du filtrage de synthèse sur
calls_completeet du surcomptage des jetons Google GenAI. - Correction des spans OpenTelemetry avec moniteurs et de la gestion des téléversements en double pour Google Cloud Storage.
Correctifs
- Suppression de la capture redondante des réponses HTTP dans certaines intégrations.
- Le tracing Google GenAI enregistre désormais les instructions système.
- Le tracing Google GenAI enregistre désormais séparément les jetons de réflexion et les jetons de complétion.
Ajouts
- API utilitaires TypeScript pour travailler avec les prompts dans le SDK Node.
- Le serveur de traces convertit automatiquement et en toute sécurité les charges utiles Base64 lorsque c’est approprié.
- Mises à jour du schéma du classement pour les futures fonctionnalités de comparaison.
- Paramètre
redact_pii_exclude_fieldspour affiner le masquage des PII. - Entrées Audio dans
LLMAsAJudgeScoreret métadonnées d’opération enrichies (types et couleurs) pour les intégrations.
Correctifs
- Correction des caractères non valides qui bloquaient la création d’opérations dans certains cas limites.
- Correction de la gestion des proxys HTTP et HTTPS pour le client HTTPX.
- Correction du tracing imbriqué lors de l’encapsulation de générateurs.
Ajouts
- Fonctions utilitaires de parsing pour les entrées et sorties de l’instrumentation Logfire Pydantic AI.
Correctifs
- Correction de l’ordre non déterministe pour les évaluations sur de grands tableaux.
- Correction des requêtes de coût qui omettaient les jetons d’entrée et de sortie.
- Correction des tables ClickHouse répliquées distribuées, et ajout d’une option de configuration pour contrôler le comportement de vidage de Kafka.
Ajouts
- Les API de streaming de complétion acceptent les prompts et les variables de template.
ObjectRef.from_urireconstruit des objets à partir d’URI Weave.- Le Tracing de l’API OpenAI Responses enregistre les en-têtes
x-request-id. - Prise en charge élargie de l’intégration Bedrock Agents.
- Fonction utilitaire
withAttributesdu SDK TypeScript pour les métadonnées de span.
Correctifs
- Correction d’une fuite de mémoire dans le processeur de Tracing OpenAI Agents.
- Correction d’un bug où les refs pouvaient encore publier lorsque Weave était désactivé.
- Correction du comportement de l’itérateur lors de la migration du code client HTTP de
requestsvershttpx.