Prise en main
weave.init(project=...) au début de votre script. Utilisez l’argument project pour journaliser vers un nom de Teams W&B spécifique au format team-name/project-name, ou utilisez project-name pour journaliser vers votre équipe ou entité par défaut.
Suivi des métadonnées des appels
weave.attributes. Ce gestionnaire de contexte vous permet de baliser un bloc de code spécifique, comme un run de pipeline ou un lot d’évaluation, afin de pouvoir ensuite filtrer et regrouper les traces associées dans l’interface Weave.
Traces
- Les étapes d’exécution de
Pipeline. - Les évaluations de
JudgeUnit. - Les transformations de
Layer. - Les opérations de pooling.
- Les unités et transformations personnalisées.
Exemple de traçage de pipeline
- L’exécution principale du
Pipeline. - Chaque évaluation de
JudgeUnitau sein de laLayer. - L’étape d’agrégation de
MeanPoolUnit. - Les informations de durée d’exécution pour chaque opération.
Configuration
weave.init(), Weave active automatiquement le traçage pour les pipelines Verdict. L’intégration fonctionne en patchant la méthode Pipeline.__init__() afin d’injecter un VerdictTracer qui transmet toutes les données de trace à Weave.
Vous n’avez besoin d’aucune configuration supplémentaire. Weave effectue automatiquement les actions suivantes :
- Capturer toutes les opérations des pipelines.
- Suivre la durée d’exécution.
- Journaliser les entrées et les sorties.
- Maintenir la hiérarchie des traces.
- Gérer l’exécution concurrente des pipelines.
Traceurs personnalisés et Weave
VerdictTracer de Weave peut être utilisé à leurs côtés afin que vous n’ayez pas à choisir entre les intégrations :
Models et évaluations
weave.Model, vous pouvez capturer et organiser des informations expérimentales telles que les prompts, les configurations de pipeline et les paramètres d’évaluation, ce qui facilite la comparaison des différentes itérations.
L’exemple suivant montre comment encapsuler un pipeline Verdict dans un weave.Model :
Évaluations
weave.Evaluation, vous pouvez capturer le niveau de performance de vos pipelines Verdict sur des tâches ou des jeux de données spécifiques :