Premiers pas
weave.init() au début de votre script. Cela initialise Weave et commence à capturer les traces de tous les appels LlamaIndex qui suivent. L’argument de weave.init() est un nom de projet qui vous aide à organiser vos traces.
Traces
Observabilité en un clic
WeaveCallbackHandler() à llama_index.core.global_handler. Ainsi, si vous utilisez LlamaIndex et Weave, il vous suffit d’initialiser un run Weave avec weave.init([NAME_OF_PROJECT]).
Créez un Model pour faciliter l’expérimentation
weave.Model, vous pouvez capturer et organiser des détails expérimentaux, comme les prompts système ou les modèles que vous utilisez, ce qui vous aide à comparer différentes itérations.
L’exemple suivant montre comment créer un moteur de requête LlamaIndex dans un WeaveModel, à l’aide de données que vous pouvez trouver dans le dossier weave/data :
SimpleRAGPipeline, qui hérite de weave.Model, organise les paramètres importants de ce pipeline RAG. Décorer la méthode query avec weave.op() permet le traçage. Une fois cette structure en place, vous pouvez désormais versionner, comparer et évaluer différentes configurations de votre pipeline RAG dans Weave.
Évaluer avec weave.Evaluation
weave.Evaluation, vous pouvez capturer les performances de votre modèle sur des tâches ou des jeux de données spécifiques, ce qui vous aide à comparer différents modèles et différentes itérations de votre application. L’exemple suivant montre comment évaluer le modèle créé dans la section précédente :
weave.Evaluation, vous avez besoin d’un jeu de données d’évaluation, d’une fonction de scorer et d’un weave.Model. Ces exigences s’appliquent à trois composants clés :
- Les clés des
dictd’échantillons d’évaluation doivent correspondre aux arguments de la fonction de scorer et de la méthodepredictduweave.Model. - Le
weave.Modeldoit avoir une méthode nomméepredict,inferouforward. Vous devez décorer cette méthode avecweave.op()pour le traçage. - La fonction de scorer doit être décorée avec
weave.op()et doit avoiroutputcomme argument nommé.
En intégrant Weave à LlamaIndex, vous pouvez assurer une journalisation et une surveillance complètes de vos applications LLM, ce qui rationalise le débogage et l’optimisation des performances grâce à l’évaluation.