Model est une combinaison de données (qui peuvent inclure la configuration, les poids d’un modèle entraîné ou d’autres informations) et de code qui définit son fonctionnement. En structurant votre code pour qu’il soit compatible avec cette API, vous bénéficiez d’un cadre structuré pour gérer les versions de votre application et suivre plus systématiquement vos expériences.
Ce guide vous montre comment définir un Model Weave, l’appeler pour capturer les entrées et les sorties, tirer parti de la gestion automatique des versions lorsque votre code ou vos paramètres changent, exposer le modèle via une API locale et étiqueter les appels de production pour les filtrer. Il s’adresse aux développeurs qui créent des applications basées sur des LLM avec Weave et qui veulent une méthode reproductible pour suivre et comparer les itérations de leur application.
- Python
- TypeScript
Pour créer un modèle dans Weave, vous avez besoin des éléments suivants :Vous pouvez appeler le modèle comme d’habitude avec :Cela permet de suivre la configuration du modèle ainsi que les entrées et les sorties chaque fois que vous appelez Après cet appel, vous verrez que vous avez maintenant deux versions de ce modèle dans l’interface utilisateur, chacune avec des appels suivis différents.Pour des instructions supplémentaires, voir serve.
- Une classe qui hérite de
weave.Model - Des définitions de type pour tous les paramètres
- Une fonction
predicttypée avec le décorateur@weave.op()
predict(). Vous disposez maintenant d’un Model Weave versionné qui enregistre chaque prédiction qu’il produit, et sur lequel s’appuient les sections suivantes.Gestion automatique des versions des modèles
Lorsque vous modifiez les paramètres ou le code qui définit votre modèle, Weave journalise ces changements et met à jour la version. Vous pouvez ainsi comparer les prédictions entre différentes versions de votre modèle. Utilisez cette fonctionnalité pour itérer sur les prompts ou essayer un autre LLM, puis comparer les prédictions selon les configurations.Par exemple, vous créez ici un nouveau modèle :Exposer des modèles
Exposer un modèle rend sa fonctionpredict accessible via HTTP, ce qui est utile pour la tester depuis d’autres applications ou la partager avec les membres de votre équipe sans distribuer le code sous-jacent. Pour démarrer un serveur FastAPI pour un modèle Weave, remplacez [MODEL-REF] par la référence de votre modèle et exécutez :