weave serve, afin de pouvoir interroger le modèle de manière interactive et l’intégrer dans des flux de travail d’inférence en production.
Pour démarrer un serveur FastAPI pour n’importe quel Weave Model, transmettez la référence Weave à weave serve. Remplacez [REF] par la référence de votre Weave Model.
http://0.0.0.0:9996/docs.
Installer FastAPI
weave serve utilise FastAPI et Uvicorn pour héberger le modèle. Vous devez donc installer ces deux packages avant de le mettre en service.
Mettre un modèle en service
[YOUR-MODEL-REF] par la référence de votre Weave Model.
[ENTITY] correspond à votre entité W&B, [PROJECT-NAME] au nom de votre projet, [MODEL-NAME] au nom du modèle et [HASH] au hachage de version du modèle :
predict, puis sur Try it out. Vous disposez maintenant d’un point de terminaison FastAPI local qui renvoie les prédictions de votre Weave Model.