Passer au contenu principal
Cette référence décrit l’API REST Serverless Inference, qui vous permet d’appeler par programmation des modèles fondamentaux depuis vos propres applications. Utilisez-la pour intégrer l’inférence hébergée à des services, scripts ou notebooks, sans avoir à gérer l’infrastructure des modèles.

URL de base

Accédez au service d’Inférence à :
https://api.inference.wandb.ai/v1

Prérequis

Pour appeler l’API d’Inférence, il vous faut :
  • Un compte W&B avec des crédits d’Inférence.
  • Une clé API W&B valide.
Si vous appartenez à plusieurs équipes, ou si vous souhaitez imputer votre utilisation à un projet, vous aurez également besoin des ID d’équipe et de projet. Dans les exemples de code, ils apparaissent sous la forme [YOUR-TEAM]/[YOUR-PROJECT]. Si vous ne les spécifiez pas, W&B utilise votre entité par défaut et le nom du projet inference.

Méthodes disponibles

L’API d’Inférence fournit des endpoints compatibles avec OpenAI pour interagir avec des modèles fondamentaux. Les méthodes suivantes sont disponibles :
  • Chat Completions : Créez des complétions de chat à l’aide de modèles fondamentaux.
  • List Models : Obtenez tous les modèles disponibles et leurs ID.

Authentification

Toutes les requêtes API nécessitent une authentification à l’aide de votre clé API W&B. Créez une clé API sur wandb.ai/settings. Incluez votre clé API dans les en-têtes de la requête :
  • Pour le SDK d’OpenAI, définissez le paramètre api_key.
  • Pour les appels API directs, utilisez Authorization: Bearer [YOUR-API-KEY].

Gestion des erreurs

Pour obtenir la liste complète des codes d’erreur et savoir comment les résoudre, voir Erreurs de l’API.

Étapes suivantes

Après avoir obtenu votre clé API, poursuivez avec l’une des options suivantes :