Guide de l’interface utilisateur

Découvrez comment utiliser le service Serverless Inference dans l’interface utilisateur web. Ce guide explique comment accéder au service, essayer des modèles dans le Playground, les comparer côte à côte et suivre la facturation et l’utilisation. Utilisez l’interface utilisateur si vous souhaitez tester des modèles de manière interactive sans écrire de code. Avant d’utiliser l’interface utilisateur, suivez les prérequis.

Accéder au service d’Inférence

Les sections suivantes décrivent trois façons d’accéder au service d’Inférence. Choisissez le point d’entrée le mieux adapté à votre flux de travail actuel.

Lien direct

Accédez à https://wandb.ai/inference.

Depuis l’onglet Inférence

Accédez à votre compte W&B sur https://wandb.ai/.
Sélectionnez Inférence dans la barre latérale du projet. Une page s’affiche avec les modèles disponibles et leurs informations.

Utilisation d’un modèle d’inférence dans le playground

Depuis l’onglet Playground

Sélectionnez Playground dans la barre latérale du projet. L’interface de chat du Playground s’affiche.
Survolez Serverless Inference dans la liste déroulante des LLM. Un menu déroulant affichant les modèles disponibles apparaît à droite.
Dans la liste déroulante des modèles, vous pouvez :
- Cliquer sur le nom de n’importe quel modèle pour l’essayer dans le Playground.
- Comparer plusieurs modèles

La liste déroulante des modèles d’Inférence dans Playground

Tester un modèle dans le Playground

Après avoir sélectionné un modèle, vous pouvez le tester dans le playground afin d’évaluer ses réponses et d’ajuster son comportement avant de l’intégrer ailleurs. Les actions disponibles sont les suivantes :

Comparer plusieurs modèles

Vous pouvez comparer des modèles d’Inférence côte à côte dans le Playground pour évaluer la qualité, la latence et le style de sortie pour un même prompt. Accédez à la vue Compare à partir de deux endroits, décrits dans les sections suivantes.

Depuis l’onglet Inférence

Sélectionnez Inférence dans la barre latérale du projet. La page des modèles disponibles s’affiche.
Cliquez n’importe où sur une carte de modèle (sauf sur le nom du modèle) pour la sélectionner. La carte est mise en surbrillance pour indiquer qu’elle est sélectionnée.
Répétez l’opération pour chaque modèle que vous souhaitez comparer.
Cliquez sur Comparer [N] modèles dans le Playground sur n’importe quelle carte sélectionnée, où [N] correspond au nombre de modèles que vous avez sélectionnés. La vue de comparaison s’ouvre.

Vous pouvez maintenant comparer les modèles et utiliser toutes les fonctionnalités de Tester un modèle dans le Playground.

Sélection de plusieurs modèles à comparer dans le Playground

Depuis l’onglet Playground

Sélectionnez Playground dans la barre latérale du projet. L’interface de chat du Playground s’affiche.
Survolez Serverless Inference dans la liste déroulante des LLM. La liste déroulante des modèles s’affiche à droite.
Sélectionnez Compare dans la liste déroulante. L’onglet Inférence s’affiche.
Cliquez n’importe où sur une carte de modèle (sauf sur le nom du modèle) pour la sélectionner. La carte est mise en surbrillance pour indiquer qu’elle est sélectionnée.
Répétez l’opération pour chaque modèle que vous souhaitez comparer.
Cliquez sur Comparer [N] modèles dans le Playground sur n’importe quelle carte sélectionnée. La vue de comparaison s’ouvre.

Vous pouvez maintenant comparer des modèles et utiliser toutes les fonctionnalités de Tester un modèle dans le Playground.

Voir les informations de facturation et d’utilisation

Les administrateurs de l’organisation peuvent suivre le solde de crédits, l’historique d’utilisation et les prochaines factures dans l’interface W&B. Utilisez cette vue pour surveiller les dépenses et prévoir les prochains frais.

Accédez à la page Billing de W&B dans l’interface.
Repérez la carte d’informations de facturation Inférence.
Vous pouvez ensuite :
- Cliquer sur View usage pour voir l’évolution de votre utilisation au fil du temps.
- Consulter les prochains frais d’inférence (pour les plans payants).

Consultez la page de tarification de l’inférence pour connaître le détail des tarifs par modèle.

Étapes suivantes

Consultez les modèles disponibles pour trouver celui qui correspond le mieux à vos besoins.
Essayez l’API pour y accéder par programmation.
Consultez les exemples d’utilisation pour voir des exemples de code.

Paramètres de réponse

Tutoriels

Référence de l’API

Accéder au service d’Inférence

Lien direct

Depuis l’onglet Inférence

Depuis l’onglet Playground

Tester un modèle dans le Playground

Comparer plusieurs modèles

Depuis l’onglet Inférence

Depuis l’onglet Playground

Voir les informations de facturation et d’utilisation

Étapes suivantes

​Accéder au service d’Inférence

​Lien direct

​Depuis l’onglet Inférence

​Depuis l’onglet Playground

​Tester un modèle dans le Playground

​Comparer plusieurs modèles

​Depuis l’onglet Inférence

​Depuis l’onglet Playground

​Voir les informations de facturation et d’utilisation

​Étapes suivantes

Accéder au service d’Inférence

Lien direct

Depuis l’onglet Inférence

Depuis l’onglet Playground

Tester un modèle dans le Playground

Comparer plusieurs modèles

Depuis l’onglet Inférence

Depuis l’onglet Playground

Voir les informations de facturation et d’utilisation

Étapes suivantes