Passer au contenu principal

Comment corriger une erreur du type `AttributeError: module 'wandb' has no attribute ...` ?

Si vous rencontrez une erreur du type AttributeError: module ‘wandb’ has no attribute ‘init’ ou AttributeError: module ‘wandb’ …

Comment corriger `Cuda out of memory` pendant un sweep ?

Si vous voyez Cuda out of memory pendant un sweep, remaniez votre code pour utiliser une exécution basée sur des processus. Réécrivez votre code sous la forme d’un …

Comment arrêter un job avec wandb ?

Pour arrêter un script instrumenté avec W&B, appuyez sur Ctrl+D. Utilisez cette méthode pour annuler un run d’entraînement dont vous n’avez plus besoin.

Comment résoudre une erreur de délai d’expiration lors de l’initialisation d’un run dans wandb ?

Une erreur de délai d’expiration lors de l’initialisation d’un run signifie que wandb.init() ne peut pas établir une connexion au service W&B dans le délai imparti …

Si wandb plante, cela peut-il aussi faire planter mon run d’entraînement ?

W&B s’exécute dans un processus distinct, donc si W&B plante, votre run d’entraînement continue. En cas de panne Internet, W&B continue de réessayer …

InitStartError: erreur de communication avec le processus wandb

Cette erreur indique que la bibliothèque W&B ne peut pas lancer le processus qui synchronise les données avec le serveur. Pour résoudre le …

L’état de mon run est `crashed` dans l’UI, mais il est toujours en cours d’exécution sur ma machine. Que faire pour récupérer mes données ?

Cet état signifie généralement que vous avez perdu la connexion à votre machine pendant l’entraînement. Pour récupérer vos données, exécutez wandb sync PATH_ …

Pourquoi mon processus ne répond-il plus lorsque j’utilise Hydra avec W&B ?

Cette page explique comment résoudre les problèmes de processus qui ne répondent plus lorsque vous démarrez un processus avec Hydra en parallèle de W&B. I …

Pourquoi mon entraînement se bloque-t-il avec l’entraînement distribué ?

Cet article vous aide à résoudre les blocages de l’entraînement lorsque vous utilisez W&B avec des frameworks d’entraînement distribué, afin que vos runs puissent st …

Pourquoi un run est-il marqué comme crashed dans W&B alors qu’il s’entraîne correctement en local ?

Un statut crashed indique généralement un problème de connexion. Si le serveur perd l’accès à Internet et que les données cessent d’être synchronisées, W&B …