grid, le contrôleur du balayage attribue chaque combinaison de valeurs d’hyperparamètres une seule fois. Une fois toutes les combinaisons attribuées, aucun nouveau run n’est généré. Si vous avez démarré plusieurs agents simultanément, ils ont peut-être consommé collectivement toutes les configurations avant qu’un agent donné ait terminé son run en cours.
Pour le confirmer : ouvrez la page du balayage dans l’interface utilisateur W&B et comparez le nombre de runs à la taille totale de la grille. S’ils correspondent, le balayage est terminé.
L’option --count limite l’agent
L’exécution de wandb agent --count [COUNT] [SWEEP-ID] indique à l’agent d’accepter au maximum [COUNT] runs avant de quitter. Si vous définissez --count 1, l’agent s’arrête après un seul run. C’est intentionnel avec SLURM et d’autres ordonnanceurs de tâches, mais cela peut surprendre si vous vous attendiez à ce que l’agent continue en boucle.
Supprimez --count (ou augmentez sa valeur) pour permettre à l’agent de continuer à récupérer des runs. Remplacez [SWEEP-ID] par l’ID du balayage affiché dans l’interface utilisateur W&B ou par la valeur renvoyée par wandb.sweep() :
Sweeps Experiments