> ## Documentation Index > Fetch the complete documentation index at: https://docs.wandb.ai/llms.txt > Use this file to discover all available pages before exploring further. > Intégrez W&B à Metaflow pour suivre les expériences et gérer les flux de travail de machine learning avec la journalisation automatique des métriques et des artifacts. # Metaflow

## Aperçu

[Metaflow](https://docs.metaflow.org) est un framework créé par Netflix pour créer et exécuter des flux de travail de ML. Cette intégration permet aux utilisateurs d’appliquer des décorateurs aux [étapes et flows](https://docs.metaflow.org/metaflow/basics) Metaflow afin d’enregistrer automatiquement les paramètres et les artifacts dans W\&B. * Décorer une étape permet d’activer ou de désactiver l’enregistrement pour certains types au sein de cette étape. * Décorer le flow permet d’activer ou de désactiver l’enregistrement pour chaque étape du flow.

## Démarrage rapide

Une clé API authentifie votre machine auprès de W\&B. Vous pouvez générer une clé API depuis votre profil. Pour une méthode plus directe, accédez aux [Paramètres utilisateur](https://wandb.ai/settings) et créez une clé API. Copiez immédiatement la clé API et conservez-la dans un endroit sûr, par exemple dans un gestionnaire de mots de passe. 1. Cliquez sur l’icône de votre profil en haut à droite. 2. Sélectionnez **Paramètres utilisateur**, puis faites défiler jusqu’à la section **API Keys**.

### Installez la bibliothèque `wandb` et connectez-vous

Pour installer la bibliothèque `wandb` en local et vous connecter : Pour `wandb` version 0.19.8 ou antérieure, installez `fastcore` version 1.8.0 ou antérieure (`fastcore<1.8.0`) au lieu de `plum-dispatch`. 1. Définissez la [variable d'environnement](/fr/models/track/environment-variables/) `WANDB_API_KEY` sur votre clé API. ```bash theme={null} export WANDB_API_KEY= ``` 2. Installez la bibliothèque `wandb` et connectez-vous. ```shell theme={null} pip install -Uqqq metaflow "plum-dispatch<3.0.0" wandb wandb login ``` ```bash theme={null} pip install -Uqqq metaflow "plum-dispatch<3.0.0" wandb ``` ```python theme={null} import wandb wandb.login() ``` ```notebook theme={null} !pip install -Uqqq metaflow "plum-dispatch<3.0.0" wandb import wandb wandb.login() ```

### Décorez vos flows et vos étapes

Décorer une étape active ou désactive la journalisation pour certains types au sein de cette étape. Dans cet exemple, tous les jeux de données et modèles de `start` seront enregistrés. ```python theme={null} from wandb.integration.metaflow import wandb_log class WandbExampleFlow(FlowSpec): @wandb_log(datasets=True, models=True, settings=wandb.Settings(...)) @step def start(self): self.raw_df = pd.read_csv(...). # pd.DataFrame -> téléverser comme jeu de données self.model_file = torch.load(...) # nn.Module -> téléverser comme modèle self.next(self.transform) ``` Décorer un flow revient à décorer toutes les étapes qui le composent avec une configuration par défaut. Dans ce cas, toutes les étapes de `WandbExampleFlow` enregistrent par défaut les jeux de données et les modèles, comme si chaque étape était décorée avec `@wandb_log(datasets=True, models=True)`. ```python theme={null} from wandb.integration.metaflow import wandb_log @wandb_log(datasets=True, models=True) # décorer tous les @step class WandbExampleFlow(FlowSpec): @step def start(self): self.raw_df = pd.read_csv(...). # pd.DataFrame -> téléverser comme jeu de données self.model_file = torch.load(...) # nn.Module -> téléverser comme modèle self.next(self.transform) ``` Décorer le flow revient à décorer toutes les étapes avec une configuration par défaut. Cela signifie que si vous décorez ensuite une étape avec un autre `@wandb_log`, celui-ci remplace la décoration définie au niveau du flow. Dans cet exemple : * `start` et `mid` enregistrent à la fois les jeux de données et les modèles. * `end` n'enregistre ni jeux de données ni modèles. ```python theme={null} from wandb.integration.metaflow import wandb_log @wandb_log(datasets=True, models=True) # équivaut à décorer start et mid class WandbExampleFlow(FlowSpec): # cette étape enregistrera les jeux de données et les modèles @step def start(self): self.raw_df = pd.read_csv(...). # pd.DataFrame -> téléverser comme jeu de données self.model_file = torch.load(...) # nn.Module -> téléverser comme modèle self.next(self.mid) # cette étape enregistrera également les jeux de données et les modèles @step def mid(self): self.raw_df = pd.read_csv(...). # pd.DataFrame -> téléverser comme jeu de données self.model_file = torch.load(...) # nn.Module -> téléverser comme modèle self.next(self.end) # cette étape est redéfinie et n'enregistrera PAS les jeux de données NI les modèles @wandb_log(datasets=False, models=False) @step def end(self): self.raw_df = pd.read_csv(...). self.model_file = torch.load(...) ```

## Accédez à vos données par programmation

Vous pouvez accéder aux informations que nous avons collectées de trois façons : dans le processus Python d’origine en cours d’enregistrement à l’aide de la [bibliothèque cliente `wandb`](/fr/models/ref/python/), via l’[interface de l’application web](/fr/models/track/workspaces/), ou par programmation à l’aide de [notre API publique](/fr/models/ref/python/public-api/). Les `Parameter`s sont enregistrés dans le [`config`](/fr/models/) de W\&B et sont disponibles dans l’[onglet Vue d’ensemble](/fr/models/runs/#overview-tab). Les `datasets`, `models` et `others` sont enregistrés dans [W\&B Artifacts](/fr/models/artifacts/) et sont disponibles dans l’[onglet Artifacts](/fr/models/runs/#artifacts-tab). Les types Python de base sont enregistrés dans le dict [`summary`](/fr/models/) de W\&B et sont disponibles dans l’onglet Vue d’ensemble. Voir notre [guide de l’API publique](/fr/models/track/public-api-guide/) pour en savoir plus sur l’utilisation de l’API afin d’obtenir ces informations par programmation depuis l’extérieur.

### Référence rapide

| Données | Bibliothèque cliente | UI | | -------------------------------------------------- | --------------------------------------------- | ------------------------------ | | `Parameter(...)` | `wandb.Run.config` | onglet Vue d’ensemble, Config | | `datasets`, `models`, `others` | `wandb.Run.use_artifact("{var_name}:latest")` | onglet Artifacts | | Types Python de base (`dict`, `list`, `str`, etc.) | `wandb.Run.summary` | onglet Vue d’ensemble, Summary |

### Arguments de `wandb_log`

| kwarg | Options | | ---------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | | `datasets` |

True: Journaliser les variables d’instance correspondant à un jeu de données
False

| | `models` |

True: Journaliser les variables d’instance correspondant à un modèle
False

| | `others` |

True: Journaliser tout autre élément sérialisable avec pickle
False

| | `settings` |

wandb.Settings(...): Spécifiez vos propres paramètres wandb pour cette étape ou ce flow
None: Équivaut à passer wandb.Settings()

Par défaut, si :

settings.run\_group vaut None, il sera défini sur \{flow\_name}/\{run\_id}
settings.run\_job\_type vaut None, il sera défini sur \{run\_job\_type}/\{step\_name}

## Questions fréquentes

### Qu’enregistrez-vous exactement ? Enregistrez-vous toutes les variables d’instance et les variables locales ?

`wandb_log` enregistre uniquement les variables d’instance. Les variables locales ne sont JAMAIS enregistrées. Cela permet d’éviter d’enregistrer des données inutiles.

### Quels types de données sont enregistrés ?

Nous prenons actuellement en charge les types suivants : | Paramètre de journalisation | Type | | ---------------------------- | ---------------------------------------------------------------------------------------------------------------------------- | | par défaut (toujours activé) |

dict, list, set, str, int, float, bool

| | `datasets` |

pd.DataFrame
pathlib.Path

| | `models` |

nn.Module
sklearn.base.BaseEstimator

| | `others` |

Tout ce qui est sérialisable avec pickle et en JSON

### Comment puis-je configurer le comportement de journalisation ?

| Type de variable | comportement | Exemple | Type de données | | ---------------- | ---------------------------------- | --------------- | --------------- | | Instance | Enregistré automatiquement | `self.accuracy` | `float` | | Instance | Enregistré si `datasets=True` | `self.df` | `pd.DataFrame` | | Instance | Non enregistré si `datasets=False` | `self.df` | `pd.DataFrame` | | Locale | Jamais enregistré | `accuracy` | `float` | | Locale | Jamais enregistré | `df` | `pd.DataFrame` |

### La traçabilité des artifacts est-elle prise en charge ?

Oui. Si vous avez un artifact qui est la sortie de l’étape A et l’entrée de l’étape B, nous construisons automatiquement le DAG de traçabilité pour vous. Pour voir un exemple de ce comportement, consultez ce [notebook](https://colab.research.google.com/drive/1wZG-jYzPelk8Rs2gIM3a71uEoG46u_nG#scrollTo=DQQVaKS0TmDU) et la [page W\&B Artifacts correspondante](https://wandb.ai/megatruong/metaflow_integration/artifacts/dataset/raw_df/7d14e6578d3f1cfc72fe/graph)