> ## Documentation Index
> Fetch the complete documentation index at: https://docs.wandb.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# PyTorch

> Intégrez W&B à PyTorch pour le suivi des expériences, la gestion des versions des jeux de données et l’enregistrement des métriques, des gradients et des modèles.

export const ColabLink = ({url}) => <a href={url} target="_blank" rel="noopener noreferrer" className="colab-link">
    <svg width="20" height="20" viewBox="0 0 24 24" fill="currentColor" xmlns="http://www.w3.org/2000/svg">
      <path d="M14.25.18l.9.2.73.26.59.3.45.32.34.34.25.34.16.33.1.3.04.26.02.2-.01.13V8.5l-.05.63-.13.55-.21.46-.26.38-.3.31-.33.25-.35.19-.35.14-.33.1-.3.07-.26.04-.21.02H8.77l-.69.05-.59.14-.5.22-.41.27-.33.32-.27.35-.2.36-.15.37-.1.35-.07.32-.04.27-.02.21v3.06H3.17l-.21-.03-.28-.07-.32-.12-.35-.18-.36-.26-.36-.36-.35-.46-.32-.59-.28-.73-.21-.88-.14-1.05-.05-1.23.06-1.22.16-1.04.24-.87.32-.71.36-.57.4-.44.42-.33.42-.24.4-.16.36-.1.32-.05.24-.01h.16l.06.01h8.16v-.83H6.18l-.01-2.75-.02-.37.05-.34.11-.31.17-.28.25-.26.31-.23.38-.2.44-.18.51-.15.58-.12.64-.1.71-.06.77-.04.84-.02 1.27.05zm-6.3 1.98l-.23.33-.08.41.08.41.23.34.33.22.41.09.41-.09.33-.22.23-.34.08-.41-.08-.41-.23-.33-.33-.22-.41-.09-.41.09zm13.09 3.95l.28.06.32.12.35.18.36.27.36.35.35.47.32.59.28.73.21.88.14 1.04.05 1.23-.06 1.23-.16 1.04-.24.86-.32.71-.36.57-.4.45-.42.33-.42.24-.4.16-.36.09-.32.05-.24.02-.16-.01h-8.22v.82h5.84l.01 2.76.02.36-.05.34-.11.31-.17.29-.25.25-.31.24-.38.2-.44.17-.51.15-.58.13-.64.09-.71.07-.77.04-.84.01-1.27-.04-1.07-.14-.9-.2-.73-.25-.59-.3-.45-.33-.34-.34-.25-.34-.16-.33-.1-.3-.04-.25-.02-.2.01-.13v-5.34l.05-.64.13-.54.21-.46.26-.38.3-.32.33-.24.35-.2.35-.14.33-.1.3-.06.26-.04.21-.02.13-.01h5.84l.69-.05.59-.14.5-.21.41-.28.33-.32.27-.35.2-.36.15-.36.1-.35.07-.32.04-.28.02-.21V6.07h2.09l.14.01.21.03zm-6.47 14.25l-.23.33-.08.41.08.41.23.33.33.23.41.08.41-.08.33-.23.23-.33.08-.41-.08-.41-.23-.33-.33-.23-.41-.08-.41.08z" />
    </svg>
    Essayer sur Colab
  </a>;

<ColabLink url="https://colab.research.google.com/github/wandb/examples/blob/master/colabs/pytorch/Simple_PyTorch_Integration.ipynb" />

Utilisez [W\&B](https://wandb.ai) pour le suivi des expériences de machine learning, la gestion des versions des jeux de données et la collaboration autour des projets.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/_OEDykSS2PIumrEw/images/tutorials/huggingface-why.png?fit=max&auto=format&n=_OEDykSS2PIumrEw&q=85&s=06138cad556d6b611c67d197c0406e85" alt="Avantages de l’utilisation de W&B" width="4672" height="816" data-path="images/tutorials/huggingface-why.png" />
</Frame>

<div id="what-this-notebook-covers">
  ## Ce que vous trouverez dans ce notebook
</div>

Nous vous montrons comment intégrer W\&B à votre code PyTorch pour ajouter le suivi des expériences à votre pipeline.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/wYBIlf7cqDpGjWr9/images/tutorials/pytorch.png?fit=max&auto=format&n=wYBIlf7cqDpGjWr9&q=85&s=973ad6711e319f519e0a5eef17e1299d" alt="Schéma de l’intégration entre PyTorch et W&B" width="1887" height="1145" data-path="images/tutorials/pytorch.png" />
</Frame>

```python theme={null}
# importer la bibliothèque
import wandb

# capturer un dictionnaire d’hyperparamètres dans la configuration
config = {
    "learning_rate": 0.001,
    "epochs": 100,
    "batch_size": 128
}

# lancer une nouvelle expérience
with wandb.init(project="new-sota-model", config=config) as run:

    # configurer le modèle et les données
    model, dataloader = get_model(), get_data()

    # facultatif : suivre les gradients
    run.watch(model)

    for batch in dataloader:
    metrics = model.training_step()
    # consigner des métriques dans votre boucle d’entraînement pour visualiser les performances du modèle
    run.log(metrics)

    # facultatif : enregistrer le modèle à la fin
    model.to_onnx()
    run.save("model.onnx")
```

Suivez ce [tutoriel vidéo](https://wandb.me/pytorch-video).

**Remarque** : les sections commençant par *Étape* suffisent pour intégrer W\&B à un pipeline existant. Le reste se limite à charger les données et à définir un modèle.

<div id="install-import-and-log-in">
  ## Installer, importer et se connecter
</div>

```python theme={null}
import os
import random

import numpy as np
import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms
from tqdm.auto import tqdm

# Garantir un comportement déterministe
torch.backends.cudnn.deterministic = True
random.seed(hash("setting random seeds") % 2**32 - 1)
np.random.seed(hash("improves reproducibility") % 2**32 - 1)
torch.manual_seed(hash("by removing stochasticity") % 2**32 - 1)
torch.cuda.manual_seed_all(hash("so runs are repeatable") % 2**32 - 1)

# Configuration du périphérique
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# supprimer le miroir lent de la liste des miroirs MNIST
torchvision.datasets.MNIST.mirrors = [mirror for mirror in torchvision.datasets.MNIST.mirrors
                                      if not mirror.startswith("http://yann.lecun.com")]
```

<div id="step-0-install-wb">
  ### Étape 0 : Installer W\&B
</div>

Pour commencer, vous devez installer la bibliothèque.
`wandb` s’installe facilement avec `pip`.

```python theme={null}
!pip install wandb onnx -Uq
```

<div id="step-1-import-wb-and-login">
  ### Étape 1 : Importer W\&B et vous connecter
</div>

Pour journaliser des données sur notre service web,
vous devrez vous connecter.

Si c'est la première fois que vous utilisez W\&B,
vous devrez créer un compte gratuit via le lien qui s'affiche.

```
import wandb

wandb.login()
```

<div id="define-the-experiment-and-pipeline">
  ## Définir l’expérience et le pipeline
</div>

<div id="track-metadata-and-hyperparameters-with-wandbinit">
  ### Suivre les métadonnées et les hyperparamètres avec `wandb.init()`
</div>

Dans le code, la première chose à faire est de définir notre expérience :
quels sont les hyperparamètres ? quelles métadonnées sont associées à ce run ?

Il est très courant de stocker ces informations dans un dictionnaire `config`
(ou un objet similaire)
puis d'y accéder au besoin.

Dans cet exemple, nous ne faisons varier que quelques hyperparamètres
et codons le reste à la main.
Mais n'importe quelle partie de votre modèle peut faire partie de `config`.

Nous incluons également quelques métadonnées : nous utilisons le jeu de données MNIST et une architecture
convolutionnelle. Si, plus tard, nous travaillons par exemple avec
des architectures entièrement connectées sur CIFAR dans le même projet,
cela nous aidera à différencier nos runs.

```python theme={null}
config = dict(
    epochs=5,
    classes=10,
    kernels=[16, 32],
    batch_size=128,
    learning_rate=0.005,
    dataset="MNIST",
    architecture="CNN")
```

Maintenant, définissons le pipeline global,
ce qui est assez typique pour l’entraînement d’un modèle :

1. nous commençons par `make` un modèle, ainsi que les données et l’optimiseur associés, puis
2. nous `train` le modèle en conséquence et enfin
3. nous le `test` pour voir comment l’entraînement s’est déroulé.

Nous implémenterons ces fonctions ci-dessous.

```python theme={null}
def model_pipeline(hyperparameters):

    # indiquer à wandb de démarrer
    with wandb.init(project="pytorch-demo", config=hyperparameters) as run:
        # accéder à tous les HPs via run.config, pour que la journalisation corresponde à l'exécution.
        config = run.config

        # créer le modèle, les données et le problème d'optimisation
        model, train_loader, test_loader, criterion, optimizer = make(config)
        print(model)

        # et les utiliser pour entraîner le modèle
        train(model, train_loader, criterion, optimizer, config)

        # et tester ses performances finales
        test(model, test_loader)

    return model
```

La seule différence ici par rapport à un pipeline standard
est que tout se passe dans le contexte de `wandb.init()`.
L’appel à cette fonction établit un canal de communication
entre votre code et nos serveurs.

Le fait de passer le dictionnaire `config` à `wandb.init()`
enregistre immédiatement toutes ces informations,
afin que vous sachiez toujours quelles valeurs d’hyperparamètres
vous avez choisi d’utiliser pour votre expérience.

Pour vous assurer que les valeurs que vous avez choisies et enregistrées sont toujours bien celles qui sont utilisées
dans votre modèle, nous vous recommandons d’utiliser la copie `run.config` de votre objet.
Consultez la définition de `make` ci-dessous pour voir quelques exemples.

> *Remarque* : nous veillons à exécuter notre code dans des processus séparés,
> afin que tout problème de notre côté
> (par exemple, si un énorme monstre marin attaque nos centres de données)
> ne fasse pas planter votre code.
> Une fois le problème résolu, par exemple lorsque le Kraken retourne dans les profondeurs,
> vous pouvez synchroniser les données avec `wandb sync`.

```python theme={null}
def make(config):
    # Préparer les données
    train, test = get_data(train=True), get_data(train=False)
    train_loader = make_loader(train, batch_size=config.batch_size)
    test_loader = make_loader(test, batch_size=config.batch_size)

    # Créer le modèle
    model = ConvNet(config.kernels, config.classes).to(device)

    # Créer la fonction de perte et l'optimiseur
    criterion = nn.CrossEntropyLoss()
    optimizer = torch.optim.Adam(
        model.parameters(), lr=config.learning_rate)

    return model, train_loader, test_loader, criterion, optimizer
```

<div id="define-the-data-loading-and-model">
  ### Définir le chargement des données et le modèle
</div>

Nous devons maintenant préciser comment les données sont chargées et à quoi ressemble le modèle.

Cette partie est très importante, mais elle n'est
pas différente de ce qu'elle serait sans `wandb`,
donc nous ne nous y attarderons pas.

```python theme={null}
def get_data(slice=5, train=True):
    full_dataset = torchvision.datasets.MNIST(root=".",
                                              train=train,
                                              transform=transforms.ToTensor(),
                                              download=True)
    #  équivalent au slicing avec [::slice]
    sub_dataset = torch.utils.data.Subset(
      full_dataset, indices=range(0, len(full_dataset), slice))

    return sub_dataset


def make_loader(dataset, batch_size):
    loader = torch.utils.data.DataLoader(dataset=dataset,
                                         batch_size=batch_size,
                                         shuffle=True,
                                         pin_memory=True, num_workers=2)
    return loader
```

Définir le modèle est généralement la partie la plus amusante.

Mais rien ne change avec `wandb`,
donc nous allons nous en tenir à une architecture ConvNet standard.

N'ayez pas peur de le modifier et d'essayer quelques expériences --
tous vos résultats seront enregistrés sur [wandb.ai](https://wandb.ai).

```python theme={null}
# Réseau de neurones conventionnel et convolutif

class ConvNet(nn.Module):
    def __init__(self, kernels, classes=10):
        super(ConvNet, self).__init__()

        self.layer1 = nn.Sequential(
            nn.Conv2d(1, kernels[0], kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2))
        self.layer2 = nn.Sequential(
            nn.Conv2d(16, kernels[1], kernel_size=5, stride=1, padding=2),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2))
        self.fc = nn.Linear(7 * 7 * kernels[-1], classes)

    def forward(self, x):
        out = self.layer1(x)
        out = self.layer2(out)
        out = out.reshape(out.size(0), -1)
        out = self.fc(out)
        return out
```

<div id="define-training-logic">
  ### Définir la logique d'entraînement
</div>

En poursuivant notre `model_pipeline`, il est temps de préciser comment nous `entraînons`.

Deux fonctions `wandb` entrent en jeu ici : `watch` et `log`.

<div id="track-gradients-with-runwatch-and-everything-else-with-runlog">
  ## Suivre les gradients avec `run.watch()` et tout le reste avec `run.log()`
</div>

`run.watch()` journalisera les gradients et les paramètres de votre modèle,
toutes les `log_freq` étapes de l'entraînement.

Il vous suffit de l'appeler avant de commencer l'entraînement.

Le reste du code d'entraînement reste le même :
nous parcourons les époques et les lots,
en effectuant des passes avant et arrière
et en appliquant notre `optimizer`.

```python theme={null}
def train(model, loader, criterion, optimizer, config):
    # Indiquer à wandb de surveiller ce que fait le modèle : gradients, poids, etc.
    run = wandb.init(project="pytorch-demo", config=config)
    run.watch(model, criterion, log="all", log_freq=10)

    # Lancer l'entraînement et le suivre avec wandb
    total_batches = len(loader) * config.epochs
    example_ct = 0  # nombre d'exemples vus
    batch_ct = 0
    for epoch in tqdm(range(config.epochs)):
        for _, (images, labels) in enumerate(loader):

            loss = train_batch(images, labels, model, optimizer, criterion)
            example_ct +=  len(images)
            batch_ct += 1

            # Consigner les métriques tous les 25 batches
            if ((batch_ct + 1) % 25) == 0:
                train_log(loss, example_ct, epoch)


def train_batch(images, labels, model, optimizer, criterion):
    images, labels = images.to(device), labels.to(device)

    # Passe avant ➡
    outputs = model(images)
    loss = criterion(outputs, labels)

    # Passe arrière ⬅
    optimizer.zero_grad()
    loss.backward()

    # Étape avec l'optimiseur
    optimizer.step()

    return loss
```

La seule différence réside dans le code de journalisation :
alors qu’auparavant vous pouviez consigner des métriques en les affichant dans le terminal,
vous transmettez maintenant les mêmes informations à `run.log()`.

`run.log()` attend un dictionnaire dont les clés sont des chaînes de caractères.
Ces chaînes identifient les objets enregistrés, qui constituent les valeurs.
Vous pouvez aussi indiquer, de façon facultative, à quelle `step` d’entraînement vous en êtes.

> *Remarque* : j’aime utiliser le nombre d’exemples que le modèle a vus,
> car cela facilite la comparaison entre différentes tailles de batch,
> mais vous pouvez utiliser les étapes brutes ou le nombre de batches. Pour des runs d’entraînement plus longs, il peut aussi être pertinent de journaliser par `epoch`.

```python theme={null}
def train_log(loss, example_ct, epoch):
    with wandb.init(project="pytorch-demo") as run:
        # Consigner la perte et le numéro d’époque
        # C’est ici que nous consignons les métriques dans W&B
        run.log({"epoch": epoch, "loss": loss}, step=example_ct)
        print(f"Loss after {str(example_ct).zfill(5)} examples: {loss:.3f}")
```

<div id="define-testing-logic">
  ### Définir la logique de test
</div>

Une fois l'entraînement du modèle terminé, nous voulons le tester :
l'exécuter sur de nouvelles données issues de la Production, par exemple,
ou l'appliquer à des exemples soigneusement sélectionnés à la main.

<div id="optional-call-runsave">
  ## (Facultatif) Appelez `run.save()`
</div>

C’est aussi le bon moment pour enregistrer l’architecture du modèle
et les paramètres finaux sur le disque.
Pour une compatibilité maximale, nous allons `exporter` notre modèle au
format [Open Neural Network eXchange (ONNX)](https://onnx.ai/).

En passant ce nom de fichier à `run.save()`, vous vous assurez que les paramètres du modèle
sont enregistrés sur les serveurs de W\&B : fini les pertes de repères pour savoir quel fichier `.h5` ou `.pb`
correspond à quel run d’entraînement.

Pour des fonctionnalités `wandb` plus avancées pour le stockage, la gestion des versions et la distribution de
modèles, consultez nos [outils Artifacts](https://www.wandb.com/artifacts).

```python theme={null}
def test(model, test_loader):
    model.eval()

    with wandb.init(project="pytorch-demo") as run:
        # Exécuter le modèle sur quelques exemples de test
        with torch.no_grad():
            correct, total = 0, 0
            for images, labels in test_loader:
                images, labels = images.to(device), labels.to(device)
                outputs = model(images)
                _, predicted = torch.max(outputs.data, 1)
                total += labels.size(0)
                correct += (predicted == labels).sum().item()

            print(f"Accuracy of the model on the {total} " +
                f"test images: {correct / total:%}")

            run.log({"test_accuracy": correct / total})

        # Enregistrer le modèle au format ONNX interopérable
        torch.onnx.export(model, images, "model.onnx")
        run.save("model.onnx")
```

<div id="run-training-and-watch-your-metrics-live-on-wandbai">
  ### Exécutez l’entraînement et suivez vos métriques en direct sur wandb.ai
</div>

Maintenant que nous avons défini l’ensemble du pipeline et ajouté
ces quelques lignes de code W\&B,
nous sommes prêts à lancer notre expérience avec un suivi complet.

Nous vous fournirons quelques liens :
notre documentation,
la page du projet, qui organise tous les runs d’un projet, et
la page du run, où les résultats de ce run seront stockés.

Accédez à la page du run et consultez ces onglets :

1. **Charts**, où les gradients du modèle, les valeurs des paramètres et la perte sont enregistrés tout au long de l’entraînement
2. **System**, qui contient diverses métriques système, notamment l’utilisation des E/S du disque, les métriques CPU et GPU (regardez cette température grimper), et bien plus encore
3. **Logs**, qui contient une copie de tout ce qui a été envoyé vers la sortie standard pendant l’entraînement
4. **Files**, où, une fois l’entraînement terminé, vous pouvez cliquer sur `model.onnx` pour visualiser notre réseau avec le [visualiseur de modèles Netron](https://github.com/lutzroeder/netron).

Une fois le run terminé, à la sortie du bloc `with wandb.init()`,
nous afficherons également un résumé des résultats dans la sortie de la cellule.

```python theme={null}
# Construire, entraîner et analyser le modèle avec le pipeline
model = model_pipeline(config)
```

<div id="test-hyperparameters-with-sweeps">
  ### Tester des hyperparamètres avec Sweeps
</div>

Dans cet exemple, nous n’avons examiné qu’un seul ensemble d’hyperparamètres.
Or, une part importante de la plupart des flux de travail de ML consiste à itérer sur
plusieurs hyperparamètres.

Vous pouvez utiliser W\&B Sweeps pour automatiser les tests d’hyperparamètres et explorer l’espace des modèles possibles ainsi que les stratégies d’optimisation.

Consultez un [notebook Colab montrant l’optimisation des hyperparamètres avec W\&B Sweeps](https://wandb.me/sweeps-colab).

Exécuter un balayage d’hyperparamètres avec W\&B est très simple. Il n’y a que 3 étapes :

1. **Définir le balayage :** pour cela, créez un dictionnaire ou un [fichier YAML](/fr/models/sweeps/define-sweep-configuration/) qui spécifie les paramètres à explorer, la stratégie de recherche, la métrique d’optimisation, etc.

2. **Initialiser le balayage :**
   `sweep_id = wandb.sweep(sweep_config)`

3. **Exécuter l’agent de balayage :**
   `wandb.agent(sweep_id, function=train)`

C’est tout ce qu’il faut pour exécuter un balayage d’hyperparamètres.

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541/wYBIlf7cqDpGjWr9/images/tutorials/pytorch-2.png?fit=max&auto=format&n=wYBIlf7cqDpGjWr9&q=85&s=43f22fd680e4d32eeee7fa3e6300f33e" alt="Tableau de bord d’entraînement PyTorch" width="1920" height="1080" data-path="images/tutorials/pytorch-2.png" />
</Frame>

<div id="example-gallery">
  ## Galerie d'exemples
</div>

Explorez des exemples de projets suivis et visualisés avec W\&B dans notre [Galerie →](https://app.wandb.ai/gallery).

<div id="advanced-setup">
  ## Configuration avancée
</div>

1. [Variables d’environnement](/fr/platform/hosting/env-vars/) : définissez des clés API dans les variables d’environnement pour pouvoir lancer des entraînements sur un cluster géré.
2. [Mode hors ligne](/fr/support/models/articles/how-do-i-run-wandb-offline) : utilisez le mode `dryrun` pour entraîner hors ligne et synchroniser les résultats plus tard.
3. [Sur site](/fr/platform/hosting/hosting-options/self-managed) : installez W\&B dans un cloud privé ou sur des serveurs isolés du réseau au sein de votre propre infrastructure. Nous proposons des déploiements locaux pour tous les profils, du monde universitaire aux équipes d’entreprise.
4. [Sweeps](/fr/models/sweeps/) : configurez rapidement une recherche d'hyperparamètres avec notre outil léger de réglage.
