En intelligence artificielle, l’inférence désigne le processus par lequel un modèle pré-entraîné génère une prédiction ou une réponse, à partir d’une donnée d’entrée.
C’est l’étape où l’IA “fait son travail”, c’est-à-dire qu’elle utilise ce qu’elle a appris pour produire un résultat : un texte, une image, une décision, une classification, etc.
En résumé :
-
L’entraînement (training) = apprendre à partir de données
-
L’inférence (inference) = utiliser ce savoir pour répondre à une nouvelle situation
Exemples concrets d’inférence :
| Domaine | Entrée | Inférence (sortie) |
|---|---|---|
| ChatGPT | Une question posée par l’utilisateur | Une réponse textuelle cohérente |
| Traduction automatique | « Bonjour » | « Hello » |
| Voiture autonome | Image d’un piéton devant la voiture | Freinage immédiat |
| Reconnaissance faciale | Photo d’un visage | Nom de la personne identifiée |
⚙️ Ce qui se passe techniquement pendant l’inférence :
-
Le modèle reçoit une entrée (texte, image, son…)
-
Il applique les poids et fonctions appris pendant l’entraînement
-
Il produit une sortie (prédiction, réponse, classification…)
Caractéristiques de l’inférence :
-
Rapide : une fois le modèle entraîné, l’inférence se fait en quelques millisecondes
-
Faible consommation comparée à l’entraînement (mais dépend de la taille du modèle)
-
Peut être embarquée sur un smartphone, une voiture, un serveur, etc.
