L’apprentissage supervisé est un type d’apprentissage automatique (machine learning) où l’algorithme apprend à partir de données étiquetées. Cela signifie que chaque exemple d’entraînement est accompagné de la bonne réponse (appelée étiquette ou label).
Principe :
On fournit à l’algorithme :
-
des entrées (features) : ce sont les données observées
-
des sorties attendues (labels) : ce sont les réponses correctes associées
Le modèle apprend à faire le lien entre les entrées et les sorties, pour ensuite pouvoir prédire la sortie correcte sur de nouvelles données jamais vues.
Exemples :
| Exemple | Données d’entrée | Étiquette (sortie) |
|---|---|---|
| Classification d’e-mails | Contenu de l’e-mail | Spam ou Non-spam |
| Prédiction de prix immobilier | Surface, emplacement, nombre de chambres | Prix du bien |
| Reconnaissance d’images | Pixels d’une image | « Chat », « Chien », etc. |
Applications courantes :
-
Reconnaissance vocale (mot prononcé → texte)
-
Diagnostic médical assisté (symptômes → maladie)
-
Prévision de la demande (historique des ventes → ventes futures)
-
Détection de fraude (transaction → frauduleuse ou non)
Les deux grandes catégories :
-
Classification :
La sortie attendue est une catégorie (ex. : « oui/non », « chat/chien/lapin »)
Exemple : reconnaître la langue d’un texte -
Régression :
La sortie attendue est une valeur numérique (ex. : 42,5)
Exemple : prédire le prix d’une maison
