Un modèle de langage est un type particulier d’algorithme d’intelligence artificielle conçu pour comprendre, générer et manipuler du texte en langage naturel (comme le français, l’anglais, etc.).
En d’autres termes, c’est un système capable de prédire les mots les plus probables dans une phrase, à partir du contexte.
Il apprend à partir de milliers voire milliards de textes pour répondre à des questions, compléter des phrases, traduire, résumer, etc.
Principe de fonctionnement :
-
On donne au modèle de grandes quantités de textes (livres, articles, forums…).
-
Il apprend les structures du langage (grammaire, logique, style, enchaînements).
-
Il prédit la suite d’un texte mot par mot ou token par token.
Exemples d’utilisation :
| Usage | Exemple |
|---|---|
| Chatbots | Répondre à vos questions en ligne |
| Rédaction automatique | Aider à écrire des e-mails ou articles |
| Traduction | Traduire du français vers l’anglais |
| Résumé de texte | Résumer un article de presse |
| Génération de code | Créer automatiquement du code informatique |
Exemples de modèles de langage :
-
GPT (Generative Pretrained Transformer) – par OpenAI (ex. : ChatGPT)
-
BERT – par Google (très utilisé pour la compréhension du langage)
-
LLaMA – par Meta
-
Gemini – par Google
-
Claude – par Anthropic
Modèles de langage vs Apprentissage automatique :
Un modèle de langage est un cas d’usage de l’apprentissage automatique, spécialisé dans la compréhension et la génération de texte. Il utilise souvent des techniques d’apprentissage supervisé, non supervisé ou par renforcement à grande échelle.
