Les métadonnées sont des données qui décrivent d’autres données.
Elles fournissent des informations contextuelles, comme l’origine, la structure, la date, l’auteur ou le format d’un fichier, d’un document, d’une image, d’un enregistrement, etc.
Autrement dit, ce sont des “données sur les données”.
À quoi servent les métadonnées ?
-
Organiser et classer des fichiers
-
Retrouver facilement des documents
-
Tracer l’origine ou l’historique d’un fichier
-
Décrire le contenu sans l’ouvrir
-
Automatiser des traitements (par exemple : IA, moteur de recherche, tri automatique…)
Exemples concrets de métadonnées :
| Type de fichier | Exemples de métadonnées |
|---|---|
| ️ Image (JPEG, PNG) | Résolution, date de prise de vue, appareil photo, localisation GPS |
| Audio (MP3, WAV) | Titre, artiste, album, durée, genre |
| Document (Word, PDF) | Auteur, date de création, nombre de pages, mots-clés |
| Vidéo | Durée, codec, résolution, framerate |
| Donnée structurée (tableur, base SQL) | Nom des colonnes, type de données, unités, source |
| Donnée IA (dataset) | Source, langue, objectif, type d’étiquetage, qualité |
Types de métadonnées :
| Type | Rôle |
|---|---|
| Descriptives | Pour identifier ou retrouver un fichier (titre, auteur, sujet, résumé…) |
| Techniques | Détails techniques (format, taille, résolution…) |
| Administratives | Propriété, droits d’accès, conditions d’utilisation |
| Structurales | Lien entre plusieurs fichiers ou parties (chapitres, versions, formats dérivés…) |
| Statistiques / analytiques | Informations issues du traitement des données (fréquence d’usage, scores, etc.) |
En IA, les métadonnées sont souvent cruciales pour :
-
Organiser un dataset (origine des données, langue, type, date…)
-
Appliquer des filtres de qualité ou de sécurité
-
Faciliter le fine-tuning ou le RAG (en taguant des documents par thème, niveau, cible…)
-
Travailler sur des modèles multimodaux (texte + image + son)
