Les notices contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc.), la nature du document (monographie, périodique, etc.), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (la cote).
Pour un document numérique, ces notices s'appellent des métadonnées et sont contenues dans le document lui-même. Les métadonnées sont aussi utilisées pour d'autres types de ressources informatiques contenant des images ou du son (cd-rom, dvd-rom).
Les métadonnées sont, dans le cadre du Web sémantique, des données signifiantes qui permettent de faciliter l'accès au contenu informationnel d'une ressource informatique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple).
Au moins quinze éléments, répartis autour de trois domaines, permettent d'identifier et de décrire les ressources documentaires :
Les métadonnées sont un élément essentiel de l'architecture Web.
Toutefois, limiter les métadonnées aux ressources numériques de types documents, sons et images, serait une erreur : dans les bases de données relationnelles, les métadonnées incluent le nom de chaque table et le type de chaque colonne dans la table.
Les métadonnées correspondent à des marqueurs que l'on introduit dans les fichiers ou dans des langages de programmation appropriés, les langages de marquage XML.
Les marqueurs ont pour effet d'améliorer l'efficacité des recherches d'information par rapport aux recherches plein texte.
RDF (Resource Description Framework) crée les conditions d'interopérabilité, avec des réseaux de métadonnées, et l'utilisation du langage XML.
Les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées ou transmises par des messageries électroniques.
Ceci s'applique à tous les types de ressources numériques (texte, son, image, multimédia).
Les métadonnées sont ainsi l'un des principaux éléments de l'étiquetage avec les tags, surtout dans le Web 2.0.
Le potentiel des métadonnées est beaucoup plus important, car elles peuvent faire interopérer les ressources informatiques, dans la mesure où elles ont été paramétrées et structurées dans des dictionnaires de données (ou registres de métadonnées). On peut alors faire communiquer les bases de données classiques, utilisées dans les progiciels de gestion intégrés) et les données non structurées (documents, images, manipulés en gestion des connaissances...).
Pour un ensemble de raisons, tant historiques que juridiques, on n'a pas encore pris conscience, en Europe, de la sensibilité de la gestion des métadonnées pour les processus de décision dans les entreprises.
Même aux États-Unis, cette prise de conscience a été difficile, la technicité du sujet cachant son caractère stratégique.
L'expert américain Robert Steele a bien compris l'importance des métadonnées dans les sources ouvertes.
Les métadonnées concernent tous les secteurs de l'économie à travers la gestion de contenu, puisque tous les organismes gèrent des ressources documentaires sous forme électronique :
Dans l'économie du savoir, il est important de protéger le patrimoine informationnel constitué par les ressources documentaires, car les documents électroniques contiennent souvent des données confidentielles.
La circulation de documents sous forme électronique entre différents types d'organismes rend la protection du patrimoine informationnel complexe.