Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | +
Ontologie (informatique)

Une ontologie en informatique est un ensemble structuré de concepts permettant de donner un sens aux informations.

Les concepts sont organisés dans un graphe dont les relations peuvent être :

  • des relations sémantiques ;
  • des relations de composition et d'héritage (au sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une évolution...) objet)

L'objectif premier d'une ontologie est de modéliser un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude...) de connaissances dans un domaine donné.

À l'origine, l'ontologie est une notion philosophique, et on considérait que l'étude de l'ontologie était une partie de la métaphysique (métaphysique générale).

Définitions d'une ontologie

Approche abstraite

L’étymologie renvoie à la « théorie de l’existence », c’est-à-dire la théorie qui tente d’expliquer les concepts qui existent dans le monde (Le mot monde peut désigner :) et comment ces concepts s’imbriquent et s’organisent pour donner du sens.

Contrairement à l'être humain, la connaissance pour un système informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des machines...) se limite à la connaissance qu'il peut représenter.

Chez l'être humain, les connaissances représentables (c'est-à-dire l'univers du discours) sont complétées par des connaissances non exprimables (sensations, perceptions, sentiments non verbalisables, connaissances inconscientes, etc.). Ces éléments non représentables participent pourtant aux processus de raisonnement et de décision, qui sont des processus cognitifs en gestion des connaissances. Les performances cognitives d'un agent informatique vont donc en partie reposer sur le champ des représentations auquel il aura accès, c'est-à-dire concrètement au champ des représentations qui aura été formalisé.

Les ontologies informatiques sont des outils qui permettent précisément de représenter un corpus de connaissances sous une forme utilisable par un ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant d'exécuter des programmes enregistrés. C'est un ensemble de circuits...).

Une des définitions de l'ontologie qui fait autorité est celle de Gruber (cf. références) :

Une ontologie est la spécification d'une conceptualisation d'un domaine de connaissance.

Cette définition s'appuie sur deux dimensions :

  • Une ontologie est la conceptualisation d'un domaine, c'est-à-dire un choix quant à la manière de décrire un domaine.
  • C'est par ailleurs la spécification de cette conceptualisation, c'est-à-dire sa description formelle.

C'est une base de formalisation des connaissances. Elle se situe à un certain niveau d'abstraction ( En philosophie, l'abstraction désigne à la fois une opération qui consiste a isoler par la pensée une ou plusieurs qualités d'un objet...) et dans un contexte (Le contexte d'un évènement inclut les circonstances et conditions qui l'entourent; le contexte d'un mot, d'une phrase ou d'un texte inclut les mots...) particulier.

C'est aussi une représentation d'une conceptualisation partagée et consensuelle, dans un domaine particulier et vers un objectif commun. Elle classifie en catégories les relations entre les concepts.

Critères d'évaluation d'une ontologie

D'après Gruber, cinq critères permettent de mettre en évidence des aspects importants d'une ontologie :

  • La clarté : La définition d'un concept doit faire passer (Le genre Passer a été créé par le zoologiste français Mathurin Jacques Brisson (1723-1806) en 1760.) le sens voulu du terme, de manière aussi objective que possible (indépendante du contexte). Une définition doit de plus être complète (c’est-à-dire définie par des conditions à la fois nécessaires et suffisantes) et documentée en langage naturel (Un langage naturel est une langue « normale » parlée par un être humain.).
  • La cohérence : Rien qui ne puisse être inféré de l'ontologie ne doit entrer en contradiction (Une contradiction existe lorsque deux affirmations, idées, ou actions s'excluent mutuellement.) avec les définitions des concepts (y compris celles qui sont exprimées en langage naturel).
  • L'extensibilité : Les extensions qui pourront être ajoutées à l'ontologie doivent être anticipées. Il doit être possible d'ajouter de nouveaux concepts sans avoir à toucher (Le toucher, aussi appelé tact ou taction, est l'un des cinq sens de l'homme ou de l'animal, essentiel pour la survie et le développement des êtres vivants, l'exploration, la...) aux fondations (Les fondations d'un ouvrage assurent la transmission et la répartition des charges (poids propre et surcharges climatiques et d'utilisation) de cet ouvrage sur le sol. Le mode de fondation sera...) de l'ontologie.
  • Une déformation d'encodage minimale : Une déformation d'encodage a lieu lorsque la spécification influe la conceptualisation (un concept donné peut être plus simple à définir d'une certaine façon pour un langage d'ontologie donné, bien que cette définition ne corresponde pas exactement au sens initial). Ces déformations doivent être évitées autant que possible.
  • Un engagement ontologique minimal : Le but d'une ontologie est de définir un vocabulaire pour décrire un domaine, si possible de manière complète ; ni plus, ni moins. Contrairement aux bases de connaissances par exemple, on n'attend pas d'une ontologie qu'elle soit en mesure de fournir systématiquement une réponse à une question arbitraire sur le domaine. Une ontologie est la théorie la plus faible couvrant un domaine ; elle ne définit que les termes nécessaires pour partager la connaissance liée à ce domaine.

Approche opérationnelle

Parallèlement à cette définition assez théorique de ce que représente une ontologie, une autre définition, plus opérationnelle, peut être formulée ainsi :

Une ontologie est un réseau sémantique qui regroupe un ensemble de concepts décrivant complètement un domaine. Ces concepts sont liés les uns aux autres par des relations taxonomiques (hiérarchisation des concepts) d'une part, et sémantiques d'autre part.

Cette définition rend possible l'écriture de langages destinés à implémenter des ontologies.

Pour construire une ontologie, on dispose d'au moins trois de ces notions :

  1. Détermination des agents passifs ou actifs.
  2. Leurs conditions fonctionnelles et contextuelles.
  3. Leurs transformations possibles vers des objectifs limités.

Pour modéliser une ontologie, on utilisera ces outils :

  1. Raffiner les vocabulaires et notions adjacentes.
  2. Décomposer en catégories et autres topics.
  3. Prédiquer afin de connaître les transformations adjacentes et d'orienter vers les objectifs internes.
  4. Relativiser afin d'englober des concepts.
  5. Similariser afin de réduire à des bases totalement distinctes.
  6. Instancier afin de reproduire l'ensemble d'une "branche" vers une autre ontologie.

Les ontologies en pratique

Exemple d'ontologies

Quelques concepts et relations d'une ontologie de la production manufacturière
Quelques concepts et relations d'une ontologie de la production manufacturière

Par exemple, pour décrire les concepts entrant en jeu dans la conception de cartes électroniques, on pourrait définir l'ontologie (simplifiée ici) suivante :

  • une carte électronique est un ensemble de composants,
  • un composant peut être soit un condensateur, soit une résistance, soit une puce,
  • une puce peut être soit une unité de mémoire, soit une unité de calcul,
  • une carte électronique qui contient une unité de calcul contient aussi au moins une unité de mémoire.

Langages pour les ontologies

Le langage de spécification est l'élément central sur lequel repose l'ontologie.

La plupart de ces langages se basent sur la logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la fois raison, langage, et raisonnement) est dans une première approche...) du premier ordre, et représentent donc les connaissances sous forme d'assertion (Dans la langue française, le mot assertion (n,f) représente une vérité absolue : il définit une proposition reconnue comme...) (sujet, prédicat, objet). Parmi les formalismes les plus employés se basant sur la logique des prédicats, on retrouve des langages comme N3 ou N-Triple.

On peut aussi évoquer le langage DEF-*.

Par ailleurs, dans le cadre de ses travaux sur le Web sémantique, le W3C a mis en place en 2002 un groupe de travail dédié au développement de langages standards pour modéliser des ontologies utilisables et échangeables sur le Web. S'inspirant de langages précédents comme DAML+OIL et des fondements théoriques des logiques de description, ce groupe a publié en 2004 une recommandation (Les industries ne fonctionnent pas correctement sans normes garantissant l'interopérabilité, des organismes crées pour, promulguent des recommandations, qui si elles sont suivies deviennent des normes ou des...) définissant le langage OWL (Web Ontology Language), fondé sur le standard RDF et en spécifiant une syntaxe XML. Plus expressif que son prédecesseur RDFS, OWL a rapidement pris une place prépondérante dans le paysage (Étymologiquement, le paysage est l'agencement des traits, des caractères, des formes d'un espace limité, d'un « pays ». Portion de l'espace terrestre saisi horizontalement par un observateur,...) des ontologies et est désormais, de facto, le standard le plus utilisé.

Outils pour travailler avec les ontologies

Les éditeurs d'ontologie suivants sont gratuits et téléchargeables

  • (en) Protégé est le plus connu et le plus utilisé des éditeurs d'ontologie. Open-source, développé par l'Université de Stanford, il a évolué depuis ses premières versions (Protégé-2000) pour intégrer à partir de 2003 les standards du Web sémantique et notamment OWL. Il offre de nombreux composants optionnels: raisonneurs, interfaces graphiques.
  • (en) SWOOP est un éditeur d'ontologie développé par l'Université du Maryland dans le cadre du projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et l’intégration d’une grande diversité...) MINDSWAP. Contrairement à Protégé, il a été développé de façon native sur les standards RDF et OWL, qu'il prend en charge (La charge utile (payload en anglais ; la charge payante) représente ce qui est effectivement transporté par un moyen de transport donné, et qui donne...) dans leurs différentes syntaxes (pas seulement XML). C'est une application plus légère que Protégé, moins évoluée en terme d'interface (Une interface est une zone, réelle ou virtuelle qui sépare deux éléments. L’interface désigne ainsi ce que chaque...), mais qui intègre aussi des outils de raisonnement.
  • KMgen est un éditeur d'ontologie pour le langage KM (KM: The Knowledge Machine).

Avec l'émergence du marché des technologies du Web sémantique, on peut noter l'apparition depuis 2005 d'outils logiciels proposés par des éditeurs commerciaux. On peut citer:

  • SemanticWorks fait partie de la suite d'outils XML développée par Altova. Il supporte le langage OWL à travers sa syntaxe XML.
  • TopBraid Composer est développé par TopQuadrant. Son interface et ses fonctionnalités ressemblent beaucoup à celles de Protégé (le développeur principal de TopBraid étant l'ancien développeur des extensions OWL de Protégé).

Il existe d'autre part des outils informatiques permettant de construire une ontologie à partir d'un corpus de textes. Ces outils parcourent le texte à la recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche...) de termes récurrents ou définis par l'utilisateur, puis analysent la manière dont ces termes sont mis en relation dans le texte (par la grammaire, et par les concepts qu'ils recouvrent et dont une définition peut être trouvée dans un lexique fourni (Les Foúrnoi Korséon (Grec: Φούρνοι Κορσέων) appelés plus communément Fourni, sont un...) par l'utilisateur). Le résultat est une ontologie qui représente la connaissance globale que contient le corpus de texte sur le domaine d'application qu'il couvre. Le projet WordNet (voir les liens) en est l'exemple le plus important.

Approche normative

En Europe (L’Europe est une région terrestre qui peut être considérée comme un continent à part entière, mais aussi comme...), la norme (Une norme, du latin norma (« équerre, règle ») désigne un état habituellement répandu ou moyen considéré le plus souvent comme une règle à suivre. Ce terme...) qui fait actuellement l'objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui a une fonction précise, et qui peut être...) d'une attention particulière est une norme qui permet notamment de décrire les ontologies sur le patrimoine culturel immatériel (bibliothèques, musées et archives,...). Ses références exactes sont :

ISO 21127 : ontologies nécessaires à la description des données concernant le patrimoine culturel

Source: Wikipédia publiée sous licence CC-BY-SA 3.0.

Vous pouvez soumettre une modification à cette définition sur cette page. La liste des auteurs de cet article est disponible ici.