Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Posté par Redbran le Mardi 30/08/2016 à 12:00
Réseaux bayésiens: les formules logiques perdent du poids
ECAI est la conférence européenne de référence sur l’intelligence artificielle. L’opportunité de découvrir quelques aspects de ce vaste domaine de recherche. Dans ce premier focus, nous découvrons une avancée en compilation de réseaux bayésiens, des représentations informatiques aux multiples applications. Cette amélioration se traduit par une transformation du réseau bayésien en une formule logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la...) pondérée.

Suscitant une littérature scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la...) abondante depuis plus de quarante ans, les réseaux bayésiens constituent un des succès importants de l’intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités intellectuelles comparables à celles des êtres humains ».), avec des applications dans de multiples domaines, tels que la biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des...), la bioinformatique, la médecine, le traitement d’images, les réseaux sociaux et l’analyse financière.


Les réseaux bayésiens sont des graphes orientés, c’est-à-dire des représentations à base de points (des noeuds) et de flèches (des arcs) les reliant. La figure d’exemple ci-dessus présente un réseau bayésien. Les noeuds d’un réseau bayésien représentent des variables aléatoires. Il y en a quatre sur l’exemple (Nuageux, Arrosage, Pluie (La pluie désigne généralement une précipitation d'eau à l'état liquide tombant de nuages vers le sol. Il s'agit d'un hydrométéore météorologique qui fait partie du cycle...) et Gazon mouillé) et ces variables prennent ici des valeurs binaires (1 ou 0). Le graphe (Le mot graphe possède plusieurs significations. Il est notamment employé :) est orienté car les arcs ont une flèche, chaque arc exprime une influence directe de la variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un...) d’origine sur la variable qui est à l’extrémité de la flèche. Ainsi, le fait que le temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) soit nuageux a une influence sur le fait que l’arrosage automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour fondements...) se déclenche ou pas. Sur l’exemple, Arrosage et Pluie sont les « parents » de Gazon mouillé.

La force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un pouvoir de la volonté ou encore une vertu morale...) des réseaux bayésiens est qu’ils permettent de représenter des distributions de probabilité de façon concise, c’est-à-dire sans avoir besoin (Les besoins se situent au niveau de l'interaction entre l'individu et l'environnement. Il est souvent fait un classement des besoins humains en trois grandes catégories : les besoins primaires, les besoins...) de préciser explicitement la probabilité de chaque événement. Pour cela, chaque noeud est associé à une distribution de probabilité (donnée ici par une table) qui indique comment la probabilité qu’une variable prenne une certaine valeur dépend des valeurs prises par ses variables parents. Dans notre exemple, la table de probabilité conditionnelle associée à la variable Arrosage indique que la probabilité que l’arrosage se mette en route (Le mot « route » dérive du latin (via) rupta, littéralement « voie brisée », c'est-à-dire...) (A=1) quand le temps est nuageux (N=1) vaut 0,1.

Parmi les opérations fondamentales à réaliser à partir d’un réseau bayésien figurent le calcul de la probabilité d’un événement donné et le calcul d’une explication la plus probable: étant donné un événement, trouver une affectation (En algorithmique (informatique), une affectation est une opération qui permet d'attribuer une valeur à une variable.) de valeurs aux variables restantes, ayant une probabilité maximale. Sur l’exemple précédent, on pourrait vouloir calculer la probabilité que le gazon soit mouillé et que l’arrosage automatique ne se soit pas mis en route. Ayant observé que le temps n’est pas nuageux et que le gazon est mouillé, on pourrait aussi vouloir calculer la probabilité de l’explication la plus probable (L’arrosage s’est-il mis en route ? A-t-il plu ?). Toutefois, ces opérations sont, en général, difficiles à calculer.

Afin de pallier cette complexité calculatoire, une approche consiste à « compiler » l’information contenue dans le réseau bayésien en un circuit arithmétique. Pour cela, le réseau bayésien est d’abord traduit en une formule logique pondérée, les poids (Le poids est la force de pesanteur, d'origine gravitationnelle et inertielle, exercée par la Terre sur un corps massique en raison uniquement du voisinage de la Terre. Elle est...) permettant de représenter les distributions conditionnelles du réseau. Cette formule logique est ensuite compilée en un circuit arithmétique, représentation compacte d’une expression arithmétique liant (Un liant est un produit liquide qui agglomère des particules solides sous forme de poudre. Dans le domaine de la peinture, il permet au pigment d'une peinture de coller sur le support, il est alors plutôt appelé médium.) des nombres et des variables, et utilisant les opérations d’addition (L'addition est une opération élémentaire, permettant notamment de décrire la réunion de quantités ou l'adjonction de grandeurs extensives de même...) et de multiplication (La multiplication est l'une des quatre opérations de l'arithmétique élémentaire avec l'addition, la soustraction et la division .). La structure d’un circuit arithmétique permet ainsi de traiter beaucoup plus rapidement les opérations précédentes.

La contribution de l’article "An Improved CNF Encoding Scheme for Probabilistic Inference" d’Anicet Bart[1], Frédéric Koriche [2], Jean-Marie Lagniez [2] et Pierre Marquis [2], est une nouvelle méthode de transformation (prouvée correcte) d’un réseau bayésien en une formule logique, dans laquelle les variables (et leurs négations) ont des poids. En considérant (entre autres choses) un poids par table de façon implicite, les formules obtenues portent sur des nombres de variables plus petits et sont plus concises que celles obtenues en utilisant les méthodes de transformation qui existaient jusqu’ici. Expérimentalement, elles conduisent à des circuits arithmétiques dont les tailles sont souvent bien plus petites.

Notes:
[1] Laboratoire d’Informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport...) de Nantes Atlantique (LINA - CNRS/Université de Nantes/École des Mines de Nantes)
[2] Centre de Recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension...) en Informatique de Lens (CRIL - CNRS/Université de l’Artois)


Commentez et débattez de cette actualité sur notre forum Techno-Science.net. Vous pouvez également partager cette actualité sur Facebook, Twitter et les autres réseaux sociaux.
Icone partage sur Facebook Icone partage sur Twitter Partager sur Messenger Icone partage sur Delicious Icone partage sur Myspace Flux RSS
Source: CNRS-INS2I