Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Photo Mystérieuse

Que représente
cette image ?
Posté par Redbran le Mardi 30/08/2016 à 12:00
Réseaux bayésiens: les formules logiques perdent du poids
ECAI est la conférence européenne de référence sur l'intelligence artificielle. L'opportunité de découvrir quelques aspects de ce vaste domaine de recherche. Dans ce premier focus, nous découvrons une avancée en compilation de réseaux bayésiens, des représentations informatiques aux multiples applications. Cette amélioration se traduit par une transformation du réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit filet), on appelle nœud...) bayésien en une formule logique (La logique (du grec logikê, dérivé de logos (λόγος), terme inventé par Xénocrate signifiant à la fois raison, langage, et raisonnement) est dans une...) pondérée.

Suscitant une littérature scientifique (Un scientifique est une personne qui se consacre à l'étude d'une science ou des sciences et qui se consacre à l'étude d'un domaine avec la rigueur et les méthodes...) abondante depuis plus de quarante ans, les réseaux bayésiens constituent un des succès importants de l'intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de...), avec des applications dans de multiples domaines, tels que la biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une...), la bioinformatique, la médecine (La médecine (du latin medicus, « qui guérit ») est la science et la pratique (l'art) étudiant l'organisation du corps humain (anatomie), son...), le traitement d'images, les réseaux sociaux et l'analyse financière (Couramment, l'analyse financière est prise au sens d'analyse fondamentale d'une entreprise soit pour y investir, (analyse boursière) soit pour lui faire un crédit.).


Les réseaux bayésiens sont des graphes orientés, c'est-à-dire des représentations à base de points (des noeuds) et de flèches (des arcs) les reliant. La figure d'exemple ci-dessus présente un réseau bayésien. Les noeuds d'un réseau bayésien représentent des variables aléatoires. Il y en a quatre sur l'exemple (Nuageux, Arrosage, Pluie (La pluie désigne généralement une précipitation d'eau à l'état liquide tombant de nuages vers le sol. Il s'agit d'un hydrométéore météorologique qui fait partie du cycle de l'eau. La...) et Gazon mouillé) et ces variables prennent ici des valeurs binaires (1 ou 0). Le graphe (Le mot graphe possède plusieurs significations. Il est notamment employé :) est orienté car les arcs ont une flèche, chaque arc exprime une influence directe de la variable (En mathématiques et en logique, une variable est représentée par un symbole. Elle est utilisée pour marquer un rôle dans une formule, un prédicat ou un algorithme. En statistiques,...) d'origine sur la variable qui est à l'extrémité de la flèche. Ainsi, le fait que le temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) soit nuageux a une influence sur le fait que l'arrosage automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a pour...) se déclenche ou pas. Sur l'exemple, Arrosage et Pluie sont les "parents" de Gazon mouillé.

La force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un pouvoir de la volonté ou encore une vertu morale « cardinale » équivalent au courage (cf. les articles « force (vertu) » et...) des réseaux bayésiens est qu'ils permettent de représenter des distributions de probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance...) de façon concise, c'est-à-dire sans avoir besoin (Les besoins se situent au niveau de l'interaction entre l'individu et l'environnement. Il est souvent fait un classement des besoins humains en trois grandes catégories : les besoins primaires, les besoins...) de préciser explicitement la probabilité de chaque événement. Pour cela, chaque noeud est associé à une distribution de probabilité (donnée ici par une table) qui indique comment la probabilité qu'une variable prenne une certaine valeur dépend des valeurs prises par ses variables parents. Dans notre exemple, la table de probabilité conditionnelle (La notion de probabilité conditionnelle permet de tenir compte dans une prévision d'une information complémentaire. Par exemple, si je tire au hasard une carte d'un jeu, j'estime...) associée à la variable Arrosage indique que la probabilité que l'arrosage se mette en route (Le mot « route » dérive du latin (via) rupta, littéralement « voie brisée », c'est-à-dire creusée dans la roche, pour ouvrir le chemin.) (A=1) quand le temps est nuageux (N=1) vaut 0,1.

Parmi les opérations fondamentales à réaliser à partir d'un réseau bayésien figurent le calcul de la probabilité d'un événement donné et le calcul d'une explication la plus probable: étant donné un événement, trouver une affectation (En algorithmique (informatique), une affectation est une opération qui permet d'attribuer une valeur à une variable.) de valeurs aux variables restantes, ayant une probabilité maximale. Sur l'exemple précédent, on pourrait vouloir calculer la probabilité que le gazon soit mouillé et que l'arrosage automatique ne se soit pas mis en route. Ayant observé que le temps n'est pas nuageux et que le gazon est mouillé, on pourrait aussi vouloir calculer la probabilité de l'explication la plus probable (L'arrosage s'est-il mis en route ? A-t-il plu ?). Toutefois, ces opérations sont, en général, difficiles à calculer.

Afin de pallier cette complexité (La complexité est une notion utilisée en philosophie, épistémologie (par exemple par Anthony Wilden ou Edgar Morin), en physique, en biologie (par exemple par Henri Atlan),...) calculatoire, une approche consiste à "compiler" l'information contenue dans le réseau bayésien en un circuit arithmétique (L'arithmétique est une branche des mathématiques qui comprend la partie de la théorie des nombres qui utilise des méthodes de la géométrie algébrique et de la théorie...). Pour cela, le réseau bayésien est d'abord traduit en une formule logique pondérée, les poids (Le poids est la force de pesanteur, d'origine gravitationnelle et inertielle, exercée par la Terre sur un corps massique en raison uniquement du voisinage de la Terre. Elle est égale à l'opposé de la résultante des...) permettant de représenter les distributions conditionnelles du réseau. Cette formule logique est ensuite compilée en un circuit arithmétique, représentation compacte d'une expression arithmétique liant (Un liant est un produit liquide qui agglomère des particules solides sous forme de poudre. Dans le domaine de la peinture, il permet au pigment d'une peinture de coller...) des nombres et des variables, et utilisant les opérations d'addition (L'addition est une opération élémentaire, permettant notamment de décrire la réunion de quantités ou l'adjonction de grandeurs extensives de...) et de multiplication (La multiplication est l'une des quatre opérations de l'arithmétique élémentaire avec l'addition, la soustraction et la division .). La structure d'un circuit arithmétique permet ainsi de traiter beaucoup plus rapidement les opérations précédentes.

La contribution de l'article "An Improved CNF Encoding Scheme for Probabilistic Inference" d'Anicet Bart[1], Frédéric Koriche [2], Jean-Marie Lagniez [2] et Pierre Marquis [2], est une nouvelle méthode de transformation (prouvée correcte) d'un réseau bayésien en une formule logique, dans laquelle les variables (et leurs négations) ont des poids. En considérant (entre autres choses) un poids par table de façon implicite, les formules obtenues portent sur des nombres de variables plus petits et sont plus concises que celles obtenues en utilisant les méthodes de transformation qui existaient jusqu'ici. Expérimentalement, elles conduisent à des circuits arithmétiques dont les tailles sont souvent bien plus petites.

Notes:
[1] Laboratoire d'Informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de...) de Nantes Atlantique (LINA - CNRS/Université de Nantes/École des Mines de Nantes)
[2] Centre de Recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par...) en Informatique de Lens (CRIL - CNRS/Université de l'Artois)


Commentez et débattez de cette actualité sur notre forum Techno-Science.net. Vous pouvez également partager cette actualité sur Facebook, Twitter et les autres réseaux sociaux.
Icone partage sur Facebook Icone partage sur Twitter Partager sur Messenger Icone partage sur Delicious Icone partage sur Myspace Flux RSS
Source: CNRS-INS2I