Algorithme espérance-maximisation - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Usage - Exemple détaillé : application en classification automatique - Principe de fonctionnement - Variantes usuelles d'EM

Principe de fonctionnement

En considérant un échantillon $\mathbf{x}=(\boldsymbol{x}_1,\dots,\boldsymbol{x}_n)$ d'individus suivant une loi $f(\boldsymbol{x}_i,\theta)$ paramétrée par $\boldsymbol{\theta}$ , on cherche à déterminer le paramètre $\boldsymbol{\theta}$ maximisant la log-vraisemblance donnée par

$L(\mathbf{x};\boldsymbol{\theta})=\sum_{i=1}^n\log f(\boldsymbol{x}_i,\boldsymbol{\theta}).$

Cet algorithme est particulièrement utile lorsque la maximisation de $L$ est très complexe mais que, sous réserve de connaître certaines données judicieusement choisies, on peut très simplement déterminer $\boldsymbol{\theta}$ .

Dans ce cas, on s'appuie sur des données complétées par un vecteur $\mathbf{z}=(z_1,\dots,z_n)$ inconnnu. En notant $f(z_i|\boldsymbol{x}_i;\theta)$ la probabilité de $z i$ sachant $\boldsymbol{x}_i$ et le paramètre $\boldsymbol{\theta}$ , on peut définir la log-vraisemblance complétée comme la quantité

$L\left((\mathbf{x,z});\boldsymbol{\theta}\right)=\sum_{i=1}^n\left(\log f(z_i|\boldsymbol{x}_i,\boldsymbol{\theta})+\log f(\boldsymbol{x}_i;\boldsymbol{\theta})\right).$

et donc,

$L(\mathbf{x};\boldsymbol{\theta})=L\left(\mathbf{(x,z)};\boldsymbol{\theta}\right)-\sum_{i=1}^n\log f(z_i|\boldsymbol{x}_i,\boldsymbol{\theta}).$

L'algorithme EM est une procédure itérative basée sur l'espérance des données complétées conditionnellement au paramètre courant. En notant $\boldsymbol{\theta}^{(c)}$ ce paramètre, on peut écrire

$E\left[L(\mathbf{x};\boldsymbol{\theta})|\boldsymbol{\theta}^{(c)}\right]=E\left[L\left(\mathbf{(x,z)};\boldsymbol{\theta}\right))|\boldsymbol{\theta}^{(c)}\right]-E\left[\sum_{i=1}^n\log f(z_i|\boldsymbol{x}_i,\boldsymbol{\theta}))|\boldsymbol{\theta}^{(c)}\right],$

ou encore

$L(\mathbf{x};\boldsymbol{\theta})=Q\left(\boldsymbol{\theta};\boldsymbol{\theta}^{(c)}\right)-H\left(\boldsymbol{\theta};\boldsymbol{\theta}^{(c)}\right)$

avec $Q\left(\boldsymbol{\theta};\boldsymbol{\theta}^{(c)}\right)=E\left[L\left(\mathbf{(x,z)};\boldsymbol{\theta}\right))|\boldsymbol{\theta}^{(c)}\right]$ et $H\left(\boldsymbol{\theta};\boldsymbol{\theta}^{(c)}\right)=E\left[\sum_{i=1}^n\log f(z_i|\boldsymbol{x}_i,\boldsymbol{\theta}))|\boldsymbol{\theta}^{(c)}\right]$ .

On montre que la suite définie par

$\boldsymbol{\theta}^{(c+1)}=\arg\max_{\boldsymbol{\theta}}\left(Q\left(\boldsymbol{\theta},\boldsymbol{\theta}^{(c)}\right)\right)$

fait tendre $L\left(\mathbf{x};\boldsymbol{\theta}^{(c+1)}\right)$ vers un maximum local.

On peut donc définir l'algorithme EM de la manière suivante:

Initialisation au hasard de $\boldsymbol{\theta}^{(0)}$
c=0
Tant que l'algorithme n'a pas convergé, faire

Evaluation de l'espérance (étape E) : $Q\left(\boldsymbol{\theta};\boldsymbol{\theta}^{(c)}\right)=E\left[L\left(\mathbf{(x,z)};\boldsymbol{\theta}\right))|\boldsymbol{\theta}^{(c)}\right]$
Maximisation (étape M) : $\boldsymbol{\theta}^{(c+1)}=\arg\max_{\boldsymbol{\theta}}\left(Q\left(\boldsymbol{\theta},\boldsymbol{\theta^{(c)}}\right)\right)$
c=c+1

En pratique, pour s'affranchir du caractère local du maximum atteint, on fait tourner l'algorithme EM un grand nombre de fois à partir de valeurs initiales différentes de manière à avoir de plus grandes chances d'atteindre le maximum global de vraisemblance.

Variantes usuelles d'EM

L'algorithme EM allie, dans la plupart des cas, simplicité de mise en oeuvre et efficacité. Néanmoins quelques cas problèmatiques ont donné lieu à des développements complémentaires. Parmi les variantes existantes de cet algorithme nous évoquerons l'algorithme GEM (Generalized EM) qui permet de simplifier le problème de l'étape maximisation; l'algorithme CEM (Classification EM) permettant de prendre en compte l'aspect classification lors de l'estimation, ainsi que l'algorithme SEM (Stochastic EM) dont l'objectif est de réduire le risque de tomber dans un optimum local de vraisemblance.

Algorithme GEM

GEM a été proposé en même temps qu'EM par Dempster et al. (1977) qui ont prouvé que pour assurer la convergence vers un maximum local de vraisemblance, il n'est pas nécessaire de maximiser Q à chaque étape mais qu'une simple amélioration de Q est suffisante.

GEM peut donc s'écrire de la manière suivante:

Initialisation au hasard de $\theta^{(0)}\,$
$c=0\,$
Tant que l'algorithme n'a pas convergé, faire

choisir $\theta^{(c+1)}\,$ tel que $Q\left(\theta,\theta^{(c+1)}\right)>Q\left(\theta,\theta^{(c)}\right)$
$c=c+1\,$

Algorithme CEM

L'algorithme EM se positionne dans une optique estimation, c'est-à-dire qu'on cherche à maximiser la vraisemblance du paramètre $\theta\,$ , sans considération de la classification faite a posteriori en utilisant la règle de Bayes.

L'approche classification, proposée par Celeux et Govaert (1991) consiste à optimiser, non pas la vraisemblance du paramètre, mais directement la vraisemblance complétée, donnée, dans le cas des modèles de mélange, par

$L(x,z;\theta)=\sum_{i=1}^n\sum_{k=1}^gz_{ik}\log\left(\pi_kf(x,\theta_k)\right)$

Pour cela, il suffit de procéder de la manière suivante:

Initialisation au hasard de $\theta^{(0)}\,$
$c=0\,$
Tant que l'algorithme n'a pas convergé, faire

$z^{(c+1)}=\arg\max_{z}\left(L\left(x,z;\theta^{(c)}\right)\right)$
$\theta^{(c+1)}=\arg\max_{\theta}\left(L\left(x,z^{(c+1)};\theta\right)\right)$
$c=c+1\,$

Algorithme SEM

Afin de réduire le risque de tomber dans un maximum local de vraisemblance, Celeux et Diebolt (1985) proposent d’intercaler une étape stochastique de classification entre les étapes E et M. Après le calcul des probabilités $t_{ik}^{(c)}$ , l’appartenance $z_{ik}^{(c)}$ des individus aux classes est tirée aléatoirement selon une loi multinomiale de paramètres $\mathcal{M}\left(1,t_{i1}^{(q)},\dots,t_{ig}^{(q)}\right)$ .

Contrairement à ce qui se produit dans l’algorithme CEM, on ne peut considérer que l’algorithme a convergé lorsque les individus ne changent plus de classes. En effet, celles-ci étant tirées aléatoirement, la suite $\left(z^{(q)},\theta^{(q)}\right)$ ne converge pas au sens strict. En pratique, Celeux et Diebolt (1985) proposent de lancer l’algorithme SEM un nombre de fois donné puis d’utiliser l’algorithme CEM pour obtenir une partition et une estimation du paramètre $\theta\,$ .

Exemple détaillé : application en classification automatique

- Introduction - Usage - Exemple détaillé : application en classification automatique - Principe de fonctionnement - Variantes usuelles d'EM

📢 Pourquoi certains sons nous réveillent, et d'autres non ?

🌋 Des BLOBS se déplacent sous nos pieds: des structures à l'origine d'éruptions cataclysmiques

🌀 Une centaine de galaxies invisibles autour de la Voie lactée ?

🐛 Ces chenilles "plastivores" transforment le plastique en graisse corporelle

⛈️ La météo sur Titan vue par James Webb et Keck

💀 Cette pieuvre tue avec un venin 1200 fois plus toxique que le cyanure, et il n'y a pas d'antidote

👀 Une "Bête" géante observée en train de danser au-dessus du Soleil

⏳ Des séismes lents filmés pour la première fois en temps réel. De quoi s'agit-il ?

✨ Découverte "d'étoiles ratées" de l'extrême: que nous apprennent-elles ?

🎨 Pourquoi les hommes sont-ils beaucoup plus souvent daltoniens que les femmes ?

☄️ Un visiteur interstellaire bientôt visible à l'œil nu dans le ciel ?

🧬 Vous avez des migraines ? Vous avez peut-être du crâne de Néandertal en vous !

🩺 L'IMC doit être remplacé: voici pourquoi et par quoi

👽 Découverte de conditions propices à la vie sur Titan, la lune de Saturne

🦖 Insolite: Ce musée trouve un fossile de dinosaure... sous son parking !

🍦 Pourquoi les glaces nous donnent parfois mal à la tête ?

🤔 Personne ne comprend ces mystérieux dodecaèdres romains

🌋 Vidéo - Un volcan de boue entre en éruption devant un temple à Taiwan

🦉 Vue d'une impressionnante chouette cosmique

🧬 Cette IA biologique accélère la sélection naturelle

🍖 Des orques partagent leur nourriture avec les humains

🔢 Les animaux peuvent-ils vraiment compter ? Découvrez les surprises de la nature

🛰️ GIRO: cet instrument pourra cartographier l'intérieur de tout objet extraterrestre

💀 Ce crâne d'enfant pourrait être celui d'un humain croisé avec une autre espèce

🌀 D'où viennent les ouragans ? Le pouvoir caché de l'océan

🔴 Pourquoi Mars a perdu son habitabilité et pas la Terre ?

🚀 Cet objet, qui retombe toujours du même côté, pourrait sauver robots et missions spatiales

🌍 Comment les premiers organismes ont vaincu l'arsenic il y a 2,1 milliards d'années ?

🪐 Les "planètes de l'impossible" expliquées

🦅 Découverte d'une très ancienne espèce de ptérosaure, si petit qu'il tiendrait sur votre épaule

💥 Ce nouvel atome super-lourd remet en question la stabilité nucléaire

Pourquoi y a-t-il du vent à la plage ?

📜 Un hymne babylonien perdu retrouvé après 3000 ans grâce à l'IA

💥 Etrange: cette étoile a explosé deux fois

🌋 La fonte des glaces pourrait déclencher des super-éruptions volcaniques

🧭 L'épave de ce navire ayant transporté un trésor de 138 millions de dollars refait surface

☄️ Il ne devrait pas être là: que fait ce minéral sur l'astéroïde Ryugu ?

Dispersion de micro-organismes: une loi pour les gouverner tous

🛠️ Ces outils vieux de 361 000 ans révèlent une technologie inconnue

❄️ La glace ne se comporte pas comme on le supposait dans l'espace

🦟 Comment les moustiques transmettent-ils des maladies ?

⚡ Cette découverte pourrait rendre nos appareils électroniques 1000 fois plus rapides

🔭 Un objet a-t-il percuté Saturne ? Un appel à témoins est lancé

🦴 Découverte d'une usine à graisse vieille de 125 000 ans

💥 Exceptionnel: deux novas illuminent le ciel en même temps

🌡️ Quelle est la température la plus haute que le corps humain peut supporter ?

🔭 Un troisième visiteur interstellaire se dirige vers nous à grande vitesse

🚀 La microgravité, une arme inattendue contre le cancer ?

👣 Découverte de chaussures romaines gigantesques... Les romains étaient-ils des géants ?

🔭 Découverte d'une très rare naine blanche vampire

Page générée en 1.229 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise