Méthode de l'entropie croisée - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Estimation via l'échantillonnage préférentiel - Optimisation continue—exemple - Algorithme CE générique - Méthodes liées

Introduction

La méthode de l'entropie-croisée (CE) attribuée à Reuven Rubinstein est une méthode générale d'optimisation de type Monte-Carlo, combinatoire ou continue. La méthode a été conçue à l'origine pour la simulation d'événements rares, où des densités de probabilités très faibles doivent être estimées correctement, par exemple dans l'analyse de la sécurité des réseaux, les modèles de file d'attente, ou l'analyse des performances des systèmes de télécommunication. La méthode CE peut être appliquée à tout problème d'optimisation combinatoire où les observations sont bruitées comme le problème du voyageur de commerce, le problème d'affectation quadratique, le problème d'alignement de séquences, le problème de la coupure maximale et les problèmes d'allocation de mémoire, tout comme des problèmes d'optimisation continue avec de nombreux extrema locaux.

La méthode CE se décompose en deux phases :

Générer aléatoirement un échantillon de données (trajectoires, vecteurs, etc.) selon un mécanisme spécifique.
Mettre à jour les paramètres du mécanisme de génération aléatoire à partir de l'échantillon de données pour produire un meilleur échantillon à l'itération suivante. Cette étape implique de minimiser l'entropie croisée ou la divergence de Kullback-Leibler.

Estimation via l'échantillonnage préférentiel

Considérons le problème général d'estimation de la quantité $\ell = \mathbb{E}_{\mathbf{u}}[H(\mathbf{X})] = \int H(\mathbf{x})\, f(\mathbf{x}; \mathbf{u})\, \textrm{d}\mathbf{x}$ , où $H$ est une fonction objectif et $f(\mathbf{x};\mathbf{u})$ est une densité de probabilité paramétrique. En utilisant l'échantillonnage préférentiel cette quantité peut être estimée par $\hat{\ell} = \frac{1}{N} \sum_{i=1}^N H(\mathbf{X}_i) \frac{f(\mathbf{X}_i; \mathbf{u})}{g(\mathbf{X}_i)}$ , où $\mathbf{X}_1,\dots,\mathbf{X}_N$ est un échantillon de variables aléatoires de densité $g\,$ . Pour $H$ positif, l'optimum théorique de la densité de probabilité des variables aléatoires est donné par $g^*(\mathbf{x}) = H(\mathbf{x}) f(\mathbf{x};\mathbf{u})/\ell$ . Cependant $\ell$ est un paramètre inconnu. La méthode CE propose d'approcher la densité optimale en sélectionnant les éléments de l'échantillon qui sont les plus proches (au sens de Kullback-Leibler) de la densité optimale $g *$ .

Optimisation continue—exemple

Le même algorithme CE peut être utilisé pour l'optimisation et l'estimation. Soit le problème consistant à maximiser une fonction $S (x)$ , par exemple, $S(x) = \textrm{e}^{-(x-2)^2} + 0.8\,\textrm{e}^{-(x+2)^2}$ . Pour utiliser l'entropie croisée on doit d'abord considérer le problème stochastique associé de l'estimation de $\mathbb{P}_{\boldsymbol{\theta}}(S(X)\geq\gamma)$ pour un niveau donné $\gamma\,$ , et une famille de distributions de probabilité paramètriques $\left\{f(\cdot;\boldsymbol{\theta})\right\}$ , par exemple la loi normale à une dimension, dont les parmètres sont la moyenne $\mu_t\,$ et la variance $\sigma_t^2$ (tel que $\boldsymbol{\theta} = (\mu,\sigma^2)$ ici). Ainsi, pour un $\gamma\,$ donné, l'objectif est de déterminer $\boldsymbol{\theta}$ tel que la quantité $D_{\mathrm{KL}}(\textrm{I}_{\{S(x)\geq\gamma\}}\|f_{\boldsymbol{\theta}})$ soit minimisée. Ce qui est fait en utilisant la version échantillonnée ( stochastic counterpart ⇔ contrepartie stochastique) du problème de la minimisation de la divergence KL, comme précédemment dans l'étape 3. Il se trouve que pour ce choix de distribution les paramètres qui minimisent la version stochastique du problème sont la moyenne et la variance empirique de l'échantillon d'élite qui est composé des tirages dont la valeur de la fonction score est $\geq\gamma$ . Le plus mauvais des éléments de l'échantillon d'élite sert de paramètre de niveau à l'itération suivante. Cela donne l'algorithme stochastique suivant pour ce problème.

Pseudo-code

      1. mu:=-6; sigma2:=100; t:=0; maxits=100;    // Initialisation des paramètres      2. N:=100; Ne:=10;                           //      3. while t < maxits and sigma2 > epsilon     // Tant que l'on a pas convergé et que maxits n'est pas dépassé      4.  X = SampleGaussian(mu, sigma2,N);         // Génère N échantillon à partir de la distribution      5.  S = exp(-(X-2)^2) + 0.8 exp(-(X+2)^2);   // Calcule le score de chaque échantillon      6.  X = sort(X, S);                           // Classe X selon le score (de façon descendante)      7.  mu = mean(X(1:Ne)); sigma2=var(X(1:Ne)); // Mise à jour des parmètres de la distribution      8.  t = t+1;                                 // Incrémentation du nombre d'itérations      9. return mu                                 // Renvoie la moyenne des derniers échantillons comme la solution

Algorithme CE générique

- Introduction - Estimation via l'échantillonnage préférentiel - Optimisation continue—exemple - Algorithme CE générique - Méthodes liées

Une gigantesque muraille de 10 milliards d'années-lumière dans l'Univers 🔭

Benchmark: les processeurs quantiques sous la loupe, quels sont les meilleurs ? 🏆

Découverte d'une "fourmi de l'enfer" vieille de 113 millions d'années 🐜

Le rôle méconnu de la décharge dans l'usure des batteries 🔋

La fonte des glaces déplace les pôles: quelles conséquences ? 🌍

L'appareil photo de votre smartphone peut détecter l'antimatière 📱

Cette étoile-zombie peut déformer les atomes à distance, et elle fonce dans notre galaxie ⭐

Un mosasaure géant découvert dans le Mississippi 🦕

Problème, les galaxies meurent plus tôt que prévu 🌀

Ce lien entre cannabis et troubles psychotiques 🧠

Une révolution dans le refroidissement des puces électroniques ? 🔥

Des parasites sous-marins filmés en train de vampiriser un poisson des abysses 👀

Lucy survole un astéroïde en forme de cacahuète 🚀

Découverte du fossile d'un dinosaure géant méconnu 🦕

Mars avait-elle un champ magnétique unilatéral ? 🔍

Des chimpanzés surpris à sociabiliser avec de l'alcool 🍇

Découverte macabre: ce gladiateur a été tué par un lion il y a 1 800 ans... en Grande-Bretagne 🦁

L'électroluminescence du graphène, une découverte inattendue ! 💡

Cet objet métallique n'a pas été fabriqué sur Terre 🔧

Cette innovation permet aux voitures électriques de charger 6 fois plus vite par grand froid ⚡

Cette super-Terre brûle les attentes des astronomes 🔥

Découverte exceptionnelle de fossiles d'amphibiens géants 🐸

Voici ce qui a causé les toutes premières inégalités de richesse 💰

Quelle est cette zone étrange dans l'Atlantique Nord ? 🌊

Cette planète orbite à angle droit autour de deux étoiles, une première ! 🔭

Des cellules solaires flexibles battent des records d'efficacité ⚡

Ce dispositif reproduit les trous noirs et trous blancs en laboratoire 🌀

Record établi pour un transistor en diamant 💎

Les sursauts radio rapides trahissent enfin leur origine cosmique 📡

Ces biomarqueurs sanguins prédisent la démence 10 ans à l'avance 🧠

Découverte majeure: des médicaments 23 fois plus efficaces contre le cancer 💊

Les oscillations collectives des foules humaines denses 🔁

Une forme inconnue de la matière détectée au LHC ? ⚛️

Le sel, un facteur méconnu de l'obésité ? 🧂

L'Univers en rotation, une réponse élégante à ce problème astrophysique majeur 🌀

Découverte tectonique majeure sous les Petites Antilles 🌍

Peut-on geler en chauffant ? ❄️

Une peau électronique pour doter les robots du sens du toucher 👌

Invention d'un bois semi-transparent avec une technique...surprenante ! 🌳

Le cancer inscrit dans nos gènes dès la naissance ? 🧬

Des supernovae à l'origine de deux extinctions massives sur Terre ? 💥

Le passé verdoyant du plus grand désert du monde 🐪

Après les campagnes antivaccins, la rougeole revient en force aux États-Unis 😷

Des puces quantiques plus proches que jamais ⚡

Pourrons-nous bientôt communiquer avec les dauphins grâce à l'IA ? 🐬

En déplaçant deux atomes, des chercheurs transforment le LSD en médicament surpuissant 💊

Des scientifiques parviennent à produire efficacement du carburant à partir de monoxyde de carbone 🛢️

Que nous apprend la découverte de cet insecte de 16 millions d'années ? 🐜

Avec 91km, l'accélérateur FCC fera passer le LHC pour un jouet ⚛️

Cette vitamine développe les fonctions cognitives du cerveau 🧠

Page générée en 0.109 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise