Algorithme de Gauss-Newton - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

- Introduction - Algorithme - Exemple - Remarques - Dérivation à partir de la méthode de Newton - Propriété de convergence - Algorithmes associés - Versions améliorées

Remarques

L'hypothèse m≥n est nécessaire, car dans le cas contraire la matrice $\mathbf{J_r^T J_r}$ serait non inversible et les équations normales ne pourraient être résolues.

L'algorithme de Gauss–Newton peut être dérivé par approximation linéaire du vecteur de fonctions $r i .$ En utilisant le Théorème de Taylor, on peut écrire qu'à chaque itération

avec $\delta\boldsymbol \beta=\boldsymbol \beta_0-\boldsymbol \beta^s$ ; notons que $\boldsymbol\beta_0$ représente la vraie valeur des paramètres pour laquelle les résidus $\mathbf{r}(\boldsymbol \beta_0)$ s'annulent. Trouver l'incrément $\delta\boldsymbol \beta$ revient à résoudre

ce qui peut se faire par la technique classique de régression linéaire et qui fournit exactement les équations normales.

Les équations normales sont un système de m équations linéaires d'inconnu $\delta \boldsymbol\beta$ . Ce système peut se résoudre en une étape, en utilisant la factorisation de Cholesky ou, encore mieux, la décomposition QR de J_r. Pour de grands systèmes, une méthode itérative telle que la méthode du gradient conjugué peut être plus efficace. S'il existe une dépendance linéaire entre les colonnes J_r, la méthode échouera car $\mathbf{J_r^T J_r}$ deviendra singulier.

Dérivation à partir de la méthode de Newton

Dans ce qui suit, l'algorithme de Gauss–Newton sera tiré de l'algorithme d'optimisation de Newton; par conséquent, la vitesse de convergence sera au plus quadratique.

La relation de récurrence de la méthode de Newton pour minimiser une fonction S de paramètres $\boldsymbol\beta$ , est

où g représente le gradient de S et H sa matrice hessienne. Puisque $S = \sum_{i=1}^m r_i^2$ , le gradient est

Les éléments de la Hessienne sont calculés en dérivant les éléments du gradient, $g j$ , par rapport à $β k$

La méthode de Gauss–Newton est obtenue en ignorant les dérivées d'ordre supérieur à deux. La Hessienne est approchée par

où $J_{ij}=\frac{\partial r_i}{\partial \beta_j}$ est l'élément $(i, j)$ de la jacobienne $\mathbf{J_r}$ . Le gradient et la hessienne approchée sont alors

Ces expressions sont replacées dans la relation de récurrence initiale afin d'obtenir la relation récursive

La convergence de la méthode n'est pas toujours garantie. L'approximation

doit être vraie pour pouvoir ignorer les dérivées du second ordre. Cette approximation peut être valide dans deux cas, pour lesquels on peut s'attendre à obtenir la convergence:

Les valeurs de la fonction $r i$ sont petites en magnitude, au moins près du minimum;
Les fonctions sont seulement faiblement non-linéaires, si bien que $\frac{\partial^2 r_i}{\partial \beta_j \partial \beta_k}$ est relativement petit en magnitude.

Propriété de convergence

On peut démontrer que l'incrément $δβ$ est une direction de descente pour S, et que si l'algorithme converge, alors la limite est un point stationnaire pour la somme des carrés S. Toutefois, la convergence n'est pas garantie, pas plus qu'une convergence locale contrairement à la méthode de Newton.

La vitesse de convergence de l'algorithme de Gauss–Newton peut approcher la vitesse quadratique. L'algorithme peut converger lentement voire ne pas converger du tout si le point de départ de l'algorithme est trop loin du minimum ou si la matrice $\mathbf{J_r^T J_r}$ est mal conditionnée.

L'algorithme peut donc échouer à converger. Par exemple, le problème avec $m = 2$ équations et $n = 1$ variable, donné par

L'optimum se situe en $β = 0$ . Si $λ = 0$ alors le problème est en fait linéaire et la méthode trouve la solution en une seule itération. Si |λ| < 1, alors la méthode converge linéairement et les erreurs décroissent avec un facteur |λ| à chaque itération. Cependant, si |λ| > 1, alors la méthode ne converge même pas localement.

Exemple

Algorithmes associés

- Introduction - Algorithme - Exemple - Remarques - Dérivation à partir de la méthode de Newton - Propriété de convergence - Algorithmes associés - Versions améliorées

💉 Des scientifiques réussissent à inverser le vieillissement

🔭 Découverte d'un objet invisible d'un million de masses solaires

💉 De l'ARN messager plus solide pour les futurs vaccins

🪐 A la recherche des Neptunes perdues

🌊 Découverte: la mer Rouge a disparu puis est réapparue brutalement

🌊 Quand la fonte des glaces nord-américaines a fait monter les océans de 10 mètres

🧲 Des étrangetés magnétiques identifiées autour de la Terre

🐁 Ces souris sauvages possèdent un langage jamais vu

💥 La fin de l'Univers se précise, sa date de mort est déjà calculée

⚠️ Les inhalateurs polluent autant que 530 000 voitures chaque année

🕷️ Découverte d'une araignée mi-mâle mi-femelle qui étonne les scientifiques

🌟 Découverte de la première étoile affichant des caractéristiques originelles !

💊 Cancer du sein: ce nouveau traitement montre des résultats très encourageants

🧻 Voici la première trace fossile de frottement de fesses !

🔌 Voitures électriques: comment optimiser au maximum le coût de recharge ?

🛰️ Quelle est cette anomalie gravitationnelle apparue en Afrique ?

👀 Voici le tout premier animal de la Terre

🔭 Le télescope James Webb aurait-il découvert les premières étoiles noires ?

🤔 Cette femme rit sans raison ni contrôle: pourquoi ?

🔭 Cette cicatrice géante pourrait avoir été causée par un trou noir supermassif errant

🫀 Crise cardiaque: les globules blancs percent des trous dans le cœur !

🏆 Un ordinateur quantique bat enfin les ordinateurs classiques sur un point crucial

🦟 Découverte exceptionnelle: des insectes de 112 millions d'années conservés dans de l'ambre

🔭 Utiliser la Lune pour révéler la matière noire

🧠 Quand le stress renforce l'intelligence collective

💊 Cancer: cette thérapie prête à l'emploi promet d'éliminer les tumeurs

🐶 Les chiens montrent des addictions aux jouets, comme les humains pour les substances

💥 Ils construisent par erreur une puce laser générant toutes les couleurs de l'arc-en-ciel

🐆 Le chat doré asiatique: un félin aux couleurs étonnantes

💥 Cette unique équation fait disparaitre matière noire, énergie noire, et autres anomalies de l'Univers

🗣️ Respirer pour parler: quand le cerveau prend le contrôle de la respiration

⚫ Première image de deux trous noirs en orbite mutuelle

🌊 Découverte fracassante: un tsunami de 100 mètres en mer du Nord

🐝 Les abeilles transportent involontairement des antibiotiques

💬 Votre oreille ne fait plus la différence entre une voix humaine et un clone IA

🪐 On en sait plus sur une planète tempérée du système TRAPPIST-1

💓 Le cœur s'use-t-il plus vite chez les sportifs ou chez les sédentaires ?

⚡ On sait enfin pourquoi les trous noirs expulsent autant d'énergie

🐛 Cette découverte sur l'alimentation pourrait changer notre façon de vieillir

🔭 3I/ATLAS: le visiteur interstellaire, voyageant à une vitesse impressionnante, observé depuis Mars

🦠 Deux microbes insoupçonnés auraient frappé la Grande Armée napoléonienne en Russie en 1812

🌍 La vie sur Terre pourrait s'expliquer par cette rare caractéristique de notre planète

⚡ Pourquoi reçoit-on parfois une petite décharge électrique en touchant certains objets ?

💥 LHC: observation d'une désintégration du boson de Higgs

🍖 Les premiers humains étaient des proies, et non des prédateurs

💧 3I/ATLAS: l'objet venu d'ailleurs a commencé à ensemencer notre Système solaire

⚛️ Record impressionnant: voici le plus grand réseau quantique avec 6100 qubits

🌕 Cette pierre lunaire provient de 50 km sous la surface, et révèle une belle surprise...

🫁 Pourquoi avons-nous le hoquet ?

🦴 La pollution plastique pénètre jusque dans nos os

Page générée en 0.160 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise