Algorithme de Gauss-Newton - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

L'algorithme de Gauss-Newton est une méthode de résolution des problèmes de moindres carrés non-linéaires. Elle peut être vue comme une modification de la méthode de Newton dans le cas multidimensionnel afin de trouver le minimum d'une fonction (à plusieurs variables). Mais l'algorithme de Gauss-Newton est totalement spécifique à la minimisation d'une somme de fonctions au carré et présente le grand avantage de ne pas nécessiter les dérivées secondes, parfois complexes à calculer.

Les problèmes de moindres carrés non-linéaires surviennent par exemple dans les problèmes de régressions non-linéaires, où des paramètres du modèle sont recherchés afin de correspondre au mieux aux observations disponibles.

Cette méthode est due au mathématicien renommé Carl Friedrich Gauss.

Algorithme

Soit m fonctions ri ( i=1,\ldots,m ) de n variables {\boldsymbol \beta}=(\beta_1, \beta_2, \dots, \beta_n), avec mn, l'algorithme de Gauss–Newton doit trouver le minimum de la somme des carrés

 S(\boldsymbol \beta)= \sum_{i=1}^m r_i^2(\boldsymbol \beta).

En débutant avec l'approximation initiale \boldsymbol \beta^0 du minimum, la méthode procède par itérations:

 \boldsymbol \beta^{s+1} = \boldsymbol \beta^s+\delta\boldsymbol\beta,

où l'incrément \delta\boldsymbol\beta vérifie les équations normales

\left(\mathbf{J_r^T J_r} \right)\delta\boldsymbol\beta= - \mathbf{ J_r^T r}.

Ici, on note par r le vecteur des fonctions ri, et par Jr la matrice jacobienne m×n de r par rapport à β, tous les deux évalués en βs. La matrice transposée est notée à l'aide de l'exposant T.

Dans les problèmes d'ajustement des données, où le but est de trouver les paramètres \boldsymbol \beta d'un certain modèle y=f(x, \boldsymbol \beta) permettant le meilleur ajustement aux observations (xi,yi),, les fonctions ri sont les résidus

r_i(\boldsymbol \beta)= y_i - f(x_i, \boldsymbol \beta).

Alors, l'incrément \delta\boldsymbol\beta peut s'exprimer en fonction de la jacobienne de la fonction f:

Dans tous les cas, une fois connu l'estimation à l'étape s, les équations normales permettent de trouver l'estimation à l'étape suivante; pour résumer, on a:

\boldsymbol \beta^{s+1} = \boldsymbol \beta^s - \left(\mathbf{J_r^T J_r} \right)^{-1} \mathbf{ J_r^T r}

L'ensemble du terme de droite est calculable car ne dépend que de \boldsymbol\beta^s et permet de trouver l'estimation suivante.

Exemple

Courbe calculée avec \hat\beta_1=0.362 et \hat\beta_2=0.556 (en bleu) contre les données observées (en rouge).

Dans cet exemple, l'algorithme de Gauss–Newton est utilisé pour ajuster un modèle en minimisant la somme des carrés entre les observations et les prévisions du modèle.

Dans une expérience de biologie, on étudie la relation entre la concentration du substrat [S] et la vitesse de réaction dans une réaction enzymatique à partir de données reportées dans le tableau suivant.

i 1 2 3 4 5 6 7
[S] 0.038 0.194 0.425 0.626 1.253 2.500 3.740
rate 0.050 0.127 0.094 0.2122 0.2729 0.2665 0.3317

On souhaite ajuster les données à la courbe de la forme:

\text{rate}=\frac{V_{max}[S]}{K_M+[S]}

L'estimation par moindres carrés porte sur les paramètres Vmax et KM.

On note xi et yi les valeurs de [S] et la vitesse de réaction, pour i=1, \dots, 7. On pose β1 = Vmax et β2 = KM. Nous allons chercher β1 et β2 pour minimiser la somme des carrés des résidus

r_i = y_i - \frac{\beta_1x_i}{\beta_2+x_i}   ( i=1,\dots, 7 )

La jacobienne \mathbf{J_r} du vecteur des résidus ri par rapport aux inconnus βj est une matrice 7\times 2 dont la ligne n° i est

\frac{\partial r_i}{\partial \beta_1}= -\frac{x_i}{\beta_2+x_i},\  \frac{\partial r_i}{\partial \beta_2}= \frac{\beta_1x_i}{\left(\beta_2+x_i\right)^2}.

Commençant avec l'estimation initiale β1=0,9 et β2=0,2, il suffit de 5 itérations de l'algorithme de Gauss–Newton pour atteindre les estimations optimales \hat\beta_1=0,362 et \hat\beta_2=0,556 . Le critère de la somme des carrés des résidus chute de 1,202 à 0,0886 en 5 itérations. Le tableau suivant détaille les cinq itérations:

Itération Estimation Somme des carrés des résidus
1 [0,9;0,2] 1,4455000
2 [0,33266;0,26017] 0,0150721
3 [0,34281;0,42608] 0,0084583
4 [0,35778;0,52951] 0,0078643
5 [0,36141;0,55366] 0,0078442
6 [ 0,3618;0,55607] 0,0078440


La figure ci-contre permet de juger de l'adéquation du modèle aux données en comparant la courbe ajustée (bleue) aux observations (rouge).

Page générée en 0.055 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise