En statistiques, les modèles ARMA (modèles autorégressifs et moyenne mobile), ou aussi modèle de Box-Jenkins, sont les principaux modèles de séries temporelles.
Étant donné une série temporelle Xt, le modèle ARMA est un outil pour comprendre et prédire, éventuellement, les valeurs futures de cette série. Le modèle est composé de deux parties : une part autorégressive (AR) et une part moyenne-mobile (MA). Le modèle est généralement noté ARMA(p,q), où p est l'ordre de la partie AR et q l'ordre de la partie MA.
La notation AR(p) réfère au modèle autorégressif d'ordre p. Le modèle AR(p) se note
où sont les paramètres du modèle, c est une constante et un bruit blanc. La constante est bien souvent omise dans la littérature.
Des contraintes supplémentaires sur les paramètres sont nécessaires pour garantir la stationnarité. Par exemple, pour le modèle AR(1), les processus tels que |φ1| ≥ 1 ne sont pas stationnaires.
Un modèle AR(1) est donné par :
où est un bruit blanc, de moyenne nulle et de variance σ2. Le modèle est stationnaire en variance si . Si , alors le processus exhibe une racine unitaire (en), ce qui signifie qu'il est une marche aléatoire, et n'est pas stationnaire en variance. Supposons donc , et en notant la moyenne μ, on obtient
Ainsi
En particulier, prendre c = 0 revient à avoir une moyenne nulle.
La variance vaut
La fonction d'autocovariance se donne par
On peut voir que la fonction d'autocovariance décroît avec un taux de .
La densité spectrale de puissance est la transformée de Fourier de la fonction d'autocovariance. Dans le cas discret, cela s'écrit :
Ce développement est périodique dû à la présence du terme en cosinus au dénominateur. En supposant que le temps d'échantillonnage (Δt = 1) est plus petit que le decay time (τ), alors on peut utiliser une approximation continue de Bn :
qui présente une forme lorentzienne pour la densité spectrale :
où γ = 1 / τ est la fréquence angulaire associée à τ.
Une expression alternative pour Xt peut être dérivée en substituant Xt − 1 par dans l'équation définissante. En continuant cette manipulation N fois fournit
Pour N devenant très grand, s'approche de 0 et :
On peut voir que Xt est le bruit blanc convolé avec le noyau plus une moyenne constante. Si le bruit blanc est gaussien, alors Xt est aussi un processus normal. Dans les autres cas, le théorème central limite indique que Xt sera approximativement normal lorsque est proche de l'unité.
Le modèle AR(p) est donné par
Les paramètres à estimer sont où i = 1, ..., p. Il y a une correspondance directe entre ces paramètres et la fonction de covariance (et donc d'autocorrélation) et on peut tirer les paramètres en inversant ces relations. Ce sont les équations de Yule-Walker :
où m = 0, ... , p, ce qui donne en tout p + 1 équations. Les coefficients γm est la fonction d'autocorrélation de X, est la déviation (écart-type) du bruit blanc et δm le symbole de Kronecker.
La dernière partie de l'équation est non-nulle si m = 0 ; en prenant m > 0, l'équation précédente s'écrit comme un système matriciel
Pour m = 0, nous avons
qui permet de trouver .
Les équations de Yule-Walker procurent un moyen d'estimer les paramètres du modèle AR(p), en remplaçant les covariances théoriques par des valeurs estimées. Une manière d'obtenir ces valeurs est de considérer la régression linéaire de Xt sur ses p premiers retards.
L'équation définissante du processus AR est
En multipliant les deux membres par Xt − m et en prenant l'espérance, on obtient
Or, il se trouve que E[XtXt − m] = γm par définition de la fonction d'autocorrélation. Les termes du bruit blancs sont indépendants les uns des autres et, de plus, Xt − m est indépendant de εt où m est plus grand que zéro. Pour m > 0, E[εtXt − m] = 0. Pour m = 0,
Maintenant, on a pour m ≥ 0,
Par ailleurs,
qui donne les équations de Yule-Walker :
pour m ≥ 0. Pour m < 0,