En mathématiques, une suite de polynômes orthogonaux est une suite infinie de polynômes p0(x), p1(x), p2(x) ... à coefficients réels, dans laquelle chaque pn(x) est de degré n, et telle que les polynômes de la suite sont orthogonaux deux à deux pour un produit scalaire de fonctions donné.
Le produit scalaire de fonctions le plus simple est l'intégrale du produit de ces fonctions, sur un intervalle borné :
Plus généralement, on peut introduire une "fonction poids" W(x) dans l'intégrale (sur l'intervalle d'intégration ]a,b[, W doit être à valeurs finies et strictement positives, et l'intégrale du produit de la fonction poids par un polynôme doit être finie ; les bornes a,b peuvent être infinies) :
Avec cette définition du produit scalaire, deux fonctions sont orthogonales entre elles si leur produit scalaire est égal à zéro (de la même manière que deux vecteurs sont orthogonaux (perpendiculaires) si leur produit scalaire égale zéro). On introduit alors la norme associée : ; le produit scalaire fait de l'ensemble de toutes les fonctions de norme finie un espace de Hilbert.
L'intervalle d'intégration est appelé intervalle d'orthogonalité.
Le domaine des polynômes orthogonaux a été développé durant le XIXème siècle par Stieltjes, comme outil de la théorie analytique des fractions continues. De multiples applications en ont découlé, en mathématiques et en physique.
Toute suite de polynômes , où chaque est de degré k, est une base de l'espace vectoriel (de dimension infinie) de tous les polynômes, "adaptée au drapeau ". Une suite de polynômes orthogonaux est simplement une telle base qui est de plus orthogonale pour un certain produit scalaire. Ce produit scalaire étant fixé, une telle suite est presque unique (unique à produit près de ses vecteurs par des scalaires non nuls), et peut s'obtenir à partir de la base canonique (non orthogonale en général), par le procédé de Gram-Schmidt.
Quand on construit une base orthogonale, on peut être tenté de la rendre orthonormale, c'est-à-dire telle que pour tout n, en divisant chaque pn par sa norme. Dans le cas des polynômes, on préfère ne pas imposer cette condition supplémentaire car il en résulterait souvent des coefficients contenant des racines carrées. On préfère souvent choisir un multiplicateur tel que les coefficients restent rationnels, et donnent des formules aussi simples que possible. On appelle cela standardisation. Les polynômes "classiques" énumérés ci-dessous ont été ainsi standardisés ; typiquement, le coefficient de leur terme de plus haut degré ou leur valeur en un point ont été mis à une quantité donnée (pour les polynômes de Legendre, Pn(1) = 1). Cette standardisation n'a pas de signification mathématique, c'est juste une convention, qui pourrait aussi parfois être obtenue par une mise à l'échelle de la fonction poids correspondante. Notons (la norme de est la racine carrée de ). Les valeurs de pour les polynômes standardisés sont énumérées dans le tableau ci-dessous. Nous avons
où δmnhn est le delta de Kronecker.
Toute suite (pk) de polynômes orthogonaux possède un grand nombre de propriétés remarquables. Pour commencer :
Lemme 1 : est une base de
Lemme 2 : pn est orthogonal à .
Le lemme 1 est dû au fait que pk est de degré k. Le lemme 2 vient de ce que, de plus, les pk sont orthogonaux deux à deux.
Pour toute suite de polynômes orthogonaux, il existe une relation de récurrence relativement à trois polynômes consécutifs.
Les coefficients an,bn,cn sont donnés par
où kj et kj' désignent les deux premiers coefficients de pj :
et hj le produit scalaire de pj par lui-même :
(Par convention, sont nuls.)
Avec les valeurs données pour an et bn, le polynôme (anx + bn)pn − pn + 1 est de degré <n (les termes de degrés n+1 et n s'éliminent). On peut donc l'exprimer sous forme d'une combinaison linéaire des éléments de la base de :
avec
(car pour j<n, pj est orthogonal à pn et pn+1).
De plus, de par la forme intégrale du produit scalaire,
Pour j<n-1, ce produit scalaire est nul car xpj est de degré <n.
Pour j=n-1, il est égal à car (par le même raisonnement qu'au début) an − 1xpn − 1 − pn est de degré <n.
On peut conclure :
avec
Dans l'espace L2 associé à W, notons Sn la projection orthogonale sur : pour toute fonction telle que ,
où Kn est le noyau de Christoffel-Darboux, défini par :
La relation de récurrence précédente permet alors de montrer :
Tout polynôme d'une suite de polynômes orthogonaux dont le degré n est supérieur ou égal à 1 admet n racines distinctes, toutes réelles, et situées strictement à l'intérieur de l'intervalle d'intégration (c'est une propriété remarquable : il est rare, pour un polynôme de degré élevé dont les coefficients ont été choisis au hasard, d'avoir toutes ses racines réelles)
Soit m le nombre des points où pn change de signe à l'intérieur de l'intervalle d'orthogonalité ; notons ces points. Ce sont les racines de pn d'ordre impair appartenant à l'intervalle d'orthogonalité. D'après le théorème fondamental de l'algèbre, m ≤ n. On va montrer m = n. Soit ; c'est un polynôme de degré m qui change de signe en chaque point xj ; S(x)pn(x) est donc strictement positif, ou strictement négatif, partout sur l'intervalle d'intégration sauf aux points xj , et il en est donc de même de S(x)pn(x)W(x). Ainsi, , l'intégrale de ce produit, est non nul. Mais, d'après le Lemme 2, pn est orthogonal à tous les polynômes de degré inférieur, donc le degré de S doit être n.
Les racines des polynômes se trouvent strictement entre les racines du polynôme de degré supérieur dans la suite.
On met d'abord tous les polynômes sous une forme standardisée telle que le coefficient dominant soit positif (ce qui ne change pas les racines), puis on effectue une récurrence sur n. Pour n=0 il n'y a rien à démontrer. Supposons la propriété acquise jusqu'au rang n. Notons les racines de pn et celles de pn + 1. La relation de récurrence donne pn + 1(xj) = − cnpn − 1(xj) avec (d'après le choix de standardisation) cn > 0. Or par hypothèse de récurrence, ( − 1)n − jpn − 1(xj) > 0. On en déduit ( − 1)n + 1 − jpn + 1(xj) > 0. En outre, et . Ceci permet de conclure : .
Une autre méthode de démonstration est de prouver (par récurrence, ou plus simplement en utilisant le noyau de Christoffel-Darboux) que pour tout n et tout x, , pour en déduire que et ont même signe, si bien que ( − 1)n − jpn(yj) > 0, ce qui permet de conclure que pn s'annule entre les yj.