Des approches différentes selon les objectifs
On distingue généralement deux grandes approches :
- L’analyse discriminante peut être une technique descriptive. On parle dans ce cas d’analyse factorielle discriminante (ou analyse discriminante descriptive). L’objectif est de proposer un nouveau système de représentation, des variables latentes formées à partir de combinaisons linéaires des variables prédictives, qui permettent de discerner le plus possible les groupes d’individus. En ce sens, elle se rapproche de l’analyse factorielle car elle permet de proposer une représentation graphique dans un espace réduit, plus particulièrement de l’analyse en composantes principales calculée sur les centres de gravité conditionnels des nuages de points avec une métrique particulière. On parle également d’analyse canonique discriminante, notamment dans les logiciels anglo-saxons.
- L’analyse discriminante peut être prédictive. Il s’agit dans ce cas de construire une fonction de classement (règle d’affectation, ...) qui permet de prédire le groupe d’appartenance d’un individu à partir des valeurs prises par les variables prédictives. En ce sens, cette technique se rapproche des techniques supervisées en apprentissage automatique telles que les arbres de décision, les réseaux de neurones, ... Elle repose sur un cadre probabiliste. Le plus connu est certainement l’hypothèse de distribution multinormale (loi normale). Additionnée à l’hypothèse d’homoscédasticité, les nuages de points conditionnels ont la même forme, nous aboutissons à l’analyse discriminante linéaire. Elle est très séduisante dans la pratique car la fonction de classement s’exprime comme une combinaison linéaire des variables prédictives, facile à analyser et à interpréter. Cette technique est, avec la régression logistique, très utilisée dans le scoring, lorsque nous voulons par exemple caractériser l’appétence – la propension à acheter – d’un client face à un nouveau produit.
La distinction entre ces deux approches n’est pas aussi tranchée. Il est par exemple possible de dériver des règles géométriques d’affectation à partir de l’analyse factorielle discriminante.