L'analyse en composantes indépendantes est une méthode d'analyse des données (voir aussi Exploration de données) qui relève des statistiques, des réseaux de neurones et du traitement du signal. Elle est notoirement et historiquement connue en tant que méthode de séparation aveugle de source mais est aujourd'hui appliquée à divers problèmes.
La première formulation du problème a été effectuée en 1985 par des chercheurs en neurosciences et traitement du signal pour modéliser biologiquement le codage du mouvement. Ces travaux ouvraient la voie à la formulation du problème de séparation de source aveugle. Une communauté a émergé autour de cette thématique dans la seconde moitié des années 80 essentiellement en France et en Finlande. La communauté française du traitement du signal adopta un formalisme statistique tandis que les chercheurs finlandais visaient à étendre l'analyse en composantes principales au moyen d'un formalisme connexionniste. L'algorithme proposé en 1985 était étonnamment robuste mais les explications théoriques de ses propriétés étaient incomplètes. Un premier formalisme du problème de séparation de source aveugle, ainsi qu'un algorithme permettant d'en obtenir une solution, a été proposé par C. Jutten et J. Hérault en 1991. La formalisation mathématique dans le cas le plus simple (mélange linéaire instantané) a été effectuée en 1994 par P. Comon aboutissant au concept d' analyse en composantes indépendantes.
La recherche dans ce domaine devint très active à partir des années 90 et des chercheurs du monde entier s'intéressèrent au problème. En plus des équipes européennes précédemment évoquées, des chercheurs américains et japonais s'intéressèrent au lien entre l'ACI et le codage neuronal. Il existe plusieurs ouvrages spécialisés donnant les détails de certaines solutions proposées, ainsi que les développements théoriques s'y rattachant.
Une conférence internationale portant spécifiquement sur le sujet existe depuis 1999. Devant avoir initialement lieu tous les 18 mois, elle est désormais annuelle. Les premières éditions ont eu lieu à Aussois (France, 1999), Helsinki (Finlande, 2000), San Diego (Californie, 2001), Nara (Japon, 2003), Grenade (Espagne, 2004), Charleston (Caroline du Sud, Etats Unis, 2006), Londres (Royaume Uni, 2007) et Parati (Brésil, 2009).
Dans le cas le plus simple (modèle linéaire instantané non bruité), la théorie est très bien maîtrisée. Néanmoins, ce modèle de mélange semble souvent trop restrictif pour modéliser les cas pratiques. Les travaux sur les modèles de mélange plus complexes font l'objet de recherches actives à ce jour.
Quand l'information mutuelle est choisie comme fonction de contraste particulière, l'analyse en composantes indépendante du vecteur aléatoire revient à identifier le modèle génératif linéaire instantané non bruité suivant:
où les composantes si du vecteur sont mutuellement indépendantes et la matrice A est de taille fixe . Néanmoins, les conditions d'identifiabilité suivantes doivent être vérifiées pour que l'on soit assuré de pouvoir retrouver le modèle (théoriquement):
La première condition résulte de la nullité des moments et cumulants d'ordre supérieur à deux pour une distribution gaussienne. L'indépendance revient alors à une simple décorrélation et l'hypothèse d'indépendance statistique ne permet pas de séparer les sources gaussiennes. Il est cependant possible de retrouver les autres sources non gaussiennes.
La seconde condition impose d'observer au moins autant de données qu'il y a de sources à identifier. Les travaux sur les représentation parcimonieuses ont cependant montré qu'il était possible d'extraire plus de sources que d'observations disponibles. Réciproquement, il est toujours possible de réduire la dimension des observations disponibles, au moyen d'une analyse en composantes principales (ACP) par exemple.
Quand ces deux conditions d'identifiabilité sont vérifiées, il reste cependant deux indéterminations:
Ces deux indéterminations ne sont pas propres au modèle linéaire instantané non bruité et se vérifient dans le cas général.
Plus réaliste que le modèle précédent, cela revient à identifier le modèle suivant:
où σ est le bruit.
Le mélange peut être convolutif. Néanmoins on peut alors se ramener à un modèle linéaire, en utilisant une transformée de Fourier par exemple.
Il s'agit du cas le plus général où les observations résultent d'une transformation non linéaire des sources:
où F(.) est une fonction non linéaire quelconque. Nous ne connaissons pas de méthode générale dans ce cas. Certains auteurs ont néanmoins proposé des méthodes pour des cas particuliers. Il s'agit d'un domaine de recherche très actif. Dans le cas le plus général, le problème étant mal-posé la solution est loin d'être unique.