Applications
L'apprentissage automatique est utilisé pour doter des machines de systèmes de perception de leur environnement (vision et reconnaissance d'objets, de visages, de schémas, etc. par ordinateur, reconnaissance des langages naturels, de l'écriture, reconnaissance de formes syntaxiques, moteurs de recherche, aide au diagnostic médical, bio-informatique, Chémoinformatique, interfaces cerveau-machine, détection de fraudes à la carte de crédit, Analyse financière, dont analyse du marché boursier, classification des séquences d'ADN, jeu, génie logiciel, sites Web adaptatifs ou mieux adaptés, locomotion de robots, etc.
Exemples :
- Un système d'apprentissage automatique peut permettre à un robot, ayant la capacité de bouger ses membres mais ne sachant initialement rien de la coordination des mouvements permettant la marche, d'apprendre à marcher.
Le robot commencera par effectuer des mouvements aléatoires, puis, en sélectionnant et privilégiant les mouvements lui permettant d'avancer, mettra peu à peu en place une marche de plus en plus efficace. - La reconnaissance de caractères manuscrits est une tâche complexe car deux caractères similaires ne sont jamais exactement égaux.
On peut concevoir un système d'apprentissage automatique qui apprend à reconnaître des caractères en observant des « exemples », c'est-à-dire des caractères connus.
Facteurs de pertinence et d'efficacité
La qualité de l'apprentissage et de l'analyse dépendent du besoin en amont et a priori compétence de l'opérateur pour préparer l'analyse. Elle dépend aussi de la complexité du modèle (spécifique ou généraliste) et de son adaptation au sujet à traiter. In fine, la qualité du travail dépendra aussi du mode (de mise en évidence visuelle) des résultats pour l'utilisateur final (un résultat pertinent pourrait être caché dans un schéma trop complexe, ou mal mis en évidence par une représentation graphiqe inappropriée).
Avant cela, la qualité du travail dépendra de facteurs initiaux contraignants, liées à la base de données :
- Nombre d' exemples (moins il y en a plus l'analyse est difficile, mais plus il y en a plus le besoin de mémoire informatique est élevé et plus longue est l'analyse)
- Nombre et qualité des attributs décrivant ces exemples (La distance entre deux "exemples" numériques (prix, taille, poids, intensité lumineuse, intensité de bruit, etc) est facile à établir, celle entre deux attributs catégoriels (couleur, beauté, utilité, est plus délicate )
- Pourcentage de données renseignées et manquantes
- « Bruit » ; Le nombre et la « localisation » des valeurs douteuses (erreurs) ou naturellement non-conformes au pattern de distribution générale des « exemples » sur leur espace de distribution impacteront sur la qualité de l'analyse.
Les algorithmes utilisés
Ce sont dans ce domaine :
Ces méthodes sont souvent combinées pour obtenir diverses variantes d'apprentissage. L'utilisation de tel ou tel algorithme dépend fortement de la tâche à résoudre (classification, estimation de valeurs, etc.).
L'apprentissage automatique est utilisé pour un large spectre d'applications :
- moteur de recherche,
- aide au diagnostic,
- bio-informatique,
- détection de donnée aberrante,
- détection de données manquantes,
- détection de fraudes,
- analyse des marchés financiers,
- reconnaissance de la parole,
- Reconnaissance de l'écriture manuscrite,
- analyse et indexation d'images et de vidéo,
- robotique
- etc.