Exploration de données - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Recherche et Groupes de réflexion

Comme on le voit ci-dessus, l'industrie est très intéressée par le sujet, notamment en matière de standard et d'interopérabilité. En outre, celle-ci, l'enseignement et la recherche ont grandement contribué à l'évolution et à l'amélioration (en terme de rigueur par exemple) des méthodes et des modèles; un article publié en 2008 par l'International Journal of Information Technology and Decision Making résume une étude qui trace et analyse cette évolution. Certains acteurs - comme on le verra par la suite - sont passés de la recherche à l'industrie.

Des Universités telles que celles de Constance et de Dortmund, Allemagne, de l'Etat de Caroline du Nord, USA , de Waikato, Nouvelle-Zélande, et l'Université Lumière Lyon 2, France, ont effectué des recherches pour trouver de nouveaux algorithmes et améliorer les anciens, et ont développé des logiciels permettant à leurs étudiants, enseignants et chercheurs de progresser dans ce domaine, faisant ainsi bénéficier l'industrie de leur progrès.

En outre, de nombreux groupements inter-professionnels et d'associations se sont créés pour réfléchir et accompagner le développement du Data Mining. Le premier de ces groupements professionnels dans le domaine du data mining est le Groupe d’intérêt de l'Association for Computing Machinery sur la Gestion des connaissances et le data mining (SIGKDD). Depuis 1989 ils accueillent une conférence internationale et publient les résultats de leur réflexion, et depuis 1999 cet organisme publie une revue semestrielle dont le titre est « SIGKDD Explorations ». D'autres conférences sur le data mining et l'informatique sont organisées, comme par exemple :

  • DMIN - International Conference on Data Mining
  • DMKD - Research Issues on Data Mining and Knowledge Discovery
  • ECML-PKDD - European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases;
  • ICDM - IEEE International Conference on Data Mining
  • MLDM - Machine Learning and Data Mining in Pattern Recognition
  • SDM - SIAM International Conference on Data Mining
  • EDM - International Conference on Educational Data Mining
  • ECDM - European Conference on Data Mining
  • PAKDD - The annual Pacific-Asia Conference on Knowledge Discovery and Data Mining


Ces recherches et résultats financièrement probants obligent les équipes de data mining à effectuer un travail méthodique dans des projets structurés.

Applications industrielles

Par objectifs

De nos jours, les techniques de data mining peuvent être utilisées pour :

  • Analyser les comportements des consommateurs : ventes croisées, similarités de comportements, cartes de fidélité, …
  • Prédire le taux de réponse à un publipostage (mailing) ou à une opération de marketing direct (par exemple pour en optimiser les coûts)
  • Prédire l’attrition (ou churn) des clients : quels sont les indices de comportement permettant de détecter qu’un client puisse quitter son fournisseur (sa banque, son opérateur de téléphonie mobile, …)
  • Détecter des comportements anormaux ou frauduleux (transactions financières, escroquerie aux assurances, distribution d’énergie, …)
  • Rechercher des critères qui permettant de repérer les « bons » clients, sans facteur de risque (Évaluation des risques-clients), et ainsi pouvoir leur proposer une tarification adaptée (par exemple pour une banque ou une compagnie d’assurance).
  • Suggérer lors de la sollicitation d’un centre d'appel, en temps réel, une réponse de l’opérateur qui soit adaptée
  • Provoquer un comportement attendu, dès lors qu'on en a isolé le stimulus

Les outils de text mining (fouille de textes) associent en complément aux principes du data mining, l’analyse lexicographique et/ou linguistique multilingue des données non structurées comme les courriels, les réponses à des questionnaires ou à des enquêtes, les réclamations clients, les blogs Internet, les news en ligne, les tchats… En tentant de déterminer par exemple le degré de satisfaction (ou d’insatisfaction) de la clientèle. Ses applications les plus rudimentaires sont la lutte contre le spam, ou pourriel, ainsi que l’analyse de contenu. De plus ambitieuses concernent l’évaluation par analyse de dépêches de presse, de l’image d’une société, d’un climat politique ou boursier, ou la catégorisation automatique d’informations.

Par secteurs d'activités

L'industrie a pris conscience de l'importance du patrimoine constitué par ses données et cherche à l'exploiter en utilisation l'informatique décisionnel et l'exploration des données. Les plus avancés se situent dans le secteur tertiaire. Selon les site www.kdnuggets.com la répartition aux USA (en % du total des réponses au sondage) de l'utilisation du data mining par secteurs d'activités s'effectue en 2010 comme ceci :

Branches/domaines dans lesquels est utilisée la Fouille de données.
  26,8
  19,2
  13,1
  12,7
  11,3
  11,3
  10,8
  10,3
  10,3
  9,9
  9,9
  8,9
  8
  8
  8
Page générée en 0.058 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise