Entrepôt de données - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Histoire

Les principales dates à retenir construisant l'histoire de l'Entrepôt de données sont les suivantes :

  • Années 1960 - General Mills et l'Université Dartmouth, dans un projet conjoint, créent les termes "faits" et "dimensions".
  • 1983 - Teradata introduit dans sa base de données managériale un système exclusivement destiné à la prise de décision.
  • 1988 - Barry Devlin et Paul Murphy publient l'article "Une architecture pour les systèmes d'information financiers" ("An architecture for a business and information systems") où ils utilisent pour la première fois le terme "Datawarehouse".
  • 1990 - Red Brick Systems crée Red Brick Warehouse, un système spécifiquement dédié à la construction de l'Entrepôt de données.
  • 1991 - Bill Inmon publie Building the Data Warehouse (Construire l'Entrepôt de Données).
  • 1995 - Le Data Warehousing Institute, une organisation à but lucratif destinée à promouvoir le datawarehousing, est fondé.
  • 1996 - Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de l'Entrepôt de données).

Comparatif entre les bases de données de l'entreprise

Caractéristique Base de données de production Data warehouses Datamarts
Opération gestion courante, production référentiel, analyse ponctuelle analyse récurrente, outil de pilotage, support à la décision
Modèle de données entité/relation 3NF, étoile, flocon de neige, Data Vault étoile, flocon de neige
Normalisation fréquente maximum rare (redondance d'information)
Données actuelles, brutes, détaillées historisées, détaillées historisées, agrégées
Mise à jour immédiate, temps réel souvent différée, périodique souvent différée, périodique
Niveau de consolidation faible faible élevé
Perception verticale transverse horizontale
Opérations lectures, insertions, mises à jour, suppressions lectures, insertions, mises à jour lectures, mises à jour
Taille en gigaoctets en téraoctets en gigaoctets

Ces différences tiennent au fait que les Entrepôts permettent des requêtes qui peuvent être complexes et qui ne reposent pas nécessairement sur une table unique. On peut résumer les conséquences de la transformation d'un Data warehouse en Datamart comme suit : un gain de temps de traitement et une perte de puissance d'utilisation.

Exemples de requêtes OLAP :

  • Quel est le nombre de paires de chaussures vendues par le magasin "OnVendDesChaussuresIci" en mai 2003 ET Comparer les ventes avec le même mois de 2001 et 2002
  • Quelles sont les composantes des machines de production ayant eu le plus grand nombre d’incidents imprévisibles au cours de la période 1992-97 ?

Les réponses aux requêtes OLAP peuvent prendre de quelques secondes à plusieurs minutes, voire plusieurs heures.

Citations

  • « Un entrepôt de données ne s'achète pas, il se construit. » - Citation généralement attribuée à Bill Inmon, un des précurseurs du concept d'entrepôt de données.
  • « Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision. » - Bill Inmon, en 1994.
Page générée en 0.073 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise