Histoire
Les principales dates à retenir construisant l'histoire de l'Entrepôt de données sont les suivantes :
- Années 1960 - General Mills et l'Université Dartmouth, dans un projet conjoint, créent les termes "faits" et "dimensions".
- 1983 - Teradata introduit dans sa base de données managériale un système exclusivement destiné à la prise de décision.
- 1988 - Barry Devlin et Paul Murphy publient l'article "Une architecture pour les systèmes d'information financiers" ("An architecture for a business and information systems") où ils utilisent pour la première fois le terme "Datawarehouse".
- 1990 - Red Brick Systems crée Red Brick Warehouse, un système spécifiquement dédié à la construction de l'Entrepôt de données.
- 1991 - Bill Inmon publie Building the Data Warehouse (Construire l'Entrepôt de Données).
- 1995 - Le Data Warehousing Institute, une organisation à but lucratif destinée à promouvoir le datawarehousing, est fondé.
- 1996 - Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de l'Entrepôt de données).
Comparatif entre les bases de données de l'entreprise
Caractéristique | Base de données de production | Data warehouses | Datamarts |
Opération | gestion courante, production | référentiel, analyse ponctuelle | analyse récurrente, outil de pilotage, support à la décision |
Modèle de données | entité/relation | 3NF, étoile, flocon de neige, Data Vault | étoile, flocon de neige |
Normalisation | fréquente | maximum | rare (redondance d'information) |
Données | actuelles, brutes, détaillées | historisées, détaillées | historisées, agrégées |
Mise à jour | immédiate, temps réel | souvent différée, périodique | souvent différée, périodique |
Niveau de consolidation | faible | faible | élevé |
Perception | verticale | transverse | horizontale |
Opérations | lectures, insertions, mises à jour, suppressions | lectures, insertions, mises à jour | lectures, mises à jour |
Taille | en gigaoctets | en téraoctets | en gigaoctets |
Ces différences tiennent au fait que les Entrepôts permettent des requêtes qui peuvent être complexes et qui ne reposent pas nécessairement sur une table unique. On peut résumer les conséquences de la transformation d'un Data warehouse en Datamart comme suit : un gain de temps de traitement et une perte de puissance d'utilisation.
Exemples de requêtes OLAP :
- Quel est le nombre de paires de chaussures vendues par le magasin "OnVendDesChaussuresIci" en mai 2003 ET Comparer les ventes avec le même mois de 2001 et 2002
- Quelles sont les composantes des machines de production ayant eu le plus grand nombre d’incidents imprévisibles au cours de la période 1992-97 ?
Les réponses aux requêtes OLAP peuvent prendre de quelques secondes à plusieurs minutes, voire plusieurs heures.
Citations
- « Un entrepôt de données ne s'achète pas, il se construit. » - Citation généralement attribuée à Bill Inmon, un des précurseurs du concept d'entrepôt de données.
- « Un entrepôt de données est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision. » - Bill Inmon, en 1994.