Un entrepôt de données est un référentiel de données unique où un enregistrement provenant de plusieurs sources de données est intégré pour un traitement analytique d’entreprise en ligne (OLAP). Cela implique qu’un entrepôt de données doit répondre aux exigences de toutes les étapes de l’activité dans l’ensemble de l’organisation. La conception d’un entrepôt de données est donc un processus extrêmement complexe, long et donc sujet aux erreurs. En outre, les fonctions analytiques de l’entreprise évoluent au fil du temps, ce qui entraîne des changements dans les exigences des systèmes. Par conséquent, les entrepôts de données et les systèmes OLAP sont dynamiques, et le processus de conception est continu.
La conception des entrepôts de données adopte une méthode différente de la matérialisation des vues dans les industries. Elle considère les entrepôts de données comme des systèmes de base de données avec des besoins particuliers tels que la réponse aux requêtes liées à la gestion. La cible de la conception devient comment l’enregistrement de plusieurs sources de données doit être extrait, transformé et chargé (ETL) pour être organisé dans une base de données comme l’entrepôt de données.
Il existe deux approches
- approche « top-down »
- approche « bottom-up »
Approche de conception « Top-down »
Dans l’approche de conception « Top-Down », un entrepôt de données est décrit comme un sujet, variable dans le temps, non volatile et intégré pour l’ensemble de l’entreprise les données provenant de différentes sources sont validées, reformatées et sauvegardées dans une base de données normalisée (jusqu’à 3NF) comme l’entrepôt de données. L’entrepôt de données stocke les informations « atomiques », c’est-à-dire les données au niveau de granularité le plus bas, à partir desquelles des marts de données dimensionnels peuvent être construits en sélectionnant les données requises pour des sujets commerciaux spécifiques ou des départements particuliers. Il s’agit d’une approche axée sur les données, car l’information est d’abord recueillie et intégrée, puis les exigences commerciales par sujets pour la construction de data marts sont formulées. L’avantage de cette méthode est qu’elle prend en charge une seule source de données intégrée. Ainsi, les data marts construits à partir de celle-ci auront une cohérence lorsqu’ils se chevauchent.
Avantages de la conception descendante
Les data marts sont chargés à partir des entrepôts de données.
Développer un nouveau data mart à partir de l’entrepôt de données est très facile.
Inconvénients de la conception descendante
Cette technique est inflexible aux besoins changeants des départements.
Le coût de mise en œuvre du projet est élevé.
Approche de conception ascendante
Dans l’approche « ascendante », un entrepôt de données est décrit comme « une copie des données de transaction architecture spécifique pour la requête et l’analyse », terme le schéma en étoile. Dans cette approche, un entrepôt de données est créé d’abord pour les capacités de reporting et d’analyse nécessaires à des processus métier (ou sujets) particuliers. Ainsi, il est nécessaire d’être une approche axée sur les affaires par opposition à l’approche axée sur les données d’Inmon.
Les marts de données comprennent les données de grain le plus bas et, si nécessaire, les données agrégées aussi. Au lieu d’une base de données normalisée pour l’entrepôt de données, une base de données dimensionnelle dénormalisée est adaptée pour répondre aux exigences de livraison de données des entrepôts de données. Avec cette méthode, pour utiliser l’ensemble des marts de données comme entrepôt de données d’entreprise, les marts de données doivent être construits en tenant compte des dimensions conformes, définissant que les objets ordinaires sont représentés de la même manière dans les différents marts de données. Les dimensions conformées ont connecté les marts de données pour former un entrepôt de données, qui est généralement appelé entrepôt de données virtuel.
L’avantage de l’approche de conception « ascendante » est qu’elle a un retour sur investissement rapide, car le développement d’un data mart, un entrepôt de données pour un seul sujet, prend beaucoup moins de temps et d’efforts que le développement d’un entrepôt de données à l’échelle de l’entreprise. En outre, le risque d’échec est encore plus faible. Cette méthode est intrinsèquement incrémentielle. Cette méthode permet à l’équipe de projet d’apprendre et de grandir.
Avantages de la conception ascendante
Les documents peuvent être générés rapidement.
L’entrepôt de données peut être étendu pour accueillir de nouvelles unités d’affaires.
Il s’agit simplement de développer de nouveaux marts de données, puis de les intégrer à d’autres marts de données.
Inconvénients de la conception ascendante
Les emplacements de l’entrepôt de données et des data marts sont inversés dans la conception de l’approche ascendante.
Différencier l’approche de conception descendante et l’approche de conception ascendante
Approche de conception descendante | Approche de conception ascendante |
---|---|
Répartit le vaste problème en sous-problèmes plus petits. | Solve le problème essentiel de bas niveau et les intègre dans un problème plus élevé. |
Inhérente à l’architecture – pas une union de plusieurs data marts. | Inhérente à l’incrémentation ; peut programmer les data marts essentiels en premier. |
Simple stockage central des informations sur le contenu. | Les informations départementales sont stockées. |
Règles et contrôle centralisés. | Règles et contrôle départementaux. |
Il comprend des informations redondantes. | La redondance peut être supprimée. |
Il peut voir des résultats rapides s’il est mis en œuvre avec des répétitions. | Moins de risque d’échec, un retour sur investissement favorable et une preuve des techniques. |
.