Een data warehouse is een enkele data repository waar een record uit meerdere gegevensbronnen wordt geïntegreerd voor online business analytical processing (OLAP). Dit impliceert een data warehouse moet voldoen aan de eisen van alle zakelijke fasen binnen de gehele organisatie. Het ontwerpen van een data warehouse is dus een zeer complex, langdurig en daardoor foutgevoelig proces. Bovendien veranderen de analytische bedrijfsfuncties in de loop van de tijd, waardoor ook de eisen aan de systemen veranderen. Daarom zijn data warehouse en OLAP systemen dynamisch, en is het ontwerpproces continu.

Data warehouse design neemt een andere methode dan view materialization in de industrieën. Het ziet data warehouses als databasesystemen met bijzondere behoeften, zoals het beantwoorden van management-gerelateerde queries. Het doel van het ontwerp wordt hoe de gegevens uit meerdere gegevensbronnen moeten worden geëxtraheerd, getransformeerd, en geladen (ETL) om te worden georganiseerd in een database als het data warehouse.

Er zijn twee benaderingen

  1. “top-down” benadering
  2. “bottom-up” benadering

Top-down Ontwerpbenadering

In de “Top-Down” ontwerpbenadering, wordt een data warehouse beschreven als een subject-georiënteerde, tijdvariërende, niet-vluchtige en geïntegreerde gegevensopslagplaats voor de gehele onderneming gegevens uit verschillende bronnen worden gevalideerd, opnieuw geformatteerd en opgeslagen in een genormaliseerde (tot 3NF) database als het data warehouse. Het data warehouse slaat “atomaire” informatie op, de gegevens op het laagste niveau van granulariteit, van waaruit dimensionele data marts kunnen worden gebouwd door de gegevens te selecteren die nodig zijn voor specifieke bedrijfsonderwerpen of bepaalde afdelingen. Het gaat om een datagestuurde aanpak, waarbij eerst de informatie wordt verzameld en geïntegreerd en vervolgens de bedrijfsbehoeften per onderwerp voor het bouwen van datamarts worden geformuleerd. Het voordeel van deze methode is dat zij één enkele geïntegreerde gegevensbron ondersteunt. Dus data marts gebouwd op basis ervan zal consistentie hebben wanneer ze overlappen.

Voordelen van top-down ontwerp

Data Marts worden geladen vanuit de data warehouses.

Het ontwikkelen van nieuwe data mart vanuit het data warehouse is zeer eenvoudig.

Nadelen van top-down ontwerp

Deze techniek is inflexibel voor veranderende behoeften van afdelingen.

De uitvoeringskosten zijn hoog.

Data Warehouse Design

Bottom-Up Design Approach

In de “Bottom-Up”-benadering wordt een data warehouse beschreven als “een kopie van transactiegegevens met een specifieke architectuur voor query’s en analyse,” de term het sterrenschema. In deze benadering wordt eerst een data mart gecreëerd om de noodzakelijke rapportage en analytische mogelijkheden voor bepaalde bedrijfsprocessen (of onderwerpen). Het moet dus een bedrijfsgerichte aanpak zijn, in tegenstelling tot de gegevensgerichte aanpak van Inmon.

Data marts omvatten de gegevens met de laagste korrel en, indien nodig, ook geaggregeerde gegevens. In plaats van een genormaliseerde database voor het data warehouse, wordt een gedenormaliseerde dimensionale database aangepast om te voldoen aan de gegevensleveringsvereisten van data warehouses. Om de set van data marts te gebruiken als het data warehouse van de onderneming, moeten de data marts volgens deze methode worden gebouwd met conforme dimensies, waarbij wordt gedefinieerd dat gewone objecten in verschillende data marts hetzelfde worden gerepresenteerd. De conforme dimensies verbinden de data marts tot een data warehouse, dat in het algemeen een virtueel data warehouse wordt genoemd.

Het voordeel van de “bottom-up” ontwerpbenadering is dat het een snelle ROI heeft, omdat het ontwikkelen van een data mart, een data warehouse voor een enkel onderwerp, veel minder tijd en moeite kost dan het ontwikkelen van een enterprise-wide data warehouse. Ook is het risico op mislukking nog kleiner. Deze methode is inherent incrementeel. Deze methode stelt het projectteam in staat te leren en te groeien.

Data Warehouse Design

Voordelen van bottom-up ontwerp

Documenten kunnen snel worden gegenereerd.

Het datawarehouse kan worden uitgebreid voor nieuwe bedrijfseenheden.

Het is niet meer dan het ontwikkelen van nieuwe data marts en vervolgens integreren met andere data marts.

Nadelen van bottom-up ontwerp

de locaties van het data warehouse en de data marts zijn omgekeerd in de bottom-up benadering ontwerp.

Verschil tussen Top-Down ontwerpbenadering en Bottom-Up ontwerpbenadering

Top-Down ontwerpbenadering Bottom-Up ontwerpbenadering
Breekt het enorme probleem in kleinere deelproblemen. Oplost het essentiële probleem op laag niveau en integreert ze in een hoger probleem.
Inherent architectonisch- geen unie van verschillende data marts. Inherent incrementeel; kan essentiële data marts eerst plannen.
Enkele, centrale opslag van informatie over de inhoud. Opgeslagen informatie per afdeling.
Centrale regels en controle. Departementale regels en controle.
Het bevat redundante informatie. Redundantie kan worden verwijderd.
Het kan snel resultaat opleveren als het met herhalingen wordt uitgevoerd. Minder risico op mislukking, gunstige return on investment, en bewijs van technieken.

Articles

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.