Ein Data Warehouse ist ein einziger Datenspeicher, in dem ein Datensatz aus mehreren Datenquellen für die analytische Online-Verarbeitung (OLAP) integriert wird. Dies bedeutet, dass ein Data Warehouse die Anforderungen aller Geschäftsstufen innerhalb des gesamten Unternehmens erfüllen muss. Daher ist der Entwurf eines Data Warehouse ein äußerst komplexer, langwieriger und daher fehleranfälliger Prozess. Darüber hinaus ändern sich die analytischen Geschäftsfunktionen im Laufe der Zeit, was wiederum zu veränderten Anforderungen an die Systeme führt. Daher sind Data-Warehouse- und OLAP-Systeme dynamisch, und der Entwurfsprozess ist ein kontinuierlicher Prozess.

Data-Warehouse-Entwurf verfolgt eine Methode, die sich von der Sichtenmaterialisierung in den Branchen unterscheidet. Sie sieht Data Warehouses als Datenbanksysteme mit besonderen Anforderungen, wie z.B. der Beantwortung von managementbezogenen Abfragen. Ziel des Entwurfs ist es, die Datensätze aus mehreren Datenquellen zu extrahieren, zu transformieren und zu laden (ETL), um sie in einer Datenbank als Data Warehouse zu organisieren.

Es gibt zwei Ansätze

  1. „Top-Down“-Ansatz
  2. „Bottom-Up“-Ansatz

Top-Down-Entwurfsansatz

Beim „Top-Down“-Entwurfsansatz wird ein Data Warehouse als subjektorientiert beschrieben, zeitvariante, nichtflüchtige und integrierte Datenablage für das gesamte Unternehmen Daten aus verschiedenen Quellen werden validiert, neu formatiert und in einer normalisierten (bis zu 3NF) Datenbank als Data Warehouse gespeichert. Das Data Warehouse speichert „atomare“ Informationen, d. h. Daten auf der niedrigsten Granularitätsebene, aus denen dimensionale Data Marts durch Auswahl der für bestimmte Geschäftsbereiche oder Abteilungen erforderlichen Daten erstellt werden können. Es handelt sich um einen datengesteuerten Ansatz, bei dem zunächst die Informationen gesammelt und integriert werden und dann die geschäftlichen Anforderungen der Fachbereiche für den Aufbau von Data Marts formuliert werden. Der Vorteil dieser Methode ist, dass sie eine einzige integrierte Datenquelle unterstützt. Daher sind die daraus erstellten Data Marts konsistent, wenn sie sich überschneiden.

Vorteile des Top-Down-Designs

Data Marts werden aus dem Data Warehouse geladen.

Die Entwicklung neuer Data Marts aus dem Data Warehouse ist sehr einfach.

Nachteile des Top-Down-Designs

Diese Technik ist unflexibel gegenüber sich ändernden Anforderungen der Abteilungen.

Die Kosten für die Implementierung des Projekts sind hoch.

Data-Warehouse-Design

Bottom-Up-Design-Ansatz

Beim „Bottom-Up“-Ansatz wird ein Data Warehouse als „eine Kopie der spezifischen Architektur von Transaktionsdaten für Abfragen und Analysen“ beschrieben, was als Sternschema bezeichnet wird. Bei diesem Ansatz wird ein Data Mart zunächst für die notwendigen Berichts- und Analysefunktionen für bestimmte Geschäftsprozesse (oder Themen) erstellt. Es handelt sich also um einen geschäftsorientierten Ansatz im Gegensatz zu Inmons datenorientiertem Ansatz.

Data Marts umfassen die Daten der untersten Ebene und, falls erforderlich, auch aggregierte Daten. Anstelle einer normalisierten Datenbank für das Data Warehouse wird eine denormalisierte dimensionale Datenbank an die Datenlieferungsanforderungen von Data Warehouses angepasst. Um eine Reihe von Data Marts als Enterprise Data Warehouse zu verwenden, sollten Data Marts mit konformen Dimensionen aufgebaut werden, die festlegen, dass gewöhnliche Objekte in verschiedenen Data Marts gleich dargestellt werden. Die konformen Dimensionen verbinden die Data Marts zu einem Data Warehouse, das im Allgemeinen als virtuelles Data Warehouse bezeichnet wird.

Der Vorteil des „Bottom-up“-Entwurfsansatzes ist der schnelle ROI, da die Entwicklung eines Data Marts, eines Data Warehouse für ein einzelnes Thema, weit weniger Zeit und Aufwand erfordert als die Entwicklung eines unternehmensweiten Data Warehouse. Außerdem ist das Risiko eines Fehlschlags noch geringer. Diese Methode ist von Natur aus schrittweise. Diese Methode ermöglicht es dem Projektteam, zu lernen und zu wachsen.

Data Warehouse Design

Vorteile des Bottom-up-Designs

Dokumente können schnell erstellt werden.

Das Data Warehouse kann erweitert werden, um neue Geschäftseinheiten aufzunehmen.

Es werden einfach neue Data Marts entwickelt und dann mit anderen Data Marts integriert.

Nachteile des Bottom-up-Designs

Die Standorte des Data Warehouse und der Data Marts sind beim Bottom-up-Design vertauscht.

Unterscheidung zwischen Top-Down-Design-Ansatz und Bottom-Up-Design-Ansatz

Top-Down-Design-Ansatz Bottom-Up-Design-Ansatz
Breaks the vast problem into smaller subproblems. Löst das wesentliche Low-Level-Problem und integriert es in ein höheres.
Inhärent architektonisch – kein Zusammenschluss mehrerer Data Marts. Inhärent inkrementell; kann wesentliche Data Marts zuerst planen.
Ein einziger, zentraler Speicher für Informationen über den Inhalt. Abteilungsbezogene Informationen gespeichert.
Zentrale Regeln und Kontrolle. Abteilungsspezifische Regeln und Kontrolle.
Es enthält redundante Informationen. Redundanz kann entfernt werden.
Es kann schnelle Ergebnisse bringen, wenn es mit Wiederholungen implementiert wird. Geringes Risiko des Scheiterns, günstige Kapitalrendite und Nachweis von Techniken.

Articles

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.