Magazyn danych jest pojedynczym repozytorium danych, gdzie rekord z wielu źródeł danych jest zintegrowany do przetwarzania analitycznego online biznesu (OLAP). Oznacza to, że hurtownia danych musi spełniać wymagania wszystkich etapów biznesowych w całej organizacji. Projektowanie hurtowni danych jest więc procesem niezwykle złożonym, długotrwałym, a co za tym idzie podatnym na błędy. Ponadto, biznesowe funkcje analityczne zmieniają się w czasie, co powoduje zmiany wymagań stawianych systemom. Dlatego systemy hurtowni danych i OLAP są dynamiczne, a proces projektowania jest ciągły.
Projektowanie hurtowni danych przyjmuje inną metodę niż materializacja widoku w branżach. Postrzega ona hurtownie danych jako systemy baz danych o szczególnych potrzebach, takich jak odpowiadanie na zapytania związane z zarządzaniem. Celem projektu staje się, jak rekord z wielu źródeł danych powinny być pobierane, przekształcane i ładowane (ETL), aby być organizowane w bazie danych jako hurtowni danych.
Istnieją dwa podejścia
- „top-down” approach
- „bottom-up” approach
Top-down Design Approach
W podejściu projektowym „Top-Down”, hurtownia danych jest opisana jako zorientowana tematycznie, zmienne w czasie, nieulotne i zintegrowane repozytorium danych dla całego przedsiębiorstwa dane z różnych źródeł są walidowane, przeformatowywane i zapisywane w znormalizowanej (do 3NF) bazie danych jako hurtownia danych. Hurtownia danych przechowuje informacje „atomowe”, dane na najniższym poziomie ziarnistości, z których można budować wymiarowe data marts poprzez selekcję danych wymaganych dla konkretnych tematów biznesowych lub poszczególnych działów. Podejście to jest podejściem data-driven, gdyż najpierw zbierane i integrowane są informacje, a następnie formułowane są wymagania biznesowe przez podmioty do budowy data marts. Zaletą tej metody jest to, że obsługuje ona jedno zintegrowane źródło danych. Dzięki temu data marts zbudowane z niego będą miały spójność, gdy będą się na siebie nakładać.
Wady top-down design
Data Marts są ładowane z hurtowni danych.
Rozwijanie nowych data mart z hurtowni danych jest bardzo łatwe.
Wady top-down design
Ta technika jest nieelastyczna do zmieniających się potrzeb działów.
Koszt wdrożenia projektu jest wysoki.
Podejście projektowe Bottom-Up
W podejściu „Bottom-Up”, hurtownia danych jest opisana jako „kopia danych transakcyjnych specyficzna architektura dla zapytań i analiz”, określana schematem gwiazdy. W tym podejściu, data mart jest tworzony najpierw do niezbędnych raportowania i możliwości analitycznych dla poszczególnych procesów biznesowych (lub przedmiotów). Tak to jest potrzebne, aby być podejście napędzane przez biznes w przeciwieństwie do Inmon’s data-driven approach.
Data marts obejmują najniższe ziarno danych i, w razie potrzeby, zagregowane dane zbyt. Zamiast normalizowanej bazy danych dla hurtowni danych, denormalizowana baza danych wymiarowych jest przystosowana do spełnienia wymagań hurtowni danych w zakresie dostarczania danych. Przy użyciu tej metody, aby wykorzystać zestaw data marts jako hurtownię danych przedsiębiorstwa, data marts powinny być zbudowane z uwzględnieniem zgodnych wymiarów, definiujących, że zwykłe obiekty są reprezentowane tak samo w różnych data marts. Zgodne wymiary połączone marts danych do tworzenia hurtowni danych, który jest ogólnie nazywany wirtualnej hurtowni danych.
Zaletą „bottom-up” podejście projektowe jest to, że ma szybki ROI, jak rozwój mart danych, hurtownia danych dla jednego tematu, zajmuje znacznie mniej czasu i wysiłku niż rozwój hurtowni danych w całym przedsiębiorstwie. Ponadto, ryzyko niepowodzenia jest jeszcze mniejsze. Metoda ta jest z natury inkrementalna. Metoda ta pozwala zespołowi projektowemu uczyć się i rozwijać.
Zalety projektowania oddolnego
Dokumenty można generować szybko.
Magazyn danych można rozszerzyć w celu uwzględnienia nowych jednostek biznesowych.
To tylko opracowywanie nowych data marts, a następnie integracja z innymi data marts.
Wady projektu bottom-up
Lokalizacje hurtowni danych i data marts są odwrócone w projekcie podejścia bottom-up.
Różnicowanie między Top-Down Design Approach i Bottom-Up Design Approach
Top-Down Design Approach | Bottom-Up Design Approach |
---|---|
Rozbija rozległy problem na mniejsze podproblemy. | Rozwiązuje istotne problemy niskiego poziomu i integruje je w jeden wyższy. |
Właściwa architektura – nie jest unią kilku data marts. | Właściwa inkrementacja; może zaplanować istotne data marts w pierwszej kolejności. |
Jednolite, centralne przechowywanie informacji o zawartości. | Przechowywanie informacji o działach. |
Scentralizowane zasady i kontrola. | Departamentalne zasady i kontrola. |
Zawiera redundantne informacje. | Redundancja może być usunięta. |
Może zobaczyć szybkie rezultaty, jeśli zostanie wdrożone z powtórzeniami. | Mniejsze ryzyko niepowodzenia, korzystny zwrot z inwestycji i dowód technik. |
.