Magazyn danych jest pojedynczym repozytorium danych, gdzie rekord z wielu źródeł danych jest zintegrowany do przetwarzania analitycznego online biznesu (OLAP). Oznacza to, że hurtownia danych musi spełniać wymagania wszystkich etapów biznesowych w całej organizacji. Projektowanie hurtowni danych jest więc procesem niezwykle złożonym, długotrwałym, a co za tym idzie podatnym na błędy. Ponadto, biznesowe funkcje analityczne zmieniają się w czasie, co powoduje zmiany wymagań stawianych systemom. Dlatego systemy hurtowni danych i OLAP są dynamiczne, a proces projektowania jest ciągły.

Projektowanie hurtowni danych przyjmuje inną metodę niż materializacja widoku w branżach. Postrzega ona hurtownie danych jako systemy baz danych o szczególnych potrzebach, takich jak odpowiadanie na zapytania związane z zarządzaniem. Celem projektu staje się, jak rekord z wielu źródeł danych powinny być pobierane, przekształcane i ładowane (ETL), aby być organizowane w bazie danych jako hurtowni danych.

Istnieją dwa podejścia

  1. „top-down” approach
  2. „bottom-up” approach

Top-down Design Approach

W podejściu projektowym „Top-Down”, hurtownia danych jest opisana jako zorientowana tematycznie, zmienne w czasie, nieulotne i zintegrowane repozytorium danych dla całego przedsiębiorstwa dane z różnych źródeł są walidowane, przeformatowywane i zapisywane w znormalizowanej (do 3NF) bazie danych jako hurtownia danych. Hurtownia danych przechowuje informacje „atomowe”, dane na najniższym poziomie ziarnistości, z których można budować wymiarowe data marts poprzez selekcję danych wymaganych dla konkretnych tematów biznesowych lub poszczególnych działów. Podejście to jest podejściem data-driven, gdyż najpierw zbierane i integrowane są informacje, a następnie formułowane są wymagania biznesowe przez podmioty do budowy data marts. Zaletą tej metody jest to, że obsługuje ona jedno zintegrowane źródło danych. Dzięki temu data marts zbudowane z niego będą miały spójność, gdy będą się na siebie nakładać.

Wady top-down design

Data Marts są ładowane z hurtowni danych.

Rozwijanie nowych data mart z hurtowni danych jest bardzo łatwe.

Wady top-down design

Ta technika jest nieelastyczna do zmieniających się potrzeb działów.

Koszt wdrożenia projektu jest wysoki.

Projektowanie hurtowni danych

Podejście projektowe Bottom-Up

W podejściu „Bottom-Up”, hurtownia danych jest opisana jako „kopia danych transakcyjnych specyficzna architektura dla zapytań i analiz”, określana schematem gwiazdy. W tym podejściu, data mart jest tworzony najpierw do niezbędnych raportowania i możliwości analitycznych dla poszczególnych procesów biznesowych (lub przedmiotów). Tak to jest potrzebne, aby być podejście napędzane przez biznes w przeciwieństwie do Inmon’s data-driven approach.

Data marts obejmują najniższe ziarno danych i, w razie potrzeby, zagregowane dane zbyt. Zamiast normalizowanej bazy danych dla hurtowni danych, denormalizowana baza danych wymiarowych jest przystosowana do spełnienia wymagań hurtowni danych w zakresie dostarczania danych. Przy użyciu tej metody, aby wykorzystać zestaw data marts jako hurtownię danych przedsiębiorstwa, data marts powinny być zbudowane z uwzględnieniem zgodnych wymiarów, definiujących, że zwykłe obiekty są reprezentowane tak samo w różnych data marts. Zgodne wymiary połączone marts danych do tworzenia hurtowni danych, który jest ogólnie nazywany wirtualnej hurtowni danych.

Zaletą „bottom-up” podejście projektowe jest to, że ma szybki ROI, jak rozwój mart danych, hurtownia danych dla jednego tematu, zajmuje znacznie mniej czasu i wysiłku niż rozwój hurtowni danych w całym przedsiębiorstwie. Ponadto, ryzyko niepowodzenia jest jeszcze mniejsze. Metoda ta jest z natury inkrementalna. Metoda ta pozwala zespołowi projektowemu uczyć się i rozwijać.

Projektowanie hurtowni danych

Zalety projektowania oddolnego

Dokumenty można generować szybko.

Magazyn danych można rozszerzyć w celu uwzględnienia nowych jednostek biznesowych.

To tylko opracowywanie nowych data marts, a następnie integracja z innymi data marts.

Wady projektu bottom-up

Lokalizacje hurtowni danych i data marts są odwrócone w projekcie podejścia bottom-up.

Różnicowanie między Top-Down Design Approach i Bottom-Up Design Approach

Top-Down Design Approach Bottom-Up Design Approach
Rozbija rozległy problem na mniejsze podproblemy. Rozwiązuje istotne problemy niskiego poziomu i integruje je w jeden wyższy.
Właściwa architektura – nie jest unią kilku data marts. Właściwa inkrementacja; może zaplanować istotne data marts w pierwszej kolejności.
Jednolite, centralne przechowywanie informacji o zawartości. Przechowywanie informacji o działach.
Scentralizowane zasady i kontrola. Departamentalne zasady i kontrola.
Zawiera redundantne informacje. Redundancja może być usunięta.
Może zobaczyć szybkie rezultaty, jeśli zostanie wdrożone z powtórzeniami. Mniejsze ryzyko niepowodzenia, korzystny zwrot z inwestycji i dowód technik.

.

Articles

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.