Datový sklad je jediné datové úložiště, kde je integrován záznam z více zdrojů dat pro online analytické zpracování (OLAP). Z toho vyplývá, že datový sklad musí splňovat požadavky ze všech fází podnikání v rámci celé organizace. Návrh datového skladu je tedy nesmírně složitý, zdlouhavý, a tudíž i náchylný k chybám. Podnikové analytické funkce se navíc v průběhu času mění, což vede ke změnám požadavků na systémy. Proto jsou datové sklady a systémy OLAP dynamické a proces návrhu probíhá průběžně.
Pro návrh datového skladu se používá metoda odlišná od materializace pohledů v odvětvích. Na datové sklady se dívá jako na databázové systémy s konkrétními potřebami, jako je zodpovídání dotazů souvisejících s řízením. Cílem návrhu se stává to, jak mají být záznamy z více zdrojů dat extrahovány, transformovány a načteny (ETL), aby byly uspořádány v databázi jako datový sklad.
Existují dva přístupy
- přístup „shora dolů“
- přístup „zdola nahoru“
Přístup návrhu „shora dolů“
V přístupu návrhu „shora dolů“ je datový sklad popsán jako věcně orientovaný, časově proměnlivé, nevolatilní a integrované datové úložiště pro celý podnik data z různých zdrojů jsou validována, přeformátována a uložena v normalizované (až 3NF) databázi jako datový sklad. Datový sklad uchovává „atomické“ informace, data na nejnižší úrovni granularity, z nichž lze sestavit dimenzionální datové marty výběrem dat potřebných pro konkrétní podnikatelské subjekty nebo konkrétní oddělení. Jde o přístup založený na datech, neboť se nejprve shromažďují a integrují informace a teprve poté se formulují obchodní požadavky subjektů na budování datových skladů. Výhodou této metody je, že podporuje jediný integrovaný zdroj dat. Datové marty z něj vybudované tak budou mít při překrývání konzistenci.
Výhody návrhu shora dolů
Data marty se načítají z datových skladů.
Vývoj nového data martu z datového skladu je velmi snadný.
Nevýhody návrhu shora dolů
Tato technika je nepružná vůči měnícím se potřebám oddělení.
Náklady na realizaci projektu jsou vysoké.
Přístup návrhu zdola nahoru
Při přístupu „zdola nahoru“ je datový sklad popsán jako „kopie specifické architektury transakčních dat pro dotazování a analýzu“, termín hvězdicové schéma. V tomto přístupu se nejprve vytvoří datový mart pro potřebné reportovací a analytické možnosti pro konkrétní obchodní procesy (nebo subjekty). Na rozdíl od Inmonova přístupu založeného na datech je tedy třeba, aby se jednalo o přístup řízený obchodem.
Data marty obsahují data nejnižšího zrna a v případě potřeby také agregovaná data. Namísto normalizované databáze pro datový sklad je denormalizovaná dimenzionální databáze přizpůsobena požadavkům datových skladů na poskytování dat. Při použití této metody, aby bylo možné použít sadu datových marţí jako podnikový datový sklad, by měly být datové marţe budovány s ohledem na konformní dimenze, které definují, ţe běţné objekty jsou v různých datových marţích reprezentovány stejně. Konformní dimenze propojily datové marty a vytvořily datový sklad, který se obecně nazývá virtuální datový sklad.
Výhodou metody návrhu „zdola nahoru“ je, že má rychlou návratnost investic, protože vývoj datového martu, datového skladu pro jeden subjekt, zabere mnohem méně času a úsilí než vývoj celopodnikového datového skladu. Také riziko selhání je ještě menší. Tato metoda je ze své podstaty přírůstková. Tato metoda umožňuje projektovému týmu učit se a růst.
Výhody návrhu zdola nahoru
Datové sklady lze vytvářet rychle.
Datový sklad lze rozšířit o nové obchodní jednotky.
Jedná se pouze o vývoj nových datových skladů a následnou integraci s jinými datovými sklady.
Nevýhody návrhu zdola nahoru
při návrhu přístupu zdola nahoru jsou umístění datového skladu a datových marty obrácená.
Rozlišujte mezi přístupem návrhu shora dolů a přístupem návrhu zdola nahoru
Přístup návrhu shora dolů | Přístup návrhu zdola nahoru |
---|---|
Rozdělí rozsáhlý problém na menší dílčí problémy. | Řeší zásadní problém na nízké úrovni a integruje je do vyššího. |
Vlastní architektura – nejedná se o spojení několika datových oddílů. | Vlastně inkrementální; může nejdříve naplánovat zásadní datové oddíly. |
Jediné, centrální úložiště informací o obsahu. | Uložené informace. |
Centralizovaná pravidla a kontrola. | Pravidla a kontrola jednotlivých oddělení. |
Obsahuje redundantní informace. | Redundanci lze odstranit. |
Může zaznamenat rychlé výsledky, pokud se realizuje s opakováním. | Menší riziko neúspěchu, příznivá návratnost investic a prokázání technik. |
.