Un data warehouse è un singolo repository di dati dove un record da più fonti di dati è integrato per l’elaborazione analitica del business online (OLAP). Questo implica che un data warehouse deve soddisfare i requisiti di tutte le fasi del business all’interno dell’intera organizzazione. Quindi, la progettazione del data warehouse è un processo enormemente complesso, lungo e quindi soggetto a errori. Inoltre, le funzioni analitiche del business cambiano nel tempo, il che si traduce in cambiamenti nei requisiti dei sistemi. Pertanto, i sistemi di data warehouse e OLAP sono dinamici, e il processo di progettazione è continuo.
La progettazione del data warehouse prende un metodo diverso dalla materializzazione della vista nelle industrie. Vede i magazzini di dati come sistemi di database con esigenze particolari, come rispondere a query relative alla gestione. L’obiettivo della progettazione diventa come il record da più fonti di dati dovrebbe essere estratto, trasformato e caricato (ETL) per essere organizzato in un database come il data warehouse.
Ci sono due approcci
- approccio “top-down”
- approccio “bottom-up”
approccio di progettazione “top-down”
Nell’approccio di progettazione “Top-Down”, un magazzino di dati è descritto come un soggetto orientato, variabile nel tempo, non volatile e integrato per l’intera impresa. I dati provenienti da diverse fonti sono convalidati, riformattati e salvati in un database normalizzato (fino a 3NF) come il data warehouse. Il data warehouse immagazzina informazioni “atomiche”, i dati al più basso livello di granularità, da dove i data mart dimensionali possono essere costruiti selezionando i dati richiesti per specifici soggetti aziendali o particolari dipartimenti. Un approccio è un approccio guidato dai dati in quanto le informazioni vengono prima raccolte e integrate e poi vengono formulati i requisiti di business dai soggetti per costruire i data mart. Il vantaggio di questo metodo è che supporta una singola fonte di dati integrata. Così i data mart costruiti da esso avranno coerenza quando si sovrappongono.
Svantaggi del design top-down
I data mart sono caricati dai data warehouse.
Sviluppare nuovi data mart dal data warehouse è molto facile.
Svantaggi del design top-down
Questa tecnica è inflessibile al cambiamento delle esigenze dipartimentali.
Il costo di implementazione del progetto è alto.
Approccio di Design Bottom-Up
Nell’approccio “Bottom-Up”, un data warehouse è descritto come “una copia di dati di transazione architettura specifica per query e analisi”, termine che indica lo schema a stella. In questo approccio, un data mart viene creato prima per le necessarie capacità di reporting e analisi per particolari processi aziendali (o soggetti). Quindi è necessario essere un approccio guidato dal business in contrasto con l’approccio guidato dai dati di Inmon.
I data mart includono i dati a grana più bassa e, se necessario, anche i dati aggregati. Invece di un database normalizzato per il data warehouse, un database dimensionale denormalizzato viene adattato per soddisfare i requisiti di consegna dei dati dei data warehouse. Usando questo metodo, per usare l’insieme dei data mart come il data warehouse aziendale, i data mart dovrebbero essere costruiti con dimensioni conformate in mente, definendo che gli oggetti ordinari sono rappresentati allo stesso modo in diversi data mart. Le dimensioni conformate collegano i data mart per formare un data warehouse, che è generalmente chiamato un data warehouse virtuale.
Il vantaggio dell’approccio di progettazione “bottom-up” è che ha un ROI rapido, poiché lo sviluppo di un data mart, un data warehouse per un singolo soggetto, richiede molto meno tempo e sforzo rispetto allo sviluppo di un data warehouse a livello aziendale. Inoltre, il rischio di fallimento è ancora minore. Questo metodo è intrinsecamente incrementale. Questo metodo permette al team del progetto di imparare e crescere.
Svantaggi del design bottom-up
I documenti possono essere generati velocemente.
Il data warehouse può essere esteso per accogliere nuove unità di business.
Si tratta solo di sviluppare nuovi data mart e poi integrarsi con altri data mart.
Svantaggi del design bottom-up
Le posizioni del data warehouse e dei data mart sono invertite nel design dell’approccio bottom-up.
Differenziazione tra l’approccio di progettazione top-down e l’approccio di progettazione bottom-up
Approccio di progettazione top-down | Approccio di progettazione bottom-up |
---|---|
Rivide il grande problema in piccoli sottoproblemi. | Solve il problema essenziale di basso livello e lo integra in uno superiore. |
Intrinsecamente architettato- non un’unione di diversi data mart. | Intrinsecamente incrementale; può programmare prima i data mart essenziali. |
Memoria unica e centrale delle informazioni sul contenuto. | Informazioni dipartimentali memorizzate. |
Regole e controllo centralizzati. | Regole e controllo dipartimentali. |
Comprende informazioni ridondanti. | La ridondanza può essere rimossa. |
Può vedere risultati rapidi se implementato con ripetizioni. | Meno rischio di fallimento, ritorno favorevole sugli investimenti, e prova delle tecniche. |