Un data warehouse è un singolo repository di dati dove un record da più fonti di dati è integrato per l’elaborazione analitica del business online (OLAP). Questo implica che un data warehouse deve soddisfare i requisiti di tutte le fasi del business all’interno dell’intera organizzazione. Quindi, la progettazione del data warehouse è un processo enormemente complesso, lungo e quindi soggetto a errori. Inoltre, le funzioni analitiche del business cambiano nel tempo, il che si traduce in cambiamenti nei requisiti dei sistemi. Pertanto, i sistemi di data warehouse e OLAP sono dinamici, e il processo di progettazione è continuo.

La progettazione del data warehouse prende un metodo diverso dalla materializzazione della vista nelle industrie. Vede i magazzini di dati come sistemi di database con esigenze particolari, come rispondere a query relative alla gestione. L’obiettivo della progettazione diventa come il record da più fonti di dati dovrebbe essere estratto, trasformato e caricato (ETL) per essere organizzato in un database come il data warehouse.

Ci sono due approcci

  1. approccio “top-down”
  2. approccio “bottom-up”

approccio di progettazione “top-down”

Nell’approccio di progettazione “Top-Down”, un magazzino di dati è descritto come un soggetto orientato, variabile nel tempo, non volatile e integrato per l’intera impresa. I dati provenienti da diverse fonti sono convalidati, riformattati e salvati in un database normalizzato (fino a 3NF) come il data warehouse. Il data warehouse immagazzina informazioni “atomiche”, i dati al più basso livello di granularità, da dove i data mart dimensionali possono essere costruiti selezionando i dati richiesti per specifici soggetti aziendali o particolari dipartimenti. Un approccio è un approccio guidato dai dati in quanto le informazioni vengono prima raccolte e integrate e poi vengono formulati i requisiti di business dai soggetti per costruire i data mart. Il vantaggio di questo metodo è che supporta una singola fonte di dati integrata. Così i data mart costruiti da esso avranno coerenza quando si sovrappongono.

Svantaggi del design top-down

I data mart sono caricati dai data warehouse.

Sviluppare nuovi data mart dal data warehouse è molto facile.

Svantaggi del design top-down

Questa tecnica è inflessibile al cambiamento delle esigenze dipartimentali.

Il costo di implementazione del progetto è alto.

Data Warehouse Design

Approccio di Design Bottom-Up

Nell’approccio “Bottom-Up”, un data warehouse è descritto come “una copia di dati di transazione architettura specifica per query e analisi”, termine che indica lo schema a stella. In questo approccio, un data mart viene creato prima per le necessarie capacità di reporting e analisi per particolari processi aziendali (o soggetti). Quindi è necessario essere un approccio guidato dal business in contrasto con l’approccio guidato dai dati di Inmon.

I data mart includono i dati a grana più bassa e, se necessario, anche i dati aggregati. Invece di un database normalizzato per il data warehouse, un database dimensionale denormalizzato viene adattato per soddisfare i requisiti di consegna dei dati dei data warehouse. Usando questo metodo, per usare l’insieme dei data mart come il data warehouse aziendale, i data mart dovrebbero essere costruiti con dimensioni conformate in mente, definendo che gli oggetti ordinari sono rappresentati allo stesso modo in diversi data mart. Le dimensioni conformate collegano i data mart per formare un data warehouse, che è generalmente chiamato un data warehouse virtuale.

Il vantaggio dell’approccio di progettazione “bottom-up” è che ha un ROI rapido, poiché lo sviluppo di un data mart, un data warehouse per un singolo soggetto, richiede molto meno tempo e sforzo rispetto allo sviluppo di un data warehouse a livello aziendale. Inoltre, il rischio di fallimento è ancora minore. Questo metodo è intrinsecamente incrementale. Questo metodo permette al team del progetto di imparare e crescere.

Data Warehouse Design

Svantaggi del design bottom-up

I documenti possono essere generati velocemente.

Il data warehouse può essere esteso per accogliere nuove unità di business.

Si tratta solo di sviluppare nuovi data mart e poi integrarsi con altri data mart.

Svantaggi del design bottom-up

Le posizioni del data warehouse e dei data mart sono invertite nel design dell’approccio bottom-up.

Differenziazione tra l’approccio di progettazione top-down e l’approccio di progettazione bottom-up

Approccio di progettazione top-down Approccio di progettazione bottom-up
Rivide il grande problema in piccoli sottoproblemi. Solve il problema essenziale di basso livello e lo integra in uno superiore.
Intrinsecamente architettato- non un’unione di diversi data mart. Intrinsecamente incrementale; può programmare prima i data mart essenziali.
Memoria unica e centrale delle informazioni sul contenuto. Informazioni dipartimentali memorizzate.
Regole e controllo centralizzati. Regole e controllo dipartimentali.
Comprende informazioni ridondanti. La ridondanza può essere rimossa.
Può vedere risultati rapidi se implementato con ripetizioni. Meno rischio di fallimento, ritorno favorevole sugli investimenti, e prova delle tecniche.

Articles

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.