Um data warehouse é um único repositório de dados onde um registro de múltiplas fontes de dados é integrado para processamento analítico de negócios online (OLAP). Isso implica que um data warehouse precisa atender aos requisitos de todas as etapas do negócio dentro de toda a organização. Assim, o design do data warehouse é um processo extremamente complexo, demorado e, portanto, sujeito a erros. Além disso, as funções analíticas do negócio mudam com o tempo, o que resulta em mudanças nos requisitos para os sistemas. Portanto, o data warehouse e os sistemas OLAP são dinâmicos e o processo de design é contínuo.

O design do data warehouse utiliza um método diferente da materialização da visão nas indústrias. Ele vê os data warehouses como sistemas de banco de dados com necessidades particulares, tais como responder a consultas relacionadas à gestão. O alvo do projeto torna-se como o registro de múltiplas fontes de dados deve ser extraído, transformado e carregado (ETL) para ser organizado em uma base de dados como o data warehouse.

Existem duas abordagens

  1. Abordagem “top-down”
  2. Abordagem “bottom-up”

Abordagem de design “top-down”

Na abordagem de design “top-down”, um armazém de dados é descrito como um armazém orientado ao assunto, Os repositórios de dados variáveis no tempo, não voláteis e integrados para todos os dados empresariais de diferentes fontes são validados, reformatados e gravados em um banco de dados normalizado (até 3NF) como o data warehouse. O data warehouse armazena informações “atômicas”, os dados no nível mais baixo de granularidade, de onde é possível construir data marts dimensionais selecionando os dados necessários para assuntos específicos de negócios ou departamentos particulares. Uma abordagem é uma abordagem baseada em dados, uma vez que as informações são coletadas e integradas primeiro e, em seguida, são formulados os requisitos comerciais por sujeitos para a construção de data marts. A vantagem deste método é que ele suporta uma única fonte de dados integrada. Assim, os data marts construídos a partir dele terão consistência quando eles se sobrepõem.

Vantagens do design top-down

Data Marts são carregados a partir dos data warehouses.

Desenvolver novos data marts a partir do data warehouse é muito fácil.

Desvantagens do design top-down

Esta técnica é inflexível às necessidades departamentais em mudança.

O custo de implementação do projeto é alto.

Concepção do Data Warehouse Design

Abordagem do design de baixo para cima

Na abordagem “Bottom-Up”, um data warehouse é descrito como “uma cópia da arquitetura específica de dados de transação para consulta e análise”, termo que designa o esquema em estrela. Nesta abordagem, um data mart é criado primeiro para os relatórios e capacidades analíticas necessárias para determinados processos de negócio (ou assuntos). Assim, é necessário ser uma abordagem orientada aos negócios, em contraste com a abordagem orientada aos dados da Inmon.

Data marts incluem os dados de grãos mais baixos e, se necessário, dados agregados também. Ao invés de uma base de dados normalizada para o data warehouse, uma base de dados dimensional desnormalizada é adaptada para atender aos requisitos de entrega de dados dos data warehouses. Usando este método, para usar o conjunto de data marts como o data warehouse da empresa, os data marts devem ser construídos com as dimensões conformadas em mente, definindo que objetos comuns são representados da mesma forma em data marts diferentes. As dimensões conformadas conectaram os data marts para formar um data warehouse, que é geralmente chamado de data warehouse virtual.

A vantagem da abordagem de design “bottom-up” é que ele tem um ROI rápido, pois desenvolver um data mart, um data warehouse para um único assunto, leva muito menos tempo e esforço do que desenvolver um data warehouse para toda a empresa. Além disso, o risco de falha é ainda menor. Este método é intrinsecamente incremental. Este método permite à equipe de projeto aprender e crescer.

Concepção de Data Warehouse

Vantagens do design bottom-up

Documentos podem ser gerados rapidamente.

O data warehouse pode ser estendido para acomodar novas unidades de negócio.

Está apenas desenvolvendo novos data marts e depois integrando-se com outros data marts.

Desvantagens do design bottom-up

As localizações do data warehouse e dos data marts são invertidas no design da abordagem bottom-up.

Diferenciação entre a Abordagem de Desenho Top-Down e a Abordagem de Desenho Bottom-Up

>

>

>

Abordagem de Desenho Top-Down Abordagem de Desenho Bottom-Up
Quebra o vasto problema em sub-problemas menores. Soluciona o problema essencial de baixo nível e os integra em um mais alto.
Inherently architected- not a union of several data marts. Inherently incremental; can schedule essential data marts first.
Single, central storage of information about the content. Departmental information stored.
Regras e controle centralizados. Regras e controle departamental.
Inclui informação redundante. Redundância pode ser removida.
Pode ver resultados rápidos se implementado com repetições. Menos risco de falha, retorno favorável do investimento e prova de técnicas.

Articles

Deixe uma resposta

O seu endereço de email não será publicado.