Un almacén de datos es un único repositorio de datos donde se integra un registro de múltiples fuentes de datos para el procesamiento analítico empresarial en línea (OLAP). Esto implica que un almacén de datos debe cumplir con los requisitos de todas las etapas del negocio dentro de toda la organización. Por tanto, el diseño de un almacén de datos es un proceso enormemente complejo, largo y, por tanto, propenso a errores. Además, las funciones analíticas del negocio cambian con el tiempo, lo que provoca cambios en los requisitos de los sistemas. Por lo tanto, los sistemas de almacén de datos y OLAP son dinámicos, y el proceso de diseño es continuo.
El diseño de los almacenes de datos adopta un método diferente al de la materialización de vistas en las industrias. Considera los almacenes de datos como sistemas de bases de datos con necesidades particulares, como responder a consultas relacionadas con la gestión. El objetivo del diseño se convierte en cómo el registro de múltiples fuentes de datos debe ser extraído, transformado y cargado (ETL) para ser organizado en una base de datos como el almacén de datos.
Hay dos enfoques
- enfoque «top-down»
- enfoque «bottom-up»
Enfoque de diseño «top-down»
En el enfoque de diseño «top-down», un almacén de datos se describe como una base de datos orientada al sujeto, orientado al tema, variable en el tiempo, no volátil e integrado para toda la empresa. Los datos de diferentes fuentes son validados, reformateados y guardados en una base de datos normalizada (hasta 3NF) como el almacén de datos. El almacén de datos almacena información «atómica», los datos al nivel más bajo de granularidad, a partir de los cuales se pueden construir mercados de datos dimensionales seleccionando los datos necesarios para temas empresariales específicos o departamentos concretos. Se trata de un enfoque orientado a los datos, ya que primero se recopila e integra la información y luego se formulan los requisitos empresariales por temas para construir los mercados de datos. La ventaja de este método es que admite una única fuente de datos integrada. Así, los marts de datos construidos a partir de él tendrán consistencia cuando se superpongan.
Desventajas del diseño descendente
Los marts de datos se cargan desde los almacenes de datos.
Desarrollar nuevos marts de datos desde el almacén de datos es muy fácil.
Desventajas del diseño descendente
Esta técnica es inflexible a las necesidades cambiantes de los departamentos.
El coste de implementación del proyecto es elevado.
Enfoque de diseño «Bottom-Up»
En el enfoque «Bottom-Up», un almacén de datos se describe como «una copia de la arquitectura específica de los datos de las transacciones para su consulta y análisis», término el esquema de estrella. En este enfoque, se crea primero un mercado de datos para las capacidades analíticas y de información necesarias para determinados procesos de negocio (o temas). Por lo tanto, es necesario que sea un enfoque impulsado por el negocio en contraste con el enfoque impulsado por los datos de Inmon.
Los mercados de datos incluyen los datos de grano más bajo y, si es necesario, también los datos agregados. En lugar de una base de datos normalizada para el almacén de datos, se adapta una base de datos dimensional desnormalizada para satisfacer los requisitos de entrega de datos de los almacenes de datos. Con este método, para utilizar el conjunto de marts de datos como almacén de datos de la empresa, los marts de datos deben construirse teniendo en cuenta las dimensiones conformadas, definiendo que los objetos ordinarios se representan igual en los diferentes marts de datos. Las dimensiones conformadas conectan los data marts para formar un almacén de datos, que generalmente se denomina almacén de datos virtual.
La ventaja del enfoque de diseño «ascendente» es que tiene un rápido retorno de la inversión, ya que desarrollar un data mart, un almacén de datos para un solo tema, lleva mucho menos tiempo y esfuerzo que desarrollar un almacén de datos para toda la empresa. Además, el riesgo de fracaso es aún menor. Este método es inherentemente incremental. Este método permite que el equipo del proyecto aprenda y crezca.
Ventajas del diseño ascendente
Los documentos pueden generarse rápidamente.
El almacén de datos puede ampliarse para dar cabida a nuevas unidades de negocio.
Sólo se trata de desarrollar nuevos marts de datos y luego integrarlos con otros marts de datos.
Desventajas del diseño ascendente
las ubicaciones del almacén de datos y de los marts de datos se invierten en el diseño de enfoque ascendente.
Diferencia entre el enfoque de diseño descendente y el enfoque de diseño ascendente
Enfoque de diseño descendente | Enfoque de diseño ascendente |
---|---|
Divide el gran problema en subproblemas más pequeños. | Resuelve el problema esencial de bajo nivel y los integra en uno superior. |
Arquitectura inherente- no una unión de varios marts de datos. | Intrínsecamente incremental; puede programar primero los marts de datos esenciales. |
Almacenamiento único y central de información sobre el contenido. | Almacenamiento de información departamental. |
Reglas y control centralizados. | Reglas y control departamental. |
Incluye información redundante. | Se puede eliminar la redundancia. |
Puede ver resultados rápidos si se implementa con repeticiones. | Menos riesgo de fracaso, retorno de la inversión favorable y prueba de técnicas. |