Arquitectura BI: Introducción al Data Warehouse & Data Mart

https://unsplash.com/

Conocer qué son un Data Warehouse y un Data Mart y, sobre todo, entender su finalidad y la creciente necesidad de las organizaciones de implantarlos es realmente importante para llegar a comprender, desde un punto de vista global, qué es Business Intelligence y poder emprender un proyecto de sus características.

Si volvemos la vista atrás en nuestro blog, veremos que son dos términos ya comentados cuando hablábamos de los componentes que intervienen en la arquitectura de un proyecto Business Intelligence. Y como iremos viendo, aquí hay mucho que hablar, ya que existen diferentes tipos de arquitecturas BI según la finalidad y alcance que se le dé al data warehouse y, en consecuencia, al data mart, llegando a haber sólidas diferencias en la definición e implantación de éstos.

El concepto de Data Warehouse, palabra inglesa cuyo significado no es otro que almacén de datos, nació en la década de los 80 ante la necesidad de desarrollar un sistema de almacenamiento de datos que garantizase la fluidez, el orden y el fácil manejo de los mismos y que, a la vez, supusiera un ahorro en tiempo y presupuesto para las empresas frente a los sistemas utilizados hasta el momento.

Un Data Warehouse es, por tanto, un contenedor en el que se almacenan los datos procedentes de las distintas fuentes que puedan existir en una organización, quedando éstos integrados, depurados y ordenados en una única base de datos centralizada. En este almacén se guardarán los datos durante el período de tiempo requerido para cumplir con las necesidades de consulta de cada organización.
Con este sistema, las compañías consiguen tener integrados en un único contenedor todos los datos de sus diferentes procesos de negocio, listos para ser analizados mediante las herramientas de explotación y reporting.
Pero no nos olvidemos del Data Mart, cuya definición es bastante similar a la del Data Warehouse, siendo su alcance y finalidad las principales diferencias entre estos dos tipos de bases de datos.

Así, mientras un Data Warehouse contiene todos los datos de una organización y su principal función es la de “almacenarlos” de manera centralizada e integrada, un Data Mart solamente recoge un subconjunto de éstos, centrándose en un área específica dentro del negocio con la principal finalidad de prepararlos para su consulta directa y explotación mediante herramientas de reporting, satisfaciendo así las necesidades concretas de esa área dentro de la compañía, razón por la cual podría definirse como un almacén de datos departamental.

El DataMart es un sistema orientado a la consulta, cuyo diseño y distribución interna de los datos es clara y no hay dudas al respecto, estando éstos estructurados en modelos dimensionales de estrella o copo de nieve. Estos modelos están plenamente orientados a la consulta a través de queries sencillas y directas, siendo necesarios muy pocos joints para obtener los resultados buscados, aspecto que simplifica la resolución de las consultas por parte de las herramientas de reporting y dispone los datos bajo modelos intuitivos y fácilmente interpretables para la consulta directa de los equipos técnicos o incluso de negocio. Sin embargo, no se puede decir lo mismo del Data Warehouse, para el que hay diferentes enfoques en cuanto a sus características y funciones. En este sentido, y haciendo alusión al principio de esta entrada donde comentaba que existen diferentes tipos de arquitecturas, es aquí donde tiene lugar un debate abierto desde la década de los 90 sobre las bases del Data Warehouse.

Existen otros enfoques en cuanto a la estructura interna y construcción del Data Warehouse que expondremos en el siguiente artículo, siendo los más importantes son los de Bill Inmon y Ralph Kimball.

En BI Geek, empresa tecnológica centrada en Business Intelligence, Big Data & IA, apostamos por un nuevo modelo de consultoría orientado a hacer accesibles las soluciones informacionales y de tratamiento de datos para cualquier tipo de empresa.

--

--

--

Apostamos por un modelo de consultoría orientado a hacer accesibles las mejores soluciones de Analítica y de Big Data para cualquier tipo de empresa

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
BI Geek

BI Geek

Apostamos por un modelo de consultoría orientado a hacer accesibles las mejores soluciones de Analítica y de Big Data para cualquier tipo de empresa

More from Medium

Data Quality

Salary of a Data Architect

Data Quality — 5 metrics to measure data quality in your company

Data life cycle phases