Data Warehouse, Data mart y Data Mining

Data Warehouse cargado desde distintos orígenes de datos

  • Data Warehousing: Los Data Warehouse se basan en estructuras multidimensionales, en las que se almacena la información calculando previamente todas las combinaciones de todos los niveles de todas las aperturas de análisis. Aunque este método se puede considerar como exagerado, nunca será tan caro, como lo que le costaría a la organización el tomar las decisiones equivocadas. Siempre va a ser más barato el gasto que conlleva la adquisición de software o hardware que el costo que representa una decisión tomada a destiempo.
  • Data Mart: El almacén de datos de un hecho en particular se denomina Data Mart (DM).
  • Data Mining: Está asociado al escalón más alto de la pirámide (Nivel Estratégico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos. La Minería de Datos ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.

la diferencia entre los términos data warehouse y data mart es por mucho una cosa de perspectiva, un data mart es clásicamente una iniciativa de un solo departamento con un área específica, algo como “data mart de marketing” o “data mart de finanzas”. estos proyectos son usualmente desarrollados por separado sin una visión consistente a través de la compañía. por otro lado un repositorio centralizado sirve a muchas comunidades dentro de la organización, esto es lo que se conoce como data warehouse. usualmente los data marts utilizan los data warehouse como fuentes de datos.

el data warehouse es donde se guarda una vista de los datos de la organización los cuales pueden ser publicados, para que accedan a ellos los usuarios. estos datos son cargados mediante operaciones de extracción, transformación y carga (etl).  este proceso limpia y valida los datos cargados. esta información es organizada y presentada al usuario en una forma que le permita fácilmente formular sus propias preguntas de negocio.