Professional Documents
Culture Documents
Sesin
Pagina: 10
Almacenes de Datos
Datawarehouse
I
OBJETIVOS
Analizar la estructura de un Datamart/Datawarehouse para una institucin
Aplicar a travs del diseo de un Datamart/Datawarehouse los conocimientos
adquiridos en el diseo de base de datos de las instituciones para su retroalimentacin.
Preparar ambientes de explotacin de datos relevantes y estructurados
II
TEMAS A TRATAR
~
~
~
~
~
Modelamiento Dimensional
Servicios de un Web site
Dimensionamiento
Administracin del Almacenamiento y la Optimizacin
Explotacin de la informacin
III
MARCO TEORICO
Funcin de un datawarehouse Baluarte (2003)
La funcin de un datawarehouse es la de seleccionar, resumir, analizar y filtrar los datos
de las bases de datos operativas y crear las bases de datos necesarias para que en base a
los datos histricos y de las fuentes externas se obtenga informacin valiosa para la toma
de decisiones diaria y de futuro.
Esta informacin crtica que se coloque al ejecutivo o administrador tiene las
caractersticas de:
Orientada hacia la informacin relevante de la organizacin
Ser resumida a diferentes niveles
Dr. Ing. Csar Baluarte Araya
Pagina: 11
De obtencin rpida
Sencilla de obtener y de manipular
Pagina: 12
DATA MART
A raiz de que la construccin de un datawarehouse es una labor titnica y de utilizacin
de muchos recursos, donde se incluye la inversin, es que surgi la necesidad de hacer
almacenes de datos departamentales que sirvan a un rea o funcin que resuelva sus
requerimientos especficos. As tenemos por citar algunas definiciones:
William Inmon (05) lo defineUn data mart es una coleccin de reas organizadas y
subordinadas para decisiones de soporte basadas en la necesidad de un departamento
especifico. As explica que Finanzas tiene su data mart, as como marketing, ventas y
otros.
Dr. Ing. Csar Baluarte Araya
Pagina: 13
Las soluciones de Data Marts, requieren una arquitectura de 3 capas: Los Data
Warehouses son la primera capa (opcional), los Data Marts son la segunda capa, y las
estaciones de trabajo de usuarios son la tercera.
DATA WAREHOUSE
DATA MART
Construido para satisfacer las necesidades de Construido para satisfacer las
informacin de toda la empresa.
necesidades de una funcin o unidad
comercial especfica.
Diseado para optimizar la integracin y la Diseado para optimizar la entrega de
administracin de los datos fuente.
informacin de soporte a decisiones.
Administra grandes cantidades de historia a Primordialmente se concentra en
nivel atmico.
administrar resmenes y/o datos de
muestreo.
Pertenece a, y se administra por, las
Puede ser propiedad de, y administrado
organizaciones de Sistemas de Informacin por, el grupo de Sistema de Informacin
(IS) de la empresa.
(IS) en la Lnea del Negocio.
Pagina: 14
El Modelo Dimensional
El modelado dimensional (ver la siguiente figura) es una tcnica de diseo lgico que busca
presentar la informacin en un marco estndar e intuitivo que permita un acceso de alto
rendimiento. Este tipo de modelado es independiente de las tecnologas y permite el empleo de
cualquier base de datos, ya sea relacional -denominadas ROLAP, cuando se aplica el modelo
dimensional a una base de datos relacional-, dimensional, -MOLAP, modelo dimensional sobre
base de datos dimensional-, de objetos, etc. Cada modelo dimensional est compuesto de una
tabla con una clave primaria compuesta, denominada tabla de hechos, y un conjunto de tablas
ms pequeas denominadas tablas de dimensiones. Cada una de las tablas de dimensin tiene
una clave primaria que corresponde exactamente con uno de los componentes de la clave
compuesta de la tabla de hechos. Esta estructura que asemeja una estrella una gran tabla
central o tabla de hechos conectada con un conjunto de tablas menores dispuestas de manera
radial alrededor de esta tabla central- recibe a menudo el nombre de star join o modelado en
estrella.
Una tabla de hechos, debido a su clave primaria compuesta de dos o ms claves ajenas, siempre
expresa una relacin muchos a muchos. las tablas de hechos, adems de sus campos clave,
contienen una o ms medidas numricas o hechos, que se dan para la combinacin de las
claves que definen cada registro. En el ejemplo, las mtricas son el valor de venta y el nmero de
unidades vendidas. Los indicadores ms tiles en una tabla de hechos son numricos y aditivos.
La aditividad es crucial porque las aplicaciones de Data Warehouse casi nunca recuperan un solo
registro de la tabla de hechos; en su lugar, acceden a cientos, miles o incluso millones de
registros a la vez y, por tanto, lo nico eficaz que se puede hacer con ellos es sumarlos.
Las tablas de dimensiones, por el contrario, contienen informacin textual descriptiva. Los
atributos de las dimensiones se emplean como fuente de las restricciones en las consultas al
DataWarehouse
El modelado en estrella es altamente desnormalizado. Con ello se logra minimizar el nmero de
uniones y, por consiguiente, incrementar el rendimiento de las consultas una tabla de hechos
est relacionada con numerosas tablas de dimensiones-. Una variante del modelo en estrella es
Dr. Ing. Csar Baluarte Araya
Pagina: 15
Pagina: 16
necesario volver a programar las herramientas de consulta o de reportes para adaptarse a los
cambios, y la ejecucin de las aplicaciones existentes continuar dando los mismos resultados.
(Fuente: http://www.tid.es)
IV
ACTIVIDADES
Pagina: 17
V
CUESTIONARIO
1.
2.
3.
4.
5.
6.
Qu es el modelamiento dimensional?
Cules son los modelos para crear o tratar un datamart/datawarehouse?
Realice la comparacin entre un datamart y un data warehouse
Explique el proceso ETL para un data warehouse
Cules seran las dimensiones para un datamart acadmico que contemple datos
referidos a la universidad, regin, departamento, facultad, programa profesional,
alumno y nota final, nota mnima, nota mxima?
Complemente lo aprendido anteriormente siguiendo el Tutorial del INEI sobre
creacin de Datawarehouse