Professional Documents
Culture Documents
UNIDAD DE POSTGRADO
MAESTRIA EN GOBIERNO DE TI
EQUIPO:
PROFESOR:
LIMA PER
NOVIEMBRE, 2015
Implementacin de DataMart y OLAP Ventas Huguito
HISTORIAL DE REVISIONES
2
Implementacin de DataMart y OLAP Ventas Huguito
1. RESUMEN EJECUTIVO
Desde principios de los 90s, las aplicaciones de inteligencia de negocios han evolucionado
dramticamente en muchas direcciones, debido al crecimiento de las bases de datos y la
necesidad de contar con informacin en tiempo real, acceso interactivo, el anlisis y la
manipulacin de tal informacin crtica por los ejecutivos de la empresa.
El punto de partida es la base de datos analtica, que mediante un proceso ETL toma los datos
de fuentes diversas, los transforma y los integra en una base de datos analtica, que puede ser
un datamart o un data warehouse, segn su cobertura de un rea o de todo el negocio. La
base de datos analtica se basa en un modelo multidimensional a diferencia de las bases de
datos transaccionales que por lo general son relacionales.
Por ejemplo, las dimensiones tpicas de un cubo que contenga informacin de ventas incluiran:
tiempo, regin, producto, canal, organizacin y escenario (planeado o real). Las medidas
tpicas incluiran: importe de ventas, unidades vendidas, beneficios o ganancias entre otras.
La parte de la solucin BI que tiene que ver con la extraccin de conocimiento a partir del
anlisis de los datos (informacin) de las bases de datos analticas, se resuelve mediante la
aplicacin de tcnicas y herramientas de minera de datos para realizar tareas de prediccin
(clasificacin y regresin), segmentacin (clusterng), reglas de asociacin y deteccin de
atpicos,
3
Implementacin de DataMart y OLAP Ventas Huguito
INDICE
1. RESUMEN EJECUTIVO______________________________________________ 3
2. INTRODUCCIN __________________________________________________ 6
2.1 Objetivo general del Proyecto: ________________________________________ 6
2.2 Objetivos especficos: _______________________________________________ 6
2.3 Alcance del proyecto________________________________________________ 7
3. LA EMPRESA _____________________________________________________ 8
3.1 Descripcin de la Empresa ___________________________________________ 8
3.2 Visin, Misin y Valores _____________________________________________ 8
3.3 Objetivos y metas de la empresa ______________________________________ 9
3.4 Organigrama de la Empresa _________________________________________ 10
3.5 Cadena de Valor. _________________________________________________ 10
3.6 Anlisis FODA Empresa: ____________________________________________ 11
4. CONCEPTUALIZACIN DEL NEGOCIO ________________________________ 12
4.1 Matriz de Objetivos Vs. Apalancadores ________________________________ 12
4.2 Matriz de Apalancadores Vs. Informacin til __________________________ 13
4.3 Conceptualizacin del DataMart _____________________________________ 14
A. BUSINESS INTELLIGENCE _________________________________________ 14
B. SISTEMAS TRANSACCIONALES ____________________________________ 15
C. SISTEMAS ANALTICOS___________________________________________ 16
D. DATAWAREHOUSE - DATAMART __________________________________ 16
E. PROCESO DATAWAREHOUSE _____________________________________ 17
F. ELEMENTOS DE UN DATA WAREHOUSE _____________________________ 17
TABLA DE HECHO: ____________________________________________ 17
DIMENSIN: ________________________________________________ 17
MTRICA:___________________________________________________ 18
TIPOS DE TABLAS DE HECHO ___________________________________ 18
TABLAS DE DIMENSIONES _____________________________________ 19
TIPOS DE MTRICAS __________________________________________ 20
4
Implementacin de DataMart y OLAP Ventas Huguito
5
Implementacin de DataMart y OLAP Ventas Huguito
2. INTRODUCCIN
Se hace una descripcin de la empresa Huguito Import S.A., resaltando los objetivos para
luego relacionarlos en un modelo conceptual del negocio.
El modelado y diseo se describen por separado e incluyen los grficos de los diagramas y
estructuras del datamart implementado.
Hacer una revisin del estado del arte referente a las tecnologas de inteligencia de
6
Implementacin de DataMart y OLAP Ventas Huguito
7
Implementacin de DataMart y OLAP Ventas Huguito
3. LA EMPRESA
Visin
En el ao 2020 HUGUITO IMPORT ser una empresa reconocida a nivel nacional por
su orientacin y compromiso con sus clientes, brindando soluciones en el suministro
de mquinas textiles para la industria y el sector textil.
8
Implementacin de DataMart y OLAP Ventas Huguito
Misin
Valores
9
Implementacin de DataMart y OLAP Ventas Huguito
Gerente
general
Atencion al
Ingresos Almacen
Cliente
Despacho
10
Implementacin de DataMart y OLAP Ventas Huguito
FORTALEZAS DEBILIDADES
OPORTUNIDADES AMENAZAS
11
Implementacin de DataMart y OLAP Ventas Huguito
APALANCADOR o ESTRATEGIAS
12
4.2 Matriz de Apalancadores Vs. Informacin til
Productividad
Colocaciones
Promotores
Calificacin
Nmero de
Nmero de
Colocados
Promotor
Inversin
Producto
OBJETIVO APALANCADOR/ INFORMACIN TIL
Montos
Tiempo
Cliente
Tienda
PBI
ventas, a nivel de empresas del sector
A. BUSINESS INTELLIGENCE
Cmo impactan
los cambios en
precio en el
comportamiento
de compra?
Cules
canales y
clientes se
desempean
mejor?
SOLUCIN BI
Cul es la
mejor
manera de
enfocar
promociones
para los
clientes?
Cules
productos no me
estn comprando
ahora?
La cadena de
suministro est
alineada con
los
consumidores?
Figura 3 : representacin general de una solucin BI (fuente:www.google.com)
Implementacin de DataMart y OLAP Ventas Huguito
B. SISTEMAS TRANSACCIONALES
15
Implementacin de DataMart y OLAP Ventas Huguito
C. SISTEMAS ANALTICOS
Los sistemas analticos estn basados en la informacin del sistema transaccional, es decir,
no existe ingreso de datos por parte del usuario y los reportes estn orientados a la
sumarizacin de la informacin. El objetivo principal de un sistema analtico es brindar
informacin base para la toma de decisiones. Este tipo de sistemas usa la tecnologa OLAP
(On line Analytical Processing)
D. DATAWAREHOUSE - DATAMART
16
Implementacin de DataMart y OLAP Ventas Huguito
E. PROCESO DATAWAREHOUSE
La estructura relacional de una base de datos operacional sigue las formas normales en su
diseo. Un data warehouse no debe seguir ese patrn de diseo. La idea principal es que la
informacin sea presentada desnormalizada para optimizar las consultas. Para ello se debe
identificar, en el seno de la organizacin, los procesos de negocio, las vistas para el proceso
de negocio y las medidas cuantificables asociadas a los mismos. De esta manera se habla
de:
TABLA DE HECHO:
Contiene las medidas o hechos del negocio. Por ejemplo, una venta puede identificarse
como un hecho de negocio.
DIMENSIN:
17
Implementacin de DataMart y OLAP Ventas Huguito
MTRICA:
A nivel de diseo una tabla de hecho es aquella que permite guardar dos tipos de
atributo diferenciados:
o Claves forneas hacia registros en una tabla de dimensin (en otras palabras, hacia
una vista de negocio)
18
Implementacin de DataMart y OLAP Ventas Huguito
TABLAS DE DIMENSIONES
Las dimensiones recogen los puntos de anlisis de un hecho. Por ejemplo, una venta se
puede analizar en funcin del da de venta, producto, cliente, vendedor o canal de
venta, entre otros. Respecto al punto de vista de la gestin histrica de los datos, stos
se pueden clasificar como: [Fuente: (Curto, INFORMATION MANEGEMENT, 2008)]
o Degenaradas:
Se encuentran como atributos en la tabla de hecho, si bien tiene el significado de un
punto de vista de anlisis. Contiene informacin de baja cardinalidad, formada por
relaciones dicotmicas. Frecuentemente contienen slo un atributo y, por ello, no se
crea una tabla aparte. Por ejemplo, el sexo de un paciente.
o Monster:
Es conveniente comentar que algunas dimensiones pueden crecer
desmesuradamente. Una buena prctica es romper la dimensin en dos tablas: una
que contenga los valores estticos y otra que contenga los valores voltiles. Un
ejemplo claro puede ser la informacin de cliente. Se debe ser consciente de cul
es la informacin primordial del mismo y cul la que slo se usa puntualmente en
los informes u otros anlisis.
o Junk:
Contiene informacin voltil que se usa puntualmente y que no se guarda de forma
permanente en la bodega de datos. Conformadas: que permite compartir
informacin entre dimensiones. Consiste en dimensiones definidas correctamente
para que sean usadas por dos tablas y poder as realizar consultas comunes. El
19
Implementacin de DataMart y OLAP Ventas Huguito
o Bridge:
Permiten definir relaciones n a m entre tablas de hecho. Necesarias para definir por
la relacin entre un piloto y sus mltiples patrocinadores.
TIPOS DE MTRICAS
o Mtricas:
Valores que recogen el proceso de una actividad o los resultados de la misma.
Estas medidas proceden del resultado de la actividad de negocio. o Mtricas de
realizacin de actividad (leading): miden la realizacin de una actividad. Por
ejemplo, la participacin de una persona en un evento. o Mtricas de resultado de
una actividad (lagging): recogen los resultados de una actividad. Por ejemplo, la
cantidad de puntos de un jugador en un partido.
o Indicadores clave:
Valores correspondientes que hay que alcanzar y que suponen el grado de
asuncin de los objetivos. Estas medidas proporcionan informacin sobre el
rendimiento de una actividad o sobre la consecucin de una meta.
20
Implementacin de DataMart y OLAP Ventas Huguito
Existen principalmente dos tipos de esquemas para estructurar los datos en un almacn
de datos:
ESQUEMA EN ESTRELLA:
A nivel de diseo, consiste en una tabla de hechos (o lo que en los libros se encontrar
como fact table) en el centro para el hecho objeto de anlisis y una o varias tablas de
dimensin por cada punto de vista da anlisis que participa de la descripcin de ese
hecho. Consiste en estructurar la informacin en procesos, vistas y mtricas recordando
a una estrella (por ello el nombre). En la tabla de hecho se encuentran los atributos
destinados a medir (cuantificar): sus mtricas. La tabla de hechos solo presenta uniones
con dimensiones.
(Curto, INFORMATION MANAGEMENT, 2007)
21
Implementacin de DataMart y OLAP Ventas Huguito
22
Implementacin de DataMart y OLAP Ventas Huguito
DIMENSIN DESCRIPCIN
23
Implementacin de DataMart y OLAP Ventas Huguito
DIMENSIN DESCRIPCIN
DIM_TIENDA DIM_PRODUCTO
DIM_TIEMPO DIM_CLIENTE
24
Implementacin de DataMart y OLAP Ventas Huguito
25
Implementacin de DataMart y OLAP Ventas Huguito
26
6.2 Modelo Fsico del Datamart
Bade de Datos HUGUITO_MART
Figura 13. Tablas seleccionadas de la fuente de origen de datos transaccional [Fuente: propia]
28
Implementacin de DataMart y OLAP Ventas Huguito
Figura 14. Proceso ETL.- poblando datos a HUGUITO_MART desde HUGUITO_OLTP [Fuente: propia]
29
TASK 1: Limpieza de la BD Destino (HUGUITO_MART)
--Eliminando Datos
DELETE FACT_VENTAS;
DELETE DIM_TIEMPO;
DELETE DIM_PRODUCTO;
DELETE DIM_TIENDA;
DELETE DIM_CLIENTE;
DELETE DIM_PROMOTOR;
--Inicializando Secuencias de la llave
DBCC CHECKIDENT ('DIM_TIENDA', RESEED, 0);
DBCC CHECKIDENT ('DIM_TIEMPO', RESEED, 0);
DBCC CHECKIDENT ('DIM_PRODUCTO', RESEED, 0);
DBCC CHECKIDENT ('DIM_CLIENTE', RESEED, 0);
DBCC CHECKIDENT ('DIM_PROMOTOR', RESEED, 0);
Query de Extraccn de Data del Origen. Por Ejm Datos para la Dimensin Tiempo
Implementacin de DataMart y OLAP Ventas Huguito
Transformacin de Datos
31
Implementacin de DataMart y OLAP Ventas Huguito
32
Implementacin de DataMart y OLAP Ventas Huguito
33
Implementacin de DataMart y OLAP Ventas Huguito
34
Implementacin de DataMart y OLAP Ventas Huguito
La tecnologa OLAP, suple la necesidad de tener este tipo de reportes dinmicos ad-
hoc para facilitar la toma de decisiones de manera ms rpida, inteligente, a nivel
horizontal y vertical de la organizacin.
Los reportes OLAP constituyen entonces una buena alternativa para favorecer la
creacin de nuevos reportes y recolectar informacin de valor para la organizacin, no
obstante la creacin de dichos reportes a partir de bases de datos transaccionales
podra parecer confuso y complicado tanto para acadmicos como para las
organizaciones.
Los ejecutivos de la empresa Huguito Import S.A. en cada una de sus tiendas podr
contar con acceso a la informacin de las ventas a travs del Excel como herramienta
conocida pero con la activacin del complemento Powerpivot para la visualizacin de
un Dashboard sobre aspectos crticos del negocio.
35
Implementacin de DataMart y OLAP Ventas Huguito
8. CONCLUSIONES
Las expectativas del curso han sido cubiertas y puestas en prctica de manera
exitosa.
36
Implementacin de DataMart y OLAP Ventas Huguito
9. LECCIONES APRENDIDAS
Es importante contar con acceso directo a la fuente de datos para poder hacer el
anlisis, la falta de esta facilidad complica el proyecto a la hora del mapeo y extraccin
de datos. Es posible que la data tenga muchas inconsistencia y requiera ser curada
antes de migrarse al Datamart.
37
Implementacin de DataMart y OLAP Ventas Huguito
BIBLIOGRAFA
4. Wikipedia, 2015
5. https://technet.microsoft.com/es-es/library/hh916543.aspx
6. (https://olgeferrer.wordpress.com/2013/10/14/creando-etl-con-sql-server-integration-
services-ssis/)
38