You are on page 1of 38

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERA DE SISTEMAS E INFORMTICA

UNIDAD DE POSTGRADO

MAESTRIA EN GOBIERNO DE TI

INTELIGENCIA DE NEGOCIOS Y GESTIN DOCUMENTAL

INFORME: DISEO Y CONSTRUCCIN DE UN DATAMART Y OLAP


VENTAS HUGUITO

EQUIPO:

ARTURO CUADROS CRDOVA


ANBAL SUAREZ
MAX SALAZAR VELSQUEZ
JOHNY PRETELL CRUZADO

PROFESOR:

ING. MIGUEL J. CASMA SALCEDO

LIMA PER

NOVIEMBRE, 2015
Implementacin de DataMart y OLAP Ventas Huguito

HISTORIAL DE REVISIONES

Fecha Versin Descripcin Autor

24-10-2015 Ver 1.0 Definicin de objetivos y alcance Equipo

31-10-2015 Ver 2.0 Diseo e implementacin de DataMart Equipo

07-10-2015 Ver 3.0 Elaboracin de Cubo Ventas y Dashboard Equipo

09-11-2015 Ver 4.0 Elaboracin de Cubo Ventas y Dashboard Equipo

2
Implementacin de DataMart y OLAP Ventas Huguito

1. RESUMEN EJECUTIVO

Desde principios de los 90s, las aplicaciones de inteligencia de negocios han evolucionado
dramticamente en muchas direcciones, debido al crecimiento de las bases de datos y la
necesidad de contar con informacin en tiempo real, acceso interactivo, el anlisis y la
manipulacin de tal informacin crtica por los ejecutivos de la empresa.

Las soluciones de inteligencia de negocios incorporan tcnicas y procedimientos para


transformar los datos del negocio en informacin, y la informacin en conocimiento, que ser
utilizado en el proceso de toma de decisiones de la empresa.

El punto de partida es la base de datos analtica, que mediante un proceso ETL toma los datos
de fuentes diversas, los transforma y los integra en una base de datos analtica, que puede ser
un datamart o un data warehouse, segn su cobertura de un rea o de todo el negocio. La
base de datos analtica se basa en un modelo multidimensional a diferencia de las bases de
datos transaccionales que por lo general son relacionales.

La explotacin de la informacin de las bases de datos analticas se implementa a travs del


procesamiento analtico en lnea-OLAP, de tal manera que la informacin es vista como cubos,
los cuales consisten de categoras descriptivas (dimensiones) y valores cuantitativos (medidas).
El modelo de datos multidimensional facilita a los ejecutivos la formulacin de consultas
complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar
o rebanar los datos en subconjuntos significativos.

Por ejemplo, las dimensiones tpicas de un cubo que contenga informacin de ventas incluiran:
tiempo, regin, producto, canal, organizacin y escenario (planeado o real). Las medidas
tpicas incluiran: importe de ventas, unidades vendidas, beneficios o ganancias entre otras.

La parte de la solucin BI que tiene que ver con la extraccin de conocimiento a partir del
anlisis de los datos (informacin) de las bases de datos analticas, se resuelve mediante la
aplicacin de tcnicas y herramientas de minera de datos para realizar tareas de prediccin
(clasificacin y regresin), segmentacin (clusterng), reglas de asociacin y deteccin de
atpicos,

3
Implementacin de DataMart y OLAP Ventas Huguito

INDICE

1. RESUMEN EJECUTIVO______________________________________________ 3
2. INTRODUCCIN __________________________________________________ 6
2.1 Objetivo general del Proyecto: ________________________________________ 6
2.2 Objetivos especficos: _______________________________________________ 6
2.3 Alcance del proyecto________________________________________________ 7
3. LA EMPRESA _____________________________________________________ 8
3.1 Descripcin de la Empresa ___________________________________________ 8
3.2 Visin, Misin y Valores _____________________________________________ 8
3.3 Objetivos y metas de la empresa ______________________________________ 9
3.4 Organigrama de la Empresa _________________________________________ 10
3.5 Cadena de Valor. _________________________________________________ 10
3.6 Anlisis FODA Empresa: ____________________________________________ 11
4. CONCEPTUALIZACIN DEL NEGOCIO ________________________________ 12
4.1 Matriz de Objetivos Vs. Apalancadores ________________________________ 12
4.2 Matriz de Apalancadores Vs. Informacin til __________________________ 13
4.3 Conceptualizacin del DataMart _____________________________________ 14
A. BUSINESS INTELLIGENCE _________________________________________ 14
B. SISTEMAS TRANSACCIONALES ____________________________________ 15
C. SISTEMAS ANALTICOS___________________________________________ 16
D. DATAWAREHOUSE - DATAMART __________________________________ 16
E. PROCESO DATAWAREHOUSE _____________________________________ 17
F. ELEMENTOS DE UN DATA WAREHOUSE _____________________________ 17
TABLA DE HECHO: ____________________________________________ 17
DIMENSIN: ________________________________________________ 17
MTRICA:___________________________________________________ 18
TIPOS DE TABLAS DE HECHO ___________________________________ 18
TABLAS DE DIMENSIONES _____________________________________ 19
TIPOS DE MTRICAS __________________________________________ 20

4
Implementacin de DataMart y OLAP Ventas Huguito

G. ESQUEMAS PARA UN DATA WAREHOUSE ___________________________ 20


ESQUEMA EN ESTRELLA:_______________________________________ 21
ESQUEMA EN COPO DE NIEVE:__________________________________ 21
5. MODELADO DIMENSIONAL DEL DATAMART ____________________ 23
5.1 Diagrama funcional de dimensiones y medidas _________________________ 23
5.2 Descripcin de Dimensiones _________________________________________ 23
5.3 Descripcin de Medidas ____________________________________________ 24
5.4 Jerarquas de las Dimensiones _______________________________________ 24
5.5 Modelo Lgico del Datamart ________________________________________ 25
5.6 Diagrama de la Arquitectura del Datamart _____________________________ 25
6. DISEO DEL DATAMART ______________________________________ 26
6.1 Estructuras de las tablas de Dimensiones y Hechos ______________________ 26
6.2 Modelo Fsico del Datamart _________________________________________ 27
6.3 Descripcin de las Fuentes de Datos __________________________________ 28
6.4 Definicin de la Extraccin, Transformacin y Carga - ETL _________________ 29
7. DASHBOARD Y CONSULTAS DINMICAS _______________________ 32
7.1 Diseo de Interfaz para el Usuario Final _______________________________ 32
7.2 Construccin de Consultas y Reportes Dinmicos. _______________________ 32
7.2.1 Reporte de Ventas por Tienda. ________________________________ 32
7.2.2 Reporte de Ventas por Categora. ______________________________ 33
7.2.3 Reporte Cantidad de Ventas x Marca de Producto. ________________ 33
7.2.4 Reporte de Ventas Anuales por Departamento.___________________ 34
7.2.5 Comisin por Vendedor ______________________________________ 34
7.3 Beneficios para el Negocio. _________________________________________ 35
8. CONCLUSIONES ______________________________________________ 36
9. LECCIONES APRENDIDAS _____________________________________ 37
BIBLIOGRAFA _____________________________________________________ 38

5
Implementacin de DataMart y OLAP Ventas Huguito

2. INTRODUCCIN

El presente informe sobre investigacin y construccin de una solucin de Inteligencia de


Negocios, tiene por objetivo principal describir el proceso seguido para la construccin de una
solucin BI para la empresa Huguito Import S.A., como parte de la aplicacin prctica de los
conocimientos recibidos en el curso de Inteligencia de negocios y gestin documental.

Se ha seguido los lineamientos planteados en el curso, ajustados a la metodologa de Ralph


Kimball para la implementacin de un Datamart.

Con el propsito de hacer ms entendible este informe, se ha dividido en 10 puntos, cuyos


contenidos se describen ms adelante.

Se incluye un resumen ejecutivo que describe a alto nivel el proceso de inteligencia de


negocios. La introduccin que hace un acercamiento al objetivo y alcance de este proyecto y
describe la estructura de este informe.

Se hace una descripcin de la empresa Huguito Import S.A., resaltando los objetivos para
luego relacionarlos en un modelo conceptual del negocio.

El modelado y diseo se describen por separado e incluyen los grficos de los diagramas y
estructuras del datamart implementado.

El punto relacionado con la explotacin de informacin, describe los cubos y dashboards


implementados para las consultas finales por parte de los ejecutivos de la empresa.

Las conclusiones, recomendaciones y lecciones aprendidas, describen los logros y las


limitaciones que se tuvo durante el diseo y construccin de la solucin BI.

Por ltimo se presenta anexos y la bibliografa sobre el tema.

2.1 Objetivo general del Proyecto:


El presente trabajo tiene como objetivo el desarrollo de una solucin B.I. con la finalidad de
apoyar la toma de decisiones en las reas de ventas, compras y atencin al cliente de la
empresa Huguito Import s.a., facilitando el logro de sus objetivos en las reas mencionadas y a
nivel de negocio.

2.2 Objetivos especficos:

Hacer una revisin del estado del arte referente a las tecnologas de inteligencia de

6
Implementacin de DataMart y OLAP Ventas Huguito

negocios con el propsito de reforzar los temas del curso.

Analizar las herramientas de software y la aplicacin de tcnicas para la construccin


de una basa de datos analtica y la implementacin de cubos OLAP.

Documentar la metodologa para diseo de:

o El procedimiento para el diseo del DataMart


o La estructura de Dimensiones y Jerarquas
o La estructura de tablas de hechos
o El proceso ETL
o La estructura del esquema Analysis Services
o Estructura de las consultas y visualizacin de reportes con Powerpivot
o La construccin de dashboards
o La construccin de consultas y reportes con el software Tableu
o El procesos de minera de datos usando el software Weka

2.3 Alcance del proyecto


El proyecto comprende desde el anlisis de informacin de alto nivel la empresa Huguito Import
S.A., el anlisis de la informacin transaccional, el diseo y construccin de la base de datos
analtica, la construccin de consultas y reportes en base a la informacin analtica y el anlisis
de determinados comportamiento aplicando una tcnica de minera de datos.

7
Implementacin de DataMart y OLAP Ventas Huguito

3. LA EMPRESA

3.1 Descripcin de la Empresa


HUGUITO IMPORT se inicia hace ms de 10 aos como un grupo importador con el
esfuerzo comercial de dos empresas orientadas a comercializar repuestos y mquinas
industriales y semi industriales para la industria textil. A lo largo de los aos se ha
ganado la confianza de marcas extranjeras convirtindose inclusive en un
representante exclusivo de algunas en el pas.

HUGUITO IMPORT brinda una amplia variedad de accesorios y repuestos que


complementan perfectamente un completo proceso de confeccin. Asimismo ofrece el
apoyo de un equipo de profesionales especializados en la reparacin y mantenimiento
de la maquinaria industrial, orientados a resolver eficientemente las necesidades o
dificultades de sus clientes.

Figura 1: Imagen Institucional Huguito Import S.A.

3.2 Visin, Misin y Valores

Visin

En el ao 2020 HUGUITO IMPORT ser una empresa reconocida a nivel nacional por
su orientacin y compromiso con sus clientes, brindando soluciones en el suministro
de mquinas textiles para la industria y el sector textil.

8
Implementacin de DataMart y OLAP Ventas Huguito

Misin

Producir y comercializar eficientemente maquinas textiles para satisfacer las


necesidades y expectativas de nuestros clientes, capacitando y gestionando el talento
humano, actuando con responsabilidad social, brindando un rendimiento racional a los
accionistas y bienestar a todos sus empleados.

Valores

Participacin Activa: El grupo humano HUGUITO IMPORT es la fuente de


nuestra fortaleza, su participacin activa y el trabajo en equipo, proporcionan
vitalidad y talento empresarial.

Responsabilidad: Las actividades que realiza la empresa y su personal son


desarrollados bajo criterios de responsabilidad con la ley, la sociedad, nuestros
proveedores y nuestros clientes

Servicio: Desarrollamos nuestras actividades estableciendo con los clientes


relaciones sostenibles, permanentes y exitosas.

Innovacin: Investigacin de las tendencias de la industria textil, desarrollo y


asimilacin permanente de tecnologa y conocimiento, para el crecimiento y
mejoramiento continuo.

Respeto: Valoramos a las personas, las instituciones y sus relaciones, les


reconocemos sus derechos y sus deberes.

3.3 Objetivos y metas de la empresa


(O1).- Ampliar su mercado de ventas (Mquina de Coser) mediante la apertura
de nuevos locales comerciales en diversas zonas del pas.

(O2).-Mejorar la atencin de servicio al cliente evitando tiempo de espera y


colas por parte de los clientes

(O3).-Diversificacin de productos, quitar productos que tengan menos rotacin


en almacn.

9
Implementacin de DataMart y OLAP Ventas Huguito

3.4 Organigrama de la Empresa

Organigrama Huguito Import S.A

Gerente
general

Contabilidad Compras Ventas

Atencion al
Ingresos Almacen
Cliente

Egresos Inventarios Caja Facturacion

Despacho

Figura 2: Estructura orgnica de Huguito Import S.A.

3.5 Cadena de Valor.

Figura 3: Procesos del negocio de Huguito Import S.A.

10
Implementacin de DataMart y OLAP Ventas Huguito

3.6 Anlisis FODA Empresa:

Anlisis Situacional Huguito Import S.A

FORTALEZAS DEBILIDADES

Ser una empresa Peruana. Poco impulso en el correcto uso de


tecnologas de informacin.
Experiencia en el manejo del negocio
Asociacin y exclusividad con empresas Falta de innovacin en los nuevos
proveedoras de mquinas Chinas. servicios y promociones
Diseos exclusivos que permiten poseer Bajo poder de negociacin con los
una ventaja competitiva y as clientes debido al margen ajustado de
diferenciarse en el mercado. precios
Precios econmicos
Personal con conocimiento insipiente en
Lucha constantemente por incrementar el uso de tecnologas de informacin.
nuestro nmero de mercado.
Rotacin constante de personal.
Servicio de mantenimiento Post- Venta.
Lealtad de los consumidores. Falta de estandarizacin de procesos
internos del negocio.

OPORTUNIDADES AMENAZAS

Incrementar la participacin en el El reconocimiento que tienen ciertas


mercado por la salida de competidores. empresas reflejado por su acelerado
crecimiento
Incorporacin de nuevos lugares de
comercializacin con ventas a La continua oferta que tienen las
minoristas. empresas en busca de ganar demanda de
los clientes
Mejorar la posicin de nuestra marca en
el mercado. Riesgo pas problemas externos no
controlables como la inflacin,
Dirigir promociones a los consumidores
inestabilidad poltica y econmica, etc.
y distribuidores.
Entrada de nuevas empresas al mercado
Aumento de nuestra publicidad.
La aceptacin del producto
Aprovechamiento de Tecnologas de
Informacin.

Cuadro 1: Anlisis FODA Huguito Import S.A..

11
Implementacin de DataMart y OLAP Ventas Huguito

4. CONCEPTUALIZACIN DEL NEGOCIO

4.1 Matriz de Objetivos Vs. Apalancadores

APALANCADOR o ESTRATEGIAS

O1: Ampliar en 20% su mercado de Apertura de nuevos locales


ventas, a nivel de empresas del
Incentivo de promotores segn ventas
sector maquinaria textil.

Ofrecer productos exclusivos

Mejorar los procesos utilizando las tecnologas de


O2 : Mejorar en un 20% los tiempos informacin
de entrega de los productos
Capacitar al personal

12
4.2 Matriz de Apalancadores Vs. Informacin til

MATRIZ INFORMACIN TIL Vs. DIMENSIONES/MEDIDAS MEDIDAS DIMENSIONES

Productividad
Colocaciones

Promotores
Calificacin
Nmero de

Nmero de
Colocados

Promotor
Inversin

Producto
OBJETIVO APALANCADOR/ INFORMACIN TIL

Montos

Tiempo
Cliente
Tienda
PBI
ventas, a nivel de empresas del sector

Aperturar nuevos locales


O1 : Ampliar en 20% su mercado de

Clientes con mayor volumen de compra por zona de ubicacin X X


Distritos en departamentos con mayor nmero de ventas en sector textil X X
maquinaria textil

Aumentar promotores de venta en zonas de poca participacin.


Nmero de promotores por agencia , nmero de desembolsos por promotor y montos
X X X X X
colocados
Metas de venta por promotor y metas de venta por agencia X X X X X
Ofrecer productos exclusivos
Categoras de productos personalizados de acuerdo a la zona, con mayor demanda. X X X X
Marcas de productos de productos de acuerdo a la zona con mayor demanda. X X X
Mejorar los procesos utilizando las tecnologas de informacin
O2: Mejorar en un 20% los
tiempos de entrega de los

Procesos con mayor impacto en la entrega de los productos X X X X X


Flujo de procesos estandarizados X X X X X
productos

Productos con alta de rotacin de inventarios X X X X X


Capacitar al personal
Inversin en Capacitacin X X
Personal Calificado con conocimientos en Tecnologas de la Informacin X X
Personal Clave, en base a su productividad y experiencia X X X
4.3 Conceptualizacin del DataMart

El marco conceptual se centra en la metodologa de Ralph Kimball, considerada la favorita a


la hora de implementar un Datamart, desde un enfoque bottom up.

A. BUSINESS INTELLIGENCE

Una de las operaciones fundamentales, en el proceso administrativo, es la toma de


decisiones, la cual determinar el xito o fracaso de una empresa. El 75% de los gerentes
toman sus decisiones con informacin incompleta y fuera de fecha. Fuente: CFO Magazine
1999 La tecnologa no puede estar ajena a esta necesidad. Es por ello que empresas como
Microsoft, Oracle, IBM e Informix han desarrollado productos Business Intelligence.

Por que cayeron


las ventas?

Cmo impactan
los cambios en
precio en el
comportamiento
de compra?

Cules
canales y
clientes se
desempean
mejor?

SOLUCIN BI

Cul es la
mejor
manera de
enfocar
promociones
para los
clientes?
Cules
productos no me
estn comprando
ahora?
La cadena de
suministro est
alineada con
los
consumidores?
Figura 3 : representacin general de una solucin BI (fuente:www.google.com)
Implementacin de DataMart y OLAP Ventas Huguito

Business Intelligence describe la habilidad de la empresa para accesar y explorar la


informacin (a menudo contenida en un data warehouse) y analizarla para desarrollar un
entendimiento profundo que nos permitir tomar mejores decisiones. Gartner Group.
Recuerde que no solo es el intercambio de productos entre empresas (B2B), entre empresa y
consumidor (B2C), entre consumidor y empresa (C2B) o entre consumidores (C2C), sino el
agregar VALOR a dichos intercambios.

B. SISTEMAS TRANSACCIONALES

Los sistemas transaccionales se basan en transacciones, es decir, tienen un proceso de inicio


y fin claramente definidos y no pueden ser interrumpidos en el proceso general. Como
ejemplo, tenemos los sistemas tradicionales de facturacin, ventas, matrcula, notas, caja, etc.
Estos sistemas estn orientados a las funciones que cumple el usuario del sistema, es decir,
existen operaciones sobre registros (ingreso, modificacin, eliminacin) que se realizan
diariamente y los reportes estn orientados al detalle de las operaciones efectuadas. Este tipo
de sistemas usa la tecnologa OLTP (On line Transactional Processing)

Figura 4 : Representacin sistema transaccional (Fuente: www.google.com)

15
Implementacin de DataMart y OLAP Ventas Huguito

C. SISTEMAS ANALTICOS

Los sistemas analticos estn basados en la informacin del sistema transaccional, es decir,
no existe ingreso de datos por parte del usuario y los reportes estn orientados a la
sumarizacin de la informacin. El objetivo principal de un sistema analtico es brindar
informacin base para la toma de decisiones. Este tipo de sistemas usa la tecnologa OLAP
(On line Analytical Processing)

Figura 5: Arquitectura general del sistema analtico Fuente: www.google.com

D. DATAWAREHOUSE - DATAMART

Los componentes de los sistemas Business Intelligence proporcionan, primero, la tecnologa


OLAP, que nos brinda tcnicas y pautas en cuanto a modelamiento y manejo de data; y,
segundo, las herramientas BI, que son herramientas grficas que permiten el anlisis en
lnea. Como resultado de su interrelacin, se crearon dos nuevos tipos de bases de datos:
data warehouse y datamart.
El Data Warehouse (DWH) es una coleccin de datos integrada en una Base de Datos,
orientada segn un tema, diseadas para soportar un Sistema de Soporte a las Decisiones
(DSS), donde cada unidad de dato es relevante en algn momento del tiempo. Bill Inmon Un
data warehouse es un conjunto de datos integrados orientados a una materia, que vara en el
tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de una
administracin. Harjinder S. Gil Un datamart es un subconjunto de un data warehouse,
orientado especficamente a un rea de la empresa.

16
Implementacin de DataMart y OLAP Ventas Huguito

E. PROCESO DATAWAREHOUSE

El proceso de desarrollo data warehouse, en forma general, es el siguiente:

Figura 6 : Representacin Grfica de Data Warehouse (Fuente: www.google.com)

F. ELEMENTOS DE UN DATA WAREHOUSE

La estructura relacional de una base de datos operacional sigue las formas normales en su
diseo. Un data warehouse no debe seguir ese patrn de diseo. La idea principal es que la
informacin sea presentada desnormalizada para optimizar las consultas. Para ello se debe
identificar, en el seno de la organizacin, los procesos de negocio, las vistas para el proceso
de negocio y las medidas cuantificables asociadas a los mismos. De esta manera se habla
de:

TABLA DE HECHO:

Contiene las medidas o hechos del negocio. Por ejemplo, una venta puede identificarse
como un hecho de negocio.

DIMENSIN:

Es un aspecto del proceso de negocio sobre el cual se necesita manejar informacin.


Retomando el ejemplo de una venta, para la misma se tiene el cliente que ha comprado,
la fecha en que se ha realizado.

17
Implementacin de DataMart y OLAP Ventas Huguito

MTRICA:

Son los indicadores de negocio de un proceso de negocio. Aquellos conceptos


cuantificables que permiten medir este proceso de negocio. Por ejemplo, en una venta
se tiene el importe de la misma.

TIPOS DE TABLAS DE HECHO

A nivel de diseo una tabla de hecho es aquella que permite guardar dos tipos de
atributo diferenciados:

o Medidas del proceso/actividad/flujo de trabajo/evento que se pretende modelizar.

o Claves forneas hacia registros en una tabla de dimensin (en otras palabras, hacia
una vista de negocio)

Existen diferentes tipos de tablas de hecho:

o Transaction Fact Table:


Representan eventos que suceden en un determinado espacio-tiempo. Se
caracterizan por permitir analizar los datos con el mximo detalle. Por ejemplo, se
puede pensar en una venta que tiene como resultado mtricas como el importe de
la misma.

o Factless Fact Tables/Coverage Table:


Son tablas que no tienen medidas, y tiene sentido dado que representan el hecho
de que el evento suceda. Frecuentemente se aaden contadores a dichas tablas
para facilitar las consultas SQL. Por ejemplo, se puede pensar en la asistencia en
un acto benfico en el que por cada persona que asiste se tiene un registro pero se
podra no tener ninguna mtrica asociada ms.

o Periodic Snapshot Fact Table:


Son tablas de hecho usadas para recoger informacin de forma peridica a
intervalo de tiempo regulares. Dependiendo de la situacin medida o la necesidad
de negocio, este tipo de tablas de hecho son una agregacin de las anteriores o
estn diseadas especficamente. Por ejemplo, se puede pensar en el balance
mensual. Los datos se recogen acumulados de forma mensual.

18
Implementacin de DataMart y OLAP Ventas Huguito

o Accumulating Snapshot Fact Table:


Representan el ciclo de vida completo con un principio y un final- de una actividad
o un proceso. Se caracterizan por tener mltiples dimensiones relacionadas con los
eventos presentes en un proceso. Por ejemplo, se puede pensar en un proceso de
matrcula de un estudiante: recopila datos durante su periodo de vida que suelen
sustituir los anteriores (superacin y recopilacin de asignaturas, por ejemplo).
[Fuente: (Curto, INFORMATION MANAGEMENT, 2008)]

TABLAS DE DIMENSIONES

Las dimensiones recogen los puntos de anlisis de un hecho. Por ejemplo, una venta se
puede analizar en funcin del da de venta, producto, cliente, vendedor o canal de
venta, entre otros. Respecto al punto de vista de la gestin histrica de los datos, stos
se pueden clasificar como: [Fuente: (Curto, INFORMATION MANEGEMENT, 2008)]

Existen otros tipos de dimensiones cuya clasificacin es funcional:

o Degenaradas:
Se encuentran como atributos en la tabla de hecho, si bien tiene el significado de un
punto de vista de anlisis. Contiene informacin de baja cardinalidad, formada por
relaciones dicotmicas. Frecuentemente contienen slo un atributo y, por ello, no se
crea una tabla aparte. Por ejemplo, el sexo de un paciente.

o Monster:
Es conveniente comentar que algunas dimensiones pueden crecer
desmesuradamente. Una buena prctica es romper la dimensin en dos tablas: una
que contenga los valores estticos y otra que contenga los valores voltiles. Un
ejemplo claro puede ser la informacin de cliente. Se debe ser consciente de cul
es la informacin primordial del mismo y cul la que slo se usa puntualmente en
los informes u otros anlisis.

o Junk:
Contiene informacin voltil que se usa puntualmente y que no se guarda de forma
permanente en la bodega de datos. Conformadas: que permite compartir
informacin entre dimensiones. Consiste en dimensiones definidas correctamente
para que sean usadas por dos tablas y poder as realizar consultas comunes. El

19
Implementacin de DataMart y OLAP Ventas Huguito

ejemplo ms fcil es la dimensin temporal.

o Bridge:
Permiten definir relaciones n a m entre tablas de hecho. Necesarias para definir por
la relacin entre un piloto y sus mltiples patrocinadores.

TIPOS DE MTRICAS

Se puede distinguir diferentes tipos de medidas, basadas en el tipo de informacin que


recopilan as como su funcionalidad asociada: [Fuente: (Curto, INFORMATION
MANEGEMENT, 2008)]

o Mtricas:
Valores que recogen el proceso de una actividad o los resultados de la misma.
Estas medidas proceden del resultado de la actividad de negocio. o Mtricas de
realizacin de actividad (leading): miden la realizacin de una actividad. Por
ejemplo, la participacin de una persona en un evento. o Mtricas de resultado de
una actividad (lagging): recogen los resultados de una actividad. Por ejemplo, la
cantidad de puntos de un jugador en un partido.

o Indicadores clave:
Valores correspondientes que hay que alcanzar y que suponen el grado de
asuncin de los objetivos. Estas medidas proporcionan informacin sobre el
rendimiento de una actividad o sobre la consecucin de una meta.

o Key Performance Indicator (KPI):


Indicadores clave de rendimiento. Ms all de la eficacia, se definen unos valores
que explican en qu rango ptimo de rendimiento se debera situar al alcanzar los
objetivos. Son mtricas del proceso.

o Key Goal Indicator (KGI):


Indicadores de metas. Definen mediciones para informar a la direccin general si un
proceso TIC ha alcanzado su requisito de negocio, y se expresan por lo general en
trminos de criterios de informacin.
[Fuente: (Curto, INFORMATION MANAGEMENT, 2008)]

G. ESQUEMAS PARA UN DATA WAREHOUSE

20
Implementacin de DataMart y OLAP Ventas Huguito

Existen principalmente dos tipos de esquemas para estructurar los datos en un almacn
de datos:

ESQUEMA EN ESTRELLA:

A nivel de diseo, consiste en una tabla de hechos (o lo que en los libros se encontrar
como fact table) en el centro para el hecho objeto de anlisis y una o varias tablas de
dimensin por cada punto de vista da anlisis que participa de la descripcin de ese
hecho. Consiste en estructurar la informacin en procesos, vistas y mtricas recordando
a una estrella (por ello el nombre). En la tabla de hecho se encuentran los atributos
destinados a medir (cuantificar): sus mtricas. La tabla de hechos solo presenta uniones
con dimensiones.
(Curto, INFORMATION MANAGEMENT, 2007)

Figura 7. Esquema en estrella [Fuente: (Wikipedia, 2008)]

ESQUEMA EN COPO DE NIEVE:

Es un esquema de representacin derivado del esquema de estrella, en el que las


tablas de dimensin se normalizan en mltiples tablas. Por esta razn, la tabla de
hechos deja de ser la nica tabla del esquema que se relaciona con otras tablas y
aparecen nuevas uniones. Es posible identificar dos tipos de esquemas en copo de

21
Implementacin de DataMart y OLAP Ventas Huguito

nieve: [Fuente: (Curto, INFORMATION MANAGEMENT, 2007)]. Completo: en el que


todas las tablas de dimensin en el esquema de estrella aparecen ahora normalizadas.
Parcial: slo se lleva a cabo la normalizacin de algunas de ellas

Figura 8. Esquema en copo de nieve [Fuente: (Wikipedia, 2008)]

22
Implementacin de DataMart y OLAP Ventas Huguito

5. MODELADO DIMENSIONAL DEL DATAMART

5.1 Diagrama funcional de dimensiones y medidas

Figura 9. Anlisis de dimensiones y medidas. [Fuente: propia]

5.2 Descripcin de Dimensiones

En base a definiciones surgidas de las reuniones de trabajo se realiz el anlisis de las


principales dimensiones:

DIMENSIN DESCRIPCIN

Esta dimensin considera meses y aos, debido a que

DIM_TIEMPO el cliente necesita analizar sus datos de manera


mensual y anual.

Esta dimensin considera los puntos de venta

DIM_TIENDA correspondiente, cada tienda corresponde un punto de


almacn de mercadera

Esta dimensin considera los productos, sus categoras,


DIM_PRODUCTO
marcas y garantas del correspondiente

23
Implementacin de DataMart y OLAP Ventas Huguito

Esta dimensin considera los empleados tanto


vendedores como, personal tcnico de reparacin de

DIM_PROMOTOR mquinas. Se considera margen de venta por producto


con finalidad de evaluar la efectividad de negociacin de
venta con el cliente

Esta dimensin considera los clientes correspondiente,


se est considerando calificacin de pagador, debido a
DIM_CLIENTE
que esto nos permitir poder ofrecer crditos
correspondientes.

5.3 Descripcin de Medidas

DIMENSIN DESCRIPCIN

Importe Corresponde el monto de ventas

Cantidad Corresponde la cantidad de artculos de venta

5.4 Jerarquas de las Dimensiones

DIM_TIENDA DIM_PRODUCTO

DIM_TIEMPO DIM_CLIENTE

24
Implementacin de DataMart y OLAP Ventas Huguito

5.5 Modelo Lgico del Datamart

5.6 Diagrama de la Arquitectura del Datamart

25
Implementacin de DataMart y OLAP Ventas Huguito

6. DISEO DEL DATAMART

6.1 Estructuras de las tablas de Dimensiones y Hechos


CREATE DATABASE HUGUITO_MART;
USE HUGUITO_MART;

CREATE TABLE DIM_TIEMPO


( TIEMPOKEY INT IDENTITY PRIMARY KEY,
MES VARCHAR(20),
ANIO VARCHAR(4) );

CREATE TABLE DIM_PRODUCTO


( PRODUCTOKEY INT IDENTITY PRIMARY KEY,
CODIGOARTI VARCHAR(30),
PRODUCTO VARCHAR(100),
CATEGORIA VARCHAR(50),
MARCA ARCHAR(20),
GARANTIA VARCHAR(20) );

CREATE TABLE DIM_TIENDA


( TIENDAKEY INT IDENTITY PRIMARY KEY,
COD_ALM INT,
ALMACEN VARCHAR(30),
UBICACION VARCHAR(30) );

CREATE TABLE DIM_CLIENTE


( CLIENTEKEY NT IDENTITY PRIMARY KEY,
CODIGO VARCHAR(6),
RAZON_SOCIAL VARCHAR(60) NOT NULL,
TIPO_CLIENTE VARCHAR(8) NOT NULL,
DISTRITO VARCHAR (30) NOT NULL,
DEPARTAMENTO VARCHAR (50) NOT NULL,
CALIF_PAGADOR VARCHAR (12) NOT NULL,
CALIFICACION VARCHAR (7) NOT NULL );

CREATE TABLE DIM_PROMOTOR


( PROMOTORKEY INT IDENTITY PRIMARY KEY,
CODIGOVEND INT,
PROMOTOR VARCHAR(50),
FECHA_NAC DATE,
TIPO_PROMOTOR VARCHAR(20),
MARGEN_VTAS VARCHAR(20) );

CREATE TABLE FACT_VENTAS


( TIEMPOKEY INT,
PRODUCTOKEY INT,
TIENDAKEY INT,
CLIENTEKEY INT,
PROMOTORKEY INT,
IMPORTE REAL,
CANTIDAD REAL,
PRIMARY KEY (TIEMPOKEY, PRODUCTOKEY, TIENDAKEY, CLIENTEKEY, PROMOTORKEY),
FOREIGN KEY (TIEMPOKEY) REFERENCES DIM_TIEMPO (TIEMPOKEY),
FOREIGN KEY (PRODUCTOKEY) REFERENCES DIM_PRODUCTO (PRODUCTOKEY),
FOREIGN KEY (TIENDAKEY) REFERENCES DIM_TIENDA (TIENDAKEY),
FOREIGN KEY (CLIENTEKEY) REFERENCES DIM_CLIENTE (CLIENTEKEY),
FOREIGN KEY (PROMOTORKEY) REFERENCES DIM_PROMOTOR (PROMOTORKEY)
);

26
6.2 Modelo Fsico del Datamart
Bade de Datos HUGUITO_MART

Figura 12. Diseo fsico de la BD Analtica [Fuente: propia]


Implementacin de DataMart y OLAP Ventas Huguito

6.3 Descripcin de las Fuentes de Datos


Base de Datos Transaccional HUGUITO_OLTP

Figura 13. Tablas seleccionadas de la fuente de origen de datos transaccional [Fuente: propia]

28
Implementacin de DataMart y OLAP Ventas Huguito

6.4 Definicin de la Extraccin, Transformacin y Carga - ETL


Proceso ETL con MS Integration Services

Figura 14. Proceso ETL.- poblando datos a HUGUITO_MART desde HUGUITO_OLTP [Fuente: propia]

29
TASK 1: Limpieza de la BD Destino (HUGUITO_MART)
--Eliminando Datos
DELETE FACT_VENTAS;
DELETE DIM_TIEMPO;
DELETE DIM_PRODUCTO;
DELETE DIM_TIENDA;
DELETE DIM_CLIENTE;
DELETE DIM_PROMOTOR;
--Inicializando Secuencias de la llave
DBCC CHECKIDENT ('DIM_TIENDA', RESEED, 0);
DBCC CHECKIDENT ('DIM_TIEMPO', RESEED, 0);
DBCC CHECKIDENT ('DIM_PRODUCTO', RESEED, 0);
DBCC CHECKIDENT ('DIM_CLIENTE', RESEED, 0);
DBCC CHECKIDENT ('DIM_PROMOTOR', RESEED, 0);

TASK 2..7: Poblando Datos


Diseo del Flujo de Datos

Query de Extraccn de Data del Origen. Por Ejm Datos para la Dimensin Tiempo
Implementacin de DataMart y OLAP Ventas Huguito

Transformacin de Datos

Mapeo de Datos Origen vs Destino

31
Implementacin de DataMart y OLAP Ventas Huguito

7. DASHBOARD Y CONSULTAS DINMICAS

7.1 Diseo de Interfaz para el Usuario Final

7.2 Construccin de Consultas y Reportes Dinmicos.


7.2.1 Reporte de Ventas por Tienda.
Permite obtener informacin de acuerdo a las tiendas (Almacenes de Venta) por
ao, esto no va permitir saber en qu tiendas se estn generando ms volumen
de venta.

32
Implementacin de DataMart y OLAP Ventas Huguito

7.2.2 Reporte de Ventas por Categora.


Permite obtener informacin de acuerdo a las categoras de Productos por ao,
esto no va permitir saber que Categoras estn generando mayor volumen de
venta.

7.2.3 Reporte Cantidad de Ventas x Marca de Producto.


Permite obtener informacin de acuerdo a la Marca del Producto por ao, esto no
va permitir saber que Marcas estn generando mayor volumen de venta.

33
Implementacin de DataMart y OLAP Ventas Huguito

7.2.4 Reporte de Ventas Anuales por Departamento.


Permite obtener informacin sobre qu departamento se estn generando los
mayores volmenes de venta.

7.2.5 Comisin por Vendedor


Haciendo uso de la Herramienta TABLEAU, se han generado la siguiente
consulta. Este reporte permite saber que vendedores estn generando las
mayores ventas, debido a la comisin que perciben. Estos nos va permitir
considerarlo como impulsores en los nuevos locales comerciales a aperturar.

34
Implementacin de DataMart y OLAP Ventas Huguito

7.3 Beneficios para el Negocio.

El uso de informacin consolidada es de vital importancia para los ejecutivos


responsables del rea de ventas de la empresa Huguito Import S.A., ya que es la
principal fuente para la toma de decisiones, planeacin del futuro y la asignacin de
recursos de manera eficiente. Normalmente, dicha informacin ha sido consultada
mediante reportes en lnea o impresos, presentacin de diapositivas de datos
obtenidos en consultas determinadas, las cuales eran elaboradas con el apoyo del
especialista de informtica. Aun cuando estos tipos de reportes no pierden vigencia,
cada vez es ms necesario la necesidad de reportes en otro tipo de formatos, ms
fcil de usar, que tengan una consulta centralizada, puedan ofrecer un mayor nivel de
detalle y flexibilidad en su consulta.

La tecnologa OLAP, suple la necesidad de tener este tipo de reportes dinmicos ad-
hoc para facilitar la toma de decisiones de manera ms rpida, inteligente, a nivel
horizontal y vertical de la organizacin.

Los reportes OLAP constituyen entonces una buena alternativa para favorecer la
creacin de nuevos reportes y recolectar informacin de valor para la organizacin, no
obstante la creacin de dichos reportes a partir de bases de datos transaccionales
podra parecer confuso y complicado tanto para acadmicos como para las
organizaciones.

Los ejecutivos de la empresa Huguito Import S.A. en cada una de sus tiendas podr
contar con acceso a la informacin de las ventas a travs del Excel como herramienta
conocida pero con la activacin del complemento Powerpivot para la visualizacin de
un Dashboard sobre aspectos crticos del negocio.

35
Implementacin de DataMart y OLAP Ventas Huguito

8. CONCLUSIONES

Se cumplido con obtener la informacin resumida para poder explicar el


comportamiento de las ventas y poder dar respuesta a los objetivos del negocio
que se describen en este documento.

El anlisis de estado de las tecnologas utilizadas y disponibles para el


desarrollo de un proyecto de inteligencia de negocios, permiti profundizar en
las distintas herramientas de software BI y propietario que estn a la
vanguardia de ste campo.

Con el estudio de las herramientas de inteligencia de negocios se logr


confirmar que las aplicaciones usadas en el desarrollo del presente documento
corresponden a las idneas para la implementacin de este tipo de proyectos
por ser las de mayor grado de completitud y ser tambin tecnologas maduras.

La utilizacin de las herramientas Integration Services, Analysis Services


permiti plantear una metodologa que oriente en la construccin de cubos
OLAP partiendo de bases de datos transaccionales. En cada uno de los pasos
de la metodologa se pudo observar cmo estas herramientas, siguiendo un
orden lgico permiten disear este tipo de cubos.

Las tecnologas usadas en este informe se han ido profundizando a medida


que se abarcaban los temas que hacan uso de las mismas. Esta
profundizacin permiti relacionar los conceptos de inteligencia de negocios a
la metodologa propuesta en el curso.

Este trabajo prctico ha sido de mucha importancia para socializar la teora y


ejemplos con la aplicacin real de una solucin de inteligencia de negocios.

Las expectativas del curso han sido cubiertas y puestas en prctica de manera
exitosa.

36
Implementacin de DataMart y OLAP Ventas Huguito

9. LECCIONES APRENDIDAS

Tomando en cuenta la importancia de documentar las lecciones aprendidas a partir de


errores cometidos, riesgos presentados, decisiones que funcionaron o no, procesos y
tcnicas que ms efectividad y eficiencia aportaron, para evitar que se repitan o sean
controlados en futuros proyectos. Entre estos tenemos:

Elaborar un plan de trabajo acorde con la metodologa y designacin de tareas


puntuales a los miembros del equipo. Evitar tareas de no identificadas que aparecen a
ltimo minuto.

Es importante evitar procrastinar aunque resulte complicado, puesto que se trata de


una solucin para el nivel ejecutivo, y no se puede dar seales de incumplimientos en
ningn momento.

Es importante contar con acceso directo a la fuente de datos para poder hacer el
anlisis, la falta de esta facilidad complica el proyecto a la hora del mapeo y extraccin
de datos. Es posible que la data tenga muchas inconsistencia y requiera ser curada
antes de migrarse al Datamart.

37
Implementacin de DataMart y OLAP Ventas Huguito

BIBLIOGRAFA

1. Articulo Cubos OLAP Dra. Anglica Urrutia

2. Artculo de Tesis de BI y Diseo de Cubos OLAP - John Herman Mantilla Hernandez.


Revisado 01/11/2015

3. Curto Josep.2008 INFORMATION MANAGEMENT. Revisado 31/10/2015 josepcurto.com

4. Wikipedia, 2015

5. https://technet.microsoft.com/es-es/library/hh916543.aspx

6. (https://olgeferrer.wordpress.com/2013/10/14/creando-etl-con-sql-server-integration-
services-ssis/)

7. Lara Juan. 2014. Minera de Datos. ISBN 978-84-454-2684-5

38

You might also like