You are on page 1of 36

Enfoques de

desarrollo DW
Kimball/Inmon.

1
sbado 5 de mayo de 2012

Antecedentes
Sistemas de Informacin

Data Warehouse

Los procesos a automatizar son


repetibles y previsibles.
Modelado Entidad Relacin.
Atencin en una rpida modificacin en
lnea de los datos.

El uso de los datos es exploratorio y


menos predecible.
Modelado multidimensional.
Enfocado en la carga y la presentacin
de los datos

DWH no es solamente crear un conjunto de


reportes.

Se trata de preguntas que hay que alcanzar y


que puede llevar a lugares imprevistos.
2

sbado 5 de mayo de 2012

Algunas Metodologas
Profesional

nfasis

Top-Down
Inmon

Bottom-Up
Kimball

Hybrid
Muchos
profesionales

Federated
Doug Hackney

DWH

DataMarts

DWH y DataMarts

Integrado a entornos BI
heterogneos

Diseo

Modelo normalizado
basado en la
empresa.

El modelo
dimensional de
datamarts, usa
esquema de estrella

Modelos locales y
uno o mas
esquemas de
estrella

Una arquitectura de
arquitecturas; comparte
dimensiones, hechos,
reglas, definiciones a
travs de la
organizacin

Arquitectura

Compuesto de varios
niveles de reas de
inters y datamarts
dependientes

rea de inters y
datamarts

Modelo empresarial
normalizado de alto
nivel;

Realidad del cambio


en organizaciones y
sistemas

DWH datos a nivel


atmico;

Contiene datos
atmicos y
sumarizados

Data set

datamarts datos
sumarizados

datamarts inciales.

3
sbado 5 de mayo de 2012

Carga datamarts con


datos atmicos y
sumarizados va un
rea de inters no
persistente

Uso de cualquiera
significado posible
para integrar las
necesidades de
negocio

Historia
Bill Inmon:
Top-Down

1990!Publica Building the Data Warehouse.


2002 Mejora su libro y define una arquitectura como
una coleccin de fuentes dispares en almacenes
de datos y variantes en el tiempo.

1996!Publica The Data Warehouse Toolkit.


2002!Mejora su libro y define mltiples bases de datos
llamados datamarts que son organizados por
procesos de negocio.
4
sbado 5 de mayo de 2012

Bottom-Up

Ralph Kimball:

Bottom-Up

Top-Down
5
sbado 5 de mayo de 2012

Paradigma Inmon
- Corporate Information Factory (CIF).
- Orientado a temas.
- Integrado.
- No voltil.
- Variante en el tiempo.
- Nivel de detalle (Atmico).
- Iterativo.
6
sbado 5 de mayo de 2012

Enfoque Inmon

7
sbado 5 de mayo de 2012

Enfoque Kimball

8
sbado 5 de mayo de 2012

Enfoque Kimball.
- El modelo se inicia con tablas:
- De hechos.
- De dimensiones.
- Los hechos contienen mtricas.
- Las dimensiones contienen atributos.
- Los datos no estn normalizados.
9
sbado 5 de mayo de 2012

Ciclo de vida
Kimball.

10
sbado 5 de mayo de 2012

El ciclo de vida.
- Ilustra el flujo general de implementacin de
un DW.
- Identifica secuencia de tareas ordenadas y
actividades principales.
- No todos los detalles de las tareas del ciclo
de vida deben ser ejecutados en todos los
proyectos.
11
sbado 5 de mayo de 2012

#$%
&'()*+,&&-.(%
/0%
,($%
)'1,&-.(%
/0%
23
72$*$8$+09',)045,)-(0))% 6(*011-:0(&0;% 0)% ),<$<0(*0% &'<=10>$
A-<B$11% (')% =+'='(0% ,($% <0*'/'1':C$% D,0% (')% $@,/$%$%)-<=1-E-&$+
&'<=10>-/$/F%#$)%*$+0$)%/0%0)*$%<0*'/'1':C$%7&-&1'%/0%G-/$;%)0%<,0)
0(%1$%E-:,+$%HF%
%

Ciclo de vida Kimball.


2-)0L'%20%#$%
$+D,-*0&*,+$%
*M&(-&$

I1$(-E-&$&-.(%
/01%I+'@0&*'

20E-(-&-.(%/0%
J0D,0+-<-0(*')%/01%
K0:'&-'

O'/01$/'%
2-<0()-'($1

N010&&-.(%/0%
I+'/,&*')%0%
6<=10<0(*$&-.(

2-)0L'%QC)-&'

P)=0&-E-&$&-.(%
/0%$=1-&$&-'(0)%
/0%56

S+0&-<-0(*'

2-)0L'%0%
6<=10<0(*$&-.(
/01%N,B)-)*0<$%
/0%PR#

20)$++'11'%/0%
$=1-&$&-'(0)%/0%
56

6<=10<0(*$&-.(

O$(*0(-<-0(*'

T/<-(-)*+$&-.(%/01%I+'@0&*'%/0%23456

%
Q-:F%HU%R$+0$)%/0%1$%<0*'/'1':C$%/0%A-<B$11?%/0('<-($/$%5")6'%)
12
768%')6('#+*96:%-;-+%*7A-<B$11%0*%$1%"V?%WV?%O,(/@%X%R9'+(*98$-*0%
sbado 5 de mayo de 2012

Ciclo de vida.
-

Planificacin del proyecto.

Requerimientos del negocio.

Linea tecnolgica:
-

Arquitectura.
- Seleccin e instalacin de productos.
-

Lnea de datos:
-

Modelo dimensional.
Modelo fsico.
ETL.
- Linea de aplicacin de BI:
- Diseo del BI.
- Desarrollo del BI.
- Despliegue:
- Despliegue.
- Crecimiento.
- Mantenimiento.
sbado 5 de mayo de 2012

13

Planificacin
- Proyectos y programas de kimball:
- Proyecto:
- Iteracin desde el lanzamiento hasta el despliegue
- Programa:
- Coordinacin progresiva de recursos,
infraestructura, tiempos y comunicacin a traves de
mltiples proyectos.

14
sbado 5 de mayo de 2012

Planificacin
- Definir el alcance.
- Identificar tareas.
- Programacin de tareas.
- Planear el uso de recursos.
- Asignar la carga de trabajo a los recursos.
- Plan de proyecto.
15
sbado 5 de mayo de 2012

Roles Recursos
- Recursos:

- Front Office.
- Ejecutivos.

- Humanos.

- Linea regular:

- Equipamiento.

- Analista de sistema de negocio.

- Servicios de terceros.

- Modelador de datos.

- Tiempo.

- DBA.
- Diseador ETL.
- Desarrollador de aplicaciones.
- Equipos especiales.
16
sbado 5 de mayo de 2012

Requerimientos del negocio.


- Requerimientos de uso de informacin.
- Tipo de informacin.
- Tipo de anlisis.
- Requerimientos de datos:
- Fuente de datos.
- Calidad de datos y limpieza.
- Almacenamientos.
- Carga de datos.
17
sbado 5 de mayo de 2012

Procesis de Calidad de datos y Limpieza de datos


Almacenamiento de datos.
Procesos de carga de datos.

Definicin de requerimientos.
Proceso de definicion de requerimiento.

18

Figura 2.2: Proceso de Definicion de requerimientos de Kimball


sbado 5 de mayo de 2012

El resultado de las entrevistas y el data profile nos ayudan a identificar los procesos de nego
e son importantes y las dimensiones que participan en el proceso. Es importante resaltar que
destacan los procesos de toda la organizacion, si no los procesos que se encuentran dentro
mbito de informacion externa de mercado del banco.

Matriz de negocio (bus matrix).

Figura 5.1: Matriz de Negocio de Kimball


19
sbado 5 de mayo de 2012

Linea de desarrollo.
- Luego de definir los requerimientos del
negocio se enfoca el proyecto a tres
lineas (tracks)
- Tecnologa.
- Datos.
- Aplicaciones.

20
sbado 5 de mayo de 2012

Ciclo de vida Kimball.


%
2-)0L'%20%#$%
$+D,-*0&*,+$%
*M&(-&$

I1$(-E-&$&-.(%
/01%I+'@0&*'

20E-(-&-.(%/0%
J0D,0+-<-0(*')%/01%
K0:'&-'

O'/01$/'%
2-<0()-'($1

Tecnologa
N010&&-.(%/0%
I+'/,&*')%0%
6<=10<0(*$&-.(

Datos
2-)0L'%QC)-&'

P)=0&-E-&$&-.(%
/0%$=1-&$&-'(0)%
/0%56

S+0&-<-0(*'

2-)0L'%0%
6<=10<0(*$&-.(
/01%N,B)-)*0<$%
/0%PR#

20)$++'11'%/0%
$=1-&$&-'(0)%/0%
56

6<=10<0(*$&-.(

O$(*0(-<-0(*'

Aplicaciones
T/<-(-)*+$&-.(%/01%I+'@0&*'%/0%23456

%
Q-:F%HU%R$+0$)%/0%1$%<0*'/'1':C$%/0%A-<B$11?%/0('<-($/$%5")6'%
21
sbado 5 de mayo de 2012

Linea Tecnolgica.
- Plataforma de hardware.
- DBMS.
- Herramienta ETL.
- Herramientas de consultas.
- Herramientas de reportes.

22
sbado 5 de mayo de 2012

Linea de datos.
- Modelo dimensional.

1. Elegir proceso de negocio.


2. Establecer el nivel de granularidad (drill down).
3. Elegir las dimensiones.
4. Identificar medidas y tablas de Hechos.

Iterativo

- Modelo Fsico:
- Tuning (indexacin y agregacin).
- Seguridad.
- ETL (Fase mas importante 70% del riesgo y esfuerzo de un proyecto).
- Extraccin.
- Limpieza y conformidad.
- Entrega y administracin.
23
sbado 5 de mayo de 2012

Modelo dimensional.

#
$%&'#()#*%+&,+-+#./#01234#./1#5,46/74#.%-/87%48+1#./#9%-:+11#;<28.=#>#
24
sbado 5 de mayo de 2012

Buble Chart.
E,-(6'
I'$-+%

:1'('7,'$-*

:1'+#74'

F1+-$-*

J-3-$+-+'1*

:1'3,$7,%*

G(62-%+'*
H2,-$4-*

&
Modelo
dimensional.
K,0.&DL&G>-(62'&+-&I'+-2'&<,$%2&+-&%24'&$,3-2&+-&2%&*-*,M$&,$,7,%2&+-&
25
sbado 5 de mayo de 2012

Linea de aplicacin.
- Diseo de aplicaciones.
- Aplicaciones candidatas.
- Interfaces de navegacin.
- Desarrollo de aplicaciones.
- Configuracin Metadatos del negocio.
- Infraestructura de herramientas.
- Analticas.
- Operacionales.
- Portal Navegacin.
26
sbado 5 de mayo de 2012

Aplicaciones BI.
- Aplicaciones que consultan, analizan y
presentan informacin desde el modelo
dimensional.
- Entregar capacidades al negocio para
soportar y mejorar la toma de decisiones:
- Diseo de aplicaciones.
- Desarrollo de aplicaciones.

27
sbado 5 de mayo de 2012

Aplicaciones BI.
- Diseo:
- Identifica las aplicaciones de BI
candidatas y interfaces de navegacin.
- Orienta las necesidades de los usuarios.
- Desarrollo
- Configuracin de los metadatos del negocio.
- Construccin y validacin de aplicaciones.
28
sbado 5 de mayo de 2012

29
sbado 5 de mayo de 2012

29
sbado 5 de mayo de 2012

29
sbado 5 de mayo de 2012

29
sbado 5 de mayo de 2012

Despliegue.
- Despliegue.
- Crecimiento.
- Mantenimiento.

30
sbado 5 de mayo de 2012

Despliegue.
- Debe ser sincronizado.
- Se deber aplazar si todas las piezas no
estan listas para produccin:
- Entrenamiento.
- Documentacin.
- Validacin de datos.
31
sbado 5 de mayo de 2012

Mantenimiento.
- Cuando el sistema este en produccin.
- Tareas operacionales:
- Monitoreo.
- Tunning del desempeo.
- Mantenimiento de Indices.
- Backups.
- Apoyo permanente, capacitacin y comunicacin
con los usuarios finales.
32
sbado 5 de mayo de 2012

Crecimiento.
- Los DW tienden a expandirse.
- Es considerado un signo de xito.
- Nuevos requerimientos deben ser prioridad.
- Empezar el ciclo de nuevo:
- Construir sobre las bases ya establecidas.
- Enfoque en los nuevos requerimientos.

33
sbado 5 de mayo de 2012

You might also like