You are on page 1of 7

5.

Fases en la implantacin de un
sistema DW. Metodologia para la
construccin de un DW.
Antes de comenzar nuestro proyecto de BI, vamos a determinar que tipo de metodologa vamos a
utilizar. Existen diferentes metodos, todos relacionados con el ambito del despliegue de sistemas
de informacin, con alguna concrecin referente a los sistemas de BI y DW.
5.1. Metodogia Hefesto.
La metodologa esta orientada a la construccin de DW para Analisis Dimensional (OLAP) y
comprende las siguientes fases, que podemos ver en el grfico de la derecha.

5.1.1. Anlisis de requerimientos.
Identificar preguntas para las que queremos tener respuesta y los objetivos que se quieren
conseguir con el nuevo sistema.
Analizar las preguntas para determinar las perspectivas de anlisis y los indicadores de negocio.
Disear el modelo conceptual, que incluira las perspectivas e indicadores identificados. A travs
del modelo se podrn alcanzar claramente cuales son los alcances del proyecto, y ser un punto
de partida con alto nivel de definicin para su exposicin a los usuarios y responsables.
5.1.2. Analisis de los sistemas transaccionales.
Determinacin de indicadores: identificar el origen de los indicadores en los sistemas
transaccionales y determinar la forma de su calculo.
Correspondencias: establecer correspondencias entre los elementos definidos en el modelo
conceptual y las fuentes de datos existentes en elos OLTP (sistemas transaccionales).
Definicin del nivel de granuralidad: nivel de detalle de los datos a obtener para cada dimensin
de anlisis.
Modelo conceptual ampliado con los campos identificados para cada perspectiva.
5.1.3. Modelo lgico del ETL.
Tipo de modelo lgico del DW: seleccin del tipo de esquema que utilizaremos (estrella, copo de
nieve, etc).
Tabla de dimensiones:Construccion de las tablas de dimensiones para cada una de las
perspectivas de analisis considerada.
Tablas de Hechos: definicin de las tablas de hechos que contendras la informacin a partir de los
cuales construiremos los indicadores de anlisis.
Uniones: relaciones entre las tablas de dimensiones y las tablas de hechos.
5.1.4. Procesos ETL: analisis, definicin y desarrollo de todos aquellos procesos necesarios para la
extraccin, transformacin y carga de datos desde los sistemas origen para llenar el DW.
5.1.5. Perfomance y mantenimiento del DW: ajustes en el diseo del DW y mantenimiento en el
tiempo.



5.2. En otro nivel tenemos la metodologa desarrollada
por SAS, llamada The SAS Rapid Data Warehouse
Methodology
Tal y como apareca en un artculo en ComputerWorld: Un Data Warehouse no se puede comprar,
se tiene que construir. Como hemos mencionado con anterioridad, la construccin e implantacin
de un Data Warehouse es un proceso evolutivo.
Este proceso se tiene que apoyar en una metodologa especfica para este tipo de procesos, si bien
es ms importante que la eleccin de la mejor de las metodologas, el realizar un control para
asegurar el seguimiento de la misma.
En las fases que se establezcan en el alcance del proyecto es fundamental el incluir una fase de
formacin en la herramienta utilizada para un mximo aprovechamiento de la aplicacin. El seguir
los pasos de la metodologa y el comenzar el Data Warehouse por un rea especfica de la
empresa, nos permitir obtener resultados tangibles en un corto espacio de tiempo.
Planteamos aqu la metodologa propuesta por SAS Institute: la Rapid Warehousing
Methodology. Dicha metodologa es iterativa, y est basada en el desarrollo incremental del
proyecto de Data Warehouse dividido en cinco fases:

Definicin de los objetivos
Definicin de los requerimientos de informacin
Diseo y modelizacin
Implementacin
Revisin
5.2.1-Definicin de los objetivos
En efecto, como punto de arranque de todo, es preciso vender la idea a los usuarios finales de
un Data Warehouse. Esto es as, por ser una idea bastante novedosa y sobre la que pueden surgir
recelos de su efectividad. Estos recelos se pueden eliminar comenzando por un pequeo mdulo,
del cual se valoren los beneficios posteriores, para iniciar progresivamente el desarrollo de nuevos
mdulos, cada uno con un coste unitario cada vez ms reducido, pero sin embargo con unos
beneficios distribuidos cada vez mayores por poder cada vez incluir ms informacin.
El simple hecho de realizar un informe de necesidades previas en el que se enumeren la situacin
de los datos entre los diversos sistemas operacionales, puede ser un hecho decisivo para
emprender un proyecto de este tipo. Muchas veces la informacin existente se encuentra tan poco
normalizada, existen tantas discrepancias entre estos sistemas, que el abordar un Data
Warehouse en el que se limpien estos datos y se normalicen pueden aportar un valor intangible:
la calidad y fiabilidad de la informacin.
La venta de esta idea no slo se ha de realizar frente a la Direccin sino que es preciso realizarla a
todos los niveles: a la Direccin, Gerencia e incluso al rea de Desarrollo.
Tras esta venta de la idea, comienzan dos fases similares al anlisis de requisitos del sistema (ARS
segn abreviaturas de la metodologa METRICA): la definicin de objetivos y requerimientos de
informacin, en el que se analicen las necesidades del comprador.
Definicin de los objetivos
En esta fase se definir el equipo de proyecto que debe estar compuesto por representantes del
departamento informtico y de los departamentos usuarios del Data Warehouse adems de la
figura de jefe de proyecto.
Se definir el alcance del sistema y cuales son las funciones que el Data Warehouse realizar
como suministrador de informacin de negocio estratgica para la empresa. Se definirn as
mismo, los parmetros que permitan evaluar el xito del proyecto.
5.2.2.-Definicin de los requerimientos de informacin
Tal como sucede en todo tipo de proyectos, sobre todo si involucran tcnicas novedosas como son
las relativas al Data Warehouse, es analizar las necesidades y hacer comprender las ventajas que
este sistema puede reportar.
Es por ello por lo que nos remitimos al apartado de esta gua de Anlisis de las necesidades del
comprador. Ser en este punto, en donde detallaremos los pasos a seguir en un proyecto de este
tipo, en donde el usuario va a jugar un papel tan destacado.


Definicin de los requerimientos de informacin
Durante esta fase se mantendrn sucesivas entrevistas con los representantes del departamento
usuario final y los representantes del departamento de informtica. Se realizar el estudio de los
sistemas de informacin existentes, que ayudaran a comprender las carencias actuales y futuras
que deben ser resueltas en el diseo del Data Warehouse
Asimismo, en esta fase el equipo de proyecto debe ser capaz de validar el proceso de entrevistas y
reforzar la orientacin de negocio del proyecto. Al finalizar esta fase se obtendr el documento de
definicin de requerimientos en el que se reflejarn no solo las necesidades de informacin de los
usuarios, sino cual ser la estrategia y arquitectura de implantacin del Data Warehouse.
5.2.3.-Diseo y modelizacin
Los requerimientos de informacin identificados durante la anterior fase proporcionarn las bases
para realizar el diseo y la modelizacin del Data Warehouse.
En esta fase se identificarn las fuentes de los datos (sistema operacional, fuentes externas,..) y
las transformaciones necesarias para, a partir de dichas fuentes, obtener el modelo lgico de
datos del Data Warehouse. Este modelo estar formado por entidades y relaciones que permitirn
resolver las necesidades de negocio de la organizacin.
El modelo lgico se traducir posteriormente en el modelo fsico de datos que se almacenar en el
Data Warehouse y que definir la arquitectura de almacenamiento del Data Warehouse
adaptndose al tipo de explotacin que se realice del mismo.
La mayor parte estas definiciones de los datos del Data Warehouse estarn almacenadas en los
metadatos y formarn parte del mismo.
5.2.4.-Implementacin
La implantacin de un Data Warehouse lleva implcitos los siguientes pasos:
Extraccin de los datos del sistema operacional y transformacin de los mismos.
Carga de los datos validados en el Data Warehouse. Esta carga deber ser planificada con
una periodicidad que se adaptar a las necesidades de refresco detectadas durante las
fases de diseo del nuevo sistema.
Explotacin del Data Warehouse mediante diversas tcnicas dependiendo del tipo de
aplicacin que se de a los datos:
o Query & Reporting
o On-line analytical processing (OLAP)
o Executive Information System (EIS) Informacin de gestin
o Decision Support Systems (DSS)
o Visualizacin de la informacin
o Data Mining Minera de Datos, etc.
La informacin necesaria para mantener el control sobre los datos se almacena en los metadatos
tcnicos (cuando describen las caractersticas fsicas de los datos) y de negocio (cuando describen
cmo se usan esos datos). Dichos metadatos debern ser accesibles por los usuarios finales que
permitirn en todo momento tanto al usuario, como al administrador que deber adems tener la
facultad de modificarlos segn varen las necesidades de informacin.
Con la finalizacin de esta fase se obtendr un Data Warehouse disponible para su uso por parte
de los usuarios finales y el departamento de informtica.
5.2.5.-Revisin
La construccin del Data Warehouse no finaliza con la implantacin del mismo, sino que es una
tarea iterativa en la que se trata de incrementar su alcance aprendiendo de las experiencias
anteriores.
Despus de implantarse, debera realizarse una revisin del Data Warehouse planteando
preguntas que permitan, despus de los seis o nueve meses posteriores a su puesta en marcha,
definir cules seran los aspectos a mejorar o potenciar en funcin de la utilizacin que se haga del
nuevo sistema.
5.2.6.-Diseo de la estructura de cursos de formacin
Con la informacin obtenida de reuniones con los distintos usuarios se disearn una serie de
cursos a medida, que tendrn como objetivo el proporcionar la formacin estadstica necesaria
para el mejor aprovechamiento de la funcionalidad incluida en la aplicacin. Se realizarn prcticas
sobre el desarrollo realizado, las cuales permitirn fijar los conceptos adquiridos y servirn como
formacin a los usuarios.
(Definiciones extraidas del Consejor Superior de Informatica, del documento Manual para la
adquisicin de un sistema de Data Warehouse,
enhttp://www.csi.map.es/csi/silice/Elogicos.html ).
Ambas metodologas tienen muchos aspectos en comn y utilizaremos una combinacin de las
tcnicas descritas en ambas para la realizacin de nuestro proyecto PILOTO.
5.3.Otras metodologias.
En el libro Mastering data warehouse design ( Imhoff, Claudia; Galemmo, Nicholas; Geiger,
Jonathan G.) ISBN:978-0-471-32421-8, podemos encontrar una metodologia para proyectos de
este tipo, desde metodos para la definicin del Modelo de Negocio (con consideraciones a tener el
cuenta segun el sector de la empresa que estemos analizando)., recogida de requerimientos,
tcnicas de reuniones, as como informacin tcnica de como modelizar y disear el DW.
E imprescindible para disear correctamente nuestro DW y para formarnos en este ambito:
The Data Warehouse Lifecycle Toolkit ( Kimball, Ralph; Ross, Margy; Thornthwaite, Warren;
Mundy, Joy; Becker, Bob) ISBN: 978-0-470-149777-5
The data warehouse toolkit : the complete guide to dimensional modeling. 2ed (Kimball,
Ralph; Ross, Margy) ISBN: 978-0-471-20024-7
Estos dos libros son fundamentales para entender todo lo necesario en el ambito del DW. Ademas,
en la segunda edicin, aparecen ejemplos de diseo en las diferentes areas de una empresa
(Ventas, Contabilidad, Recursos Humanos, Finanzas) y de diferentes sectores.
Como un resumen de las metodologas descritas en estos libros, es interesante la siguiente
presentacin de Manuel Torres, de la Universidad de Almeria:
Como aportacin interesante para nuestra tarea de construir el DW, la serie de articulos publicado
en Business Intelligence Facil ( Como construir un Datawarehouse ), que nos hablan de como
definir y construir los diferentes elementos que forman un DW, y sobre todo, que errones no
cometer.
Introduccin: Cmo no construir un datawarehouse
Artculo 1: Datawarehouse
Artculo 2: Dimensiones
Artculo 3: Jerarquas
Artculo 4: Dimensiones lentamente cambiantes
Artculo 5: Claves subrogadas
Artculo 6: Tablas de hecho
Artculo 7: DWH organizado por temas
Artculo 8: Tablas agregadas
Artculo 9: Mximo nivel de detalle
Artculo 10: Rendimiento
Artculo 11: Unificar los hechos
Artculo 12: Unificar las dimensiones
Igualmente, os dejo los links igualmente a un serie de artculos publicados por Josep Curso en
su blog, os pueden ser muy utiles en los diferentes aspectos que teneis que tener en cuenta a la
hora de construir un DW:
Definiciones de Kimball & Inmon.
Arquitectura de un data warehouse.
Contexto para un data warehouse.
Data Warehousing, Data Warehouse y Data Mart.
Qu es una Staging Area?
Definiciones.
Estrella y copo de nieve.
Slowly Changing dimensions (e informacin ampliada en la entrada del Blog de
Bernabeu Dario en Dataprix, incluyendo ejemplos reales).
Medidas (I).
Medidas (II).
Tabla de hecho.

You might also like