You are on page 1of 14

LOGO

1
Data Warehouse
Temas Selectos del Tratamiento de Informacin
Algunas Definiciones de Data
Warehouse
Un Data Warehouse es un conjunto integrado de bases de datos,
con orientacin temtica, que estn diseados para el apoyo a la
Toma de Decisiones, y donde cada unidad de datos es relevante en
algn momento del tiempo
Bill H. Inmon
Una copia de las transacciones de datos especficamente
estructurada para la consulta y el anlisis o "la unin de todos los
Data marts de una entidad
Ralph Kimball
Yo considero al DW como algo que provee dos beneficios
empresariales reales: Integracin y Acceso de datos. DW elimina
una gran cantidad de datos intiles y no deseados, como tambin el
procesamiento desde el ambiente operacional clsico
Susan Osterfeldt

2
Objetivos
Hacer la informacin de la organizacin
accesible
Hacer a la informacin de la organizacin
consistente
Controlar el acceso efectivo a los datos
Generar informacin de manera flexible
Servir de ayuda a la toma de decisiones

3
En resumen
Un almacn de datos es una tecnologa de
gestin y anlisis de los datos. Puede definirse
como una coleccin de datos clasificados por
temas, integrada, variable en el tiempo y no
voltil que se utiliza como ayuda al proceso de
toma de decisiones por parte de quienes dirigen
una organizacin. Un Data Warehouse tiene
como objetivo almacenar y proveer a la
Organizacin de informacin relevante y a
tiempo.
4
Importancia y Ventajas del Data
Warehouse
Mejorar la Entrega de Informacin:.
Mejorar el Proceso de Toma de Decisiones
Impacto Positivo sobre los Procesos
Empresariales
Ventajas competitivas derivadas de su
utilizacin

5
A pensar antes de implementar un
Data Warehouse
La amplitud; el nmero de diferentes temas y puntos de
foco
Fuentes que proveern datos brutos.
Los medios por los cuales los datos se transportan de las
aplicaciones fuente y son cargados al Data Warehouse.
Las reglas de negocio que se aplican a la data en bruto
para producir activos de datos de alta calidad.
Las bases de datos receptoras, en la que estos activos
de datos sern almacenados.
Los activos de datos; los elementos, el nivel de detalle de
cada elemento, y cunta historia se ha mantenido, por
ejemplo.
La Inteligencia de negocio
Herramientas de nivel usuario para acceder a los activos
de datos.
La arquitectura y complejidad en general del entorno.

Empresas que usan DATA
WAREHOUSE
Royal bank of canada
Paypal
3M
Coca-Cola Company
Verizon
Ford Motor Company


7

Las principales componentes de un
almacn de datos son:

1. Fuentes de Datos operacionales: todos los datos operacionales
previamente almacenados en BDs, archivos propietarios, estaciones
primarias de trabajo e incluso en sistemas externos como Internet,
bases de datos comerciales bases de datos dependientes de los
proveedores clientes de la organizacin.
2. Repositorio de datos operacionales (Operacional Data Store -
ODS): es un almacn de datos operacionales actuales e integrados que
se utilizan para el anlisis.
3. Gestor de carga ( componente de interfaz): realiza todas las
operaciones asociadas con la extraccin y carga de los datos en el
almacn. Se incluyen transformaciones simples.
4. Gestor del almacn de datos: realiza las operaciones asociadas
con la gestin de datos dentro del almacn. Incluye el anlisis de los
datos para garantizar su coherencia, transformacin y combinacin de
datos de origen, creacin de ndices y vistas, generalizacin de
agregaciones y desnormalizaciones, y el archivado y copia de
seguridad de los datos.

5. Gestor de consultas ( componente de servicio): realiza
todas las operaciones asociadas con la gestin de las consultas
de los usuarios: dirigir consultas hacia tablas apropiadas y
planificar su ejecucin.
6. Datos detallados: rea del almacn que guarda todos los
datos detallados contenidos en el esquema de la BD.
7. Datos poco resumidos y muy resumidos: guarda todos los
datos, poco muy resumidos (agregados), que hayan sido
establecidos por el gestor de datos como resmenes
predefinidos.
8. Datos de archivo / copia de seguridad: guarda los datos
detallado y resumidos con el propsito de mantener un archivo
y disponer de copias de seguridad.
9. Metadatos: guarda todas las definiciones de metadatos
(datos acerca de los datos) utilizadas por todos los procesos del
almacn. Se utilizan para propsitos tales como:

10. Herramientas de acceso para
usuarios finales:

Consulta y generacin de informes: Incluyen generacin de
informes de produccin de carcter operacional, peridicos con
altos volmenes de tareas- y escritores de informes diseados
para usuarios finales, de bajo costo-. Las herramientas de consulta
para almacenes de datos relacionales estn diseadas para aceptar
SQL generar instrucciones SQL con el fin de consultar los datos
del almacn.
Desarrollo de aplicaciones: Puede requerirse por algunos usuarios.
Sistemas de informacin ejecutiva (EIS): Inicialmente para ayuda a
la toma de decisiones estratgicas de alto nivel. Se han ampliado
para incluir soporte para todos los niveles de gestin.
Procesamiento analtico en lnea (OLAP): Basadas en el concepto
de BDs multidimensionales. Permiten analizar los datos mediante
vistas complejas de carcter multidimensional. Genera modelos
retrospectivos.
Minera de Datos: Proceso de descubrimiento de nuevas
correlaciones, patrones y tendencias significativas procesando
grandes cantidades de datos mediante tcnicas estadsticas,
matemticas y de inteligencia artificial. Posee la capacidad de
construir modelos predictivos

11
Productos (suites) de DATA
WAREHOUSE y BI
IBM Cognos
http://www-01.ibm.com/software/data/cognos/
Teradata
http://www.teradata.com
Oracle Hyperion
http://www.oracle.com/hyperion/index.html
MicroStrategy
http://www.strategy.com
SAS
http://www.sas.com


12
Caractersticas de un Data Warehouse
Orientado a un tema
Administra grandes cantidades de informacin
Guarda informacin en diversos medios de
almacenamiento
Comprende mltiples versiones de uno (o
varios) esquema de base de datos
Condensa y agrega informacin
Integra y asocia informacin de muchas fuentes
Diferencias entre un sistema de Data
Warehouse y aplicaciones
tradicionales
SISTEMAS TRADICIONALES

DATAWAREHOUSE

Predomina la actualizacin.
Actividad operativa (da a da).
Proceso puntual.
Estabilidad.
Datos desagregados.
Dato actual.
Respuesta de la transaccin
inmediata.
Estructura relacional.
Usuarios de perfiles bajos.
Explotacin de la informacin
relacionada con operatividad de
cada aplicacin

Predomina la consulta
Anlisis y decisin estratgica.
Proceso masivo.
Dinamismo.
Niveles de detalle/agregacin.
Dato histrico.
Respuesta masiva
Estructura Multidimensional
Usuarios de perfiles altos.
Explotacin de informacin
interna y externa relacionada con
el negocio.

You might also like