You are on page 1of 24

GESTIN DE BASES DE DATOS

Contenido
INTRODUCCION................................................................................................... 2
DEFINICION......................................................................................................... 3
DATAWAREHOUSE Y SUS PRINCIPALES CARACTERSTICAS.....................................3
ESTRUCTURA DEL DATA WAREHOUSE....................................................................4
VENTAJAS......................................................................................................... 8
DESVENTAJAS................................................................................................... 8
Esquemas de un Data Warehouse.......................................................................9
Esquema estrella............................................................................................. 9
Esquema copo de nieve................................................................................. 10
ARQUITECTURA DE UN DATAWAREHOUSE.........................................................11
Usos.................................................................................................................. 12
Formas de acceso de los usuarios..................................................................12
Uso de los datos............................................................................................. 13
Las consultas de los usuarios accedan a cantidades grandes de datos.........13
Ejemplo....................................................................................................... 15
CONSIDERACIONES ADICIONALES.....................................................................17
EJEMPLO DE UN DATA WAREHOUSE..............................................................19
EXCEPCIONES EN EL DATA WAREHOUSE......................................................20
Conclusiones..................................................................................................... 22
Referencias....................................................................................................... 23

1 | Pgina

GESTIN DE BASES DE DATOS

INTRODUCCION
Mejores decisiones de negocio es la clave es el xito en el mercado competitivo de hoy,
para lo cual las organizaciones buscan que sus tomas de decisiones sean entendibles. Para
facilitar estos datos a una amplia audiencia de usuarios.
Para lo cual muchas organizaciones escogen construir un Data Warehouse para liberar la
informacin en sus sistemas operativos y entender los verdaderos problemas del mundo de
los negocios. El Data Warehouse es un almacenamiento integrado de informacin obtenido
de otros sistemas, que provee soporte de decisiones, disponibilidad y manipulacin de
informacin para el anlisis de datos. Clientes deslumbrados, mejores rendimientos, mayor
participacin en el mercado son las bases de los negocios en una dcada competitiva como
la actual y para lograr ella una de las respuestas es el Data Warehouse.
El Data Warehouse representa el proceso de reunir la informacin histrica de una
organizacin en un depsito central, y se ha convertido en una tecnologa comn y
fundamental. Est es la tecnologa que finalmente puede llevar al sueo que perseguan los
tericos del tema desde la dcada de los setenta.
En donde el proceso del Data Warehouse es complejo, y costoso que consume tiempo, sin
embargo, con el paso de los ao se ha venido trabajando en esta industria para crear una
plataforma que sea consistente

en los componentes tecnolgicos

y de liderazgo de

productos, los cuales pueden ser utilizados para reducir los costos e impulsar a las
empresas a crear, administrar y utilizar un Data Warehouse.

2 | Pgina

GESTIN DE BASES DE DATOS

DEFINICION
Las definiciones anteriores se centran en los datos en s mismos. Sin embargo,
los medios para obtener y analizar esos datos, para extraerlos, transformarlos
y cargarlos, as como las diferentes formas para realizar la gestin de datos son
componentes esenciales de un almacn de datos. Muchas referencias a un
almacn de datos utilizan esta definicin ms amplia. Por lo tanto, en esta
definicin se incluyen herramientas para la inteligencia empresarial,
herramientas para extraer, transformar y cargar datos en el almacn de datos,
y herramientas para gestionar y recuperar los metadatos.

DATAWAREHOUSE Y SUS PRINCIPALES CARACTERSTICAS


Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar informacin de una o ms fuentes distintas, para luego
procesarla permitiendo su anlisis desde infinidad de pespectivas y con
grandes velocidades de respuesta. La creacin de un datawarehouse
representa en la mayora de las ocasiones el primer paso, desde el punto de
vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.

en

la

La ventaja principal de este


tipo de bases de datos
radica en las estructuras
en las que se almacena la
informacin (modelos de tablas
estrella, en copo de nieve, cubos
relacionales... etc). Este tipo de
persistencia de la informacin es
homognea y fiable, y permite
consulta y el tratamiento
jerarquizado de la misma
(siempre en un entorno
diferente a los sistemas
operacionales).

El trmino Datawarehouse
fue acuado por primera
vez por Bill Inmon, y se traduce literalmente como almacn de datos. No

3 | Pgina

GESTIN DE BASES DE DATOS

obstante, y como cabe suponer, es mucho ms que eso. Segn defini el


propio Bill Inmon, un datawarehouse se caracteriza por ser
Integrado: los datos almacenados en el datawarehouse deben integrarse en
una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas. La informacin suele
estructurarse tambin en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.
Temtico: slo los datos necesarios para el proceso de generacin del
conocimiento del negocio se integran desde el entorno operacional. Los datos
se organizan por temas para facilitar su acceso y entendimiento por parte de
los usuarios finales. Por ejemplo, todos los datos sob re clientes pueden ser
consolidados en una nica tabla del datawarehouse. De esta forma, las
peticiones de informacin sobre clientes sern ms fciles de responder dado
que toda la informacin reside en el mismo lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el
estado de la actividad delnegocio en el momento presente. Por el contrario, la
informacin almacenada en el datawarehouse sirve, entre otras cosas, para
realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.
No voltil: el almacn de informacin de un datawarehouse existe para ser
ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los ltimos
valores que tomaron las distintas variables contenidas en l sin ningn tipo de
accin sobre lo que ya exista.
Otra caracterstica del datawarehouse es que contiene metadatos, es decir,
datos sobre los datos. Los metadatos permiten saber la procedencia de la
informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.
Los metadatos sern los que permiten simplificar y automatizar la obtencin de
la informacin desde los sistemas operacionales a los sistemas
informacionales.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va
dirigido, son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con
su propio lenguaje de negocio, indicando qu informacin hay y qu significado
tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas
deBusiness Intelligence como DSS, EIS o CMI.
4 | Pgina

GESTIN DE BASES DE DATOS

ESTRUCTURA DEL DATA WAREHOUSE


Los data warehouses tienen una estructura distinta. Hay niveles diferentes de
esquematizacin y detalle que delimitan el data warehouse. La estructura de
un data warehouse se muestra en la Figura N 5.
En la figura, se muestran los diferentes componentes del data warehouse y
son:

Detalle de datos actuales


Detalle de datos antiguos
Datos ligeramente resumidos
Datos completamente resumidos
Meta data

Detalle de datos actuales.- En gran parte, el inters ms importante


radica en el detalle de los datos actuales, debido a que:
Refleja las ocurrencias ms recientes, las cuales son de gran inters
Es voluminoso, ya que se almacena al ms bajo nivel de granularidad.
Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su
administracin sea costosa y compleja.
Detalle de datos antiguos.- La data antigua es aquella que se
almacena sobre alguna forma de almacenamiento masivo. No es
frecuentemente accesada y se almacena a un nivel de detalle,
consistente con los datos detallados actuales. Mientras no sea prioritario
el almacenamiento en un medio de almacenaje alterno, a causa del gran
volumen de datos unido al acceso no frecuente de los mismos, es poco
usual utilizar el disco como medio de almacenamiento.
Datos ligeramente resumidos.- La data ligeramente resumida es
aquella que proviene desde un bajo nivel de detalle encontrado al nivel
de detalle actual. Este nivel del data warehouse casi siempre se
almacena en disco. Los puntos en los que se basa el diseador para
construirlo son:
Que la unidad de tiempo se encuentre sobre la esquematizacin hecha.
Qu contenidos (atributos) tendr la data ligeramente resumida.
Datos completamente resumidos.- El siguiente nivel de datos
encontrado en el data warehouse es el de los datos completamente
resumidos. Estos datos son compactos y fcilmente accesibles.

5 | Pgina

GESTIN DE BASES DE DATOS

A veces se encuentra en el ambiente de data warehouse y en otros, fuera del


lmite de la tecnologa que ampara al data warehouse. (De todos modos, los
datos completamente resumidos son parte del data warehouse sin considerar
donde se alojan los datos fsicamente.)
Metadata.- El componente final del data warehouse es el de la metadata. De
muchas maneras la metadata se sita en una dimensin diferente al de otros
datos del data warehouse, debido a que su contenido no es tomado
directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y es
usada como:
Un directorio para ayudar al analista a ubicar los contenidos del data
warehouse.
Una gua para el mapping de datos de cmo se transforma, del ambiente
operacional al de data warehouse.
Una gua de los algoritmos usados para la esquematizacin entre el detalle de
datos actual, con los datos ligeramente resumidos y stos, con los datos
completamente resumidos, etc.
La metadata juega un papel mucho ms importante en un ambiente data
warehousing que en un operacional clsico.
A fin de recordar los diferentes niveles de los datos encontrados en el data
warehouse, considere el ejemplo mostrado en la Figura N 6.

6 | Pgina

GESTIN DE BASES DE DATOS

El detalle de ventas antiguas son las que se encuentran antes de 1992. Todos
los detalles de ventas desde 1982 (o cuando el diseador inici la coleccin de
los archivos) son almacenados en el nivel de detalle de datos ms antiguo.
El

detalle actual contiene informacin desde 1992 a 1993 (suponiendo que 1993 es el ao actual). En
general, el detalle de ventas no se ubica en el nivel de detalle actual hasta que haya pasado, por lo
menos, veinticuatro horas desde que la informacin de ventas llegue a estar disponible en el
ambiente operacional.
En otras palabras, habra un retraso de tiempo de por lo menos veinticuatro horas, entre el tiempo
en que en el ambiente operacional se haya hecho un nuevo ingreso de la venta y el momento
cuando la informacin de la venta haya ingresado al data warehouse.
El detalle de las ventas son resumidas semanalmente por lnea de subproducto y por regin, para
producir un almacenamiento de datos ligeramente resumidos.
El detalle de ventas semanal es adicionalmente resumido en forma mensual, segn una gama de
lneas, para producir los datos completamente resumidos.
La metadata contiene (al menos):
La estructura de los datos

7 | Pgina

GESTIN DE BASES DE DATOS

Los algoritmos usados para la esquematizacin


El mapping desde el ambiente operacional al data warehouse
La informacin adicional que no se esquematiza es almacenada en el data
warehouse. En muchas ocasiones, all se har el anlisis y se producir un tipo
u otro de resumen. El nico tipo de esquematizacin que se almacena
permanentemente en el data warehouse, es el de los datos que son usados
frecuentemente. En otras palabras, si un analista produce un resumen que
tiene una probabilidad muy baja de ser usado nuevamente, entonces la
esquematizacin no es almacenada en el data warehouse.

VENTAJAS
Hay muchas ventajas por las que es recomendable usar un almacn de datos.
Algunas de ellas son:
Los almacenes de datos hacen ms fcil el acceso a una gran variedad de
datos a los usuarios finales
Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la
decisin tales como informes de tendencia', por ejemplo: obtener los items con
la mayora de las ventas en un rea en particular dentro de los ltimos dos
aos; informes de excepcin, informes que muestran los resultados reales
frente a los objetivos planteados a priori.
Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar
el valor operacional de las aplicaciones empresariales, en especial la gestin de
relaciones con clientes.

DESVENTAJAS
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos
de ellos son:
A lo largo de su vida los almacenes de datos pueden suponer altos costos. El
almacn de datos no suele ser esttico. Los costos de mantenimiento son
elevados.
Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
A veces, ante una peticin de informacin estos devuelven una informacin
subptima, que tambin supone una prdida para la organizacin.
A menudo existe una delgada lnea entre los almacenes de datos y sistemas
operativos. Hay que determinar qu funcionalidades de estos se pueden
aprovechar y cules se deben implementar en el data warehouse, resultara
8 | Pgina

GESTIN DE BASES DE DATOS

costoso implementar operaciones no necesarias o dejar de implementar alguna


que s vaya a necesitarse.

Esquemas de un Data Warehouse


Un Data Warehouse adopta un esquema estrella o copo de nieve para
maximizar la performance de las consultas.
Un diseo de esquema estrella o copo de nieve es muy diferente del diseo de
un esquema de base de datos operacional.

Esquema estrella

La tcnica de diseo ms popular usada para un Data Warehouse es el


esquema estrella.

El esquema estrella es un paradigma en el cual un nico objeto en el


centro (conocido como tabla de hechos) est conectado radialmente con
otros objetos circundantes llamados tabla de dimensiones formando una
estrella.

El esquema estrella puede ser simple o complejo. Un esquema estrella


simple consiste de una tabla de hechos y varias tablas de dimensin.

Un esquema estrella complejo puede tener ms de una tabla de hechos


y cientos de tablas de dimensin.

9 | Pgina

GESTIN DE BASES DE DATOS

Una consulta se traduce a un ensamble entre una tabla de hechos y


mltiples tablas de dimensin.

Cada tabla de dimensin se ensambla con la tabla de hechos por la


clave primaria de la tabla de dimensin, pero las tablas de dimensin no
se ensamblan unas con otras.

Una tabla de hechos normalmente contiene claves y medidas.

Una simple tabla de hechos podra contener la medida Ventas, y la clave


de Tiempo, Producto, y Mercado.

Habra tablas de dimensin correspondientes a Tiempo, Producto, y


Mercado. La tabla de dimensin Producto, por ejemplo, contendra la
informacin sobre cada nmero de producto que aparece en el tabla de
hechos

Esquema copo de nieve

El esquema copo de nieve es una extensin del esquema estrella donde


cada punta de la estrella se explota en ms puntas y su denominacin se
debe a que el diagrama del esquema se asemeja a un copo de nieve.

En este esquema, las tablas de dimensin se encuentran ms


normalizadas para mejorar la performance de las consultas debido a la
reduccin del almacenamiento en disco para los datos y a la mejora de
la performance debido a que los ensambles se realizan sobre tablas de
dimensin mas pequeas.

10 | P g i n a

GESTIN DE BASES DE DATOS

Los esquemas copo de nieve normalizan dimensiones para eliminar


redundancia.

Los datos de las dimensiones se agrupan en mltiples tablas en lugar de


una tabla grande.

Una tabla de dimensin Producto en un esquema estrella se podra


normalizar en una tabla Producto, una tabla Categoria_Producto, y otra
de Fabricante_Producto en un esquema copo de nieve.

El resultado es el ahorro de espacio de almacenamiento en disco en


perjuicio de un aumento en la cantidad de tablas.

11 | P g i n a

GESTIN DE BASES DE DATOS

ARQUITECTURA DE UN DATAWAREHOUSE
Elementos dentro de la arquitectura Data Warehouse (que es una forma de
representar la estructura global de los datos, la comunicacin, los procesos y la
presentacin del usuario final). Como ya sabemos la construccin del data
warehouse se establece como elemento crtico en el proceso de implantacin
de una herramienta Business Intelligence y por lo tanto resulta interesante
recordar todos estos conceptos:
Base de datos operacional/nivel de base de datos externos: hace referencia a
los sistemas operacionales/transaccionales de la organizacin y a fuentes que
forman parte del proceso de Data Warehousing.
Nivel de acceso a la informacin: es la capa de interaccin del usuario cuya
finalidad es la conversin de los datos almacenados en informacin fcil y
transparente para las herramientas de los usuarios finales.
Nivel de acceso a los datos: comunica el nivel de acceso a la informacin con el
nivel operacional de forma universal.
Nivel de directorio de datos (metadatos): repositorio de metadatos de los datos
almacenados que proporcionan informacin sobre el origen y sobre la
transformacin de los mismos en el proceso de Data Warehousing.
Nivel de gestin de procesos: planificacin de las tareas y procesos para la
construccin y mantenimiento actualizado del Data Warehouse.
Nivel de mensaje de la aplicacin: determina el transporte de informacin a lo
largo del entorno de computacin de la organizacin a modo de middleware
pero ms all de meramente protocolos de red.
Nivel Data Warehouse (fsico): es el repositorio central altamente flexible de
informacin donde residen copias de los datos operacionales y/o externos
optimizados para su acceso para la consulta.
Nivel de organizacin de datos: incluye todos los procesos necesarios para
seleccionar, editar, resumir (normalmente sumarizar), combinar y cargar en el
Data Warehouse y en la capa de acceso a la informacin los datos
operacionales y/o externos.

Usos
Formas de acceso de los usuarios
Uso de Base de Datos Operacionales
Muchos usuarios concurrentes
12 | P g i n a

GESTIN DE BASES DE DATOS

Consultas predefinidas y actualizables


Cantidades pequeas de datos detallados
Requerimientos de respuesta inmediata

Uso de Data Warehouse


Pocos usuarios concurrentes
Consultas complejas, frecuentemente no anticipadas.
Cantidades grandes de datos detallados
Requerimientos de respuesta no crticos

Uso de los datos


Por lo general, los diferentes niveles de datos dentro del data warehouse
reciben diferentes usos. A ms alto nivel de esquematizacin, se tiene mayor
uso de los datos.
Hay mayor uso de los datos completamente resumidos, a diferencia de la
informacin antigua que apenas es usada.
Los datos ms resumidos, permiten capturar los datos en forma ms rpida y
eficiente. Si en una tarea se encuentra que se hace mucho procesamiento a
niveles de detalle del data warehouse, entonces se consumir muchos recursos
de mquina. Es mejor hacer el procesamiento a niveles ms altos de
esquematizacin como sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la
informacin a nivel de detalle en un pre data warehouse. Una de las
actividades del diseador de datos es el de desconectar al usuario del sistema
de soporte de decisiones del uso constante de datos a nivel de detalle ms
bajo.

Las consultas de los usuarios accedan a cantidades


grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre
muchas clases de datos, las consultas al data warehouse permiten acceder a
volmenes muy grandes tanto de data detallada como resumida. Debido a los
requerimientos de datos histricos, los data warehouses evolucionan para
llegar a un tamao ms grande que sus orgenes operacionales (de 10 a 100
veces ms grande).
Las consultas de los usuarios no tienen tiempos de respuesta crticos
13 | P g i n a

GESTIN DE BASES DE DATOS


Las transacciones operacionales necesitan una respuesta inmediata porque un cliente
puede estar esperando una respuesta. En el data warehouse, por el contrario, tiene un
requerimiento de respuesta no-crtico porque el resultado frecuentemente se usa en un
proceso de anlisis y toma de decisiones. Aunque los tiempos de respuesta no son
crticos, los usuarios esperan una respuesta dentro del mismo da en que es hecha la
consulta.
Por lo general, los diferentes niveles de datos dentro del data warehouse reciben
diferentes usos. A ms alto nivel de esquematizacin, se tiene mayor uso de los datos.

En la Figura N 12 se muestra que hay mayor uso de los datos completamente


resumidos, a diferencia de la informacin antigua que apenas es usada.
Hay una buena razn para mover una organizacin al paradigma sugerido en la
figura, la utilizacin del recurso. La data ms resumida, permite capturar los
datos en forma ms rpida y eficiente. Si en una tarea se encuentra que se
hace mucho procesamiento a niveles de detalle del data warehouse, entonces
se consumir muchos recursos de mquina. Es mejor hacer el procesamiento a
niveles ms altos de esquematizacin como sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la
informacin a nivel de detalle en un pre data warehouse. La seguridad de la
informacin de detalle se consigue de muchas maneras, aun cuando estn
disponibles otros niveles de esquematizacin. Una de las actividades del
diseador de datos es el de desconectar al usuario del sistema de soporte de
decisiones del uso constante de datos a nivel de detalle ms bajo.
El diseador de datos tiene dos predisposiciones:
Instalar un sistema chargeback, donde el usuario final pague por los recursos
consumidos
Sealar el mejor tiempo de respuesta que puede obtenerse cuando se trabaja
con la data a un nivel alto de esquematizacin, a diferencia de un pobre tiempo
de respuesta que resulta de trabajar con los datos a un nivel bajo de detalle.
Para ilustrar cmo un data warehouse puede ayudar a una organizacin a
mejorar sus operaciones, se muestra un ejemplo de lo que es el desarrollo de
actividades sin tener un data warehouse.

14 | P g i n a

GESTIN DE BASES DE DATOS

Ejemplo
Preparacin de un reporte complejo
Considere un problema bastante tpico en una compaa de fabricacin grande
en el que se pide una informacin (un reporte) que no est disponible.

15 | P g i n a

GESTIN DE BASES DE DATOS

El informe incluye las finanzas actuales, el inventario y la condicin de


personal, acompaado de comparaciones del mes actual con el anterior y el
mismo mes del ao anterior, con una comparacin adicional de los 3 aos
precedentes. Se debe explicar cada desviacin de la tendencia que cae fuera
de un rango predefinido.
Sin un data warehouse, el informe es preparado de la manera siguiente:
La informacin financiera actual se obtiene desde una base de datos mediante
un programa de extraccin de datos, el inventario actual de otro programa de
extraccin de otra base de datos, la condicin actual de personal de un tercer
programa de extraccin y la informacin histrica desde un backup de cinta
magntica o CD-ROM.
Lo ms interesante es que se ha pedido otro informe que contine al primer
informe (debido a que las preguntas se originaron a partir del anterior). El
hecho es, que ninguno de los trabajos realizados hasta aqu (por ejemplo,
diversos programas de extraccin) se pueden usar para los prximos o para
cualquier reporte subsiguiente. Imagine el tiempo y el esfuerzo que se ha
desperdiciado por un enfoque anticuado. (Ver Figura N 13).
Las inconsistencias deben identificarse en cada conjunto de datos extrados y
resolverse, por lo general, manualmente. Cuando se completa todo este
procesamiento, el reporte puede ser formateado, impreso, revisado y
transmitido.
Nuevamente, el punto importante aqu es que todo el trabajo desempeado
para hacer este informe no afecta a otros reportes que pueden solicitarse es
decir, todos ellos son independientes y caros, desde el punto de vista de
recursos y productividad.
Al crear un data warehouse y combinar todos los datos requeridos, se obtienen
los siguientes beneficios:
Las inconsistencias de los datos se resuelven automticamente cuando los
elementos de datos se cargan en el data warehouse, no manualmente, cada
vez que se prepara un reporte.
Los errores que ocurrieron durante el proceso complejo de la preparacin del
informe, se minimizan porque el proceso es ahora mucho ms simple.
Los elementos de datos son fcilmente accesibles para otros usos, no slo para
un reporte particular.

16 | P g i n a

GESTIN DE BASES DE DATOS

Se crea una sola fuente.

CONSIDERACIONES ADICIONALES
Hay algunas consideraciones adicionales que deben tenerse en cuenta al
construir y administrar el data warehouse.
La primera consideracin es respecto al ndice. La informacin de los niveles
de esquematizacin ms altos pueden ser libremente indexados, mientras que
las de los niveles ms bajos de detalle, por ser tan voluminosa, pueden ser
indexados moderadamente.
Por lo mismo, los datos en los niveles ms altos de detalle pueden ser
reestructurados fcilmente, mientras que el volumen de datos en los niveles
17 | P g i n a

GESTIN DE BASES DE DATOS

ms inferiores es tan grande, que los datos no pueden ser fcilmente


reestructurados.
Por consiguiente, el modelo de datos y el diseo clsico fundamentan que el
data warehouse se aplique casi exclusivamente al nivel actual de detalle. En
otras palabras, las actividades de modelamiento de datos no se aplican a los
niveles de esquematizacin, en casi todos los casos.
Otra consideracin estructural es la particin de la informacin en el data
warehouse. El nivel de detalle actual es casi siempre particionado.
La particin puede hacerse de dos maneras: al nivel de DBMS y al nivel de la
aplicacin. En la particin DBMS, se conoce las particiones y se administra por
consiguiente. En el caso de la particin de las aplicaciones, slo los
programadores de las mismas conocen las particiones y la responsabilidad de
su administracin es asignada a ellos.
Al interior de las particiones DBMS, mucho de los trabajos de infraestructura se
hacen automticamente. Pero existe un elevado grado de rigidez asociada con
la gestin automtica de las particiones. En el caso de las particiones de las
aplicaciones del data warehouse, la mayor parte del trabajo recae sobre el
programador, pero el resultado final es que la gestin de datos es ms flexible.

18 | P g i n a

GESTIN DE BASES DE DATOS

EJEMPLO DE UN DATA WAREHOUSE


En la Figura N 14 se muestra un ejemplo hipottico de un data warehouse
estructurado para un centro de produccin industrial.

19 | P g i n a

GESTIN DE BASES DE DATOS

Se muestra slo el detalle actual, no as los niveles de esquematizacin ni los


archivos de detalle ms antiguos.
Adems, se observa que hay tablas del mismo tipo divididas a travs del
tiempo. Por ejemplo, para el histrico de la fabricacin de las piezas, hay
muchas tablas separadas fsicamente, representando cada una un trimestre
20 | P g i n a

GESTIN DE BASES DE DATOS

diferente. La estructura de los datos es consistente con la tabla de la


elaboracin de las piezas, aunque fsicamente hay muchas tablas que
lgicamente incluyen el histrico.
Para los diferentes tipos de tablas hay diferentes unidades de tiempo que
fsicamente dividen las unidades de informacin. El histrico de fabricacin
est dividido por trimestres, el histrico de la orden de piezas est dividido por
aos y el histrico de cliente es un archivo nico, no dividido por el tiempo.
As tambin, las diferentes tablas son vinculadas por medio de un identificador
comn, piezas u rdenes de piezas (la representacin de la interrelacin en el
ambiente de depsito toma una forma muy diferente al de otros ambientes, tal
como el ambiente operacional).

EXCEPCIONES EN EL DATA WAREHOUSE


Mientras que los componentes del data warehouse trabajan de acuerdo al
modelo descrito para casi todos los datos, hay pocas excepciones tiles que
necesitan ser discutidas.
Una de ellas es la data resumida pblica, que es la data que ha sido
calculada fuera del data warehouse pero es usada a travs de la corporacin.
La data resumida pblica se almacena y administra en el data warehouse,
aunque su clculo se haya hecho fuera de l.
Un ejemplo clsico de data resumida pblica es el archivamiento trimestral
hecho por cada compaa pblica. Los contadores trabajan para producir
cantidades como rentas trimestrales, gastos trimestrales, ganancias
trimestrales y otros. El trabajo hecho por los contadores est fuera del data
warehouse. Sin embargo, esas cantidades referenciales producidas por ellos se
usan ampliamente dentro de la corporacin para marketing, ventas, etc. Una
vez que se haya hecho el archivo, los datos se almacenan en el data
warehouse.
Otra excepcin no considerada en este documento es la data externa.
Otro excepcional tipo de datos a veces encontrados en un data warehouse es
el detalle de los datos permanentes, que resulta de la necesidad de una
corporacin para almacenar la data a un nivel detallado permanentemente por
razones ticas o legales.
Si una corporacin expone a sus trabajadores a sustancias peligrosas hay una
necesidad de detalle de datos permanente. Si una corporacin produce un
21 | P g i n a

GESTIN DE BASES DE DATOS

producto que involucra la seguridad pblica, tal como la construccin de las


partes de aviones, hay una necesidad de datos permanentes. Si una
corporacin se compromete con contratos peligrosos, hay una necesidad de
detalle de datos permanentes.

La organizacin simplemente no puede dejar los detalles porque en futuros


aos, en el caso de una demanda, una notificacin, un edificio en disputa, etc.,
se incrementara la exposicin de la compaa. Por lo tanto hay un nico tipo
de datos en el data warehouse conocido como detalle de datos permanentes.
El detalle de datos permanentes comparte muchas de las mismas
consideraciones como otro data warehouse, excepto que:
El medio donde se almacena la data debe ser tan seguro como sea posible.
Los datos deben permitir ser restaurados.
Los datos necesitan un tratamiento especial en su indexacin, ya que de otra
manera los datos pueden no ser accesibles aunque se haya almacenado con
mucha seguridad.

22 | P g i n a

GESTIN DE BASES DE DATOS

Conclusiones
Resumiendo los beneficios de la arquitectura del DWH :
Provee un esquema de organizacin cules son los componentes que la
forman, cmo ellos se interrelacionan, quin es el dueo de cada parte y cules
son las prioridades.
Mejora la flexibilidad permite que rpidamente se aadan nuevas fuentes de
datos.
Desarrollo rpido y reuso los desarrolladores de DWH son ms capaces de
comprender el proceso de DWH , los contenidos de las bases de datos y las
reglas del negocio ms rpidamente.
Herramientas de comunicaciones define y comunica la direccin y el alcance
de las expectativas , identifica los roles y responsabilidades y comunica los
requerimientos al proveedor.
En general, podemos plantear que el Datawarehouse representa una
oportunidad para estrechar las relaciones de las empresas con los clientes.

23 | P g i n a

GESTIN DE BASES DE DATOS

Referencias

http://www.exa.unicen.edu.ar/catedras/dwhouse/
http://www.sqlmax.com/dataw1.asp
http://informationmanagement.wordpress.com/2007/06/03/arquitecturade-un-datawarehouse/
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos#Ventajas
http://es.wikipedia.org/wiki/Almac
%C3%A9n_de_datos#Una_definici.C3.B3n_m.C3.A1s_amplia_de_almac.C
3.A9n_de_datos
http://www.ongei.gob.pe/publica/metodologias/Lib5084/14.HTM
http://www.google.com.pe/#hl=es&q=datawarehouse+estructura&meta
=&aq=f&aqi=g1&aql=&oq=&gs_rfai=&fp=b613da276d1a7f
http://egkafati.bligoo.com/content/view/302166/Datawarehouse-y-susprincipales-caracteristicas.html
http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos
http://dmi.uib.es/~bbuades/datawarehouse/datawarehouse.ppt
http://www.google.com.pe/search?hl=es&client=firefoxa&hs=hYj&rlz=1R1GGLL_es___PE370&q=filetype
%3Appt+datawarehouse+aplicacion&meta=&aq=f&aqi=&aql=&oq=&gs
_rfai=

24 | P g i n a

You might also like