You are on page 1of 5

Datawarehouse

2. Almacenes de Datos 2.1. Introduccin a los Almacenes de Datos. 2.2. Arquitectura de un Sistema de Almacn de Datos. 2.3. Explotacin de un Almacn de Datos: erramientas !"A#. 2.$. Sistemas %!"A# & '!"A#. 2.(. )ar*a & 'antenimiento de un Almacn de Datos. 2.+. Dise,o de un almacn de Datos. 2.-. ".neas de In/esti*acin A0iertas. Objetivos: )onocer las /enta1as & casos donde es aconse1a0le recopilar in2ormacin interna & externa en un Almacn de Datos. )onocer el modelo multidimensional de los almacenes de datos & los operadores de re2inamiento asociados: drill, roll, slice & dice, pivot. )onocer la arquitectura & di2erentes implementaciones 3%!"A#4 '!"A#5 de Almacenes de Datos. %econocer pautas para el dise,o & mantenimiento de ADs. Introduccin a los Almacenes de Datos OBJETIVO: Anlisis de Datos para el Soporte en la Toma de Decisiones 6eneralmente4 la in2ormacin que se quiere in/esti*ar so0re un cierto dominio de la or*ani7acin se encuentra en 0ases de datos & otras 2uentes mu& di/ersas4 tanto internas como externas. 'uchas de estas 2uentes son las que se utili7an para el tra0a1o diario 30ases de datos operacionales5. So0re estas mismas 0ases de datos de tra0a1o &a se puede extraer conocimiento 3/isin tradicional5. !so de la base de datos transaccional para varios cometidos: Se mantiene el tra0a1o transaccional diario de los sistemas de in2ormacin ori*inales 3conocido como !"8#4 On-Line Transactional Processing5. Se hace an9lisis de los datos en tiempo real so0re la misma 0ase de datos 3conocido como !"A#4 On-Line Analytical Processing5. #%!:"E'AS: pertur0a el tra0a1o transaccional diario de los sistemas de in2ormacin ori*inales 3; killer queries<5. Se de0e hacer por la noche o en 2ines de semana. la 0ase de datos est9 dise,ada para el tra0a1o transaccional4 no para el an9lisis de los datos. 6eneralmente no puede ser en tiempo real 3era A# pero no !"A#5. Se desea operar e2icientemente con esos datos... los costes de almacenamiento masi/o & conecti/idad se han reducido dr9sticamente en los =ltimos a,os4 parece ra7ona0le reco*er los datos 3in2ormacin histrica5 en un sistema separado " espec#$ico. >A)E E" DA8A?@A%E !ASI>6 Data warehouses 3Almacenes o :ode*as de Datos5 Almacenes de Datos (AD) (data warehouse) Motivacin: Disponer de Sistemas de Informacin de apoyo a la toma de decisiones (DSS: Decision Support Systems).

Disponer de bases de datos que permitan extraer conocimiento de la informacin histrica almacenada en la organizacin Objetivos: Anlisis de la organizacin pre isiones de e olucin dise!o de estrategias Almacenes de datos "ase de Datos dise!ada con un o#$eti o de e%plotacin distinto que el de las #ases de datos de los sistemas operacionales.
Sistema Operacional (OLTP) Sistema de Almacn de Datos (DW) BD orientada al proceso BD orientada al anlisis

Almacenes de Datos De$inicin: coleccin de datos dise,ada para dar apo&o a los procesos de toma de decisiones %aracter#sticas: !rientada hacia la in2ormacin3sub ect oriented, not process oriented! rele/ante de la or*ani7acin Inte*rada /aria0le en el tiempo no /ol9til AD: Orientado &acia la in$ormacin relevante de la or'ani(acin: se dise,a para consultar
e2icientemente in2ormacin relati/a a las acti/idades 3/entas4 compras4 produccin4 ...5 09sicas de la or*ani7acin4 no para soportar los procesos que se reali7an en ella 3*estin de pedidos4 2acturacin4 etc5.

AD: Inte'rado: inte*ra datos reco*idos de di2erentes sistemas operacionales de la or*ani7acin 3&Bo 2uentes
externas5.

AD: Variable en el tiempo: los datos son relati/os a un periodo de tiempo & de0en ser incrementados
peridicamente.

"os datos son almacenados como 2otos 3snapshots5 correspondientes a periodos de tiempo.

AD: )o voltil: los datos almacenados no son actuali7ados4 slo son incrementados. El periodo de tiempo cu0ierto por un AD /ar.a entre 2 & 1C a,os.

Almacenes de Datos Ventajas para las or'ani(aciones: %enta0ilidad de las in/ersiones reali7adas para su creacin. aumento de la competiti/idad en el mercado aumento de la producti/idad de los tcnicos de direccin *roblemas: In2ra/aloracin del es2uer7o necesario para su dise,o & creacin in2ra/aloracin de los recursos necesarios para la captura4 car*a & almacenamiento de los datos incremento continuo de los requisitos de los usuarios pri/acidad de los datos
Sistema Operacional +O,T*almacena datos actuales almacena datos de detalle 0ases de datos medianas 31CC'0?1605 los datos son din"#icos $actuali%ables! los procesos $transacciones! son repetitivos el n=mero de transacciones es ele/ado tiempo de respuesta peque,o 3se*undos5 dedicado al procesamiento de transacciones orientado a los procesos de la or*ani7acin soporta decisiones diarias sir/e a muchos usuarios 3administrati/os5 Almac.n de datos +D/almacena datos histricos almacena datos de detalle & datos a*re*ados a distintos ni/eles 0ases de datos *randes 31CC60?1805 los datos son est9ticos los procesos no son pre/isi0les el n=mero de transacciones es 0a1o o medio tiempo de respuesta /aria0le 3se*undos?horas5 dedicado al an9lisis de datos orientado a la in2ormacin rele/ante soporta decisiones estrat*icas sir/e a tcnicos de direccin

Ar0uitectura de un Almac.n de Datos


"a Arquitectura de un AD /iene determinada por su situacin central como 2uente de in2ormacin para las herramientas de an9lisis.

%omponentes: Sistema E8" 3&'traction, Trans(or#ation, Load5: reali7a las 2unciones de e'tracci)n de las 2uentes de datos 3transaccionales o externas54 trans(or#aci)n 3limpie7a4 consolidacin4 ...5 & la carga del AD4 reali7ando: extraccin de los datos. 2iltrado de los datos: limpie7a4 consolidacin4 etc. car*a inicial del almacn: ordenacin4 a*re*aciones4 etc. re2resco del almacn: operacin peridica que propa*a los cam0ios de las 2uentes externas al almacn de datos

%epositorio #ropio de Datos: in2ormacin rele/ante4 metadatos. Inter2aces & 6estores de )onsulta: permiten acceder a los datos & so0re ellos se conectan herramientas m9s so2isticadas 3!"A#4 EIS4 miner.a de datos5. Sistemas de Inte*ridad & Se*uridad: se encar*an de un mantenimiento *lo0al4 copias de se*uridad4 ...

Or'ani(acin +E1terna- de ,os Datos2 "as herramientas de explotacin de los almacenes de datos han adoptado un modelo multidimensional de datos. Se o2rece al usuario una /isin multidimensional de los datos que son o01eto de an9lisis. EJE3*,O !r*ani7acin: )adena de supermercados. Acti/idad o01eto de an9lisis: /entas de productos. In2ormacin re*istrada so0re una /enta: ;del producto ;8auritn 33cl< se han /endido en el almac.n ;Almacn nro.1< el d#a 1-B-B2CC34 ( unidades por un importe de 1C341D euros.<

#ara hacer el an9lisis no interesa la /enta indi/idual 3ticEet5 reali7ada a un cliente sino las /entas diarias de productos en los distintos almacenes de la cadena. 3odelo multidimensional: en un esquema multidimensional se representa una acti/idad que es o01eto de an9lisis 3hecho5 & las dimensiones que caracteri7an la acti/idad 3dimensiones5. la in2ormacin rele/ante so0re el hecho 3acti/idad5 se representa por un con1unto de indicadores 3medidas o atri0utos de hecho5. la in2ormacin descripti/a de cada dimensin se representa por un con1unto de atri0utos 3atri0utos de dimensin5.

You might also like