You are on page 1of 36

Data Warehouse

Administracin de Bases de Datos


Fernando Bleye

7/5/2003
Introduccin
Qu es un Sistema de Informacin de
Gestin (SIG)?
Es el proceso por el cual los datos que son importantes para una
empresa son identificados, analizados y recolectados para su
posterior uso.

El primer objetivo de un SIG es incrementar la inteligencia de los
procesos del negocio (Business Intelligence).

El SIG debe permitir observar el estado del negocio y el
descubrimiento de informacin.

En los ltimos aos ha cambiado la forma de entender los SIG:
Mercados cambiantes y altamente competitivos.
Las nuevas tecnologas ofrecen nuevas oportunidades.
Existe deseo de conocer mejor el comportamiento de los clientes.


El aumento espectacular del volumen de datos hace evidente la
necesidad de una infraestructura para la logstica de la informacin.

Perspectiva histrica de los
Sistemas de Informacin
Primeros sistemas de informacin basados en aplicaciones.
Generan ficheros especficos y/o utilizan bases de datos normalmente
heterogneas entre ellas donde almacenan la informacin.
Diseo marcado por las necesidades puntuales del da a da de
diferentes departamentos del negocio.
La integracin entre aplicaciones no era un objetivo.
Aunque la tecnologa ha mejorado, perdura la falta de
integracin, consistencia, coherencia (limitaciones) , sin embargo
la demanda de informacin crece.
Problema: Las aplicaciones siguen profundamente marcadas por
las primeras consideraciones que dirigieron su desarrollo.
La arquitectura sobre la que se construyeron estas aplicaciones
(OLTP) no es vlida para soportar las necesidades de los sistemas
de informacin de gestin actuales.
En estos sistemas la arquitectura de los datos nunca fue un
objetivo del negocio.


Nacimiento del concepto
Data Warehouse
La complejidad y dinamismo de la economa digital han situado
en un lugar predominante a los gestores, desvelando las
dificultades de acceso a la informacin de la empresa.
La calidad y disponibilidad de la informacin se convierte en un
objetivo primordial del negocio.
Se apunta como primera solucin crear una gran base de datos
virtual para integrar los datos de las aplicaciones existentes, una
vez que hayan sido depurados y reconciliadas sus disparidades.
Esto posibilitar que los datos sean utilizados para la gestin.
La solucin pasa por separar el procesamiento en dos grandes
categoras
Proceso Operacional (OLTP).
Procesamiento para el sistema de soporte de decisiones
(OLAP/DSS/DM).
Como consecuencia de lo anterior aparece el concepto de

Definicin Data Warehouse
Data Warehousing / Data Warehouse / DW
(Almacenes de datos)

El Data Warehouse es un componente de la arquitectura de
sistemas, temtico, integrado, no voltil y dependiente del
tiempo diseado para ayudar en la toma de decisiones.
[W. H. Inmon (considerado el padre del concepto DW)
1992]

Conjunto de tecnologas de soporte a la toma de decisin,
cuyo objeto es que quien trabaja con los conocimientos
(ejecutivo, director, analista) pueda tomar decisiones de
manera ms rpida y eficaz.
[Chaudhuri y Dayal 1997]
Pero, Qu es un Data Warehouse?
El DW es un conjunto de tecnologas, NO UN PRODUCTO. Debe
construirse, paso a paso.
Es una arquitectura que debe construirse de acuerdo a las
necesidades y entorno especfico del cliente, y debe construirse
de manera ITERATIVA, para consolidar y administrar datos de
varias fuentes con el propsito de conseguir en un perodo de
tiempo aceptable y gracias a las nuevas capacidades de
procesamiento y tcnicas analticas:
Responder preguntas de negocio (OLAP - Anlisis de datos)
Ayudar en la toma de decisiones (DSS EIS)
Descubrir conocimiento (Data Mining - Minera de datos)

El Data Warehouse es una arquitectura bien definida cuyo
objetivo inicial es satisfacer la demanda de los gestores de
obtener una visin integrada de la empresa y su entorno.

Terminologa y definiciones
OLAP (On-Line Analytical Processing o procesamiento analtico on-line)
Se define como anlisis rpido de informacin multidimensional compartida.
[Richard Creeth, Nigel Pendse]
Herramientas OLAP (para anlisis de datos en DW):
Frontales para el acceso a los datos del DW (o bases de datos multidimensionales tambin
denominadas OLAP) basados en el modelo de datos multidimensional.
DSS (Decision-Support Systems o sistemas de soporte a la toma de decisiones)
EIS (Executive Information Systems o sistemas de informacin ejecutiva)
Hacen alusin a las herramientas para obtener datos de nivel superior del DW para la
toma de decisiones.
Herramientas DSS / EIS:
Objetivo: apoyar la toma de decisiones mediante la aplicacin de modelos matemticos y
estadsticos, o de conocimiento especfico a un problema particular.
Son un sistema integrado de planificacin y tratamiento de la informacin que incorpora la
habilidad de consultar los datos del DW en una forma determinada, analizar la informacin
obtenida y predecir, en base a unos determinados modelos, el impacto de las futuras decisiones
antes de llevarlas a la prctica.
DM (Data Mining o minera de datos)
Se emplea como parte del proceso de descubrir conocimiento:
Reglas de asociacin, Patrones secuenciales, rboles de clasificacin.
Objetivos:
Prediccin, Identificacin, Clasificacin, Optimizacin.

Terminologa y definiciones
OLTP (On-Line Transaction Processing o procesamiento de transaccines
on-line)
Los datos que una empresa utiliza como soporte a los negocios se les
denomina operacionales. Los sistemas usados con el fin de recogerlos u
operar con ellos reciben el nombre de OLTP.
Es el procesamiento de datos soportado por las bases de datos tradicionales
(tambin denominadas transaccionales).
BDs Relacionales (normalmente), Red, Jerrquicas,
Operaciones de: Aadir, Modificar, Eliminar, Consulta.
Optimizado para transacciones que habitualmente slo abarcan una pequea
parte de una base de datos.
Orientado a conseguir la mxima eficacia y rapidez en las transacciones
(actualizaciones) individuales de los datos, y no a su anlisis de forma
agregada.
Bases de datos transaccionales (basadas en el modelo de datos ER) no
pueden ser optimizadas para OLAP, DSS o Minera de Datos.

Terminologa y definiciones
BI (Business Intelligence)
Considerado como una Tecnologa de Informacin
Describe un conjunto de conceptos y mtodos diseados para
mejorar la toma de decisiones en los negocios a travs del uso de
sistemas basados en hechos. Los sistemas basados en hechos
abarcan:
Sistemas de informacin ejecutiva - EIS (Executive Information Systems)
Sistemas de soporte a la toma de decisiones - DSS (Decision-Support
Systems)
Procesamiento analtico on-line - OLAP (On-Line Analytical Processing)
Minera de datos - DM (Data Mining)
Herramientas de visualizacin de datos Data Visualization
Sistemas de informacin Geogrfica - Geoghaphic Information Systems
[Howard Dresner]

Es el conjunto de tecnologas que permiten a las empresas utilizar la
informacin disponible en cualquier parte de la organizacin para
hacer mejores anlisis, descubrir nuevas oportunidades y tomar
mejores decisiones estratgicas.


Terminologa y definiciones
Metadata en un Data Warehouse
Metadata es la informacin sobre los datos que se introducen,
transforman y existen en el DW. (Datos acerca de los datos)

Metadata normalmente incluye los siguientes elementos:
Las estructuras de datos.
Las definiciones del sistema de registro desde el cual se
construye el DW.
Las especificaciones de transformaciones de datos que deben
realizarse para la carga de nuevos datos en el DW desde las
fuentes de datos.
El modelo de datos del DW.
Informacin de cuando los nuevos elementos de datos se
agregan al DW y cuando los elementos de datos antiguos se
eliminan o se resumen.
Los niveles de sumarizacin, el mtodo de sumarizacin y las
tablas de registros de el DW.


Sistemas operacionales (OLTP) vs
Sistemas analticos (OLAP, DSS, DM)
Sistema Operacional (BD tradicional) Sistema Analtico (DW o almacn de datos)
Almacena datos actuales Almacena datos histricos
(datos tienen clave de tiempo)
Almacena datos de detalle Almacena datos de detalle y datos agregados
a distintos niveles
Los datos son dinmicos (actualizables) Los datos son principalmente estticos
Las actualizaciones no suelen estar
programadas
Las actualizaciones son escasas y
programadas, incremental a intervalos regulares
Los procesos (transacciones) son repetitivos Los procesos no son previsibles
Dedicado al procesamiento de transacciones Dedicado al anlisis de datos
Orientado a los procesos operativos Orientado a la obtencin de informacin
Soporta decisiones diarias (corto plazo) Soporta decisiones estratgicas
(medio y largo plazo)
Sirve a muchos usuarios Sirve a tcnicos de direccin pocos usuarios*
Requerimientos de respuesta inmediata Requerimientos de respuesta no crticos
Modelo de datos relacional (normalmente) Modelo de datos multidimensional
Base de Datos operativa vs
Data Warehouse
Una base de datos operativa:
Almacena la informacin de un sector del negocio.
Se actualiza a medida que llegan datos que deban ser almacenados.
Se opera mediante los cuatro mecanismos clsicos aadir-eliminar-modificar-
consulta.
Normalmente se orienta hacia la elaboracin de informes peridicos.
Suele manejar pequeos volmenes de datos.
Entorno optimizado para muchas transacciones (con gran cantidad de
actualizaciones).
Sirve de infraestructura al da a da de las funciones de explotacin de una
empresa.
Un Data Warehouse:
Almacena informacin integrada de los distintos sectores del negocio.
Su actualizacin se realiza a intervalos regulares (tpicamente una al da) dentro
de un proceso controlado, y tras realizar un preprocesado de los datos que se
van a almacenar.
Su orientacin es hacia la consulta del estado del negocio y obtencin de
informacin para ayuda en la toma de decisiones estratgicas.
Se ofrece informacin bajo demanda (anlisis mediante el uso de herramientas
de generacin de informes que consultan el data warehouse).
Refleja el modelo de negocio, frente al modelo de proceso.
Caractersticas de un Data Warehouse
Un DW es normalmente un almacn de datos integrados
proveniente de fuentes diversas (datos de una
empresa o negocio):
Datos externos de ficheros generados por aplicaciones ad hoc.
Administracin, Contabilidad, Facturacin
Datos provenientes de diferentes sistemas de BDs
transaccionales (datos operacionales), que normalmente son
heterogneas.
Datos generados por las herramientas de anlisis y de obtencin
de informacin y conocimiento a partir de los datos originales del
DW.
Los datos almacenados en el DW mantienen series de
tiempo y de tendencia.
Mayor cantidad de datos histricos que los contenidos
normalmente por las BDs transaccionales.

Caractersticas de un Data Warehouse
Abarcan gran cantidad de datos (suelen ser del orden de
Terabytes).
Tienen un orden de magnitud (a veces dos) superior al de las
bases de datos fuente.
El volumen de datos es tratado por medio de:
Almacenes de datos en grandes empresas
Son proyectos de gran tamao que requieren una enorme inversin
de tiempo y recursos.
*Almacenes de datos virtuales
Proporcionan vistas de bases de datos operacionales que se
materializan para un acceso eficiente.
Data marts (mercadillos de datos)
Tienen generalmente como objetivo un subconjunto de la
organizacin de la empresa (por ejemplo un departamento).

La tarea ms difcil y que ms tiempo consume en la
construccin de un DW es extraer, transformar y cargar
los datos en l.
Proceso de Extraccin,
Transformacin y Carga (ETL) de
datos en el DW

DW

Extraccin
y Limpiado
Transformacin
Fuentes de Datos
Bases de datos
Ficheros
Datos
Preprocesados
Data
Warehouse
OLAP
DSS
DM
Carga
Modelado de datos:
El modelo de datos Relacional
Ejemplo de Modelo Relacional Entidad-Relacin (ER) de una empresa
Modelo de datos para DW:
El modelo de datos Relacional (KO)
Situacin que se presenta para trabajar en anlisis de datos en el
modelo ER:
Legibilidad limitada.
Los usuarios finales no son capaces de entender el modelo ER
(normalmente no son informticos). Evidentemente, por tanto, no
pueden "navegar" por dicho modelo en busca de informacin.
Dificultad para las herramientas de consulta en el acceso a un
modelo ER general.
A menudo presentan prestaciones mediocres o inaceptables cuando
se trabaja en entornos de grandes volmenes de informacin
(problemas de optimizacin de consultas)
La utilizacin de la tcnica de modelado ER frustra la recuperacin de
informacin intuitiva y con alto rendimiento (caracterstica deseable
de un Data Warehouse).

Modelo de datos no apropiado para Almacenes de datos (DW)

Modelado de datos:
El modelo de datos multidimensional
Caractersticas del Modelo Dimensional (o
Multidimensional)
Un modelo dimensional est compuesto de:
Una tabla con una clave primaria compuesta, denominada tabla
de hechos y un conjunto de tablas ms pequeas denominadas
tablas de dimensiones.
Cada una de las tablas de dimensin tiene una clave primaria
que corresponde exactamente con uno de los componentes de la
clave compuesta de la tabla de hechos.
La tabla de hechos, debido a su clave primaria compuesta de dos
o ms claves ajenas, siempre expresa una relacin 'n' a 'n'. Las
tablas de hechos, adems de sus campos clave, contienen una o
ms medidas numricas o "hechos", que se "dan" para la
combinacin de las claves que definen cada registro.



Modelado de datos:
El modelo de datos multidimensional
Caractersticas del Modelo Dimensional (o Multidimensional)
Tiene estructura que asemeja una estrella (o un copo de nieve):
Una gran tabla central o tabla de hechos est conectada con un conjunto
de tablas (una por dimensin) dispuestas de manera radial alrededor de
esta tabla central. Recibe a menudo el nombre de "star join" o modelado
en estrella.
El modelado en estrella es altamente desnormalizado. Con ello se logra
minimizar el nmero de uniones y, por consiguiente, incrementar el
rendimiento de las consultas
Una variante del modelo en estrella es el modelo en copo de nieve o
snowflake. En este modelado se normalizan las dimensiones (ms de una
tabla por dimensin) creando as jerarquas en las mismas y conservando
lo esencial del modelo en estrella: las tablas de hechos

Permite el empleo de diferentes bases de datos:
Denominado ROLAP, cuando se aplica el modelo dimensional a una base
de datos relacional.
Denominado MOLAP, cuando se aplica el modelo dimensional sobre base
de datos dimensional.



Modelado de datos:
El modelo de datos multidimensional
Ejemplo de Modelo Dimensional (o Multidimensional)
Modelado de datos:
El modelo de datos multidimensional
Visualizacin del Modelo Dimensional mediante representacin en cubo
Modelado de datos:
El modelo de datos multidimensional
Las herramientas OLAP permiten navegar a travs de los datos
almacenados en un modelo de datos dimensional para
analizarlos dinmicamente desde una perspectiva
multidimensional, es decir, considerando unas variables en
relacin con otras y no de forma independiente entre s,
permitiendo enfocar el anlisis desde distintos puntos de vista
(por ejemplo se podra rotar el cubo de datos anterior para
mostrar las ventas por producto a modo de filas). Esta visin
multidimensional de los datos puede visualizarse como un
cubo de Rubik, que puede girarse para examinarlo desde
distintos puntos de vista, y del que se pueden seleccionar
distintas rodajas o cubos dependiendo de los aspectos de
inters para el anlisis.
Modelo de datos para DW:
El modelo de datos multidimensional
Situacin que se presenta para trabajar en anlisis de
los datos en el modelo Dimensional
El modelo de datos es intuitivo.
Es el mismo que manejan habitualmente los usuarios finales:
Ejecutivos, Directivos y Analistas.
Permite a las herramientas OLAP analizar los datos desde una
perspectiva multidimensional (una tabla de hechos puede
verse desde la perspectiva de varias tablas de dimensiones
tcnica denominada pivotacin o rotacin).
Permite crear fcilmente representaciones jerrquicas:
Exploracin ascendente (roll-up)
Desplaza la jerarqua hacia arriba agrupando en unidades mayores
(de grano ms grueso) a travs de una dimensin (por ejemplo,
resumiendo los datos semanales en trimestrales o anuales)
Exploracin descendente (drill-down)
Se da una visin ms concreta (de grano ms fino), por ejemplo,
disgregar las ventas por provincias en ciudades, y clasificar los
productos por tipos o categoras.
Modelo de datos para DW:
El modelo de datos multidimensional
Situacin que se presenta para trabajar en
anlisis de los datos en el modelo Dimensional
Las ampliaciones del modelo son sencillas y
transparentes para las aplicaciones y consultas que
ya trabajan con el modelo:
Aadir nuevos atributos a la tabla de hechos
Aadir nuevas tablas de dimensiones
Existe un nmero creciente de utilidades
administrativas y aplicaciones que gestionan y
utilizan los agregados (dependientes del modelo
dimensional).
Los agregados son resmenes de registros (redundantes
con la informacin ya existente en el DW) y son
empleados para mejorar el rendimiento de las consultas.
Pasos para el desarrollo de un DW
Identificar los requerimientos de usuario y delimitar el mbito del
proyecto.
Desarrollar el modelo de datos lgico del DW (modelo de datos
dimensional).
Implementar la arquitectura (seleccionar tecnologas, hardware y
software) que constituir la infraestructura del DW.
Implementar fsicamente el modelo lgico de datos crear la base
de datos.
Identificar las fuentes de datos -sistemas operacionales y/o
externos- del DW.
Describir los procesos de conversin necesarios para la
incorporacin de los datos origen al DW.
Pasos para el desarrollo de un DW
Documentar el metadata del DW.
Seleccionar y/o desarrollar los programas de extraccin, limpieza,
conversin e integracin de los datos fuente.
Cargar la base de datos del DW con los programas anteriores.
Verificar con el usuario final la calidad de los datos, disponibilidad y
rendimiento.
El siguiente paso debera ser reconstruir de forma incremental
(iteraciones), las entradas al sistema de procesamiento para
establecer un entorno bien definido que permita las cargas
automticas de datos, y a lo largo del tiempo, eliminar
completamente todas las aplicaciones viejas, desintegradas y con
problemas de mantenimiento.
Software en un Data Warehouse
Bases de datos usadas para data warehouse


PRODUCTO (EMPRESA DISTRIBUIDORA)
Adabas D (Software AG)
Advanced Pick (Pick Systems)
DB2 (IBM)
Fast-Count DBMS (MegaPlex Software)
HOPS (HOPS International)
Microsoft SQL Server (Microsoft)
Model 204 (Computer Corporation of America)
NonStop SQL (Tandem)
Nucleus Server (Sand Technology Systems)
OnLine Dynamic Server (Informix)
Extended Parallel Server (Informix)
OpenIngres (Computer Associates)
Oracle Server (Oracle)
Rdb (Oracle)
Red Brick Warehouse (Red Brick Systems)
SAS System (SAS)
Sybase IQ (Sybase)
Sybase SQL Server, SQL Server MPP (Sybase)
SymfoWARE (Fujitsu)
Teradata DBS (NCR)
THOR (Hitachi)
Time Machine (Data Management Technologies,
Inc.)
Titanium (Micro Data Base Systems, Inc.)
Unidata,Unidata (Inc.)
UniVerse (VMARK)
Vision (Innovative Systems Techniques, Inc.)
WX9000 (White Cross Systems, Inc.)
XDB Server (XDB Systems, Inc.)

Datos de Software obtenidos del manual para la construccin de un Data Warehouse
referenciado en la bibliografa.
Software en un Data Warehouse
Herramientas de consulta y reporte


PRODUCTO (EMPRESA DISTRIBUIDORA)
Access (Microsoft)
Access+ (Sonetics)
Actuate Reporting System (Actuate Software
Corporation)
AMIS Information Server (Hoskyns Group plc)
Application System (IBM)
Approach (Lotus Corporation)
ARPEGGIO (Wall Data Inc.)
APTuser (International Software Group)
AS/Access for Microsoft Access (Martin Spencer &
Associates)
ASK Joe (Information Management Services)
aXcess/400 (Glenbrook Software)
BrioQuery (Brio Technology)
Business Objects (Business Objects, Inc.)
Crystal Reports, Crystal Info (Seagate Software)
d.b. Express (Computer Concepts Corp.)
Databoard, Dataread (SLP Infoware)
DataDirect Explorer (Intersolv)
DataSite (NetScheme Solutions, Inc.)
DB Publisher (Xense Technology Inc.)
DbPower (Db-Tech Inc.)
Decision Analyzer (Decisin Technology)
DECquery, DECdecision (Touch Technologies, Inc.)
Discoverer, Discoverer/2000 (Oracle Corporation)
DS Server, DS Modeler (Interweave)
EasyReporter (Speedware Corporation)
Eclipse Query/Report (Cornut Informatique)
ELF (ELF Software)
English Wizard (English Wizard)
EnQuiry (Progress Software)
Esperant (Speedware)
FOCUS Six (Information Builders, Inc.)
4S-Report (Four Seasons Software, Inc)
Freequery (Dimension Software Systems)
Front & Center for Reporting, Nomad (Thomson
Software Products)
GQL (Andyne)
HarborLight (Harbor Software)
HP Information Access (Hewlett-Packard)
Impress, SqlBuddy (Objective Technologies, Inc.)
Impromptu (Cognos Corporation)
InfoAssistant (Asymetrix)
InfoMaker (Powersoft Corporation)
InfoQuery (Platinum Technology, Inc.)
InfoReports (Platinum Technology, Inc.)
InformEnt Warehouse Desktop (Fiserv)
Internet DataSpot (DTL Data Technologies Ltd.)
inSight (Williams & Partner)
Interactive Query (New Generation software)
IQ/Objects, IQ/SmartServer (IQ Software Corporation)
Iridon Panorama (The Great Elk Company Limited)
Kinetix (Hilco Technologies)
LANSA/Client (LANSA USA)
MARKIS/400 (AS Software)
Nirvana (Synergy Technologies)
OR-REPORTER II (Output Reporting, Inc.)
Oracle Reports, Browser (Oracle Corporation)
Paradox (Borland)
Platinum Report Facility (Platinum Technology, Inc)
ProBit (System Builder)
Productivity Series Reports (michaels, ross & cole)
QBE Vision (Sysdeco)
QMF (IBM)
QueryObject (Cross/Z International, Inc.)
Quest (Centura Software Corporation)
R&R Report Writer (Concentric Data Systems)
Report Writer (Raima)
Reportoire (Synergistic Systems, Inc.)
Reports (Nine to Five software Co.)
ReporTool (Zen Software)
ReportSmith (Borland)
Rocket Shuttle (Rocket Software, Inc.)
Safari ReportWriter (Interactive Software Systems)
Sagent Data Mart Solution (Sagent Technology, Inc.)
SAS System (SAS Institute)
Second Wind (Anju Technologies)
Select! (Attachmate)
SEQUEL (Advanced Systems Concepts)
Snow Report Writer (Snow International Corporation)
Spectrum Writer (Pacific Systems Group)
SQLPRO Agent (Beacon Ware, Inc.)
SQR Workbench (MITI)
Strategy (ShowCase Corporation)
The Reporter (Sea Change Systems, Inc)
Unique XTRA (Unique AS)
URSA InfoSuite (Decision Support Inc.)
ViewPoint (Informix)
Viper (Brann Software)
VisPro/Reports (Hock Ware)
Visual Cyberquery (Cyberscience Corporation)
Visual Dbase (Borland)
Visual Express (Computer Associates International)
Visual FoxPro (Microsoft Corporation)
Visual Net (CNet Svenska AB)
Visualizer Query, Charts (IBM)
Voyant (Brossco Systems)
WebBiz (Cybercom Partners)
WebSeQueL (InfoSpace Inc.)
WinQL (Data Access Corporation)
Xentis (GrayMatter Software Corporation)
Software en un Data Warehouse
Herramientas de base de datos multidimensional/olap


PRODUCTO, EMPRESA DISTRIBUIDORA, TIPO
Acuity ES, Acuity Management Systems Ltd., MDDB
Acumate ES, Kenan Systems Corporation, MDDB
Advance For Windows, Lighten, Inc., MDDB
AMIS OLAP Server, Hoskyns Group plc, MDDB
BrioQuery, Brio Technology, MDDB
Business Objects, Business Objects, Inc., Relacional
Commander OLAP, Decision, Prism, Comshare Inc., MDDB
Control, KCI Computing, Relacional
CrossTarget, Dimensional Insight, MDDB
Cube-It, FICS Group, MDDB
Dataman, SLP Infoware, MDDB
DataTracker, Silvon Software, Inc., Relacional
DecisionSuite, Information Advantage, Inc., Relacional
Delta Solutions, MIS AG, MDDB
Demon for Windows, Data Command Limited, MDDB
DSS Agent, MicroStrategy, Relacional
DynamicCube.OCX, Data Dynamics, Ltd., Relacional
EKS/Empower, Metapraxis, Inc., MDDB
Essbase Analysis Server, Arbor Software Corporation, MDDB
Essbase/400, ShowCase Corporation, MDDB
Express Server, Objects, Oracle, MDDB
Fiscal, Lingo Computer Design, Inc., Relacional
Fusion, Information Builders, Inc., MDDB
FYI Planner, Think Systems, MDDB
Gentia, Planning Sciences, MDDB
Helm, Codeworks, MDDB
Holos, Holistic Systems, MDDB
Hyperion OLAP, Hyperion Software, MDDB
InfoBeacon, Platinum technology, Inc., Relacional
Informer, Reportech, MDDB/Relacional
Intelligent Decision Server, IBM, Relacional
IQ/Vision, IQ Software Corporation, Relacional
Khalix, Longview Solutions, Inc., Relacional
Lightship, Pilot Software, Inc., MDDB
Matryx, Stone, Timber, River, MDDB
MDDB Server, SAS, Relacional
Media, Speedware Corporation, MDDB
Metacube, Informix, Relacional
MIKSolution, MIK, MDDB
MIT/400, SAMAC, Inc, MDDB
MSM, Micronetics Design Corporation, MDDB
Muse, OCCAM Research Corp., MDDB
OLAP Office, Graphitti Software GmbH, MDDB
OpenOLAP, Inphase Software Limited, Relacional
Pablo, Andyne, MDDB/Relacional
MDDB: Multidimensional Data Base.
Software en un Data Warehouse
Sistemas de informacin ejecutivos


PRODUCTO, EMPRESA DISTRIBUIDORA, TIPO
Acuity/ES, Acuity Management Systems Limited, 1
Applixware, Applix, 1
BusinessMetrics, Valstar Systems Ltd., 1
BOARD, Pragma Inform, 1
COINS, Russell Consulting Limited, 1
ColumbusEIS, Jitcons YO, 1
Commander EIS, Comshare Inc., 1
Corporate Management/ Financial Executive Information System,
Strategic Information Associates, Inc., 1
CorVu, CorVu Pty Ltd., 1
Decision Suite, Softkit, 1
Discovery EIS, Atlantic Information Systems Ltd., 1
EIS, Inphase Software Limited, 1
Electronic Balanced Scorecard, ASI Financial Services, 1
Enterprise Periscope, Everyware Development Corp., 1
Eureka, European Management Systems, 1
ExecuSense, TLG Corporation, 1
FOCUS EIS, Information Builders, Inc., 1
Forest & Trees, Platinum Technologies, Inc., 1
iMonitor, BayStone Software, 1
InfoManager, Ferguson Information Systems, 1
Iridon Almanac, The Great Elk Company Limited, 1
InSight, Arcplan Information Services, 2
LEADER, Sterling Strategic Solutions, 1
MagnaFORUM, Forum Systems, Inc., 1
Merit, GIST, s.r.o., 1
Open EIS Pak, Microsoft, 1
Panorama Business Views, Panorama Business Views Inc., 1
Perspectives, Syntell, 1
Qbit, Zenia Software, Inc., 1
Reveal, CSD Software Inc., 1
SAS System, SAS Institute, 1
Show Business EIS, Show Business Software, 1
Tiler EIS++, Avoca Systems Limited, 1
Track, Track Business Solutions, 1
Traffic Control EIS, Research & Planning, Inc., 3
VentoMap, VentoSales, Vento Software Inc., 1
Virtual Headquarters Management System, vHQ LLC, 1
Visual EIS, Synergistic Software, 1
Visual Publisher, KMA Associates International, Inc, 1
VITAL, Braintec Corporation, 1
Wingz, Investment Intelligence Systems Group, 1
Wired for OLAP, AppSource Corporation, 1
Xecutive Pulse EIS, Megatrend Systems, Ltd., 1

TIPO
1.- Proporciona un sistema de informacin ejecutivo con capacidades analticas.
2.- Proporciona un sistema de informacin ejecutivo con capacidades analticas para usuarios SAP R/3.
3.- Proporciona un sistema de informacin ejecutivo con capacidades analticas para usuarios SAP R/2 y R/3.
Data Mining (DM)
Minera de datos
Introduccin
La idea clave es que los datos contienen ms
informacin oculta de la que se ve a simple vista.
KDD (Knowlegde Discovery in Databases):
descubrimiento de conocimiento en bases de datos
KDD = proceso completo:
extraccin no trivial de conocimiento implcito, previamente
desconocido y potencialmente til, a partir de una base de
datos
[Frawley et al., 1991]
DM = etapa de descubrimiento en el proceso de KDD:
paso consistente en el uso de algoritmos concretos que
generan una enumeracin de patrones a partir de los datos
preprocesados
[Fayyad et al., 1996]
Data Mining (DM)
Minera de datos
Aplicaciones
Informtica:
Soporte al Diseo de Bases de Datos.
Reverse Engineering (nomalizar bases de datos desnormalizadas).
Mejora de Calidad de Datos.
Mejora de Consultas (si se descubren dependencias funcionales)
Comercio/Marketing:
Identificar patrones de compra de los clientes.
Buscar asociaciones entre clientes y caractersticas demogrficas.
Predecir respuesta a campaas de marketing.
Anlisis de cestas de la compra.
Banca:
Detectar patrones de uso fraudulento de tarjetas de crdito.
Identificar clientes leales.
Predecir clientes con probabilidad de cambiar su afiliacin.
Determinar gasto en tarjeta de crdito por grupos.
Encontrar correlaciones entre indicadores financieros.
Identificar reglas de mercado de valores a partir de histricos.
Data Mining (DM)
Minera de datos
Aplicaciones
Seguros y Salud Privada:
Anlisis de procedimientos mdicos solicitados conjuntamente.
Predecir qu clientes compran nuevas plizas.
Identificar patrones de comportamiento para clientes con riesgo.
Identificar comportamiento fraudulento.
Transportes:
Determinar la planificacin de la distribucin entre tiendas.
Analizar patrones de carga.
Medicina:
Identificacin de terapias mdicas satisfactorias para diferentes enfermedades.
Asociacin de sntomas y clasificacin diferencial de patologas.
Estudio de factores (genticos, precedentes, hbitos, alimenticios, etc.) de
riesgo/salud en distintas patologas.
Segmentacin de pacientes para una atencin ms inteligente segn su grupo.
Predicciones temporales de los centros asistenciales para el mejor uso de
recursos, consultas, salas y habitaciones.
Estudios epidemiolgicos, anlisis de rendimientos de campaas de
informacin, prevencin, sustitucin de frmacos, etc.
Conclusiones
El aumento espectacular del volumen de datos en las empresas y
su falta de integracin crean la necesidad de una infraestructura
para la logstica de la informacin. Este es el principio u origen del
Data Warehouse.
No existe una nica definicin (ni traduccin) de Data Warehouse.
El DW es un conjunto de tecnologas, no un producto.
GRAN BASE DE DATOS.
Herramientas para manipular los datos.
Basado en el modelo de datos dimensional.
La construccin de un DW es un proceso ITERATIVO.
Un DW engloba las tecnologas que sirven de soporte al Business
Intelligence.
Es parte componente de un Sistema de Informacin de Gestin.

Conclusiones
Un administrador de Data Warehouse tiene
que:
Ser primero un excelente Administrador de Bases de
Datos.
Tener amplios conocimientos en Fundamentos de
Bases de Datos, Gestin, Planificacin e Informtica
en general.
Tener una extensa experiencia de trabajo con
diferentes sistemas de bases de datos.


Bibliografa
Bsica
Ttulo: Fundamentos de sistemas de bases de datos (3 edicin) - Captulo 26
Autor(es): Elmasri, Ramez & Navathe, Shamkant
Editorial: Addison Wesley

Data Warehouse
http://www.ica.com.uy/dw/dw-doc.htm#Sistemas de Data Warehousing
http://www.tid.es/presencia/publicaciones/comsid/esp/22/08.pdf
(caso concreto de telefnica)
Manual para la construccin de un Data Warehouse
http://www.inei.gob.pe/cpi-mapa/bancopub/libfree/lib619/INDEX.HTM
http://kybele.escet.urjc.es/adto/

Minera de datos:
http://www.daedalus.es/Web.php?pag=040000
http://www.gsi.dit.upm.es/~gfer/ssii/aprendizaje/MD.pdf
http://www.tid.es/presencia/publicaciones/comsid/esp/22/09.pdf
(caso concreto de telefnica)

Business Intelligence
http://www.bitam.com/DefBI.htm
http://www.aliga.org/JORNADAS_DW_V2.PPT

You might also like