You are on page 1of 31

Inteligencia de Negocios

Por Jos Luis Mart


USM

Problema Inicial

Cules fueron los volmenes de venta, por regin y por categora de


producto, en el ltimo ao?.
Qu tipos de rdenes se debieran favorecer para maximizar las
ganancias?.
Un 10% de descuento, incrementar el volumen de ventas de forma
satisfactoria?.

Solucin

Solucin

Dashboard

Inteligencia de Negocios
Alternativa

tecnolgica para manejar la


informacin requerida por una organizacin para
apoyar la toma de decisiones estratgica.
Comprende desde la extraccin de los datos de
los sistemas existentes hasta la explotacin de la
informacin por herramientas de anlisis de datos.

Inteligencia de Negocios
BDs Operacional

BD de ERP

Fuentes
Internas
Archivos
Planos

Herramientas de
consultas e
informes

Respaldos

Herramientas
EIS y DSS

ETL

DW

Interfaz y
Operadores
Herramientas
OLAP

Fuente de
Datos 1
texto

Fuente de
Datos 3

Herramientas de
Minera de Datos

HTML

Fuente de
Datos

Fuentes
Externas

Inteligencia de Negocios

Primera Parte: Proceso ETL

BDs Operacional

BD de ERP

Fuentes
Internas
Archivos
Planos

Herramientas de
consultas e
informes

Respaldos

Herramientas
EIS y DSS

ETL

DW

Interfaz y
Operadores
Herramientas
OLAP

Fuente de
Datos 1
texto

Fuente de
Datos 3

Herramientas de
Minera de Datos

HTML

Fuente de
Datos

Fuentes
Externas

Primera Parte: Proceso ETL


El encargado del mantenimiento del almacn de
datos es el sistema ETL (Extraccin Transformacin Carga):
La construccin del sistema ETL es responsabilidad del
equipo de desarrollo del DW.
El sistema ETL es construido especficamente para cada
DW, aproximadamente, 50% del esfuerzo.
En la construccin del ETL se pueden utilizar herramientas del mercado o programas diseados especficamente.

Primera Parte: Proceso ETL


Extraccin: antes de llevarla a cabo, hay que identificar los cambios, al determinar los datos
operacionales (relevantes) que han sufrido una
modificacin desde el ltimo refresh.
C a r a c t e r s t ic a
s

N iv e l
E s t r a t g ic o

N iv e l T c t ic o

N iv e l
O p e r a c io n a l

D e c is i n q u e
apoya

P la n ific a c i n
L a r g o P la z o

C o n tr o l G e r e n c ia l

C o n tr o l
O p e r a c io n a l

T ip o d e D e c is i n

N o E s tr u c tu r a d a

E s tr u c tu r a d a

M o d e lo m s u s a d o

P r e d ic tiv o

Sem i
E s tr u c t u r a d a
D e s c r ip tiv o

M e d io A m b ie n te
R a z o n a b le
R e s u m id a
A S o lic itu d
Aos
P r e d ic c i n

R e g is tr o s In te r n o s
Buena
D e ta lla d a
P e r i d ic a
Aos
C o n tr o l

O p e r a c i n In t e r n a
E x a c ta
M u y D e t a lla d a
T ie m p o R e a l
M eses
A c c i n D ia ria

C a r a c te r s tic a s d e
la I n fo r m a c i n :
 F u e n te
 E x a c titu d
 A m p litu d
 F r e c u e n c ia
 R ango de
T ie m p o
 U so

N o r m a tiv o

Primera Parte: Proceso ETL


Transformacin:
Unificar estndares: unidades de medida, unidades de tiempo,
moneda,...
cm
cm
inches
DD/MM/YY
DD-Mon-YY
MM/DD/YY
1,000 GBP
USD 600
FF 9,990

Primera Parte: Proceso ETL


Carga (transporte):
Consiste en mover los datos desde las fuentes
operacionales o el almacenamiento intermedio hasta el
DW y cargar los datos en las correspondientes
estructuras de datos.
La carga puede consumir mucho tiempo.

Base de datos
operacional

T1

T2

T3

Segunda Parte: Data Warehouse


(Almacn de Datos)
BDs Operacional

BD de ERP

Fuentes
Internas
Archivos
Planos

Herramientas de
consultas e
informes

Respaldos

Herramientas
EIS y DSS

ETL

DW

Interfaz y
Operadores
Herramientas
OLAP

Fuente de
Datos 1
texto

Fuente de
Datos 3

Herramientas de
Minera de Datos

HTML

Fuente de
Datos

Fuentes
Externas

Segunda Parte: Data Warehouse


(Almacn de Datos)
Data Warehouse: coleccin de datos orientada a
temas especficos, integrada, no voltil y variante
en el tiempo, organizada para apoyar las
necesidades de la gestin
Data Mart: corresponde a un pequeo data
warehouse, especfico a un rea de negocio o
departamento de la empresa.

Segunda Parte: Data Warehouse


(Almacn de Datos)
Su estructura se puede visualizar como un cubo...

Tercera Parte: Anlisis de Datos

BDs Operacional

BD de ERP

Fuentes
Internas
Archivos
Planos

Herramientas de
consultas e
informes

Respaldos

Herramientas
EIS y DSS

ETL

DW

Interfaz y
Operadores
Herramientas
OLAP

Fuente de
Datos 1
texto

Fuente de
Datos 3

Herramientas de
Minera de Datos

HTML

Fuente de
Datos

Fuentes
Externas

Tercera Parte: Anlisis de Datos


Consultas y Reportes
Corresponde a un anlisis dirigido por el analista, y
requiere tanto un conocimiento acabado de los datos como
un trabajo excesivo sobre stos por parte de dicho analista.
Este anlisis considera la definicin de las consultas, el
acceso y recuperacin de datos, la manipulacin de
clculos, y la preparacin y entrega de los reportes.

Tercera Parte: Anlisis de Datos


Anlisis Multidimensional (OLAP)
Anlisis asistido por el analista,
consiste en un estudio basado
en las tablas presentes en un
data warehouse.
Se
definen
operaciones
especiales para el manejo de
los datos de un cubo:
Drill-down: obtencin de mayor
detalle de los datos, bajando por
alguna dimensin.
Roll-up: operacin inversa a la
anterior, para tener datos ms
agregados.

Tercera Parte: Anlisis de Datos


Anlisis Multidimensional (OLAP)

Tercera Parte: Anlisis de Datos


Minera de Datos
Anlisis dirigido por lo datos, permite moverse a travs de
los almacenes de datos para encontrar las tendencias,
patrones y correlaciones que pueden guiar la toma de
decisiones estratgicas.
OLAP (Agregacin)
Cul es la tasa promedio de accidentes entre
fumadores y no fumadores?
Cul es la cuenta telefnica promedio de mis
clientes v/s la de quienes que han cancelado el
servicio?
Cul es el monto de la compra diaria promedio entre
tarjetas de crdito robadas y aqullas usadas por sus
dueos?

Data Mining (Influencias)


Cules son los mejores predictores de
accidentes?
Qu atributos estn asociados con los
clientes que estn cerca de cerrar sus
servicios?
Qu patrones de compra estn asociados
con fraudes de crdito?

Tercera Parte: Anlisis de Datos


Minera de Datos: un Breve Ejemplo
Ejemplo Prctico con Clementine (SPSS): Ensayo de
Medicamentos (http://www.pcc.qub.ac.uk/tec/courses/datamining/ohp/dm-OHP-final_3.html)
Un nmero de pacientes hospitalarios que sufren todos
la misma enfermedad se tratan con un abanico de
medicamentos.
Cinco medicamentos diferentes estn disponibles y los
pacientes han respondido de manera distinta a los
diferentes medicamentos.
Problema: qu medicamento es apropiado para un
nuevo paciente.

Tercera Parte: Anlisis de Datos


Minera de Datos: un Breve Ejemplo
Primer Paso: ACCEDIENDO LOS DATOS
Se leen los datos, por ejemplo de un archivo con
delimitadores.
Se nombran los campos
age
sex
BP
Cholesterol
Na
K
drug

edad
sexo
presin sangunea (High, Normal, Low)
colesterol (Normal, High)
concentracin de sodio en la sangre.
concentracin de potasio en la sangre.
medicamento al cual el paciente respondi
satisfactoriamente.

Se pueden combinar los datos; por ejemplo aadiendo un


nuevo atributo llamado Na/K.

Tercera Parte: Anlisis de Datos


Minera de Datos: Tcnica de Patrones Secuenciales
Se trata de establecer asociaciones del estilo: si compra
X en T comprar Y en T+P?

Ejemplo:

Tercera Parte: Anlisis de Datos


Minera de Datos: Tcnica de Patrones Secuenciales

Tercera Parte: Anlisis de Datos


Minera de Datos: Tcnica de Clasificacin
a) rboles de Clasificacin: estructura similar a un
diagrama de flujo, donde cada nodo interno denota una
condicin sobre un atributo, cada enlace representa una
salida de la misma, y cada nodo hoja representa las clases.

b) Extraccin de Reglas.

Tercera Parte: Anlisis de Datos


Minera de Datos: Tcnica de Regresin Lineal
Prediccin: mediante regresin lineal, los datos son
modelados usando una recta.
que considera conceptos como variable de respuesta,
variable predictora, coeficientes de regresin, mtodo de
mnimos cuadrados.

Aplicaciones
rea: Gobierno y Seguridad Nacional.
A principios del mes de julio de 2002, el director del Federal Bureau of
Investigation (FBI), John Aschcroft, anunci que el Departamento de Justicia
comenz a introducirse en la vasta cantidad de datos comerciales referentes a
los hbitos y preferencias de compra de los consumidores, con el fin de
descubrir potenciales terroristas antes de que ejecuten una accin. Algunos
expertos aseguran que, con esta informacin, el FBI unir todas las bases de
datos probablemente mediante el nmero de la Seguridad Social y permitir
saber si una persona fuma, qu talla y tipo de ropa usa, su registro de
arrestos, su salario, las revistas a las que est suscrito, su altura y peso, sus
contribuciones a la Iglesia, grupos polticos u organizaciones no
gubernamentales, sus enfermedades crnicas (como diabetes o asma), los
libros que lee, los productos de supermercado que compra, si tom clases de
vuelo o si tiene cuentas de banco abiertas, entre otros. La inversin inicial
ronda los setenta millones de dlares estadounidenses para consolidar los
almacenes de datos, desarrollar redes de seguridad para compartir
informacin e implementar nuevo software analtico y de visualizacin.

Aplicaciones
rea: Investigacin Espacial.
Durante seis aos, el Second Palomar Observatory Sky Survey (POSS-II)
coleccion tres terabytes de imgenes que contenan aproximadamente dos
millones de objetos en el cielo. Tres mil fotografas fueron digitalizadas a una
resolucin de 16 bits por pxel con 23.040 x 23.040 pxeles por imagen. El
objetivo era formar un catlogo de todos esos objetos. El sistema Sky Image
Cataloguing and Analysis Tool (SKYCAT) se basa en tcnicas de agrupacin
(clustering) y rboles de decisin para poder clasificar los objetos en estrellas,
planetas, sistemas, galaxias, etc. con una alta confiabilidad (Fayyad y otros,
1996). Los resultados han ayudado a los astrnomos a descubrir diecisis
nuevos qusars. Estos qusars son difciles de encontrar y permiten saber ms
acerca de los orgenes del universo.

Aplicaciones
rea: Club Deportivo.
En el 2003, el AC de Miln comenz a usar redes neuronales (otra tcnica de
clasificacin) para prevenir lesiones y optimizar el acondicionamiento de cada
atleta. Esto ayudar a seleccionar el fichaje de un posible jugador o a alertar
al mdico del equipo de una posible lesin. El sistema, creado por Computer
Associates International, es alimentado por datos de cada jugador,
relacionados con su rendimiento, alimentacin y respuesta a estmulos
externos, que se obtienen y analizan cada quince das. El jugador lleva a cabo
determinadas actividades que son monitoreadas por veinticuatro sensores
conectados al cuerpo y que transmiten seales de radio que posteriormente
son almacenadas en una base de datos. Actualmente el sistema dispone de
5.000 casos registrados que permiten predecir alguna posible lesin. Con ello,
el club intenta ahorrar dinero evitando comprar jugadores que presenten una
alta probabilidad de lesin, lo que hara incluso renegociar su contrato. Por
otra parte, el sistema pretende encontrar las diferencias entre las lesiones de
atletas de ambos sexos, as como saber si una determinada lesin se relaciona
con el estilo de juego de un pas concreto donde se practica el ftbol.

Fuente: www.olapreport.com

Anlisis del Mercado

Fuente: www.olapreport.com

Anlisis del Mercado

You might also like