You are on page 1of 31

Anlisis de Algoritmos

Unidad 3: Minera de Datos Introduccin

Temario

Qu es minera de datos?
Quin usa minera de datos?
Por qu de la minera de datos?
Ciclo virtuoso de la minera de datos
Resumen de principales tcnicas de
minera de datos

Definicin de minera de datos


Minera de datos es la exploracin y
anlisis de grandes cantidades de
datos con el objeto de encontrar
patrones y reglas significativas
(conocimiento)

Metas de la minera de datos


Permitir a una organizacin MEJORAR
_____ a travs de un mejor
CONOCIMIENTO de _______
Mejorar la ventaja competitiva

La minera de datos es un campo


multidisciplinario
Inteligencia
Artificial
(Machine
Learning)

Bases de
Datos
(VLDB)

Graficacin y
visualizacin

Estadstica

Minera de datos

Ciencias de
la informacin

Otras
disciplinas

La minera de datos es un subconjunto


de la inteligencia de negocios

Minera de datos
Proceso de utilizar datos crudos para inferir
importantes relaciones entre ellos
Coleccin de tcnicas poderosas para
analizar grandes volmenes de datos
No existe un solo enfoque para minera de
datos sino un conjunto de tcnicas que se
pueden utilizar de manera independiente o
en combinacin
Existe una relacin con la estadstica,
aunque frecuentemente se separan las
tcnicas que no estn basadas en mtodos
estadsticos

Tipos de aplicaciones de la minera


de datos
Aplicaciones o problemas de minera
de datos pueden clasificarse en las
siguientes categoras
Clasificacin
Estimacin
Pronstico
Asociacin
Agrupacin o segmentacin

Clasificacin
Examinar las caractersticas de un
nuevo objeto y asignarle una clase o
categora de acuerdo a un conjunto de
tales objetos previamente definido
Ejemplos:
Clasificar aplicaciones a crdito como bajo,
medio y alto riesgo
Detectar reclamos fraudulentos de seguros

Estimacin
Relacionado con clasificacin
Mientras clasificacin asigna un valor
discreto, estimacin produce un valor
continuo

Ejemplos:
Estimar el precio de una vivienda
Estimar el ingreso total de una familia

Pronstico
Predecir un valor futuro con base a
valores pasados
Ejemplos:
Predecir cunto efectivo requerir un
cajero automtico en un fin de semana

Asociacin
Determinar cosas u objetos que van
juntos
Ejemplo:
Determinar que productos se adquieren
conjuntamente en un supermercado

Agrupacin o segmentacin
Dividir una poblacin en un nmero de
grupos ms homogneos
No depende de clases pre-definidas a
diferencia de clasificacin
Ejemplo:
Dividir la base de clientes de acuerdo con
los hbitos de consumo

Usos de la minera de datos


Administracin de la relacin con los
clientes:
Identificar nuevos clientes potenciales para
aumentar ventas
Ampliar la base de cliente con la mnima
inversin por parte de la empresa
Retener clientes existentes evitando que
se vayan a la competencia (attrition)
Vender ms a clientes existentes (ventas
cruzadas)

Usos de la minera de datos


Deteccin de fraudes en el uso de
tarjetas de crdito
Determinar patrones que puedan estar
relacionados con lavado de dinero
Determinar el precio de una casa con
base en sus caractersticas y el precio
de otras casas vendidas

Ejercicio en grupos
Equipos: 3 personas mximo
Objetivos:
Identificar situaciones concretas para
utilizar la minera de datos (10 minutos)
Reportar a la clase verbalmente (3
minutos)
Las situaciones identificadas
Tipo de aplicacin o problema de minera de
datos relacionado
Los beneficios esperados de aplicar la minera
de datos

Usos de la minera de datos


Usos de la minera de datos se han
ampliado con el comercio electrnico

Recomendaciones

Disponibilidad de datos de
transacciones

Por qu de la minera de datos?


Datos se encuentran disponibles
Poder computacional es cada vez
menos costoso
Las presiones competitivas son
enormes
Software para minera de datos se
encuentra disponible

Ciclo virtuoso de la minera de datos

Principales tcnicas de minera de


datos

Anlisis de canasta de supermercado


K vecinos ms cercanos
Deteccin de grupos
Anlisis de encadenamiento
rboles de decisin
Redes neuronales artificiales
Algoritmos genticos

Resumen tcnicas de minera de


datos
Anlisis de canasta de supermercado
Agrupar objetos que aparecen juntos
Ejemplos:
Paales y cervezas

Resumen tcnicas de minera de


datos
K vecinos ms cercanos
Determinar los K vecinos ms cercanos en
instancias conocidos con el objeto de
clasificar o hacer una prediccin sobre una
instancia desconocida
Ejemplo: Dado un reclamo para un seguro
determinar basado en reclamos similares
(vecinos) si se debe pagar o investigar

Resumen tcnicas de minera de


datos
Deteccin de grupos
Encontrar objetos similares entre s
Ejemplos: tipificar clases de clientes

Resumen tcnicas de minera de


datos
Anlisis de encadenamiento
Encuentra relaciones entre objetos de
acuerdo con patrones
Relacionado con la teora de grafos
Ejemplos:
Relaciones entre individuos basados en
llamadas telefnicas
Relaciones entre casos criminales de acuerdo
con sus caractersticas

Resumen tcnicas de minera de


datos
rboles de decisin
Dividir objetos en grupos asociando reglas
para la asignacin de los objetos en su
correspondiente grupo
Ejemplos: determinar el sexo o grupo de
edad de una persona en funcin a una
serie de preguntas contestadas

Resumen tcnicas de minera de


datos
Redes neuronales artificiales
Ms comn de las tcnicas y para algunos
sinnimo de minera de datos
Modelos simples de interconexiones
neuronales en el cerebro que aprenden de
un conjunto de adiestramiento y
generalizan patrones dentro de l con el
objeto de clasificar, estimar o predecir
Ejemplo: estimar el valor de una casa
tomando en cuenta el precio pagado por
casas similares

Resumen tcnicas de minera de


datos
Algoritmos genticos
Aplican la mecnica de la gentica y la
seleccin natural para encontrar un
conjunto de parmetros ptimos para una
funcin predictiva
Utilizados para entrenar redes neuronales
artificiales

Resumen tcnicas de minera de


datos
Tcnicas mencionadas pueden utilizarse en
varias aplicaciones o problemas de minera
de datos
Ejemplo: rboles de decisin sirven para detectar
grupos, clasificar y predecir

Varias tcnicas pueden ser utilizadas en una


misma aplicacin o problema de minera de
datos
Ejemplo: K vecinos ms prximos, rboles de
decisin y redes neuronales artificiales pueden
utilizarse para clasificacin

Anlisis de Algoritmos
Unidad 3: Minera de Datos Introduccin

You might also like