You are on page 1of 21

ARBOLES DE

DECISIÓN
Andres Felipe Corrales
Juan Pablo Lugo Ramos
Santiago Akira Inoue
Sebastian Bello
Minería de Datos
Paquetes informáticos en los cuales
se analizan grandes volúmenes de
información cuidadosamente para
tomar la mejor decisión.
Predecir una variable o
comportamiento
Procedimiento

Identificación del Problema Exploración y preparación de la Data


• Se identifican los objetivos del • Se estudia la data disponible
estudio, focalizándose en el • Aplicación de estadísticos
problema
• Determinación de calidad
• Se transforma (limpia)
Procedimiento

Modelamiento Evaluación
• Selecciona y aplica distintos • Se evalúan los modelos verificando
modelos sobre la data si se cumplieron los objetivos
• Por lo general, hay que volver a la • Ya se puede identificar si la DM es
etapa anterior, para perfeccionar la la necesaria para la toma de
entrada desiciones
Implementación
• Los resultados son exportados a
reportes o a otra base de datos
• Se pueden utilizar distintos
Algoritmos para obtener mejores
resultados
Algoritmos

Algoritmos de Clasificación Algoritmos de Regresión


• Predecir una o mas variables • Similar A. de clasificación
discretas basándose en distintos • Cambia el tipo de variable
atributos de la data dependiente
• Se predice una variable continua
Algoritmos

Algoritmo de Segmentación Algoritmo de Asociación


• Se agrupa la data en grupos o • Son algoritmos que suelen suceder
clústas con características juntos, es decir, tienen
similares correlaciones o asociaciones en la
data
Algoritmo de Secuencia

Se encuentran secuencias
típicas de sucesos de datos
Patrones sobre una lista de
objetos (IMPORTANTE EL
ORDEN)
ARBOLES DE DECISIÓN
Árbol de decisión
• Técnica predictiva de clasificación
• Consiste en una división jerárquica y secuencial del problema en el cual cada
una de estas divisiones o nodos describen gráficamente las decisiones
posibles y por lo tanto los resultados
Algoritmos

A. ID3 A. C4.5 A. C5.0


• Construye un • Mas avanzado que el ID3 • Eficiencia en el tiempo
árbol de • Ayuda a afinar la información de construcción del uso
decisión desde faltante de memoria y la
un set fijo de • Desglosa la información obtención de arboles
hasta llegar a lo mas
ejemplos importante mas pequeños que los
• Código binario • Crea ramas vacías anteriores con la misma
(SI/NO) (irrelevantes) cantiad productiva
Redes Neuronales

Red de unidades interconectadas


Cada una recibe un numero de
valor de entrada, los procesa y
produce un valor único de salida
Aprende de la experiencia y es muy
organizado
Aplicación finanzas
Dada la gran cantidad de información
generada por los mercados financieros, se
empezó a aplicar la minería de datos dada su
aplicación para manejar las complejas
relaciones no lineales existente entre:
─ Las variables
─ La estacionalidad
─ Presencia de quiebres estructurales
Predicción del mercado
accionario

Limitadas a la captura de relaciones


lineales entre las variables
seleccionadas
Las R.N son capaces de encontrar
la relación entre la variable
dependiente e independiente (aun
si son complejas)
Detección de fraudes

─ Detección de patrones inusuales en grandes


volúmenes de información y en una
limitada cantidad de tiempo
─ La información legitima es mayor que la
fraudulenta y la útil es muy poca
─ Análisis de outliers
─ Redes Neuronales, Modelos de regresión,
Fuzzy Logic y sistemas experto en conjunto
Predicción de mercados de
divisas

─ Uno de los mercados mas líquidos


─ Buffer (regulador de términos de intercambio entre
las economías)
─ Volatility clusters: Tendencia a periodos persistentes
de alta o baja volatilidad de tiempo
1. Combinación entre bosque aleatorios y arboles de
regresión junto a modelos econométricos GARCH
2. Text mining: Captura s noticias del día y las evalúa
prediciendo el movimiento intra-pariedad
Administración de portafolio

─ Maximizar el retorno y
minimizar el riesgo de una
cartera
─ Modelos de valoración de
activos como el CAMP o APT
(optimización del portafolio)
METODOLOGIA

1. Comprensión del negocio


2. Planteamiento del problema
3. Recolección y Comprensión de la
data
4. Preparación de la data
5. Modelamiento
6. Evaluación
MATRIZ DE
CORRELACIONES DE
VARIABLES

Finalmente, el siguiente cuadro de


correlaciones sobre las variables
continuas busca ilustrar el sentido y la
magnitud de las relaciones en la data en
uso.
Dada por las probabilidades en cada
una de ellas.
SEGMENTACION DE ESCENARIOS
Son los cambios en la tendencia de este índice entre dos escenarios de crisis las que
delimitan el largo de los escenarios
BIBLIOGRAFÍA
• “APLICACIÓN DE ÁRBOLES DE DECISIÓN PARA LA ESTIMACIÓN DEL
ESCENARIO ECONÓMICO Y LA ESTIMACIÓN DE MOVIMIENTO LA TASA DE
INTERÉS EN CHILE” (Carlos Dupouy Berrios, 2014)

You might also like