You are on page 1of 15

Introduccin a la Minera de

Datos

ndice

Introduccin
Contexto
Definicin
Comentarios
Bibliografa

Introduccin
Cada vez ms cantidad de datos es almacenada.
El desarrollo tecnolgico permiten computar, almacenar
y transmitir datos.
Algunos factores que han permitido este avance son:

Abaratamiento de los sistemas de almacenamiento


Incremento de la velocidad de cmputo
Mejoraras en la confiabilidad
Desarrollo de sistemas administradores de bases de datos

Introduccin
Los datos en bruto tienen poco valor.
Surge la necesidad de estudiar y analizar los datos
para obtener informacin valiosa Conocimiento

Gran Volumen
de Datos
Datos en
Bruto

Estudio,
transformacin
Datos

Bajo Volumen
de Datos
Conocimiento

Introduccin
En muchos dominios, el estudio y anlisis de datos fue
tradicionalmente un proceso manual.
Sin embargo, tal enfoque cambi como consecuencia del
crecimiento del volumen de datos.
En este nuevo enfoque es necesario el uso de las tecnologas
computacionales para automatizar el proceso de estudio y
anlisis de los datos.
Se requiere del uso de las metodologas que ofrece el
anlisis inteligente de datos.

Contexto
El Anlisis Inteligente de Datos (AID) es la disciplina
que se encarga de la obtencin de este conocimiento
til a partir de los datos.
Formalmente el AID se define como un proceso no
trivial de identificar patrones validos, novedosos,
potencialmente tiles y, en ltima instancia,
comprensibles a partir de los datos, [1].
[1]U. M. Fayyad (1996). Advances in Knowledge Discovery and Data Mining. AAAI Press Series. AAAI Press.

Contexto
Fases del proceso del AID
Evaluacin e
interpretacin

Preprocesamiento
de datos
Integracin y
recopilacin de
los datos

Minera
de datos

------------------------

Datos

Datos
objetivo

Datos
preprocesados

Modelos

Difusin y uso
de modelos

Contexto
Fases del proceso del AID
Evaluacin e
interpretacin

Preprocesamiento
de datos
Integracin y
recopilacin de
los datos

Minera
de datos

------------------------

Datos

Datos
objetivo

Datos
preprocesados

Modelos

Difusin y uso
de modelos

Definicin
Fayyad en [1] define Minera de Datos como:
Un proceso no trivial de identificacin vlida,
novedosa, potencialmente til y entendible de
patrones comprensibles que se encuentran
ocultos en los datos
[1] Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in
databases. AI magazine, 17(3), 37.

Definicin
El objetivo fundamental de la minera de datos es
encontrar modelos inteligibles a partir de los datos.
La minera de datos para ser efectiva debe de ser un
proceso automtico o semiautomtico.
Los modelos descubiertos deberan ayudar a tomar
decisiones que aporten algn beneficio al sistema.
El resultado de aplicar minera de datos es un modelo o
varios modelos construidos a partir de los datos de
entrada (datos preprocesados).

Comentarios
Anlisis Inteligente de Datos en Big Data se est
asociando en ciertos contextos a la Data Science
(Ciencia de Datos).
Minera de Datos en Big Data avanza un paso ms
ya no slo tienda a encontrar patrones a partir
de los datos sino que adems est tendiendo a
analizar esos patrones
Minera de Datos Procesamiento de Datos + Anlisis de Datos

Comentarios
Nueva generacin de tcnicas de Minera de
Datos para Big Data
Tcnicas
Clsicas de
Minera de
Datos

Extendiendo,
combinando y
redefiniendo

Extraer y poder
analizar
conocimiento en
Big Data

Comentarios
Nuevas herramientas y libreras para el
desarrollo, aplicacin y ejecucin de tcnicas
de minera de datos aplicadas a Big Data
Librera Apache Mahout
http://mahout.apache.org

Librera Mllib (Machine Learning library) de la plataforma Spark.


https://spark.apache.org/mllib/
https://spark.apache.org/docs/latest/mllib-guide.html

Bibliografa
Data Mining: Principles, Applications and Emerging Challenges
(2014). Ma, X., & Capri, H. L.. Hauppauge, New York: Nova
Science Publishers, Inc.
Data Mining: Concepts and Techniques (2006). Han, Jiawei,
Kamber, Micheline. In The Morgan Kaufmann Series in Data
Management Systems. Amsterdam : Morgan Kaufmann.
http://www.aaai.org/ojs/index.php/aimagazine/article/downl
oad/1230/1131/
http://www.uoc.edu/web/esp/art/uoc/molina1102/molina11
02.pdf

Gracias

You might also like