Professional Documents
Culture Documents
Datos
ndice
Introduccin
Contexto
Definicin
Comentarios
Bibliografa
Introduccin
Cada vez ms cantidad de datos es almacenada.
El desarrollo tecnolgico permiten computar, almacenar
y transmitir datos.
Algunos factores que han permitido este avance son:
Introduccin
Los datos en bruto tienen poco valor.
Surge la necesidad de estudiar y analizar los datos
para obtener informacin valiosa Conocimiento
Gran Volumen
de Datos
Datos en
Bruto
Estudio,
transformacin
Datos
Bajo Volumen
de Datos
Conocimiento
Introduccin
En muchos dominios, el estudio y anlisis de datos fue
tradicionalmente un proceso manual.
Sin embargo, tal enfoque cambi como consecuencia del
crecimiento del volumen de datos.
En este nuevo enfoque es necesario el uso de las tecnologas
computacionales para automatizar el proceso de estudio y
anlisis de los datos.
Se requiere del uso de las metodologas que ofrece el
anlisis inteligente de datos.
Contexto
El Anlisis Inteligente de Datos (AID) es la disciplina
que se encarga de la obtencin de este conocimiento
til a partir de los datos.
Formalmente el AID se define como un proceso no
trivial de identificar patrones validos, novedosos,
potencialmente tiles y, en ltima instancia,
comprensibles a partir de los datos, [1].
[1]U. M. Fayyad (1996). Advances in Knowledge Discovery and Data Mining. AAAI Press Series. AAAI Press.
Contexto
Fases del proceso del AID
Evaluacin e
interpretacin
Preprocesamiento
de datos
Integracin y
recopilacin de
los datos
Minera
de datos
------------------------
Datos
Datos
objetivo
Datos
preprocesados
Modelos
Difusin y uso
de modelos
Contexto
Fases del proceso del AID
Evaluacin e
interpretacin
Preprocesamiento
de datos
Integracin y
recopilacin de
los datos
Minera
de datos
------------------------
Datos
Datos
objetivo
Datos
preprocesados
Modelos
Difusin y uso
de modelos
Definicin
Fayyad en [1] define Minera de Datos como:
Un proceso no trivial de identificacin vlida,
novedosa, potencialmente til y entendible de
patrones comprensibles que se encuentran
ocultos en los datos
[1] Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in
databases. AI magazine, 17(3), 37.
Definicin
El objetivo fundamental de la minera de datos es
encontrar modelos inteligibles a partir de los datos.
La minera de datos para ser efectiva debe de ser un
proceso automtico o semiautomtico.
Los modelos descubiertos deberan ayudar a tomar
decisiones que aporten algn beneficio al sistema.
El resultado de aplicar minera de datos es un modelo o
varios modelos construidos a partir de los datos de
entrada (datos preprocesados).
Comentarios
Anlisis Inteligente de Datos en Big Data se est
asociando en ciertos contextos a la Data Science
(Ciencia de Datos).
Minera de Datos en Big Data avanza un paso ms
ya no slo tienda a encontrar patrones a partir
de los datos sino que adems est tendiendo a
analizar esos patrones
Minera de Datos Procesamiento de Datos + Anlisis de Datos
Comentarios
Nueva generacin de tcnicas de Minera de
Datos para Big Data
Tcnicas
Clsicas de
Minera de
Datos
Extendiendo,
combinando y
redefiniendo
Extraer y poder
analizar
conocimiento en
Big Data
Comentarios
Nuevas herramientas y libreras para el
desarrollo, aplicacin y ejecucin de tcnicas
de minera de datos aplicadas a Big Data
Librera Apache Mahout
http://mahout.apache.org
Bibliografa
Data Mining: Principles, Applications and Emerging Challenges
(2014). Ma, X., & Capri, H. L.. Hauppauge, New York: Nova
Science Publishers, Inc.
Data Mining: Concepts and Techniques (2006). Han, Jiawei,
Kamber, Micheline. In The Morgan Kaufmann Series in Data
Management Systems. Amsterdam : Morgan Kaufmann.
http://www.aaai.org/ojs/index.php/aimagazine/article/downl
oad/1230/1131/
http://www.uoc.edu/web/esp/art/uoc/molina1102/molina11
02.pdf
Gracias