You are on page 1of 5

Base de datos

Ingeniería en Sistemas de Computación

Jonathan Varela Guillén

Raquel Piñas Pérez

Luis Gabriel Andrés Naranjo

Fausto Lizano Villar

Carlos López Delgado

David Rojas Picado

| Introducción a la informática | 31/07/2018


Arquitecturas de Integración del proceso de descubrimiento de
conocimiento con sistemas de Gestión de Bases de Datos: Un estado
del Arte.
Por medio de esta lectura hablaremos de las investigaciones en descubrimiento de
conocimiento en Bases de Datos, cuyo fin es definir modelos de descubrimiento de
patrones y el desarrollo de algoritmos para estos. También sobre el problema que
presenta integrar DCBD con sistemas de bases de datos, por motivo del cual se da
como resultado el desarrollo de sistemas y herramientas de Descubrimiento de
Conocimiento y su división en 3 categorías:

 Débilmente acopladas con un Sistema de Gestión de Bases de Datos.


 Medianamente acopladas con un Sistema de Gestión de Bases de Datos.
 Fuertemente acopladas con un Sistema de Gestión de Bases de Datos.

Debido al crecimiento en volúmenes de datos y las bases de datos que superan los
métodos tradicionales de análisis basados en hojas de cálculo surge la necesidad de
obtener nuevas técnicas y herramientas que puedan de forma inteligente y automática
transformar estos datos en información útil, conocimiento.

Por medio de este proceso se identifica patrones válidos, novedosos y entendibles al


usuario a partir de los datos. Por medio de numerosos pasos (Selección,
Procesamiento, Limpieza de datos, Transformación, Reducción, Minería de datos,
Interpretación y Evaluación), le permite al usuario la toma de muchas decisiones.

Por medio de una herramienta de descubrimiento de conocimiento de bases de datos


y la integración de varios componentes (técnicas de minería de datos, consultas,
métodos de visualización, interfaces) se identifican y extraen patrones útiles para
almacenar en la base de datos. Con la necesidad de integrar los sistemas de
descubrimiento de conocimiento y bases de datos, se dividen en tres tipos:

 Arquitectura DCBD Débilmente Acoplada


En este tipo de arquitectura, los procesos de minería corren en un espacio de
direccionamiento diferente al del SGBD.

 Arquitectura DCBD Medianamente Acoplada


Se dice que es medianamente acoplada cuando ciertas tareas y algoritmos de
descubrimiento de patrones se encuentran formando parte del SGDB por procesos
almacenados.

PÁGINA 1
Su principal ventaja, tiene en cuenta las capacidades de escalabilidad, administración
y manipulación de datos del SGBD.

 Arquitectura DCBD Fuertemente Acoplada


Cuando la totalidad de las tareas y algoritmos del descubrimiento de patrones forman
parte del SGBD como operación primitiva, brindándole capacidades de
descubrimiento de conocimiento.

Ya que en la actualidad se ha dado un crecimiento de información almacenada en


bases de datos y seguirá creciendo constantemente, se necesita el desarrollo de
métodos y herramientas que permitan de manera eficaz sustraer conocimiento de
esas bases.

La integración de los Sistemas de Descubrimiento de Conocimiento y Bases de


Datos es un área activa de investigación que continuara en el futuro cercano.

Con respecto a las propuestas de extensión del lenguaje SQL proponen el DMQL (Data
Mining Query Language), un lenguaje de consultas de minería de datos para bases de
datos relacionales, el cual adapta una sintaxis SQL-like para facilitar un alto nivel de
minería de datos y una integración con el lenguaje relacional SQL.

DMQL extiende el lenguaje SQL con una colección de operadores para la


generalización. DMQL puede funcionar como un lenguaje de desarrollo para
implementaciones de sistemas de minería de datos.

Se expone el M-SQL, un lenguaje de consulta que extiende el SQL con un conjunto


pequeño de primitivas para minería de datos con un operador especial unificado, el
operador MINE.MINE genera y recupera todo un conjunto de reglas que cumplen con
el soporte y la confianza establecidas por el usuario.

La mejor ventaja de estas dos propuestas DMQL y M-SQL es que extienden el lenguaje
SQL con nuevos operadores para poder expresar operaciones de minería de datos con
una sintaxis SQL y la desventaja es la arquitectura bajo la cual estos lenguajes fueron
implementados.

De igual forma, M-SQL hace parte del prototipo data mine que es un sistema para
Minería de datos que de acuerdo a sus autores es débilmente acoplado con un SGBD.
La arquitectura de data mine tiene un motor de minería de datos, una interfaz gráfica
de usuario y una interfaz de comunicación de datos. Data Mine puede leer datos a
partir de archivos ASCII o desde una base de datos directamente.

Se expone un modelo de operador unificado SQL-like para encontrar reglas de


asociación en datos agrupados por diferentes atributos. El operador mine rule se

PÁGINA 2
diseña como una extensión del lenguaje SQL para obtener diferentes tipos de reglas de
asociación, como reglas de asociación simples, con condicionales, con clustering, con
generalización y con jerarquías. El operador mine rule produce una nueva tabla donde
cada tupla corresponde a una regla descubierta.

Los creadores proponen una semántica formal para el operador mine rule, se describe
por medio de una extensión del álgebra relacional con nuevos operadores que
permiten transformar una relación con el fin de descubrir reglas de asociación. Los
creadores proponen una arquitectura que está fuertemente acoplada con SQL server,
para soportar el operador mine rule.

PÁGINA 3
Referencia.

Timaran, R. (2001) Arquitecturas de integración del proceso de descubrimiento del


conocimiento con sistemas de gestión de bases de datos: un estado del arte.

PÁGINA 4

You might also like