Professional Documents
Culture Documents
DBLEARN
1. Introduccin.
La minera de datos puede definirse inicialmente como un proceso de
descubrimiento de nuevas y significativas relaciones, patrones y tendencias al
examinar grandes cantidades de datos.
La disponibilidad de grandes volmenes de informacin y el uso generalizado de
herramientas informticas ha transformado el anlisis de datos orientndolos hacia
determinadas tcnicas especializadas englobadas bajo el nombre de minera de
datos o Data Mining.
Las tcnicas de minera de datos persiguen el descubrimiento automtico del
conocimiento contenido en la informacin almacenado de modo ordenado en
grandes bases de datos. Estas tcnicas tienen como objetivo descubrir patrones,
perfiles y tendencias a travs del anlisis de los datos utilizando tecnologas de
reconocimiento de patrones, redes neuronales, lgica difusa, algoritmos genticos y
otras tcnicas avanzadas de anlisis de datos.
2. Concepto.
El sistema DBLearn fue diseado por Cai, Han y Cercone[2] y utiliza conocimientos
del dominio para generar descripciones para subconjuntos predefinidos de una base
de datos relacional. Las caractersticas especiales de este sistema son su estrategia
de bsqueda de abajo hacia arriba (bottom up); el uso de conocimientos del dominio
como jerarquas de valores de atributos y el uso del lgebra relacional. El conjunto
de entrenamiento es una tabla de datos relacional con n-tuplas. El sistema DBLearn
es relativamente simple, ya que utiliza solo dos operaciones de generalizacin para
construir los descriptores. La generalizacin est orientada a los atributos, lo cual
limita el conjunto de descriptores que pueden ser construidos. La performance del
sistema es buena, y la complejidad en el tiempo est en el orden de los O(N logN),
siendo N la cantidad inicial de tuplas.
3. Ventajas y Desventajas.
DBLearn utiliza SQL en la tarea inicial para extraer los datos relevantes de la base
de datos. En este sentido est dbilmente acoplado a un manejador de bases de
datos relacional. Una vez se ha encontrado el conjunto de datos objetivo, se lleva a
cabo un proceso de generalizacin orientado por atributos con base en una jerarqua
LENGUAJE DBLEARN.