Professional Documents
Culture Documents
Introducción
Curso Maestría
Por
Elizabeth León Guzmán, Ph.D.
Profesora Asociada
Ingeniería de Sistemas
Grupo de Investigación MIDAS
TABD - Introducción
Agenda
1. ¿Qué son Bases de Datos?
Datos, Información, Conocimiento
3. Integracion de Datos
4. Análisis de Datos
5. Recuperación de Datos
TABD - Introducción
¿Qué es un dato?
Hecho individual acerca de algo de interés para alguien
TABD - Introducción
¿Qué es información?
Datos relacionados
TABD - Introducción
Los datos son la materia prima bruta
INFORMACIÓN
TABD - Introducción
Generación de Datos
Comercial
Web (e-commerce)
Supermercados(compras)
Bancos (transacciones con tarjetas)
TABD - Introducción
Generación de Datos
Científico
Satélites (sensores)
Telescopios
Microarrays (información genética)
Simulaciones
TABD - Introducción
Datos
Datos almacenados
Bases de datos
Web
Archivos (excel, pdf, txt, etc)
TABD - Introducción
Modelo Relacional
TABD - Introducción
KDD
Descubrimiento de Conocimiento en Bases de Datos
Nos referimos al
Conocimiento
TABD - Introducción
¿Qué es conocimiento?
Información co-relacionada
Patrones!
TABD - Introducción
Información
Y no saber qué
hacer con ella.
TABD - Introducción
KDD
Descubrimiento de Conocimiento en Bases de Datos
TABD - Introducción
Necesidad de Análisis
“Conocimiento”
● Entender mejor el ambiente
● Globalización
● Ambiente cultural
● Tecnología
TABD - Introducción
BD
BD
BD
BD
BD
BD
INTEGRAR ANALIZAR
Descripción,
Grandes repositorios Algoritmos inteligentes
RECUPERAR Optimización
TABD - Introducción
Integrar Información
BODEGA
BODEGA
DE
DE
DATOS
DATOS
TABD - Introducción
Bodegas de Datos
Data Warehousing
TABD - Introducción
Estructura del Proceso de Acceso a
Datos y Entrega de Información en BI
Data Quality
Diseño y Construcción
Modelos OLAP
Fuentes OLAP
de datos ETLC Data
Data
Warehouse
Warehouse
Calidad de datos
Modelos Molap / Rolap
TABD - Introducción
Análisis Exploratorio
Hacer uso de las habilidades humanas para el
reconocimiento de patrones.
Una imagen vale más que mil palabras.
l
10th
percentile
l
75th
percentile
l
50th
l percentile
25th
percentile
l
10th
percentile
TABD - Introducción
OLAP
TABD - Introducción
Minería de Datos
Datos
Minería Conocimiento
de
datos
TABD - Introducción
Minería de datos
Paso del KDD,
Que descubre “conocimiento” en grandes conjunto de datos
Usa métodos como:
Aprendizaje
Estadistica
de Máquina
Mineria
Mineriade
dedatos
datos
Inteligencia Bases de
artificial datos
TABD - Introducción
Minería de datos
No es…
TABD - Introducción
Minería de datos
es…
• Encontrar grupos de personas con similares hobbies.
• ¿Hay mas probabilidad de desarrollar cáncer si se vive
cerca de una línea de poder?
TABD - Introducción
Inteligencia de Negocios
(BI)
Integración Análisis
TABD - Introducción
Estructura del Proceso de Acceso a
Datos y Entrega de Información en BI
Data Quality
Diseño y Construcción
Modelos OLAP
Fuentes OLAP
de datos ETLC Data
Data
Warehouse
Warehouse
Calidad de datos
Modelos Molap / Rolap
Texto
Audio
Video Indices
imagenes DB
Información
estructurada
Datos estructurados Datos no estructurados
TABD - Introducción
Sistemas de Recuperación
de Información
Query System
(Db,
www,etc)
Query System
query
matched to
object stored
System
Top ranking objects Ranking objects
TABD - Introducción
Aplicaciones IR
TABD - Introducción
Optimización: Indices
TABD - Introducción