You are on page 1of 45

c 




  


a   
  a 



  a

 a
2 Es un conjunto de información no redundante en
datos estructurados y organizados
independientemente de su utilización y su
implementación, accesibles en tiempo real y
compatibles con usuarios concurrentes con
necesidad de información de diferente tipo y en
diferente momento
 a
2 En este sentido, una biblioteca puede
considerarse una base de datos compuesta en
su mayoría por documentos y textos impresos en
papel e indexados para su consulta
consulta.. En la
actualidad, y debido al desarrollo tecnológico de
campos como la informática y la electrónica, la
mayoría de las bases de datos tienen formato
electrónico, que ofrece un amplio rango de
soluciones al problema de almacenar datos
datos..
  a

2 En informática existen los sistemas gestores de


bases de datos (SGBD), que permiten almacenar
y posteriormente acceder a los datos de forma
rápida y estructurada
estructurada..

2 son un tipo de software muy específico, dedicado


a servir de interfaz entre la base de datos, el
usuario y las aplicaciones que la utilizan
utilizan.. Se
compone de un lenguaje de definición de datos,
de un lenguaje de manipulación de datos y de un
lenguaje de consulta
  a

2 
 

2 
2 

2  

2 !
2 "# 

2 $
2 %

&" 
2
 '" "$'
  a

2 
2   (
2  %'
2 %
2 %

&
2 
2

Ê a)
 
 *

 *
2 ndependencia de datos y tratamiento
2 Coherencia de resultados
2 Mayor disponibilidad de datos
2 Cumplimiento de normas
2 Facilidad de manejo
2 Seguridad de la información
2 No hay duplicidad de datos
2 ntegridad referencial

Ê a)
 
 *

 *
2 $+,#-
%-"$&.
2 $,"$
"$
$ .
2  $ "$
%/".
)  0  a

2 Carácter
2 Unidad de construcción básica de información
representada por un byte
2 Campo
2 Grupo de caracteres
2 Registro
2 Conjunto de campos relacionados
2 Archivo
2 Grupo de registros relacionados
)  0  a

2 Base de Datos
2 Conjunto de archivos integrado y
relacionados.
2 Entidad
2 Tipos generalizados de personas, lugares o
cosas (objetos), para los cuales se recopilan,
almacenan y mantienen datos.
2 Atributo
2 Los atributos, tanto de entidades como de
relaciones, toman sus valores posibles de un
conjunto llamado dominio. El dominio es,
entonces, el conjunto de valores posibles que
puede tomar un atributo dado de un conjunto
de entidades.
)  0  a

2 ALMACENAMENTO DE DATO
2 Valor especifico de un atributo.
2 CLAVE
2 Campo o grupo de campos en un registro que
se usa para identificar a este ultimo.
2 CLAVE PRMARA
2 Campo o grupo de campos que identifica
exclusivamente el registro.
  
2 ^ste es el modelo más utilizado en la actualidad
para modelar problemas reales y administrar
datos dinámicamente
dinámicamente.. Tras ser postulados sus
fundamentos en 1970 por Edgar Frank Codd, de
los laboratorios BM en San José (California), no
tardó en consolidarse como un nuevo paradigma
en los modelos de base de datos datos.. Su idea
fundamental es el uso de "relaciones"
"relaciones".. Estas
relaciones podrían considerarse en forma lógica
como conjuntos de datos llamados "tuplas"
"tuplas"..
2 Esto es pensando en cada relación como si
fuese una tabla que está compuesta por registros
(las filas de una tabla), que representarían las
tuplas, y campos (las columnas de una tabla)
tabla)..
  
2 El lenguaje más habitual para construir las
consultas a bases de datos relacionales es SQL,
Structured Query Language o Lenguaje
Estructurado de Consultas, un estándar
implementado por los principales motores o
sistemas de gestión de bases de datos
relacionales. Durante la elaboración de una base
de datos relacional pasa por un proceso de
normalización
  
2 Ente las ventajas del modelo relacional estánestán::
2 Garantizar herramientas para evitar la
duplicidad de registros, a través de campos
claves o llaves
llaves..
2 Garantiza la integridad referencial
referencial:: Así al
eliminar un registro elimina todos los
registros relacionados dependientes
dependientes..
2 Favorece la normalización por ser más
comprensible y aplicable
aplicable..
  
2 El proceso de 6 6



 consiste en aplicar una serie de reglas a
las relaciones obtenidas tras el paso del modelo
entidad--relación al modelo relacional. Las bases
entidad
de datos relacionales se normalizan para:

2 Evitar la redundancia de los datos.


2 Evitar problemas de actualización de los datos
en las tablas.
2 Proteger la integridad de los datos.
  
2 Las relaciones que describe Codd al definir su
modelo relacional, son transformadas en tablas
al momento de trabajar con una base de datos
datos..
Las Formas Normales buscan optimizar estas
estructuras eliminando básicamente la
redundancia utilizando como medio principal las
dependencias funcionales
funcionales.. Las Formas Normales
son un pequeño numero de reglas que de
cumplirse hacen que las estructuras posean la
menor cantidad de redundancia posible
posible..

2 !12!3#
"4"1"
,3.a%
$$.
  
2 Segunda Forma Normal (2NF) NF):: Todo campo
que no sea clave debe depender por completo
de toda la clave
clave..
2 Tercera Forma Normal (3NF) NF):: No hay
dependencias transitivas
transitivas.. Un campo debe
depender de la clave y no de otro campo
campo..
2 Forma Normal de BoyceBoyce--Codd (BCNF)
(BCNF):: Todos
los determinantes de la tabla son clave
candidata..
candidata
2 Cuarta Forma Normal (4NF) NF):: Una fila no debe
contener dos o más campos multi multi--valorados
(aquellos que pueden contener más de un
valor simultáneamente) sobre una entidad
entidad..
  
2 Quinta Forma Normal (5NF): Una tabla puede
almacenar atributos dependientes a la clave
 por unión.
  a 
 ) a

2 En una base de datos orientada a objetos, la


información se representa mediante objetos
como los presentes en la programación orientada
a objetos
objetos.. Cuando se integra las características
de una base de datos con las de un lenguaje de
programación orientado a objetos, el resultado es
un sistema gestor de base de datos orientada a
objetos (ODBMS, › ect Data ase Management
System)). Un ODBMS hace que los objetos de la
System
base de datos aparezcan como objetos de un
lenguaje de programación en uno o más
lenguajes de programación a los que dé soporte
soporte..
  a 
 ) a

2 Un ODBMS extiende los lenguajes con datos


persistentes de forma transparente, control de
concurrencia, recuperación de datos, consultas
asociativas y otras capacidades
capacidades..
2 Las bases de datos orientadas a objetos se
diseñan para trabajar bien en conjunción con
lenguajes de programación orientados a objetos
como Java, C#, Visual Basic
Basic..NET y C++
C++.. Los
ODBMS usan exactamente el mismo modelo que
estos lenguajes de programación
programación..
  a 
 ) a

2 à  6

2 Las clases en un sistema orientado a objetos


se representan en forma jerárquica, así que
las propiedades o características del elemento
persona las contendrán (heredaran) los
elementos alumno y maestro
maestro.. Se puede decir
que tanto la entidad Alumno y maestro son
subclases de la clase persona
  a 
 ) a

2 En base de datos orientados a objetos pueden


existir los siguientes cambios:

2 Adición de una nueva clase: Para realizar este


proceso, la nueva clase debe colocarse en la
jerarquía de clase o subclase cuidando las
variables o métodos de herencia
correspondientes.
2 Eliminación de una clase: Se requiere la
realización de varias operaciones, se debe de
cuidar los elementos que se han heredado de
esa clase a otras y reestructurar la jerarquía.
0a  

2 $
$+"""
" "$5$
$6$
"$5$",
$"""
7##88$"
7##
".
0a  

2 EJEMPLO:
2 Dimensión (Tiempo,Productos)
2 Jerarquía (Año-
(Año->Semestre
>Semestre-->Mes
>Mes-->Semana),(Categoría
>Semana),(Categoría-->Línea
>Línea--
>Marca)
2 Elementos(2006,2007 Ó Máquinas caras, Máquinas Baratas)
2 Hecho `act (Ventas, nventario, Defectos, Devoluciones)
2 Métrica (PD:=Devoluciones/Ventas, Ventas, Cantidad de
Defectos)

tabla
devolucion
tiempo productos ventas inventario defectos devoluciones es ventas
2006 todos 1000 200 10 1--100 5%
0a  

2 Las estructuras multidimensionales permiten que


el usuario analice los datos de acuerdo a como
quiera mirar el negocio, resumido por línea de
producto, u otras perspectivas claves para su
negocio.. El server de Data Mining debe estar
negocio
integrado con el data warehouse y el server
OLAP para insertar el análisis de negocios
directamente en esta infraestructura
infraestructura..
a9 :0

2 En el contexto de la informática, un 6


 (©ata warehouse
warehouse)) es una colección de
datos orientados a un dominio, integrado y
variable que ayuda a la toma de decisiones de la
empresa u organización
organización..

2 Se trata, sobre todo, de un expediente de una


empresa más allá de la información transaccional
y operacional, almacenado en una base de datos
diseñada para favorecer el análisis y la
divulgación eficientes de datos (especialmente
OLAP, procesamiento analítico en línea)
línea)..
a9 :0

2 Data warehousing es el centro de la arquitectura
para los sistemas de información en la década
de los '90
90.. Soporta el procesamiento informático
al proveer, una plataforma sólida, a partir de los
datos históricos para hacer el análisis
análisis.. Facilita la
integración de sistemas de aplicación no
integrados.. Organiza y almacena los datos que
integrados
se necesitan para el procesamiento analítico,
informático sobre una amplia perspectiva de
tiempo..
tiempo
a9 :0

÷

   
  6


 6   
   6
6 6

 6
 
 6
  
6
    
 
  
 

 

 
  
 66 6
a9 :0


, orientados a soportar la toma de


Y     ,
decisiones.
Y    , , diseñados para soportar las actividades de
coordinación y manejo de documentación y definidos para facilitar
consultas sobre información almacenada en el sistema y asi
proporcionar informes.
Y   6  ! " que cubren el núcleo de
operaciones tradicionales de captura masiva de datos y servicios
básicos de tratamiento de datos
a9 :0

2 6 , este último nivel
Y   6 6  6 ,
de sistemas de información recién está
surgiendo, es consecuencia del desarrollo
organizacional orientado a un mercado de
carácter global, el cual obliga a pensar e
implementar estructuras de comunicación más
estrechas entre la organización y el mercado
a9 :0

2 En un almacén de datos lo que se quiere es


contener datos que son necesarios o útiles para
las empresas
empresas..
2 Un almacén de datos debe entregar la
información correcta a la gente indicada en el
momento adecuado en el formato correcto
correcto.. El
almacén de datos da respuesta a las
necesidades de usuarios conocedores, utilizando
Sistemas de Soporte de Decisiones (DSS)
2 El ambiente de un Data Warehouse queda
definido por la suma de los diferentes DataMarts
integrados, no sólo a nivel físico sino también a
nivel lógico
lógico..
a9 :0

2  a 
a

2 
2  
2 "&
2 &
a9 :0

a
2 Bajo el nombre de 6 #

 se
engloban un conjunto de técnicas encaminadas a
la extracción de "conocimiento" procesable
implícito en las bases de datos
datos.. Las bases de la
minería de datos se encuentran en la inteligencia
artificial y en el análisis estadístico
estadístico.. Mediante los
modelos extraídos utilizando técnicas de minería
de datos se aborda la solución a problemas de
predicción, clasificación y segmentación
a
2 Un proceso típico de minería de datos parte de la
selección del conjunto de datos, tanto en lo que
se refiere a las variables dependientes, como a
las variables objetivo, como posiblemente al
muestreo de los registros disponibles.

2 El ejemplo clásico de la minería de datos tiene


que ver con la detección de  
 
6   
. . Un estudio muy citado
detectó que los viernes había una cantidad
inusualmente elevada de clientes que adquirían
a la vez pañales y cerveza.
a
2
,5$/5$#/
/$$""
;,&$""&"%
/5$
$$#;&&,
$&+. 
$""$$
&&+",'
"<"%&
.
M .
a
2    a

 
 

a 
a=a
0 a 
! 
2 Ê+
Ê+$
$
'%
 %&$
&$ $"
",.
2  ,%,$
,%,$
&.
a
2 Análisis cluster:: permite la clasificación de
cluster
una población en un número determinado
de grupos, en base a semejanzas y
desemejanzas de perfiles existentes.
2 Análisis discriminante:
discriminante: permite la
clasificación de individuos en grupos que
previamente se han establecido, permite
encontrar la regla de clasificación de los
elementos de estos grupos, y por tanto una
mejor identificación.
a
2 TENDENCAS
2 La Minería de Datos ha sufrido
transformaciones en los últimos años de
acuerdo con cambios tecnológicos, de
estrategias de marketing, la extensión de los
modelos de compra en línea, etc. Los más
importantes de ellos son:
2 La importancia que han cobrado los

6 
(texto, páginas de
nternet, etc.)
2 La 6  


6  los algoritmos y
resultados obtenidos en sistemas
operacionales, portales de nternet, etc.
0


a  
2 Business ntelligence suele definirse como la
transformación de los datos de la compañía en
conocimiento para obtener una ventaja
competitiva.

2 Business ntelligence puede ser el conjunto de


metodologías, aplicaciones y tecnologías que
permiten reunir, depurar y transformar datos de
los sistemas transaccionales e información
desestructurada (interna y externa a la
compañía) en información estructurada, para su
explotación directa (análisis OLAP.) o para su
análisis y conversión en conocimiento soporte a
la toma de decisiones sobre el negocio.
0


a  

2 $%&&Y  ÷
2  '    . Para
 6 
    .
resolver el diseño de un modelo B, se deben
contestar a tres preguntas básicas
básicas:: cuál es la
información requerida para gestionar y tomar
decisiones;; cuál debe ser el formato y
decisiones
composición de los datos a utilizar
utilizar;; y de
dónde proceden esos datos y cuál es la
disponibilidad y periodicidad requerida
requerida..
0


a  

2 à  6
( 6

6:
6 6:
2 es el área donde más avances se han producido en los
últimos años
años.. Sin embargo, la proliferación de
soluciones y su aplicación coyuntural para solucionar
aspectos puntuales ha llevado, en ocasiones, a una
situación de desánimo en la organización respecto a los
beneficios de una solución B
B..

2 6:
 ) *   6:
2 herramientas para la elaboración de informes y listados,
tanto en detalle sobre información agregada, a partir de
la información de los datawarehouses
0


a  
2 +% (on
+% ( on--line analytical processing):
processing):
2 herramientas que manejan interrogaciones
complejas de bases de datos relacionales,
proporcionando un acceso multidimensional a
los datos, capacidades intensivas de cálculo y
técnicas de indexación especializadas.
Permiten a los usuarios trocear sus datos
planteando queries sobre diferentes atributos
o ejes.
0


a  
2  !

!

2 Cualitativamente, los beneficios se derivan,
obviamente, del incremento de la eficiencia en
el proceso de toma de decisiones
decisiones:: mayor
información, de mejor calidad, más fiable,
compartida por toda la organización, menores
tiempos de respuesta en su obtención, mejora
de la comunicación en la empresa y creación
de un lenguaje homogéneo
homogéneo..

You might also like