Professional Documents
Culture Documents
INTEGRANTES:
Jorge Rivas C.I.: 19.060.844
Maria Etura C.I.: 21.127.166
Yahiliana Melendez C.I.: 20.921.819
SECCION: 10N1IS
Datawarehouse
Un almacn de datos del ingls datawarehouse es una coleccin
de datos en la cual se encuentra integrada la informacin de la empresa
u organizacin. Esta informacin es de utilidad en el proceso de toma de
decisiones gerenciales.
Un datawarehouse es como el expediente de una empresa con
informacin transaccional y operacional, que es almacenada en una
base de datos diseada para favorecer anlisis y la divulgacin
eficientes de datos (especialmente OLAP, procesamiento analtico en
lnea). El almacenamiento de los datos no debe usarse con datos de uso
actual.
Los almacenes de los datos contienen a menudo grandes
cantidades de informacin que se subdividen a veces en unidades
lgicas ms pequeas, llamadas los centros comerciales, dependientes
de los datos. Generalmente, dos ideas bsicas dirigen la creacin de un
almacn de los datos:
de anlisis
posible y
informacin.
Proporciona la capacidad de aprender de los datos del pasado y
en
una
estructura
consistente,
por
lo
que
las
adecuarse
a las distintas
comparaciones.
No voltil: el almacn de informacin de un DataWarehouse existe
para ser ledo, y no modificado. La informacin es por tanto
permanente, significando la actualizacin del DataWarehouse la
incorporacin de los ltimos valores que tomaron las distintas
variables contenidas en l sin ningn tipo de accin sobre lo que ya
exista.
Datamart
Un Datamart es una base de datos departamental, especializada
en el almacenamiento de los datos de un rea de negocio especfica. Se
caracteriza por disponer la estructura ptima de datos para analizar la
informacin al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento. Un datamart puede ser alimentado
desde los datos de un datawarehouse, o integrar por si mismo un
compendio de distintas fuentes de informacin.
Cubo de datamart
Por tanto, para crear el datamart de un rea funcional de la
empresa es preciso encontrar la estructura ptima para el anlisis de su
informacin, estructura que puede estar montada sobre una base de
datos OLTP, como el propio datawarehouse, o sobre una base de datos
OLAP. La designacin de una u otra depender de los datos, los
requisitos y las caractersticas especficas de cada departamento. De
esta forma se pueden plantear dos tipos de datamarts:
Datamart OLAP
Se basan en los populares cubos OLAP, que se construyen
agregando, segn los requisitos de cada rea o departamento, las
dimensiones y los indicadores necesarios de cada cubo relacional. El
modo de creacin, explotacin y mantenimiento de los cubos OLAP es
muy heterogneo, en funcin de la herramienta final que se utilice.
Datamart OLTP
Pueden basarse en un simple extracto del datawarehouse, no obstante,
lo comn es introducir mejoras en su rendimiento (las agregaciones y los
filtrados suelen ser las operaciones ms usuales) aprovechando las
caractersticas particulares de cada rea de la empresa. Las estructuras
ms comunes en este sentido son las tablas report, que vienen a ser
fact-tables reducidas (que agregan las dimensiones oportunas), y las
vistas materializadas, que se construyen con la misma estructura que las
anteriores, pero con el objetivo de explotar la reescritura de queries
(aunque slo es posible en algunos SGBD avanzados, como Oracle).
Los datamarts que estn dotados con estas estructuras ptimas de
anlisis presentan las siguientes ventajas:
formato que sea reconocido por dicha base. Adems, contiene toda la
informacin, estructuras, variables y llamadas a funciones, necesarias
para comunicarse con la base de datos.
El software de acceso usualmente es el software distribuido con la base
de datos, el cual permite el acceso a la misma, a travs de solicitudes
con formato. Luego, el software de acceso recibe los resultados de la
base de datos, an los mensajes de error, y los pasa hacia la interfaz, y
sta a su vez, los pasa hasta el software de procesamiento.
Cualquier otro software (servidor HTTP, software de redes, etc.) agrega
enlaces adicionales a este proceso de extraccin de la informacin, ya
que el software de procesamiento pasa los resultados hacia el servidor
Web, y ste hasta el browser del Web (ya sea directamente o a travs
de una red).
Todos los factores que condicionan las Bases de Datos Multimedia les
obligan a tener dos caractersticas principales:
La disponibilidad de bases de datos avanzadas, en un entorno
de fcil utilizacin por parte del usuario.
El establecimiento de redes de telecomunicaciones de alta
velocidad.
BBDD Referenciales
Son bases de datos que se encargan de almacenar datos
concernientes a informacin sobre archivos multimedia, como video o
msica. Esta informacin almacenada podra tratarse de datos tales
como el autor y ttulo, el formato, la duracin, entre otros.
Una base de datos referencial, por ejemplo podra ser la de una
biblioteca, por ejemplo, imaginemos que queremos ver un video, o leer
un libro, o ver una foto, y slo sabemos el nombre, o el autor, o su
identificador. Entonces, accedemos a esta base de datos referencial
biblioteca, y buscamos el archivo, y nos dir dnde lo podemos localizar,
en que seccin de la web de la biblioteca, o en que parte de la misma
biblioteca, es decir, que la base de datos referencial sirve para saber
dnde est lo que buscamos, con los pocos parmetros que se tiene
sobre ello, como su nombre, autor, o editorial.
BBDD Descriptivas
Tipos de datos
En la siguiente imagen podemos observar los diferentes tipos de
datos que podemos tener en una base de datos multimedia:
de formato estndar.
Animaciones: Representan secuencias temporales de imgenes
o datos.
Vdeo: Definen secuencias temporales de imgenes o datos a
una determinada velocidad (fps o tasa de frames por segundo),
gusto
Facilitar la disponibilidad de bases de datos avanzadas. As como
el establecimiento de redes de telecomunicaciones de alta
velocidad.
Ventajas:
Inconvenientes:
Historia
La necesidad de almacenar datos de forma masiva dio paso a la
creacin de los sistemas de bases de datos.
La base de datos distribuidas originalmente almacenan la
informacin de manera centralizada, pero con el paso del tiempo las
necesidades aumentaron y esto produjo ciertos inconvenientes que no
era posible solucionarlos o volverlos eficientes de la forma centralizada.
Estos problemas impulsaron la creacin de almacenamiento distribuido,
los cuales hoy en da proveen caractersticas indispensables en el
manejo de informacin; es decir, la combinacin de las redes de
comunicacin y las bases de datos.
Funcionalidades de un SGBDD
Hardware
El hardware que compone una base de datos distribuida se
reduce a servidores y la red.
Software
Sistema manejador de base de datos distribuida (DDBMS): Este
sistema est formado por las transacciones y los administradores de la
base de datos distribuidos. Un DDBMS implica un conjunto de
programas que operan en diversas computadoras, estos programas
pueden ser subsistemas de un nico DDBMS de un fabricante o podra
consistir de una coleccin de programas de diferentes fuentes.
Administrador de transacciones distribuidas (DTM): Este es un
programa que recibe las solicitudes de procesamiento de los programas
de consulta o transacciones y las traduce en acciones para los
administradores de la base de datos. Los DTM se encargan de coordinar
y controlar estas acciones. Este DTM puede ser propietario o
desarrollado en casa.
El manejador de transacciones es el encargado de definir la
estructura de las transacciones, mantener la consistencia en la base de
datos cuando se ejecuta una transaccin o se cancela la ejecucin de
una, mantener protocolos de fiabilidad, implementar algoritmos para el
control de la concurrencia y sincronizar las transacciones que se
ejecutan simultneamente.
El
manejador
recibe
solicitudes
de
procesamiento
de
Para que una fragmentacin sea correcta esta debe cumplir con las
siguientes reglas:
Debe ser Completa: Si una relacin R se fragmenta en R1, R2,
, Rn, cada elemento de la data de R debe estar en algn Ri.
Debe ser Reconstruible: Debe ser posible definir una operacin
relacional que a partir de los fragmentos obtenga la relacin.
Tipos de arquitecturas/implementaciones
describen a continuacin:
Autonoma de diseo: Habilidad de un componente del sistema para
decidir cuestiones relacionadas a su propio diseo.
Ventajas
Desventajas
Un Sistema
de
Informacin
en
su
Funcionamiento de un SIG
3.
4.
5.
6.
La creacin de datos
Los datos SIG representan los objetos del mundo real (carreteras,
el uso del suelo, altitudes). Los objetos del mundo real se pueden dividir
en dos abstracciones: objetos discretos (una casa) y continuos (cantidad
Para qu sirven?
Los SIG nos permiten hacer un anlisis exhaustivo del territorio en
los mbitos ms diversos. Son herramientas verstiles, con un amplio
campo de aplicacin en cualquier actividad que conlleve un
componente espacial.
As, la tecnologa de los Sistemas de Informacin Geogrfica
puede ser utilizada para investigaciones cientficas, para gestin de los
recursos y activos, en arqueologa, en evaluacin del impacto
ambiental, para la planificacin urbana, en cartografa, sociologa,
La productividad
El tiempo de respuesta
distribucin
Procesamiento de Consultas: En el procesamiento de consultas
en BDP se tiene que considerar el procesamiento de una consulta
y adems el costo involucrado en la transmisin de informacin
entre los diferentes nodos para la obtencin de los resultados de
de
bases
de
datos,
Modelos de arquitectura
memoria comn.
Disco compartido: Todos los procesadores comparten un disco
comn.
Sin compartimiento: Los procesadores no comparten ni
memoria ni disco.
Jerrquico: Es un hbrido de las anteriores.
Arquitectura de un SBDP
La mayora de los sistemas de manejo de bases de datos
actualmente disponibles se basan en la arquitectura ANSI-SPARC, la
cual divide a un sistema en tres niveles: Interno, Conceptual y Externo.
La vista conceptual representa la visin que tiene la comunidad de
usuarios de la base de datos. La vista externa permite a los usuarios ver
slo los datos de inters en la base de datos, proporcionando as una
vista para las aplicaciones de los usuarios, las cuales pueden ser
diferentes. El esquema interno a su vez, es el nivel de descripcin ms
bajo de la base de datos y tiene que ver directamente con la
organizacin fsica de los datos dentro de la computadora. Este
esquema interacta directamente con el sistema de archivos del sistema
operativo. Los sistemas centralizados se apegan perfectamente a la
arquitectura de la Figura anterior, sin embargo en los SBDP, intervienen
otros aspectos importantes los cuales se presentan en la siguiente figura
Procesamiento de Consultas
El nico reto en los SMBDM es el procesamiento de consultas
(queries) que dependen de la localizacin fsica de la unidad mvil
Consultas dependientes de la localizacin: Son consultas que
involucran la localizacin fsica de la unidad mvil en combinacin con
otros datos como la localizacin de otras unidades mviles o estructuras
fsicas.
Ejemplo: Encontrar el hotel ms cercano desde donde me
encuentro con un precio < $50
Manejo de transacciones
Se considera el manejo de transacciones cuando un dispositivo
mvil inicia una transaccin hacia la base de datos o hacia un servidor
fijo. La transaccin puede ejecutarse en el servidor o en el dispositivo
mvil.
Se debe tomar en cuenta:
comunicaciones
mviles,
Sony-Ericsson,
Nokia,
Motorola
cobertura
LAN Inalmbrica: Bajo costo, poco rango de cobertura, buen
Estructura y Caractersticas
debemos
distinguir
una
serie
de
elementos
principales
utiliza en la organizacin.
Base de datos remota y SMBD que gestiona y almacena los datos
mviles. Son las bases de datos que deben estar implementadas
entre
el
SMBD
Arquitectura BD Mviles
SMBD Mviles
IBM: DB2 Everyplace
DB2 Everyplace forma parte de la solucin de IBM para procesos
de informtica distribuida. Mediante DB2 Everyplace, los profesionales
que se desplazan con frecuencia (tales como vendedores, inspectores,
auditores, tcnicos de mantenimiento, mdicos, agentes inmobiliarios y
tasadores de seguros) pueden tener acceso a datos vitales que
necesitan mientras estn lejos de su centro de trabajo.
Las empresas pueden ahora transferir sus datos corporativos DB2
a dispositivos porttiles o incorporados. Con DB2 Everyplace, puede
acceder a una base de datos contenida en su dispositivo porttil y
realizar actualizaciones en ella. Con DB2 Everyplace Sync Server, puede
sincronizar datos entre el dispositivo porttil y otras fuentes de datos
ubicadas en la empresa. El Adaptador de Archivos le permite distribuir
archivos y aplicaciones hacia usuarios porttiles.
una
rica
funcionalidad,
incluyendo
procedimientos
SQLite
Es un sistema de gestin de bases de datos relacional compatible con
ACID (En bases de datos se denomina ACID a un conjunto de
caractersticas necesarias para que una serie de instrucciones puedan
ser consideradas como una transaccin. As pues, si un sistema de
gestin de bases de datos es ACID compliant quiere decir que el mismo
cuenta con las funcionalidades necesarias para que sus transacciones
tengan las caractersticas ACID. En concreto ACID es un acrnimo
de Atomicity, Consistency, Isolation
and Durability:
Atomicidad,
en el dispositivo mvil.
Sincronizar los datos del servidor de base de datos centralizado y
en el dispositivo mvil.
Capturar datos de varias fuentes, por ejemplo, de Internet.
Gestionar datos en el dispositivo mvil.
Analizar los datos almacenados en el dispositivo mvil.
Crear aplicaciones mviles personalizadas.
Ventajas e Inconvenientes
Las principales ventajas que hemos detectado en las bases de datos
mviles son las siguientes:
conflictos importantes.
El tratamiento de fallos es un aspecto delicado ya que al tratarse de
un entorno distribuido, los fallos de transmisin de datos deben de
Introduccin y definicin
Un sistema de base de datos deductiva, es un sistema de base de
datos pero con la caracterstica de que a travs informacin extensional de
reglas y hechos se pueden deducir o inferir informacin adicional a la que
tenemos almacenada en nuestra base de datos. El lenguaje ms usado para
este tipo de bases de datos es el Datalog.
Representacin de la informacin
Hechos
Conocidos
como
la
base
de
datos
extensional
(EDB):
relacin intenta describir algn hecho del mundo real cuyo significado
queda determinado en parte por los nombres de los atributos. En una
Base de Datos Deductiva, el significado del valor del atributo en una
tupla queda determinado exclusivamente por su posicin dentro de la
tupla.
Reglas
Referidos
como
la
base
de
datos
intencional
(IDB):
para
la
representacin
manejo
de
las
reglas.
Sistema de inferencia
Mecanismo
de
inferencia
ascendente: Tambin
llamado
Lenguaje de programacin
Datalog
datos
deductivasy
es
sintcticamente
un
subconjunto
del
Sintxis
Este tipo de bases de datos se componen de clusulas de
Horn que constituyen reglas de tipo "modus ponendo pones", lo que
quiere decir que si es verdad el antecedente ser verdad el
consecuente. En este caso se escribe al revs, primero el consecuente y
despus el antecedente.
%hechos
%reglas
hombre(teraj).
hijo(X,Y)
hombre(abraham).
hombre(X),(padre(Y,X);madre(Y,X)).
:-
hombre(najor).
hombre(haran).
hija(X,Y)
hombre(lot).
mujer(X),(padre(Y,X);madre(Y,X)).
:-
mujer(sarai).
mujer(melca).
abuelo(X,Y)
mujer(jesca).
padre(X,Z),(padre(Z,Y);madre(Z,Y)).
:-
padre(teraj,sarai).
padre(teraj,abraham).
abuela(X,Y)
padre(teraj,najor).
madre(X,Z),(padre(Z,Y);madre(Z,Y)).
:-
padre(teraj,haran).
padre(abraham,isma
hermano(X,Y)
el).
(X\==Y),hombre(X),hijo(X,Z),
padre(abraham,isaac
(hijo(Y,Z);hija(Y,Z)).
:-
).
padre(najor,batuel).
hermana(X,Y)
padre(haran,melca).
(X\==Y),mujer(X),hija(X,Z),
padre(haran,jesca).
(hijo(Y,Z);hija(Y,Z)).
:-
padre(haran,lot).
casado(abraham,sar
tio(X,Y)
ai).
hermano(X,Z),(padre(Z,Y);madre(Z,Y)).
:-
casado(najor,melca).
tia(X,Y)
:-
hermana(X,Z),(padre(Z,Y);madre(Z,Y)).
Para hacer una consulta utilizamos una clusula de Horn con uno de los
parmetros vacos (poniendo una variable en lugar donde queremos recibir los
datos)
Ejemplo de consultas:
?-padre(X,sarai)
X=teraj
YES
?-madre(X,isaac)
X=sarai
YES
?-padre(X,isaac)
X=abraham
YES
?-padre(X,abraham)
X=teraj
YES
?-abuelo(X,isaac)
X=teraj
X=teraj
YES.
Ventajas
Inconvenientes
Posibles aplicaciones
empresa.
Prueba de hiptesis o dragado de datos: este dominio implica formular
una hiptesis, traducirla a un conjunto de reglas LDL y una consulta, y
luego ejecutar la consulta contra los datos para probar la hiptesis. El
proceso se repite reformulando las reglas y la consulta. Esto se ha
aplicado al anlisis de datos de genoma en el campo de la
microbiologa. El dragado de datos consiste en identicar las secuencias
Ejemplos de uso
con
concurrencia,
datos persistentes de
recuperacin
de
forma
datos,
transparente,
consultas
control
asociativas
de
otras
capacidades.
Las bases de datos orientadas a objetos se disean para trabajar bien
en conjuncin con lenguajes de programacin orientados a objetos como Java,
C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo
que estos lenguajes de programacin.
Los ODBMS son una buena eleccin para aquellos sistemas que
necesitan un buen rendimiento en la manipulacin de tipos de dato complejos.
Los ODBMS proporcionan los costes de desarrollo ms bajos y el mejor
rendimiento cuando se usan objetos gracias a que almacenan objetos en disco
y tienen una integracin transparente con el programa escrito en un lenguaje
de programacin orientado a objetos, al almacenar exactamente el modelo de
objeto usado a nivel aplicativo, lo que reduce los costes de desarrollo y
mantenimiento.
representar gran
cantidad
de
datos,
pero
las operaciones y
Operaciones limitadas
Desadaptacin de impedancias
dominios)
Mientras que las necesidades de las aplicaciones actuales con respecto a las
bases de datos son:
Identificadores nicos
Gestin de versiones
Facilidades de evolucin
Interconexin e interoperabilidad
de ingeniera,
manufacturacin,
en
numerosos sistemas
de
Caractersticas
Persistencia
Manejador
Opcional: Son las que pueden ser aadidas para hacer el sistema mejor
pero que no son mandatorias estas son de: herencia mltiple, chequeo
de tipos e inferencia distribucin y diseo de transacciones y versiones.
Competencia.
Con
respecto
los
SGBDR
los
SGBDOR.