Professional Documents
Culture Documents
Sistemas Centralizados
Usuario 1
AP1 D Usuario 2 OScc B OSdm DB
AP2
AP3
M
S
Usuario n
Oscc = Control de comunicaciones del sistema operativo Osdm = Administracin de datos del sistema operativo
Red
Usuario 2
Usuario n
Sistemas Cliente/Servidor
Funcionalidades de la parte visible al usuario y del sistema subyacente
Interfaz de usuario SQL Interfaz de formularios Diseador de Informes Interfaz grfica
Motor SQL
Sistema subyacente
Sistemas Cliente/Servidor
Existen dos arquitecturas bsicas:
La lgica de la Presentacin est en el Cliente. La lgica de los Datos y del negocio est en el Servidor.
La lgica de la Presentacin est en el Cliente. La lgica de los Datos est en el Servidor de Datos La lgica del Negocio est en el Servidor de Aplicaciones.
Sitio 5
Sitio 1
Arquitectura de BD Distribuida
red AP1 AP2 OSnet DDBMS OSdm OSnet DDBMS OSdm OSnet DDBMS OSdm AP2 AP3 OSnet DDBMS OSdm BD
AP2
BD
BD
BD
Sistemas Distribuidos
En un sistema distribuido la base de datos se almacena en varias computadoras. Varios medios de comunicacin, como redes de alta velocidad o lneas telefnicas, ponen en contacto a las distintas computadoras. No comparten memoria ni discos. Las computadoras pueden variar en tamao y funcin.
Sistemas Distribuidos
Un conjunto de localizaciones o sitios conectados entre si mediante algn tipo de red de comunicaciones, en el cual: Cada sitio es un sistema de base de datos en s mismo. Los sitios han convenido en trabajar juntos (si es necesario) como si los datos estuvieran almacenados localmente en el propio sitio del usuario.
Sistemas Distribuidos
Caractersticas
Los distintos emplazamientos estn informados sobre los dems. Aunque algunas tablas pueden estar almacenadas slo en algunos emplazamientos, stos comparten un esquema global comn. Cada emplazamiento proporciona un entorno para la ejecucin de transacciones tanto globales como locales. En general, en cada emplazamiento se ejecuta el mismo software de gestin de BD distribuidas.
Ventajas
Compartimiento de Datos
Autonoma.
Los usuarios de un emplazamiento pueden acceder a los datos que residen en otros emplazamientos.
Cada emplazamiento conserva un cierto grado de control sobre los datos almacenados localmente. Cada administrador local de BD puede tener una autonoma local diferente, dependiendo del diseo del sistema distribuido de BD.
La base de datos se fragmenta en bases de datos ms pequeas, manteniendo los datos cerca de donde ms se necesitan Las consultas y transacciones locales tienen mejor rendimiento debido al tamao de la BD
Ventajas
Fiabilidad y Disponibilidad
La fiabilidad se refiere a la probabilidad de que el sistema est operativo en cualquier momento dado. La disponibilidad consiste en la probabilidad de que el sistema est disponible continuamente durante un determinado perodo de tiempo Si falla un emplazamiento, los restantes pueden continuar funcionando. Si se duplican los elementos de datos acertadamente en varios emplazamientos, una transaccin que requiera un determinado elemento puede obtenerlo de cualquiera de dichas copias. As, el fallo de un emplazamiento no implica necesariamente el cierre del sistema.
Inconvenientes
La implementacin de un sistema distribuido de BD es ms difcil, y por tanto ms costoso. Como los emplazamientos operan en paralelo, es mas difcil asegurarse de la correccin de los algoritmos, del funcionamiento especial durante los fallos de parte del sistema, as como de la recuperacin. Debido al intercambio de mensajes y el cmputo adicional para la coordinacin entre los emplazamientos.
Significa dividir una relacin en fragmentos para propsito de almacenamiento. Mejora el desempeo.
particin de una tabla en subconjuntos de filas. Fragmentacin Vertical: Consiste en particionar una tabla por la proyeccin del subconjunto de sus atributos.
Fragmentacin Horizontal
Percepcin del usuario
NUM EMP E1 E2 E3 NUM DEPTO DX DY DZ SALARIO 45K 40K 50K
E4
E5
DY
DZ
63K
40K
Fragmento en Tokyo
NUM EMP E1 E3 E5 NUM DEPTO DX DZ DZ SALARIO 45K 50K 40K NUM EMP E4 E2 NUM DEPTO DY DY
Fragmento en Lima
SALARIO
63K 40K
Ocurre si el sistema mantiene copias de una tabla X en diferentes sitios para que la data tenga mas disponibilidad. Los usuarios debern poder comportarse como si solo hubiera una copia de los datos (Independencia de Rplica). Permite la creacin y eliminacin dinmica de rplicas en respuesta a cambios en los requerimientos, sin afectar los programas o actividades de los usuarios.
Ventajas
Si una de las estaciones que contiene la tabla X falla, la tabla puede recuperarse de otro sitio Si la mayora de los accesos a la tabla X slo involucran una consulta a la tabla, entonces varios sitios pueden estar solicitando datos de X en forma concurrente. Mientras mas copias haya de X ser menor el trfico de la red.
Rplica
NUM EMP E1 E2 E3 E4 E5 NUM DEPTO DX DY DZ DY DZ SALARIO 45K 40K 50K 63K 40K
Fragmento de Tokyo
NUM EMP E1 E3 E5
NUM DEPTO DX DZ DZ
Fragmento de Lima
NUM EMP E4 E2
NUM DEPTO DY DY
Mnimo Coste:
De almacenamiento de cada fragmento en el nodo correspondiente De modificar un fragmento que est replicado en distintos nodos De trasferencia de datos en la red Minimizar tiempos de respuesta Maximizar capacidad de procesamiento en cada nodo
Rendimiento:
Expandiendo el catlogo de la BD para seguir la pista de la distribucin de los datos, la fragmentacin y la rplica
Determinar estrategias de ejecucin de consultas y transacciones que acceden a datos de ms de una localizacin, sincronizar el acceso a dichos datos y mantener la integridad Decidir a qu copia de los datos acceder y mantener la consistencia entre dichas copias
La capacidad de recuperarse de cadas de sitios individuales y de fallos de los enlaces de comunicacin
Seguridad
Controlar la seguridad y privilegios de acceso de los usuarios de las transacciones distribuidas Informacin de dnde y cmo se almacenan los datos, el modo de acceso y caractersticas fsicas. Alternativas: catlogo centralizado, replicado completamente, dividido, combinacin de centralizado y dividido.
Consideraciones:
El nmero de accesos a disco El costo de la trasmisin de datos por la red (nmero y volumen de mensajes) La ganancia potencial en rendimiento respecto de hacer que varios emplazamientos procesen en paralelo parte de la consulta
Control de concurrencia: No se permite bloqueo mutuo entre dos agentes que sean parte de una misma transaccin. Control de recuperacin: Todos los agentes de la misma transaccin se comprometen (Commit) o abortan (Rollback) simultneamente.
Debe mantenerse la consistencia entre las copias: El control de concurrencia debe asegurar que cada copia sea consistente con todas las dems, an cuando el sitio en el que reside falla y se recupera posteriormente El sistema debe continuar operando con sus sitios activos, si es posible, cuando fallen sitios individuales. Cuando el sitio que fall se recupera, su BD local debe sincronizarse con las dems antes de reincorporarse al sistema.
Podra haber problemas al confirmar una transaccin distribuida si alguno de los sitios involucrados falla durante la confirmacin
Podra ocurrir bloqueo mortal (interbloqueo) entre varios sitios, por lo que deben extenderse las tcnicas para su tratamiento para considerar esta situacin
Se designa una de las copias de cada elemento de datos como copia distinguida Todos los bloqueos se asocian a la copia distinguida, y todas las solicitudes de bloqueo y desbloqueo se envan al sitio que contiene esa copia
Se designa un sitio como coordinador para todos los elementos de la base de datos. Los bloqueos son hechos en este sitio.
Se designa un segundo sitio como de respaldo, y los bloqueos se mantienen en ambos sitios
Copia primaria
Se mantienen las copias distinguidas de los elementos de datos almacenadas en diferentes sitios. Se puede combinar con sitios de respaldo
A
B A A
Recuperacin en BDD
El sistema debe ser capaz de detectar un fallo en uno de los emplazamientos, de modo que pueda decidir si es necesaria alguna accin de recuperacin. El sistema debe dejar de utilizar los servicios del emplazamiento con falla. Deben existir mecanismos para reintegrar fcilmente en el sistema al emplazamiento que fall, cuando se haya recuperado.
Tipos de BD Distribuidas
AP1 AP2 DBMS/OS W X Y Z
No Distribuida
Lnea de comunicacin
AP1 DBMS/OS
W X BD1
AP2
DBMS/OS
Dividida no Duplicada
Y Z BD2
Tipos de BD Distribuidas
AP1 AP2
Lnea de comunicacin
DBMS/OS
W X Y Z BD (copia 1)
No Dividida y Duplicada
AP1
AP2
DBMS/OS
W X Y Z BD (copia 2)
Tipos de BD Distribuidas
Lnea de comunicacin
AP1 DBMS/OS W X Y BD1
Dividida y Duplicada
AP2 DBMS/OS
Y Z
BD2
Clases de SGBDD
Distribucin
SGDB federado, heterogneo y distribuido SGDB heterogneo y distribuido Mltiples SGDB homogneos, lgicamente integrados SGDB homogneo y distribuido SGDB federado, homogneo y distribuido Sistema multibase, homogneo y distribuido
Autonoma
Sistema multibase, homogneo SGDB federado, heterogneo en una sede SGDB federado, homogneo en una sede Sistema multibase, heterogneo
Heterogeneidad
Diseo de BDD
Esquema Lgico Global
Distribucin
Integracin
Bibliografia