You are on page 1of 39

Base de Datos: Arquitecturas de Bases de Datos Multiusuario

Profesor: Msc. Luis Serna Jherry

Objetivos del Dia de Hoy


Sistemas Centralizados Sistemas Cliente Servidor Sistemas Distribuidos

Sistemas Centralizados
Usuario 1
AP1 D Usuario 2 OScc B OSdm DB

AP2
AP3

M
S

Usuario n

Oscc = Control de comunicaciones del sistema operativo Osdm = Administracin de datos del sistema operativo

Arquitectura cliente - servidor


Usuario 1

AP1 OS net AP2

Red

Usuario 2

AP2 OSnet OSnet DBMS OSdm AP2 OS net AP3 BD

Usuario n

Osnet= porcin de comunicaciones de red del SO

Oddm= porcin de administracin de datos del SO

Sistemas Cliente/Servidor
Funcionalidades de la parte visible al usuario y del sistema subyacente
Interfaz de usuario SQL Interfaz de formularios Diseador de Informes Interfaz grfica

Parte visible al usuario Interfaz (SQL + API)

Motor SQL

Sistema subyacente

Sistemas Cliente/Servidor
Existen dos arquitecturas bsicas:

De dos niveles, en los que:

La lgica de la Presentacin est en el Cliente. La lgica de los Datos y del negocio est en el Servidor.

De tres niveles, que implica servicios de gestin


de transacciones complejas, y donde:

La lgica de la Presentacin est en el Cliente. La lgica de los Datos est en el Servidor de Datos La lgica del Negocio est en el Servidor de Aplicaciones.

Sistema Distribuido de Base de Datos


Sitio 3 Sitio 4 Red de Comunicaciones Sitio 2

Sitio 5

Sitio 1

Arquitectura de BD Distribuida
red AP1 AP2 OSnet DDBMS OSdm OSnet DDBMS OSdm OSnet DDBMS OSdm AP2 AP3 OSnet DDBMS OSdm BD

AP2

BD

BD

BD

Sistemas Distribuidos

En un sistema distribuido la base de datos se almacena en varias computadoras. Varios medios de comunicacin, como redes de alta velocidad o lneas telefnicas, ponen en contacto a las distintas computadoras. No comparten memoria ni discos. Las computadoras pueden variar en tamao y funcin.

Sistemas Distribuidos

Un conjunto de localizaciones o sitios conectados entre si mediante algn tipo de red de comunicaciones, en el cual: Cada sitio es un sistema de base de datos en s mismo. Los sitios han convenido en trabajar juntos (si es necesario) como si los datos estuvieran almacenados localmente en el propio sitio del usuario.

Sistemas Distribuidos

Principio fundamental: Desde el punto de vista


del usuario, un sistema distribuido deber ser idntico a un sistema no distribuido. Permite que cada sitio almacene y mantenga su propia BD. Puede mejorar la fiabilidad; esto es, si falla un sitio el resto de la red puede seguir funcionando. Permite el control local de los datos que se usan con mas frecuencia en un sitio.

Caractersticas

Los distintos emplazamientos estn informados sobre los dems. Aunque algunas tablas pueden estar almacenadas slo en algunos emplazamientos, stos comparten un esquema global comn. Cada emplazamiento proporciona un entorno para la ejecucin de transacciones tanto globales como locales. En general, en cada emplazamiento se ejecuta el mismo software de gestin de BD distribuidas.

Ventajas

Compartimiento de Datos

Autonoma.

Los usuarios de un emplazamiento pueden acceder a los datos que residen en otros emplazamientos.
Cada emplazamiento conserva un cierto grado de control sobre los datos almacenados localmente. Cada administrador local de BD puede tener una autonoma local diferente, dependiendo del diseo del sistema distribuido de BD.

Mejora del rendimiento para procesamientos locales

La base de datos se fragmenta en bases de datos ms pequeas, manteniendo los datos cerca de donde ms se necesitan Las consultas y transacciones locales tienen mejor rendimiento debido al tamao de la BD

Ventajas

Fiabilidad y Disponibilidad

La fiabilidad se refiere a la probabilidad de que el sistema est operativo en cualquier momento dado. La disponibilidad consiste en la probabilidad de que el sistema est disponible continuamente durante un determinado perodo de tiempo Si falla un emplazamiento, los restantes pueden continuar funcionando. Si se duplican los elementos de datos acertadamente en varios emplazamientos, una transaccin que requiera un determinado elemento puede obtenerlo de cualquiera de dichas copias. As, el fallo de un emplazamiento no implica necesariamente el cierre del sistema.

Inconvenientes

Costo de desarrollo del software.

La implementacin de un sistema distribuido de BD es ms difcil, y por tanto ms costoso. Como los emplazamientos operan en paralelo, es mas difcil asegurarse de la correccin de los algoritmos, del funcionamiento especial durante los fallos de parte del sistema, as como de la recuperacin. Debido al intercambio de mensajes y el cmputo adicional para la coordinacin entre los emplazamientos.

Mayor probabilidad de errores.

Mayor sobrecarga de procesamiento

Almacenamiento Distribuido de Datos


Fragmentacin

Significa dividir una relacin en fragmentos para propsito de almacenamiento. Mejora el desempeo.

Fragmentacin Horizontal: Consiste en la

particin de una tabla en subconjuntos de filas. Fragmentacin Vertical: Consiste en particionar una tabla por la proyeccin del subconjunto de sus atributos.

Fragmentacin Horizontal
Percepcin del usuario
NUM EMP E1 E2 E3 NUM DEPTO DX DY DZ SALARIO 45K 40K 50K

E4
E5

DY
DZ

63K
40K

Fragmento en Tokyo
NUM EMP E1 E3 E5 NUM DEPTO DX DZ DZ SALARIO 45K 50K 40K NUM EMP E4 E2 NUM DEPTO DY DY

Fragmento en Lima
SALARIO

63K 40K

Almacenamiento fsico en Tokyo

Almacenamiento fsico en Lima

Almacenamiento Distribuido de Datos


Rplica

Ocurre si el sistema mantiene copias de una tabla X en diferentes sitios para que la data tenga mas disponibilidad. Los usuarios debern poder comportarse como si solo hubiera una copia de los datos (Independencia de Rplica). Permite la creacin y eliminacin dinmica de rplicas en respuesta a cambios en los requerimientos, sin afectar los programas o actividades de los usuarios.

Ventajas

Si una de las estaciones que contiene la tabla X falla, la tabla puede recuperarse de otro sitio Si la mayora de los accesos a la tabla X slo involucran una consulta a la tabla, entonces varios sitios pueden estar solicitando datos de X en forma concurrente. Mientras mas copias haya de X ser menor el trfico de la red.

Rplica
NUM EMP E1 E2 E3 E4 E5 NUM DEPTO DX DY DZ DY DZ SALARIO 45K 40K 50K 63K 40K

Percepcin del Usuario

Fragmento de Tokyo

NUM EMP E1 E3 E5

NUM DEPTO DX DZ DZ

SALARIO 45K 50K 40K

NUM EMP E4 E2 NUM EMP E1 E3 E5

NUM DEPTO DY DY NUM DEPTO DX DZ DZ

SALARIO 63K 40K

Fragmento de Lima

Rplica del fragmento de Lima

SALARIO 45K 50K 40K

NUM EMP E4 E2

NUM DEPTO DY DY

SALARIO 63K 40K

Rplica del fragmento de Tokyo

Almacenamiento fsico en Tokyo

Almacenamiento fsico en Lima

Esquema de Asignacin y Replicacin: objetivos

Mnimo Coste:

De almacenamiento de cada fragmento en el nodo correspondiente De modificar un fragmento que est replicado en distintos nodos De trasferencia de datos en la red Minimizar tiempos de respuesta Maximizar capacidad de procesamiento en cada nodo

Rendimiento:

Funciones Adicionales de los SGBDD

Mantenimiento de la pista de los datos

Expandiendo el catlogo de la BD para seguir la pista de la distribucin de los datos, la fragmentacin y la rplica

Gestin de Transacciones Distribuidas

Determinar estrategias de ejecucin de consultas y transacciones que acceden a datos de ms de una localizacin, sincronizar el acceso a dichos datos y mantener la integridad Decidir a qu copia de los datos acceder y mantener la consistencia entre dichas copias
La capacidad de recuperarse de cadas de sitios individuales y de fallos de los enlaces de comunicacin

Gestin de datos replicados

Recuperacin de la base de datos distribuida

Funciones Adicionales de los SGBDD

Seguridad

Controlar la seguridad y privilegios de acceso de los usuarios de las transacciones distribuidas Informacin de dnde y cmo se almacenan los datos, el modo de acceso y caractersticas fsicas. Alternativas: catlogo centralizado, replicado completamente, dividido, combinacin de centralizado y dividido.

Gestin del directorio (catlogo) distribuido

Procesamiento Distribuido de Consultas

Consideraciones:

El nmero de accesos a disco El costo de la trasmisin de datos por la red (nmero y volumen de mensajes) La ganancia potencial en rendimiento respecto de hacer que varios emplazamientos procesen en paralelo parte de la consulta

Buscar todas las tuplas de la tabla Cuenta

Si replicada, si fragmentada, si replicada y fragmentada.

Procesamiento Distribuido de Transacciones

Agente: proceso ejecutado a nombre de una determinada transaccin en un determinado sitio.

Control de concurrencia: No se permite bloqueo mutuo entre dos agentes que sean parte de una misma transaccin. Control de recuperacin: Todos los agentes de la misma transaccin se comprometen (Commit) o abortan (Rollback) simultneamente.

Control de Concurrencia y Recuperacin en BDD

Manejar mltiples copias de los datos:

Debe mantenerse la consistencia entre las copias: El control de concurrencia debe asegurar que cada copia sea consistente con todas las dems, an cuando el sitio en el que reside falla y se recupera posteriormente El sistema debe continuar operando con sus sitios activos, si es posible, cuando fallen sitios individuales. Cuando el sitio que fall se recupera, su BD local debe sincronizarse con las dems antes de reincorporarse al sistema.

Fallo de sitios individuales:

Control de Concurrencia y Recuperacin en BDD

Confirmacin (commit) distribuida:

Podra haber problemas al confirmar una transaccin distribuida si alguno de los sitios involucrados falla durante la confirmacin

Bloqueo mortal distribuido:

Podra ocurrir bloqueo mortal (interbloqueo) entre varios sitios, por lo que deben extenderse las tcnicas para su tratamiento para considerar esta situacin

Control de Concurrencia por Copia Distinguida

Se designa una de las copias de cada elemento de datos como copia distinguida Todos los bloqueos se asocian a la copia distinguida, y todas las solicitudes de bloqueo y desbloqueo se envan al sitio que contiene esa copia

Control de Concurrencia por Copia Distinguida


Tcnicas de eleccin de copia distinguida: Sitio primario:

Se designa un sitio como coordinador para todos los elementos de la base de datos. Los bloqueos son hechos en este sitio.

Control de Concurrencia por Copia Distinguida


Tcnicas de eleccin de copia distinguida: Sitio primario con sitio de respaldo

Se designa un segundo sitio como de respaldo, y los bloqueos se mantienen en ambos sitios

Control de Concurrencia por Copia Distinguida


Tcnicas de eleccin de copia distinguida:

Copia primaria

Se mantienen las copias distinguidas de los elementos de datos almacenadas en diferentes sitios. Se puede combinar con sitios de respaldo
A

B A A

Recuperacin en BDD

El sistema debe ser capaz de detectar un fallo en uno de los emplazamientos, de modo que pueda decidir si es necesaria alguna accin de recuperacin. El sistema debe dejar de utilizar los servicios del emplazamiento con falla. Deben existir mecanismos para reintegrar fcilmente en el sistema al emplazamiento que fall, cuando se haya recuperado.

Tipos de BD Distribuidas
AP1 AP2 DBMS/OS W X Y Z

No Distribuida

Lnea de comunicacin

AP1 DBMS/OS

W X BD1

AP2
DBMS/OS

Dividida no Duplicada

Y Z BD2

Tipos de BD Distribuidas
AP1 AP2

Lnea de comunicacin

DBMS/OS

W X Y Z BD (copia 1)

No Dividida y Duplicada

AP1

AP2
DBMS/OS

W X Y Z BD (copia 2)

Tipos de BD Distribuidas
Lnea de comunicacin
AP1 DBMS/OS W X Y BD1

Dividida y Duplicada

AP2 DBMS/OS

Y Z
BD2

Clases de SGBDD
Distribucin
SGDB federado, heterogneo y distribuido SGDB heterogneo y distribuido Mltiples SGDB homogneos, lgicamente integrados SGDB homogneo y distribuido SGDB federado, homogneo y distribuido Sistema multibase, homogneo y distribuido

Sistema multibase, heterogneo y distribuido

Autonoma
Sistema multibase, homogneo SGDB federado, heterogneo en una sede SGDB federado, homogneo en una sede Sistema multibase, heterogneo

SGDB integrados, heterogneos

Heterogeneidad

Arquitectura para SGBDD


Esquema Externo Global 1 Esquema Externo Global 2 Esquema Externo Global n

Esquema Externo Local 11

Esquema Externo Local 1h

Esquema Conceptual Global

Esquema Externo Local n1

Esquema Externo Local nm

Esquema Conceptual BD Local 1

Esquema Conceptual BD Local n

Esquema Interno BD Local 1

Esquema Interno BD Local n

Arquitectura de los SGBD Multibase


Esquema Externo 1 Esquema Externo 2 Esquema Externo n

Esquema Conceptual BD Local 1

Esquema Conceptual BD Local 2

Esquema Conceptual BD Local n

Esquema Interno BD Local 1

Esquema Interno BD Local 2

Esquema Interno BD Local n

Diseo de BDD
Esquema Lgico Global

Distribucin

Integracin

Esquema Lgico Local 1

Esquema Lgico Local 2

Esquema Lgico Local n

Bibliografia

Fundamentos de Sistemas de Base de Datos. Ramez Elmasri, Shamkant Navathe

You might also like