Professional Documents
Culture Documents
Disciplina: INE651600
Sistemas Operacionais
Professor: Antnio Augusto Frhlich
1. Introduo
Este trabalho apresenta uma viso geral sobre Bancos de Dados Distribudos e efetua uma
descrio de pesquisas atuais na rea. Apresenta as caractersticas principais da tecnologia e
descreve trabalhos recentes que buscam atualizar os conceitos da tecnologia e do uso de
bancos de dados distribudos.
Estes pontos podem estar fisicamente prximos, ligadas por uma rede local (LAN), ou
geograficamente distantes, ligadas atravs de uma rede de longa distncia (WAN). A
combinao desta situao tambm pode ser utilizada.
As redes podem possuir diferentes topologias para definir o caminho de comunicao entre
elas. O tipo de topologia pode ter impacto significativo sobre o rendimento da rede.
tenha acesso s demais informaes de uma tupla. A fragmentao vertical consiste na diviso
em colunas de uma relao.
Um conjunto de fragmentos horizontais cuja unio corresponda a todas as tuplas de uma
relao R, denomina-se fragmentao horizontal completa de R; um conjunto de fragmentos
verticais cuja projeo inclui todos os atributos de R denomina-se fragmentao vertical
completa de R.
A mescla destas duas fragmentaes produz uma fragmentao mista. Um fragmento de uma
relao pode ser obtido atravs da combinao de operaes SELECAO e PROJEO.
Um esquema de fragmentao de uma base de dados uma definio de um conjunto de
fragmentos que incluem todos os atributos e tuplas de uma base de dados e satisfaa a
condio de que a base completa possa ser reconstruda atravs de operaes de unio.
Um esquema de repartio descreve a diviso de fragmentos entre os pontos do banco
distribudo, ou seja, uma correspondncia que especifica onde armazenado cada
fragmento. Se um fragmento armazenado em mais de um ponto, se diz que ele est
replicado.
A replicao til para melhorar a disponibilidade dos dados. Um banco de dados distribudo
chamado de totalmente replicado quando toda a base de dados est replicada em todos os
pontos que o compe. Isto melhora a disponibilidade, pois o sistema pode operar enquanto
houver algum ponto ativo. Melhora tambm a performance das consultas, porque o resultado
de qualquer consulta pode ser obtido localmente. A desvantagem da replicao completa
que diminui drasticamente a velocidade das operaes de atualizao, pois uma s atualizao
deve ser executada em cada uma das copias da base para que a consistncia seja mantida. O
oposto da replicao completa no ter nenhuma replicao, onde cada fragmento encontrase em apenas um ponto da rede. Entre estes dois casos temos uma ampla gama de replicao
parcial dos dados. Um esquema de replicao uma descrio da replicao dos fragmentos
de um banco de dados distribudo.
Cada fragmento, ou cada copia de fragmento, deve estar associada a um ponto determinado
do sistema distribudo. Este processo se chama distribuio dos dados. A escolha dos pontos e
o grau de replicao dependem dos objetivos de performance e disponibilidade desejados.
Common SQL API para permitir que aplicaes cliente sejam escritas sem a
necessidade de conhecer o fornecedor do banco de dados que esta sendo acessado;
Commom Database Protocol: permite que um banco de dados de um fabricante
comunique-se com um banco de dados de outro fabricante sem a necessidade de um
gateway
Common network protocol: para permitir a comunicao entre diferentes bancos de
dados
Outro fator relacionado com o grau de homogeneidade o grau de autonomia local. Se todo o
acesso ao banco se da atravs de um cliente, dizemos que o sistema no tem autonomia local.
Se permitir as transaes locais acessarem diretamente um servidor, o sistema ter certo grau
de autonomia local. Num extremo de autonomia temos um banco de dados distribudo que da
ao usurio a impresso de um banco centralizado. S h um esquema conceitual, e todo o
acesso se d atravs de um cliente, sem existir autonomia local. No outro extremo
encontramos com um tipo de banco de dados distribudo denominado federado (ou sistema
de mltiplas bases de dados - MDBS). Num sistema assim, cada servidor um SGBD
centralizado independente e autnomo que tem seus prprios usurios, transaes locais e
um DBA, possuindo assim alto grau de autonomia local.
Cada servidor pode autorizar o acesso a partes especificas de acordo com as classes dos
usurios. Um sistema federado uma combinao de sistemas distribudos e centralizados.
Para usurios autnomos locais um sistema centralizado e para usurios globais um
sistema distribudo.
Em sistemas heterogneos um servidor pode ser um banco relacional, outro pode ser um de
rede e outro um banco hierrquico. Neste caso [e necessrio contar com uma linguagem e
incluir tradutores de linguagem no cliente a fim de traduzir as consultas.
Um terceiro aspecto que serve para a classificao das bases de dados distribudas o grau de
transparncia da distribuio, ou grau de integrao dos esquemas. Se o usurio percebe um
s esquema integrado sem informao alguma relativa fragmentao, replicao ou
distribuio, se que diz que o SGBDD tem alto grau de transparncia de distribuio. Se o
usurio pode ver toda a fragmentao e a replicao, o SGBDD no tem transparncia de
distribuio.
constraint global (constraint que deve ser aplicada nos vrios bancos) seja analisada
com o acesso aos dados em uma base nica, eliminando o custo de acesso a dados
remotos. Isto se d atravs da identificao da restrio global e dos dados a serem
inseridos numa base local. O algoritmo produz uma condio local de forma que se o
dado local satisfizer esta condio, esta ser aceita na restrio global. Caso contrrio
existe a necessidade de verificao global.
Baio [10] apresenta a aplicao da teoria da reviso no projeto de bancos de dados
distribudos atravs de algoritmo que decide a tcnica de fragmentao a ser utilizada
em cada classe do banco de dados. Esta tcnica encontra esquemas de fragmentao
melhores e aumenta a performance.
Lin [11] apresenta um estudo que mostra uma nova abordagem para o processo de
checkpoint em bancos de dados distribudos.
Wildemberg [12] trata do problema da alocao de dados em bancos de dados
distribudos. Algoritmos de alocao so usados para descobrir uma distribuio de
dados ideal. Ele prope um novo algoritmo que busca um custo de execuo mnimo,
mantendo a complexidade do algoritmo original. O algoritmo apresenta resultados
melhores que o algoritmo original.
Baio [13] indica que os principais problemas em bancos de dados distribudos
concentram-se em: distribuio dos dados (particionamento e replicao); controle de
concorrncia distribudo onde se busca um equilbrio entre manuteno da
consistncia e o alto nvel de concorrncia; o processamento de consultas distribudo
onde deve ser considerado o custo de otimizao e o custo de execuo. Destaca
como pontos em aberto: problemas de crescimento da rede; o processamento de
transaes distribudo e a integrao com sistemas operacionais distribudos j que os
bancos de dados distribudos possuem caractersticas especficas tais como suporte a
transaes distribudas com controle de concorrncia e recuperao e que no so
esto perfeitamente integradas com sistemas operacionais distribudos. Levanta
tambm a questo da integrao da convergncia de bancos de dados distribudos
com a gerncia de dados na Web, existindo a necessidade de convergncia de duas
culturas distintas, com necessidades de interoperabilidade e mudanas de tecnologia,
como arquiteturas multi-camadas e servios Web
Bibliografia
[1] ELMASRI, NAVATHE Sistemas de Bases de Datos, segunda Edicion, AddisonWesley Iberoamericana
[2] zsu, Valduriez Principles of Distributed Database Systems Prentice Hall, 1991
[3] Clack. C. DatabasesIIIdistributedDBMSs. Dsiponvel em
http://www.cs.ucl.ac.uk/staff/C.Clack/3C13/powerpoints/databasesIIIdistributed
DBMSs.ppt. Acesso em 24/08/2008.
[4] Gorla, Narasimhaiah. A Methodology for Vertically Partitioning in a Multi-Relation
Database Environment. JCS&T Vol. 7 No. 3. 217-227
[5] Wiesmann, Shiper. Comparision od database replication techniques based on total
order broadcast. IEEE TRANSACTIONS ON KNOWLEDGE AND DATA
ENGINEERING, VOL. 17, NO. 4, APRIL 2005. 551-566
[6] Huebsch et al. Sharing Aggregate Computation for Distributed Queries.
SIGMOD07, June 1114, 2007, Beijing, China
[7] Atreya et al. Efficient detection of a locally stable predicate in a distributed system.
J. Parallel Distrib. Comput. 67 (2007) 369 385
[8] Hachen et al. Distributed Database Management for Scientific Data Analysis.
Worcester Polytec Institute.USA
[9] Gupta. A. Local verification of global integrity constraints in distributed databases.
In Proceedings of the ACM SIGMOD International Conference on Management
of Data, 1993
[10] Baiao. Applying Theory Revision to the Design of Distributed Databases.
Disponivel em http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.58.261
[11] Lin J. Dunham M. A survey of distributed database checkpointing. Distributed and
Parallel Databases Journal. 1997. Vol 5 p 31.
[12] Wildemberg et al. Alocao de Dados em Bancos de Dados Distribudos. SBBD
2003
[13] Baiao, F. Banco de Dados Distribudo. Apresentao. Disponvel em
www.cos.ufrj.br/~baiao/ISExpert2003/BDDPublicado.pdf. Acesso em
29/08/2008