Professional Documents
Culture Documents
Apresentao do professor
Ol senhoras e senhores! Hoje comeamos mais um curso relacionado a
Banco de dados Avanados. um prazer imenso fazer parte desta equipe de
professores do Estratgia Concursos e ter a oportunidade de apresentar um
pouco do meu conhecimento e experincia em concursos pblicos! Gostaria,
antes de comear de fato o contedo terico desta aula, de me apresentar de
forma rpida. Creio que seja importante para nos conhecermos.
Meu nome Thiago, sou casado, tenho um filho de quatro anos. Sou
cristo. Frequento a IPN Igreja Presbiteriana Nacional. Sou formado em
Cincia da Computao pela UFPE. Tenho mestrado em engenharia de software
na mesma faculdade. Frequento academia para manter a forma, mas meu hobby
mesmo pedalar! Decidi vender o carro e viver num desafio intermodal de
transporte. Vou para o trabalho de bike sempre que possvel!
16712855225
www.estrategiaconcursos.com.br
1 de 55
Vamos juntos?
www.estrategiaconcursos.com.br
2 de 55
Cronograma
Para proporcionar uma viso geral do assunto e fornecer uma linha de ao
para o estudo da matria dividimos o curso em cinco aulas, sendo esta a aula
00. A aula engloba a parte de estruturas de arquivos e mtodos de acesso.
Falaremos ainda sobre indexao de banco de dados. As demais aulas, seguindo
a ementa do curso, so apresentadas abaixo e esto distribudas como se segue:
EMENTA DO CURSO: Armazenamento de dados e indexao, Processamento e
otimizao de consulta, Banco de dados distribudos e paralelos, Segurana em
banco de dados e Noes e georreferenciamento e banco de dados orientado a
objetos
Pois bem, e como sero distribudas as nossas aulas?
Aula 00 Armazenamento de dados e indexao
Aula 01 - Processamento e otimizao de consulta
Aula 02 Banco de dados distribudos e paralelos
Aula 03 Segurana em banco de dados
Aula 04 - Noes de georreferenciamento e banco de dados orientado a
objetos
Definido o cronograma, vamos partir para o contedo da nossa aula
demonstrativa.
16712855225
Armazenamento de Dados.
O assunto da nossa aula de hoje trata dos aspectos fsicos do banco de
dados. Nossa ementa ter como foco a organizao de arquivos e mtodos de
acesso. Outra forma de descrever esse mesmo assunto usada por alguns autores
relacionar a estruturas de arquivo, indexao e hashing. Veremos como a
estrutura fsica efetivamente contribui para o desempenho de um sistema de
banco de dados.
1. Estrutura de arquivos
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
3 de 55
www.estrategiaconcursos.com.br
4 de 55
Existem dois tipos de memria RAM que devem ser consideradas no nosso
estudo: DRAM e SRAM. DRAM a sigla em ingls para Dynamic Random Access
Memory, ou Memria de Acesso Randmico Dinmica. Isso significa que ela
precisa que a informao seja atualizada o tempo todo para que permanea
armazenada. Com isso, esse tipo de RAM gasta mais energia se comparado
com a SRAM.
A Memria de Acesso Randmico Esttica (SRAM) consegue manter os
bytes mesmo sem atualizao contnua, os dados so perdidos somente aps
a interrupo da fonte de energia. A memria RAM esttica mais econmica,
alm de entregar uma performance melhor. Vejamos como esse assunto j foi
cobrado em provas anteriores.
1.
www.estrategiaconcursos.com.br
5 de 55
www.estrategiaconcursos.com.br
6 de 55
Um disco pode ter apenas uma das suas faces uteis conforme podemos
observar na parte (a) da figura acima. Outra possibilidade ter as duas faces
com capacidade de leitura e gravao. Podemos ainda ter um disk pack com
vrios discos em apenas um dispositivo como exemplificado na parte (b) da
figura.
A figura apresenta ainda os termos tcnicos que descrevem uma estrutura
de disco. Por estarem em ingls vamos aproveitar as prximas linhas para
descrever os termos aproveitando para expor a devida palavra em portugus.
Track (trilha) um crculo de pequena largura. Existem vrios em cada
uma das faces de um disco. Em disk packs, as trilhas de mesmo dimetro so
denominadas cilindros. Dados armazenados no mesmo cilindro so recuperados
mais rapidamente. Cada trilha dividida em blocos ou setores.
Actuator (acionador) - o responsvel por mover o brao sob a
superfcie dos pratos, e assim permitir que as cabeas faam o seu trabalho.
Para que a movimentao ocorra, o atuador contm em seu interior uma bobina
que induzida por ims.
16712855225
www.estrategiaconcursos.com.br
7 de 55
16712855225
www.estrategiaconcursos.com.br
8 de 55
1.2.
Arquivos no disco
www.estrategiaconcursos.com.br
9 de 55
www.estrategiaconcursos.com.br
10 de 55
www.estrategiaconcursos.com.br
11 de 55
www.estrategiaconcursos.com.br
12 de 55
16712855225
Existem algumas outras operaes que podem ser fornecidas pelo SGBD
ou pelo sistema de entrada e sada do SO. Essas operaes so responsveis por
retornar ou manipular mais de um registro que satisfaa a uma determinada
condio. Observem a lista no quadro a seguir:
www.estrategiaconcursos.com.br
13 de 55
1.3.
Organizao de arquivos
www.estrategiaconcursos.com.br
14 de 55
www.estrategiaconcursos.com.br
15 de 55
16712855225
www.estrategiaconcursos.com.br
16 de 55
www.estrategiaconcursos.com.br
17 de 55
menos
srio,
pois,
independentemente de quantos registros possam caber no bucket eles podem
ser definidos por hashing ao mesmo bucket sem causar problema.
Esse modelo conhecido como hashing externo. O bucket o espao de
endereos de destino, um bloco de disco ou um cluster de bloco de disco
contguos. Uma funo mapeia uma chave no bucket relativo e no no
absoluto. At aqui o endereamento esttico, no possvel crescer ou
diminuir o tamanho do espao de endereamento do hash. Os prximos
modelos esto baseados na criao de buckets de forma dinmica.
A prxima opo usar o hashing extensvel que armazena uma
estrutura de acesso fora do arquivo, semelhante a indexao. O hash
extensvel usa um diretrio dinmico de registros que armazena uma tabela,
onde cada registro contm um ponteiro para um balde (tabela que armazena
os registros) e cada balde tem um nmero fixo de itens.
A ideia usar um diretrio de ponteiros para baldes e duplicar o nmero
de baldes atravs da duplicao do diretrio, particionando justamente o balde
que transbordou. Veja a figura abaixo:
16712855225
www.estrategiaconcursos.com.br
18 de 55
www.estrategiaconcursos.com.br
19 de 55
ndice o ponteiro
www.estrategiaconcursos.com.br
20 de 55
1.4.1.
Nveis de RAID
Vamos tratar primeiramente dos nveis sete nveis de RAID mais comuns na
literatura. Vejamos cada um deles na lista abaixo:
RAID 0 - tambm conhecido como striping de disco, uma tcnica que
divide um arquivo e distribui os dados em todas as unidades de disco em um
grupo RAID. No existe nenhum espelhamento ou controle de paridade. Neste
caso todos os discos funcionam como apenas um, multiplicando a performance
geral pelo nmero de discos utilizados no conjunto (desde que o sistema
operacional oferea suporte), unicamente com o objetivo de aumentar o
desempenho.
16712855225
www.estrategiaconcursos.com.br
21 de 55
www.estrategiaconcursos.com.br
22 de 55
1.4.2.
Nested RAID
www.estrategiaconcursos.com.br
23 de 55
1.5.
www.estrategiaconcursos.com.br
24 de 55
exemplo,
www.estrategiaconcursos.com.br
25 de 55
2. ndices
O primeiro conceito que devemos ter em mente do assunto a definio de
ndices. Um ndice um mecanismo utilizado para melhorar a velocidade de
acesso aos dados. Ele composto por uma chave que um atributo ou conjunto
de atributos usado para procurar registros em um arquivo. Ele tambm possui
um ponteiro que consiste em um identificador para um bloco de disco, alm do
deslocamento dentro do bloco para encontrar o registro.
www.estrategiaconcursos.com.br
26 de 55
www.estrategiaconcursos.com.br
27 de 55
www.estrategiaconcursos.com.br
28 de 55
www.estrategiaconcursos.com.br
29 de 55
16712855225
www.estrategiaconcursos.com.br
30 de 55
3. ndices multinveis
Para falarmos dos ndices mulitnveis vamos comear recorrendo a uma
imagem que est apresentada abaixo.
16712855225
www.estrategiaconcursos.com.br
31 de 55
16712855225
www.estrategiaconcursos.com.br
32 de 55
16712855225
www.estrategiaconcursos.com.br
33 de 55
O nosso assunto terico est concludo, vamos logo a seguir passar para o
comentrio das questes sobre os temas discutidos durante a aula. Antes,
porm, gostaria de fazer um rpido comentrio sobre indexao de textos.
INDEXAO DE TEXTOS
Existem dois mtodos principais de busca por frases em bancos de dados
textuais utilizando indexao de textos, um arquivo invertidos com
contadores de posio e o outro ndice para a prxima palavra.
Um arquivo invertido possui duas partes principais: uma estrutura de busca,
chamada de vocabulrio, contendo todos os termos distintos existentes nos
textos indexados e, para cada termo, uma lista invertida que armazena os
identificadores dos registros contendo o termo. Consultas so feitas tomando-se
a lista invertida correspondente ao termo procurado. As consultas booleanas so
feitas obtendo-se a conjuno ou disjuno entre as listas relativas aos termos
presentes na consulta.
16712855225
www.estrategiaconcursos.com.br
34 de 55
Questes Comentadas
Vamos continuar nosso estudo de fazendo algumas questes sobre o
assunto. Sempre que possvel vamos inserir algum detalhamento terico na
explicao da questo. Esperamos que vocs gostem. Nesta aula optamos por
colocar as questes apenas ao final devido quantidade escassa de questes
disponveis.
2.
ANO: 2015 BANCA: COSEAC RGO: UFF PROVA: ANALISTA TECNOLOGIA DA INFORMAO
C. Vimos durante a aula que o acesso direto trabalha com registros de tamanho
fixo.
D. O acesso indexado tem por base a utilizao de ndice.
A alternativa E est correta e apresenta a nossa resposta. A ideia que voc use
uma funo hash para apontar para um determinando endereo e em seguida
siga por meio do bloco de disco at achar o valor correspondente. Trata de uma
funo hash com endereamento aberto.
Gabarito: E
www.estrategiaconcursos.com.br
35 de 55
3.
ANO: 2015 BANCA: NUCEPE RGO: SEFAZ - PI PROVA: ANALISTA SISTEMAS JNIOR
4.
Em SGBDs,
A os metadados resultam da converso de comandos DDL pelo compilador da
DDL.
16712855225
www.estrategiaconcursos.com.br
36 de 55
5.
6.
www.estrategiaconcursos.com.br
37 de 55
7.
8.
A memria do tipo
___I___ se diferencia das memrias convencionais
___II___ por serem muito rpidas. Por outro lado, so muito mais caras.
16712855225
A memria
___III___ consiste em uma quantidade menor de memria
embutida no processador. Quando este precisa ler dados na memria RAM, um
circuito especial transfere blocos de dados muito utilizados da RAM para esta
memria. Assim, no prximo acesso do processador, este consultar esta
memria, que bem mais rpida, permitindo o processamento de dados de
maneira mais eficiente.
Completam, correta e respectivamente, as lacunas de I a III do texto o que
consta em:
A DRAM (Dynamic RAM) SRAM (Static RAM) cache.
B cache RAM DRAM (Dynamic RAM).
C DDR DDR2 DDR3.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
38 de 55
9.
www.estrategiaconcursos.com.br
39 de 55
II. Apenas um contraexemplo que torna a questo errada, o RAID nvel 1. Nele,
uma unidade "duplica" a outra, isto , faz uma "cpia" da primeira, razo pela
qual o nvel tambm conhecido como mirroring (espelhamento). Com isso, se
o disco principal falhar, os dados podem ser recuperados imediatamente porque
existe cpias no outro. Desta forma a alternativa II est incorreta.
III. Striping o processo de dividir um conjunto de dados em blocos e distribuir
os blocos de dados em vrios dispositivos de armazenamento, como discos
rgidos ou SSDs. Esse conceito de fato utilizado por RAID para distribuir a
informao entre diferentes discos. Desta forma, a alternativa III est correta.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
40 de 55
III. Vimos no item I que iSCSI est relacionado ao protocolo IP, protocolo
padro na internet.
Gabarito: C
PROVA:
ANALISTA
www.estrategiaconcursos.com.br
41 de 55
13. ANO: 2015 BANCA: CESPE RGO: MEC PROVA: TCNICO DE NVEL
SUPERIOR - ANALISTA DE SISTEMA OPERACIONAL
Julgue os itens a seguir, acerca de arquiteturas e protocolos para redes de
armazenamento de dados.
[1] O iSCSI um protocolo embasado em IP que estabelece e gerencia conexes
entre armazenamentos, hosts e dispositivos de ponte sobre IP, encapsulando
dados e comandos SCSI para permitir que estes blocos de dados sejam
transportados por meio de pacotes TCP/IP.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
42 de 55
14. ANO: 2015 BANCA: IESES RGO: IFC-SC PROVA: INFORMTICA SEGURANA E PROJETOS DE REDES
Em relao a implementao de redes e dispositivos do tipo SAN (Storage Area
Network) o que correto afirmar?
A Em funo de requisitos de performance, alguns protocolos como iSCSI e
Ethernet no podem ser utilizados.
B uma excelente alternativa para se utilizar em unidades de armazenamento
de dados distribudas. Em funo do seu baixo consumo de banda, podem ser
largamente utilizados em conexes WAN.
C Trata-se de uma tecnologia que vem perdendo aplicabilidade hoje em dia.
Outras tecnologias de armazenamento como DAS e NAS naturalmente a
substituem.
D Apresenta vantagens como: alto desempenho, alta disponibilidade, facilidade
de gerenciamento e reduo de custos operacionais em relao a outras
tecnologias de storage do gnero.
Comentrios: Vamos analisar cada uma das alternativas abaixo.
A. Alternativa incorreta. Utiliza principalmente os protocolos FC (e suas
variaes) e iSCSI.
16712855225
www.estrategiaconcursos.com.br
43 de 55
de
Gabarito: D
IV. So conhecidas como listas FIFO First In First Out. Pessoas organizadas
para entrar em um trem metropolitano um exemplo de funcionamento desta
estrutura.
V. utilizada para pesquisa em MS, quando os arquivos contm mais registros
do que a MP pode armazenar. uma estrutura de dados utilizada para
manuteno e organizao de arquivos, podendo ser utilizada para armazenar e
recuperar informaes que esto em grandes repositrios de dados.
As estruturas definidas nos itens de I a V so, respectivamente:
A Queues Heaps rvore Binria de Busca Pilhas rvore AVL.
B Pilhas Diretrios Heap Filas Tabelas Hashing.
C Queues Arquivos Lista Duplamente Encadeada Stacks Heap.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
44 de 55
Heaps
Queues
Tabelas
17. ANO: 2012 BANCA: FUNRIO RGO: MPOG PROVA: ANALISTA TECNOLOGIA DA INFORMAO
Sobre a organizao de arquivos de registros desordenados (Heap Files), usada
frequentemente em sistemas de gerenciamento de banco de dados, correto
afirmar que
A possvel usar pesquisa binria sobre campo chave.
B seus registros so armazenados em rvores-B.
C permite o uso de ndices primrios.
D requer uma funo de hashing externo.
E incluir um novo registro muito eficiente.
Comentrios: Quando tratamos da organizao de registro em arquivos tempos
basicamente 4 tipos segundo o silberchatz:
Organizao de arquivo heap: Nessa organizao, qualquer registro pode ser
colocado em qualquer lugar no arquivo onde haja mais espao para registro. No
h uma ordem de registro. Normalmente, h um nico arquivo para cada
relao.
Organizao de arquivo sequencial: Nessa organizao, os registros so
armazenados em ordem sequencial, baseada no valor da chave primria de cada
registro.
Organizao de arquivo hashing: Nessa organizao, uma funo hash
calculada sobre algum atributo de cada registro. O resultado da funo hash
especifica em qual bloco do arquivo o registro deve ser colocado.
16712855225
www.estrategiaconcursos.com.br
45 de 55
MI
PROVA:
ANALISTA
DE
consiste
em
como
seus
dados
esto
em blocos
www.estrategiaconcursos.com.br
46 de 55
www.estrategiaconcursos.com.br
47 de 55
21. ANO: 2015 BANCA: FCC RGO: CNMP PROVA: ANALISTA DO CNMP SUPORTE E INFRAESTRUTURA
Em um sistema de banco de dados relacional, os ndices representam um tipo de
estrutura de grande importncia. Considerando os tipos de ndices existentes,
correto afirmar que
A um ndice ordenado do tipo esparso no contm registros para todos os
valores da chave de busca.
B um ndice ordenado do tipo esparso ou denso no pode utilizar a chave
primria da tabela como chave de busca.
16712855225
C uma vez montado um ndice, esparso ou denso, ele no precisa mais ser
atualizado no decorrer do uso do banco de dados.
D quando um registro inserido em um ndice, ele deve permanecer at que a
tabela que originou o ndice seja excluda.
E um banco de dados com poucas tabelas no comporta os ndices chamados
multinvel.
Comentrios: ndices so estruturas de dados que recebem como entrada uma
propriedade de registro (um valor de um ou mais campos) e encontra os
registros com essa propriedade rapidamente. Portanto, os ndices so estruturas
auxiliares cujo nico propsito tornar mais rpido o acesso a registros
baseados em certos campos, chamados campos de indexao.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br
48 de 55
www.estrategiaconcursos.com.br
49 de 55
23. ANO: 2010 BANCA: CESPE RGO: TRT - 21 REGIO (RN) PROVA:
ANALISTA JUDICIRIO - TECNOLOGIA DA INFORMAO
Acerca de desempenho e otimizao de consultas SQL no SQL Server 2008,
julgue os itens de 63 a 69.
[1] Os ndices do tipo clustered determinam a ordem fsica dos dados em uma
tabela e mostram-se particularmente eficientes em colunas pesquisadas
frequentemente por uma faixa de valores ou quando o valor do registro nico
na tabela.
Comentrios: Dentre as estratgias de otimizao para bancos de dados os
ndices so os mais usados e atuam diretamente no sequenciamento dos dados
mapeados, criando links para as linhas das tabelas e aumentando a performance
das consultas.
Um ndice clusterizado determina a ordem em que as linhas de uma tabela so
armazenadas no disco. Se uma tabela tem um ndice clusterizado, no momento
de um INSERT as linhas dessa tabela sero armazenadas em disco na ordem
exata do mesmo ndice. Por exemplo, suponha que temos uma tabela chamada
Livro que tem uma coluna de chave primria livroID e que criamos um ndice
clusterizado para essa mesma coluna. Ao fazer isso, todas as linhas dentro da
tabela Livro sero fisicamente ordenadas (no disco atual em que esto inseridas)
atravs dos valores que esto na coluna livroID.
Isso implicar em um ganho enorme na performance das pesquisas, pois as
colunas da tabela estaro ordenadas na mesma ordem dos ndices clusterizados
por intermdio do modelo de armazenamento usado por esse tipo de ndice.
Baseado no que acabamos de explicar podemos marcar a alternativa como
correta.
Gabarito: C
16712855225
www.estrategiaconcursos.com.br
50 de 55
16712855225
www.estrategiaconcursos.com.br
51 de 55
25. ANO: 2015 BANCA: IESES RGO: IFC-SC PROVA: INFORMTICA BANCO DE DADOS
Qual das afirmaes a seguir uma caracterstica positiva atribuda ao uso de
ndices em banco de dados?
A Menor consumo de espao em disco para armazenamento dos dados.
B Garantia de integridade dos dados.
C Atribuio de um identificador nico para cada registro gravado.
D Melhor desempenho nas consultas s tabelas do banco de dados.
Comentrios: Algumas caractersticas dos ndices que ns conhecemos,
primeiramente eles melhoram o desempenho das consultas que tem como
referencias o (s) campo (s) utilizado (s) na construo do ndice. Outro ponto
que o arquivo de ndice precisa ser armazenado, esses vai ocupar um espao
extra diferente do arquivo de dados.
Os ndices no tm preocupao direta com a integridade dos dados, esses so
controlados pelo SGBD por meio da garantia das restries de integridade e do
controle de transaes. A identificao nica s tem guarida quando temos um
ndice denso, o que no verdadeiro para 100% dos casos.
Pelo exposto, temos nossa resposta na alternativa D.
Gabarito: D
26. ANO: 2015 BANCA: CESPE RGO: TCU PROVA: AUDITOR FEDERAL
DE CONTROLE EXTERNO - TECNOLOGIA DA INFORMAO
16712855225
www.estrategiaconcursos.com.br
52 de 55
STJ
PROVA:
ANALISTA
STJ
PROVA:
ANALISTA
www.estrategiaconcursos.com.br
53 de 55
Gabarito: B
16712855225
www.estrategiaconcursos.com.br
54 de 55
Consideraes finais
Chegamos, pois, ao final da nossa aula sobre organizao de arquivos,
mtodos de acesso, indexao e hashing! Este o primeiro assunto que
consideramos quando pensamos em um curso avanado de banco de dados. No
toa que ele est presente na primeira aula do curso de banco de dados
avanados.
Espero que voc esteja curtindo o assunto de banco de dados. Cada passo
dentro do assunto deve ser dado com segurana, portanto, no deixe de mandar
suas dvidas por um dos canais de atendimento do Estratgia.
Peo que depois de lerem esse material, tentem esgotar todas as questes
sobre o assunto de algum site de questes. Qualquer dvida pode postar no
frum aqui do Estratgia.
Thiago Cavalcanti
Referncias
Fiz uma lista com alguns links de referncias caso voc queria se
aprofundar um pouco.
i.
Sistemas de banco de dados Navathe, Elmari 6 edio.
ii.
Introduo a sistemas de banco de dados C.J. Date 8 edio.
iii.
Sistemas de banco de dados Silberchatz, Korth Sudarshan - 5
edio.
iv.
Texto sobre HD - http://www.infowester.com/hd.php
16712855225
www.estrategiaconcursos.com.br
55 de 55