Professional Documents
Culture Documents
Sumrio
Apresentao do professor ........................................................................................................... 2
Motivao para o curso .................................................................................................................. 3
Cronograma ........................................................................................................................................ 5
Fundamentos de Gesto do Conhecimento............................................................................ 6
1. Consideraes iniciais ..................................................................................................... 6
2. Introduo a gesto do conhecimento..................................................................... 6
3. Dado, informao, conhecimento e inteligncia. ................................................. 7
3.1. Conhecimento tcito e explcito ............................................................................ 11
4. Dados estruturados e no estruturados. .............................................................. 13
5. Dados Abertos ................................................................................................................. 15
Conceitos de Banco de Dados ................................................................................................... 18
6. Conceitos bsicos ........................................................................................................... 18
7. Caractersticas da abordagem de BD ..................................................................... 22
8. Personagem do ecossistema de BD ........................................................................ 26
Modelo de dados e arquitetura trs esquemas................................................................... 29
9. Modelo de Dados, instncias, esquemas............................................................... 29
10. Arquitetura trs esquemas ......................................................................................... 30
11. Ambiente do Sistema de banco de dados............................................................. 36
Questes comentadas da CESPE .......................................................................................... 40
Consideraes finais .................................................................................................................. 70
Referncias ....................................................................................................................................... 70
Apresentao do professor
Ol senhoras e senhores,
Frequento academia para manter a forma, mas meu hobby mesmo pedalar!
Decidi vender o carro e viver num desafio intermodal de transporte. Ia para o
trabalho de bike sempre que possvel! Ultimamente tenho usado mais Uber/Cabify
do que a magrela, mais isso um detalhe! A pergunta : onde eu trabalho? No
Banco Central do Brasil!
Agora que voc j me conhece! Vamos seguir em frente com o nosso curso!
Cronograma
Para proporcionar uma viso geral do assunto e fornecer uma linha de ao
para o estudo da matria dividimos o curso em seis aulas, sendo esta a aula 00.
A presente aula engloba a parte introdutria da matria apresentando os conceitos
de dados, informaes, conhecimento e inteligncia, bem com os termos de banco
de dados que subsidiam o entendimento do restante do contedo. As demais
aulas, seguindo a ementa do curso, so apresentadas abaixo e esto distribudas
como se segue:
Aula Contedo
1 Dado, informao, conhecimento e inteligncia. Dados
Aula 0 estruturados e no estruturados. Dados abertos. Conceitos de
banco de dados.
Aula 1 Bancos de dados Modelagem conceitual. Projeto de banco
de dados.
2 Banco de dados relacionais: conceitos bsicos e
Aula 2 caractersticas. Metadados. Tabelas, vises (views) e ndices.
Chaves e relacionamentos.
3 Noes de modelagem dimensional: conceito e aplicaes.
Aula 3 Coleta, tratamento, armazenamento, integrao (ETL) e
recuperao de dados.
4 Noes de minerao de dados: conceituao e
caractersticas. Modelo de referncia CRISP-DM. Tcnicas para
pr-processamento de dados. Tcnicas e tarefas de minerao
Aula 4 de dados. Classificao. Regras de associao. Anlise de
agrupamentos (clusterizao). Deteco de anomalias.
Modelagem preditiva. Aprendizado de mquina. Minerao de
texto.
Aula 5 5 Noes de Big Data: conceito, premissas e aplicao. 6
Visualizao e anlise exploratria de dados.
Definido o cronograma, vamos partir para o contedo da nossa aula
demonstrativa.
1. Consideraes iniciais
Esta o curso de Anlise de Informaes para o concurso do TCE-PE. Recebi
vrias crticas construtivas sobre como melhorar o material e tentei implant-
las aqui. Os objetivos vo alm de apresentar o contedo de forma sucinta,
necessrio discorrer sobre alguns exemplos prticos e usar um vocabulrio
simples.
Outra premissa importante a seguinte: fornecer ao aluno segurana para
resolver questes relativas ao contedo. Uma longa reflexo me trouxe algumas
ideias: trazer as questes mais recentes das bancas de concurso, em especial
do CESPE, apresentar exemplos reais do uso das tecnologias e procurar redigir
um texto enxuto e objetivo.
Fazer nosso aluno fixar o contedo com todos os conceitos e explicaes
necessrios para levar voc a marcar a alternativa correta! s isso que eu
desejo! E, assim, contribui para a sua aprovao!
Considero importante mencionar a presena das videoaulas, gravadas
exclusivamente para este concurso. Voc tem a opo de utilizar esse recurso
como complemento aos seus estudos, incrementando seu processo de
aprendizado. Se aps a leitura deste material, ainda existirem dvidas sobre o
assunto, use o frum disponvel no seu curso para expor seus questionamentos.
Teremos o maior prazer em responder!
Ajustar Avaliao
Conhecimento
Dados podem ser definidos como sucesses de fatos brutos, que no foram
organizados, processados, relacionados, avaliados ou interpretados,
representando apenas partes isoladas de eventos, situaes ou ocorrncias.
Constituem as unidades bsicas a partir das quais informaes podero ser
elaboradas ou obtidas.
Uma vez que dados tenham sido transformados em informaes, pelo menos
em uma interpretao inicial, possvel refinar as informaes mediante um
processo de elaborao. As informaes resultantes deste processo incluem
caractersticas adicionais do problema, geram hipteses, consequncias das
hipteses, sugerem solues para problemas, explanao e justificativas de
sugestes, crtica de argumentos, entre outras sadas. Portanto, a transformao
de dados em informaes deve ser vista simplificadamente, como um tipo de pr-
processamento de um processo de elaborao.
O nvel mais alto desta hierarquia a inteligncia, que pode ser entendida
como sendo a informao como oportunidade, ou seja, o conhecimento
contextualmente relevante que permite atuar com vantagem no ambiente
considerado. Tambm pode ser vista como o conhecimento que foi sintetizado e
aplicado a uma determinada situao, para ganhar maior profundidade de
conscincia da mesma.
[91] Existe uma estrutura baseada nas noes de qualidade versus quantidade,
classificando a informao em quatro nveis, na medida em que agregado valor
a cada nvel, e nos apresenta essa estrutura atravs da pirmide informacional,
dado, informao, conhecimento e inteligncia. Assim, explica que o atributo da
inteligncia mais de carter qualitativo que quantitativo, uma vez que depende
mais da qualidade da informao adquirida do que de sua quantidade, ao contrrio
dos dados, onde a quantidade de informao mais importante que sua qualidade
aparente. Desta forma a alternativa encontra-se correta.
Gabarito: E C.
Vamos tentar abstrair um pouco essa definio. Imagine uma tabela com
apenas duas colunas nome e telefone. O nome deve possuir no mximo 20
caracteres e o telefone deve ser um valor numrico de 9 algarismos. Veja que
para incluir um par, nome/telefone, nesta tabela voc deve respeitar o tipo e
tamanho dos campos.
4. Estrutura parcial apenas parte dos dados disponveis podem ter uma
estrutura.
1Um tipo de dados em uma linguagem de programao ou em um banco de dados so os domnios bsicos que podem ser
atribudos a cada uma das colunas de uma tabela. Os tipos de dados mais utilizados so os numricos e os de caracteres.
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 14 de 70
Anlise de Informaes TCE-PE
Prof. Thiago Rodrigues Cavalcanti Aula 00
5. Dados Abertos
Vejamos, a seguir, o que o governo federal tem a dizer sobre dados abertos.
O contedo foi extrado de http://dados.gov.br/dados-abertos/.
Alm disso, o grupo afirmou que a conformidade com esses princpios precisa
ser verificvel e uma pessoa deve ser designada como contato responsvel pelos
dados.
2 Valores nulos correspondem ao conjunto vazio. Suponha que um campo em uma tabela Excel no esteja preenchido, se
formos traduzir esse fato para uma tabela em um banco de dados relacional em deve ser preenchido com NULL ou nulo .
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 17 de 70
Anlise de Informaes TCE-PE
Prof. Thiago Rodrigues Cavalcanti Aula 00
6. Conceitos bsicos
No sei se voc se lembra, mas em matemtica existe um conjunto de
definies feitas por meio de axiomas ou postulados. Axiomas so verdades
inquestionveis, universalmente vlidas, utilizadas como princpios para a
construo de uma teoria ou como base para uma argumentao lgica. Como
exemplo de axiomas podemos citar os princpios na Geometria Euclidiana Clssica.
O que quero mostrar que, em qualquer cincia, o entendimento completo
do seu contedo deve se basear nos conceitos fundamentais. Nossa primeira aula
comea focada nesses conceitos. Quando iniciamos nosso estudo, precisamos ter
a capacidade de responder a seguinte pergunta: o que banco de dados? Voc
j consegue definir esse termo e suas principais caractersticas?
Se voc ainda no tem o entendimento perfeito do que seria um banco de
dados, nosso objetivo agora construir o conceito. Uma forma tradicional de
definir banco de dados comear entendendo o significado das palavras que
compe o termo: Banco e dados.
Banco tem diversas definies possveis no dicionrio da lngua portuguesa.
Dentre elas a que melhor se encaixa no nosso contexto um conjunto organizado
e categorizado de objetos, por exemplo, podemos ter um banco de fotografias ou
um banco de leite.
Dados so fatos conhecidos que podem ser registrados e possuem um
significado implcito. Esse conceito, porm, um pouco amplo e abstrato para
nosso intuito. Quando reduzimos o escopo tecnologia da informao, temos um
conceito mais adequado para dado. Ele a representao fsica de um evento no
tempo e espao que no agrega fundamento ou significado para quem o sente ou
recebe. , basicamente, um registro!
Imagine que eu fale para voc por 32260436, cinco, teste, Thiago. Voc
vai pensar, o professor est ficando louco! Mas em um banco de dados, esses
registros so armazenados e chamados de dados. Para representarem uma
informao eles precisam de um contexto associado. Se pensarmos em uma
agenda telefnica o nmero 32260436 pode ser o telefone de Thiago.
Agora que temos o entendimento dos termos vamos partir para a definio
do banco de dados.
O primeiro conceito bsico voc j dever ter entendido. Voc no deve ter
dvidas sobre o que seria um banco de dados. Vamos agora entender a diferena
entre banco de dados, sistemas de gerenciamento de banco de dados
(SGBD) e sistemas de banco de dados (SBD). So trs conceitos diferentes
para os autores dos livros tericos sobre o assunto. Para entender essas diferenas
peo que voc observe a figura a seguir:
Controle de
transaes
Ajuste/ Segurana de
Tunning acesso
SGBD
Controle de Recuperao
concorrncia aps falha
7. Caractersticas da abordagem de BD
Segundo Navathe, so quatro, as principais caractersticas da abordagem de
banco de dados que a fazem sobressair em relao s abordagens de
processamento de arquivo.
Vejam que a lista acima pode ser caracterizada como uma enumerao e,
como eu sempre digo, listas fazem parte do rol de questes de prova de concurso.
Seja qual for a matria, sempre gaste um pouco do seu tempo lendo, mais de
uma vez, cada uma das listas pertencentes aos assuntos. A verdade : no
importa o grau de relevncia dentro do assunto, um examinador preguioso
sempre est propcio a utilizar deste artifcio ao elaborar uma questo.
3 SQL uma linguagem declarativa usada para enviar comandos aos sistemas de gerenciamento de banco de dados. Esses
comandos permitem a criao de tabelas e a manipulao dos dados armazenados. Na criao da tabela podemos observar
a definio dos tipos de dados (VARCHAR2, DATE, NUMBER), bem como das restries de integridade (NOT NULL, DEFAULT).
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 23 de 70
Anlise de Informaes TCE-PE
Prof. Thiago Rodrigues Cavalcanti Aula 00
Compartilhamento de dados
Transaes
4. Problemas de integridade
5. Problemas de atomicidade
7. Problemas de segurana
8. Personagem do ecossistema de BD
Quando tratamos de grandes organizaes, as atividades relacionadas a
banco de dados devem ser compartilhadas entre diferentes pessoas. Trataremos
agora dos dois principais papis dentro desse processo: o administrador de banco
de dados (DBA) e o administrador de dados (AD).
ento vises para cada grupo de usurios. Podemos listar ainda como atribuies
do AD:
D anlise de sistemas.
E gerncia de sistemas.
Comentrio: Percebam que a questo trata da padronizao dos dados
corporativos. Entender a organizao e sua relao com as informaes de forma
a gerenciar os dados de maneira eficiente reponsabilidade da equipe de
administrao de dados. Hoje em dia um termo muito utilizado para os dados
que permeiam vrios setores das empresas ou rgos pblicos o conceito de
dados mestres. Eles so armazenados em um repositrio central e distribudos
aos diversos usurios.
Gabarito: B.
De uma forma simples, cada um dos nveis possui uma funo dentro das
suas respectivas abstraes. O nvel de viso do usurio determina a parte em
que o usurio tem acesso. O nvel conceitual identifica os dados armazenados e
suas relaes. Por fim, o nvel fsico o nvel mais baixo de abstrao, define a
maneira como os dados esto armazenados. Vejamos mais algumas questes
sobre o assunto:
10. Ano: 2016 Banca: CESPE rgo: TCE-PA Prova: Auditor de Controle
Externo - rea Informtica - Administrador de Banco de Dados
Com relao a sistemas gerenciadores de bancos de dados (SGBD), julgue o
prximo item.
No nvel conceitual da arquitetura de trs camadas de banco de dados, cada
esquema externo descreve a parte do banco que interessa a determinado grupo
de usurios e oculta desse grupo o restante do banco de dados.
Comentrio: Perceba que essa questo apresenta uma casca de banana das mais
malvadas. Ele mistura o nvel conceitual da arquitetura em trs esquemas com o
nvel externo. Sabemos que os esquemas externos esto associados as diferentes
vises dos grupos de usurios. Tal fato reflete os interesses distintos de cada
grupo quanto ao acesso as informaes do banco de dados. Assim, podemos
marcar nosso gabarito como errado.
Gabarito: E.
12. Ano: 2010 Banca: FGV rgo: BADESC Cargo: Analista de Sistemas
Os objetivos dos compiladores DDL, DML e DCL so, respectivamente:
A) criar os objetos do banco de dados, manipular (recuperao, insero, remoo
e alterao) de dados nos objetos criados pela DDL e fornecer privilgio de acesso
s informaes.
B) fornecer privilgio de acesso s informaes, criar os objetos do banco de dados
e manipular (recuperao, insero, remoo e alterao) de dados nos objetos
criados pela DDL.
C) manipular (recuperao, insero, remoo e alterao) de dados nos objetos
criados pela DML, criar os objetos do banco de dados e fornecer privilgio de
acesso s informaes.
D) fornecer privilgio de acesso s informaes, manipular (recuperao,
insero, remoo e alterao) de dados nos objetos criados pela DDL e criar os
objetos do banco de dados.
E) criar os objetos do banco de dados, fornecer privilgio de acesso s informaes
e manipular (recuperao, insero, remoo e alterao) de dados nos objetos
criados pela DDL.
Comentrio: Vimos que o compilador DDL permite que o DBA emita comandos
para a criao dos objetos do banco de dados, esses vo fornecer informaes
sobre as estruturas das tabelas como atributos e restries. O compilador DML
responsvel por transformar o cdigo SQL para manipulao dos dados
armazenados.
Por fim, temos o Data Control Language DCL, essa parte da linguagem SQL
vai permitir aos administradores de banco de dados a distribuio de privilgios
de acesso sobre a base de dados. Com essa informao, podemos marcar
tranquilamente a resposta na alternativa A.
Gabarito: A.
Espero que voc tenha entendido nossa proposta de apresentar o ambiente
do SGBD. Acabamos aqui o nosso primeiro conjunto de assuntos tericos
envolvidos na introduo dos sistemas de bancos de dados. Vamos agora falar um
pouco sobre modelagem conceitual.
13. Ano: 2017 Banca: CESPE rgo: SEDF Cargo: Analista de gesto
educacional Especialidade: tecnologia da informao Questo: 109
Julgue os itens seguintes, a respeito de estruturas em programao e de
arquiteturas de bancos de dados.
[109] O esquema do nvel externo de uma arquitetura de trs esquemas oculta
os detalhes das estruturas de armazenamento fsico e se concentra na descrio
de entidades, tipos de dados, conexes, operaes de usurios e restries.
Comentrio: O objetivo da arquitetura trs esquemas separar as aplicaes do
usurio do banco de dados fsico. So trs nveis:
Nvel interno: tem um esquema interno, que descreve a estrutura do
armazenamento fsico do banco de dados. O esquema interno usa um modelo
de dados fsico e descreve detalhes completos do armazenamento de dados.
Nvel conceitual: tem esquema conceitual, que descreve a estrutura do banco
de dados inteiro para uma comunidade de usurios. Oculta detalhes das
estruturas de armazenamento fsico e se concentra na descrio das entidades,
tipos de dados, relacionamentos, operaes e restries. Um modelo
representativo usado para descrever o esquema conceitual.
Nvel externo ou de viso: inclui uma srie de esquemas externos ou vises
do usurio. Cada esquema externo descreve a parte do banco de dados em
que um grupo de usurios em particular est interessado e oculta o restante
do banco. Como o nvel anterior, cada esquema externo implementado por
um modelo de dados representativo.
Aps analisarmos as afirmaes tericas acima, podemos concluir que a
alternativa 109 da prova do SEDF est incorreta.
Gabarito: E.
Gabarito: C.
Sua principal desvantagem est no alto custo, pois exige ambiente especial para
mainframes e solues centralizadas.
Sistemas de Computador Pessoal - PC: Os computadores pessoais trabalham
em sistemas stand-alone, ou seja, fazem seus processamentos sozinhos. No
princpio esse processamento era bastante limitado, porm, com a evoluo do
hardware, hoje temos PCs com grande capacidade de processamento. Eles
utilizam o padro Xbase e quando se trata de SGBDs, funcionam como
hospedeiros e terminais. Desta maneira, possuem um nico aplicativo a ser
executado na mquina. A principal vantagem desta arquitetura a simplicidade.
Banco de Dados Cliente-Servidor: Na arquitetura Cliente-Servidor, o cliente
(front_end) executa as tarefas do aplicativo, ou seja, fornece a interface do
usurio (tela, e processamento de entrada e sada). O servidor (back_end)
executa as consultas no DBMS e retorna os resultados ao cliente. Apesar de ser
uma arquitetura bastante popular, so necessrias solues sofisticadas de
software que possibilitem: o tratamento de transaes, as confirmaes de
transaes (commits), desfazer transaes (rollbacks), linguagens de consultas
(stored procedures) e gatilhos (triggers). A principal vantagem desta arquitetura
a diviso do processamento entre dois sistemas, o que reduz o trfego de dados
na rede.
Banco de Dados Distribudos (N camadas): Nesta arquitetura, a informao
est distribuda em diversos servidores. Como exemplo, observe a abaixo. Cada
servidor atua como no sistema cliente-servidor, porm as consultas oriundas dos
aplicativos so feitas para qualquer servidor indistintamente. Caso a informao
solicitada seja mantida por outro servidor ou servidores, o sistema encarrega-se
de obter a informao necessria, de maneira transparente para o aplicativo, que
passa a atuar consultando a rede, independente de conhecer seus servidores.
Exemplos tpicos so as bases de dados corporativas, em que o volume de
informao muito grande e, por isso, deve ser distribudo em diversos
servidores. Porm, no dependente de aspectos lgicos de carga de acesso aos
dados, ou base de dados fracamente acopladas, em que uma informao solicitada
vai sendo coletada numa propagao da consulta numa cadeia de servidores. A
caracterstica bsica a existncia de diversos programas aplicativos consultando
a rede para acessar os dados necessrios, porm, sem o conhecimento explcito
de quais servidores dispem desses dados.
Gabarito: A.
30. Ano: 2015 Banca: Quadrix rgo: COBRA Tecnologia S/A (BB)
Cargo: Analista de Operaes
Observe as seguintes afirmaes sobre modelagem de dados.
I. O modelo conceitual um diagrama em blocos que demonstra todas as relaes
entre as entidades, suas especializaes, seus atributos e autorrelaes.
II. O modelo lgico mostra as ligaes entre as tabelas de banco de dados, as
chaves primrias, os componentes de cada uma, etc. Frequentemente
apresentado em um diagrama.
III. Inclui a anlise das caractersticas e recursos necessrios para
armazenamento e manipulao das estruturas de dados (estrutura de
armazenamento, endereamento, acesso e alocao fsica), sendo uma sequncia
de comandos executados em SQL a fim de criar as tabelas, estruturas e ligaes
projetadas at ento e finalmente criar o banco de dados. Tal modelo no precisa
existir caso o modelo conceitual j tenha sido feito.
correto o que se afirma em:
A) I e II, somente.
B) II e III, somente.
C) II, somente.
D) III, somente.
E) todas
Comentrio: De acordo com a abordagem, os modelos de dados normalmente
so classificados da seguinte forma: Conceitual, Lgico e Fsico. A nica
afirmao errada a III, quando diz o seguinte: "Tal modelo no precisa existir
caso o modelo conceitual j tenha sido feito."
No modelo fsico desenvolvemos a modelagem fsica do modelo de banco de
dados. Neste caso, leva-se em conta as limitaes impostas pelo SGBD escolhido
e deve ser criado sempre com base nos modelos de dados produzidos no projeto
lgico.
Gabarito: A.
31. Ano: 2015 Banca: Quadrix rgo: CFA Cargo: Analista de Sistemas
32. Ano: 2015 Banca: Quadrix rgo: CFA Cargo: Analista de Sistemas
Assinale a alternativa que apresenta as palavras que preenchem,
respectivamente, as lacunas do seguinte texto, sobre os nveis de independncia
de um banco de dados relacional.
A independncia fsica de dados a habilidade de se modificar o esquema _______
sem a necessidade de rescrever o modelo conceituai, enquanto a independncia
________ de dados a habilidade de se modificar o esquema _______ sem a
necessidade de reescrever as aplicaes.
A) fsico; lgica; conceitual
B) lgico; fsica; conceitual
C) lgico; lgica; conceitual
D) conceitual; lgica; lgico
Gabarito: B.
Gabarito: A.
Gabarito: A.
48. BANCA: BIO RIO ANO: 2014 RGO: EMGEPRON PROVA: ANALISTA
DE SISTEMAS - BANCO DE DADOS
O conceito da arquitetura de trs camadas que define a capacidade de alterar o
esquema em um nvel do sistema de banco de dados sem ter de alterar o esquema
no nvel mais alto denominado independncia de:
A dados
B esquema
C instncia
D atualizao
Comentrio: Quando estudamos a arquitetura em trs esquemas definimos o
conceito de independncia dos dados. Basicamente, ele se refere a capacidade de
alterar um esquema em um determinado nvel da arquitetura, sem a necessidade
de alterar o esquema no nvel superior. Identificamos a existncia da
independncia de dados lgica, que uma caracterstica do nvel conceitual da
arquitetura ANSI/SPARC e a independncia de dados fsica que feita sobre o
nvel interno da arquitetura.
Gabarito: A.
49. BANCA: BIO RIO ANO: 2014 RGO: EMGEPRON PROVA: ANALISTA
DE SISTEMAS - BANCO DE DADOS
A arquitetura em trs esquemas em um sistema de banco de dados, tambm
denominada de ANSI/SPARC, tem por objetivo:
A controlar a redundncia nas tabelas
B manter a disponibilizao dos dados para os usurios
C separar as aplicaes do usurio do banco de dados fsico
Prof. Thiago Rodrigues Cavalcanti
www.estrategiaconcursos.com.br 68 de 70
Anlise de Informaes TCE-PE
Prof. Thiago Rodrigues Cavalcanti Aula 00
Consideraes finais
Thiago Cavalcanti
Referncias
Fiz uma lista com alguns links de referncias caso voc queria se aprofundar
um pouco.
i. Fundamentals of Database Systems - Ramez Elmasri, Sham Navathe
Addison-Wesley, 2011 - Computers - 1172 pages
ii. Introduo a sistemas de bancos de dados - By C. J. Date - Elsevier
Brasil, 2004 - 865 pages
iii. Sistema de Banco de Dados - Abraham Silberschatz, Henry F. Korth,
S. Sudarshan - Editora: ELSEVIER BRASIL