Professional Documents
Culture Documents
Objetivos
Ao finalizar este módulo o participante:
Recordará os conceitos básicos de um sistema OLTP
com seus exemplos.
Compreenderá as características de um Data
Warehouse junto com seus componentes.
Reconhecerá a necessidade dos processos de
extração, transformação e carga de dados (ETL) que
permitem alimentar as tabelas auxiliares que suportarão
a estrutura multidimensional.
Conhecerá as diferenças entre um sistema transacional
e um Data Warehouse.
Compreenderá o termo OLAP e a sua relação com a
navegabilidade da informação.
Conhecerá as transformações necessárias para montar
um DW a partir de um Banco de Dados Operacional.
Introdução
Para desenvolver um Data Warehouse, devemos considerar uma série de
pautas que deverão estar alinhadas com os objetivos do negócio e os fatos que
precisam ser analisados, incluindo o alcance do sistema, a granularidade dos
dados e a navegabilidade desejada.
Devem ser identificadas as origens dos dados para selecioná-los, depurá-los,
transformá-los e importá-los.
Página 1 de 16
Conteúdo do módulo
2.1 Sistema Transacional (OLTP)
2.1.1 Características
2.1.2 Usos comuns de sistemas OLTP
2.2 Sistemas OLAP
2.2.1 Bancos de Dados (Estruturas)
2.2.2 Usos Comuns de sistemas OLAP
2.3 Dados de Origem X Informações do Negócio
2.3.1 Convertendo Dados em Informações
2.3.2 Extração, transformação e carga de dados – ETL
Página 2 de 16
Relações (ou Relacionamentos): vínculos existentes entre as tabelas
que servem para garantir a integridade referencial.
Sistema OLTP
Imaginemos estar diante de um Sistema de Caixas
Eletrônicos. O sistema, ao ser operado por um cliente,
passará pelas seguintes situações:
Receber o cartão do Cliente.
Validar o Cliente. Consultar no Banco de Dados se o
Cliente existe e, se existir, confirmar que está em uma
linha de caixas habilitada.
Autenticar o cliente no sistema.
Se desejar realizar uma transferência:
Verificar se apresenta autorização para realizá-la.
Verificar se apresenta saldo.
Inicializar a transferência tratando-a como uma
transação.
Emitir comprovante.
Despedir-se do Cliente.
Página 3 de 16
A situação em um Sistema de Vendas através de um Site
seria a seguinte:
Validar o cliente e autenticá-lo no sistema.
Aceitar o pedido.
Controlar os limites de crédito.
Informar os valores parciais da compra e acumulados.
Confirmação do cliente antes de enviar o pedido.
Enviar o pedido.
Descontar as quantidades vendidas do estoque.
Informar o número da venda e a data de entrega.
Despedir-se do cliente.
Página 4 de 16
As organizações precisam então registrar as transações ocorridas durante seus
processos operacionais, para controle e consulta posterior.
Um sistema OLTP é utilizado em:
Sistemas bancários
Processamento de pedidos
Comércio eletrônico
Sistemas de faturamento
Sistemas de estoque
Página 5 de 16
Os cubos OLAP armazenam vários níveis de dados formados por
estruturas altamente otimizadas que atendem às expectativas de
negócio da empresa.
Um sistema OLAP está preparado para realizar relatórios complexos de
uma forma simples.
O OLAP proporciona uma visão multidimensional dos dados. Os cubos
oferecem uma visão multidimensional dos dados que vai além da análise
de duas dimensões, oferecida por uma simples planilha de cálculo
utilizada como tal.
Os usuários podem modificar facilmente as filas, as colunas e as
páginas nos relatórios do OLAP, sendo possível visualizar a informação
da forma que seja mais conveniente para análise.
Um Sistema OLAP
Os sistemas OLAP representam uma solução que retorna
respostas rápidas para as consultas realizadas.
A partir de sistemas OLAP podem ser obtidos relatórios de
negócios sobre Vendas ou Marketing, entre outros.
OLAP em EIS
Alertas.
Tomada de decisões.
Página 6 de 16
previsões. Os analistas financeiros utilizam sistemas OLAP
extensivamente para análise de dados financeiros e operacionais para
responder as perguntas dos superiores.
OLAP no Marketing
Análise de Produtos.
Análise de Clientes.
Análise de Faturamento.
Página 7 de 16
dados originais nos sistemas transacionais até que os usuários possam utilizar
essa informação. Ele indica qual parte destes processos cada módulo cobrirá.
Página 8 de 16
O ambiente operacional é orientado a aplicativos e funções (vendas,
faturamento, estoque, etc.). O banco de dados combina os processos em uma
estrutura que responde às necessidades das regras do negócio.
Entretanto, em um Data Warehouse estes elementos são orientados a sujeitos
(vendedores, produtos, filiais, etc.).
Após reconhecer a análise do negócio como um valor significativo para uma
organização, as solicitações dos dados e da informação tornam-se numerosas
e freqüentes.
Satisfazer estas solicitações pode ser uma tarefa muito complexa em um
sistema OLTP, sendo necessário procurar entre grandes quantidades de dados
obtidos de diferentes fontes, tentando selecionar, adequar e consolidar a
informação. Em um sistema OLAP, estes pontos são resolvidos de uma só vez,
na etapa de design.
ETL
Os diferentes processos concentrados no conceito de extração,
transformação e carga de dados em um Data Warehouse
denomina-se ETL, em inglês Extract – Transform – Load.
Página 9 de 16
É comum que os sistemas OLTP das organizações tenham sido desenvolvidos
por diferentes equipes de programadores ou empresas de software e, que no
seu desenvolvimento, tenham adotado diferentes convenções na codificação
de variáveis, nomes dos atributos das tabelas, diferentes tipos de dados ou
formatos de datas.
Ao reunir dados dos diferentes sistemas deve ser definida uma norma única
para o Data Warehouse e realizar as transformações necessárias em cada
caso. Basicamente devem ser realizadas as seguintes tarefas:
Estabelecer as regras que serão utilizadas para realizar a
transformação.
Detectar as inconsistências que podem ocorrer ao extrair dados de
diferentes fontes.
Planejar cuidadosamente e com detalhes a transformação dos dados,
que ofereçam como resultado final conjuntos de dados consistentes.
Aplicação A: M e F
Aplicação B: 1 e 0 M–F
Página 10 de 16
Operacional Data Warehouse
Aplicação A: Litros
Aplicação C: Decilitros
Aplicação A: aaaa/mm/dd
Aplicação C: dd/mm/aaaa
Página 11 de 16
Uma coluna para vários: Os sistemas mais antigos
costumavam colocar o tipo e número de documento no
mesmo campo da tabela. Em um DW é possível que
seja necessário colocar o tipo de documento em um
campo e o número de documento em outro.
Granularidade
Página 12 de 16
Por contar com o plano de trabalho desenvolvido segundo as regras de
transformação, colhemos os dados do sistema OLTP e os importamos dentro
da nossa área de dados. Utilizaremos tabelas auxiliares para armazenar os
dados de origem para ajudar durante a transformação.
Página 13 de 16
Estudo de Caso
Relevando os Requerimentos
No Módulo 1 identificamos as necessidades da Contoso e quais fatores
deseja analisar para a tomada de decisões.
Agora devemos identificar de que forma, através das aberturas e das
medidas, vamos medir os fatos que a empresa precisa analisar.
Levando em consideração que cada ponto mencionado nos requerimentos
está relacionado às vendas da empresa, podemos dizer que o fato do nosso
Data Warehouse será, justamente, as Vendas.
Começaremos analisando cada necessidade e qual é a dimensão ou medida
que deverá ser criada para satisfazê-la. Depois, deve ser desenvolvida uma
tabela onde será resumida a informação obtida. Esta tabela será utilizada na
etapa de design.
Página 14 de 16
produto (com a possibilidade de obter o detalhe por produto), por
cidade, por mês, para os últimos 13 meses (para detectar paradas).
Verificamos que é necessário analisar os produtos de acordo com a sua
categoria e os clientes que os adquiriram. A partir daqui se faz necessária
uma nova dimensão chamada Clientes e que os produtos sejam agrupados
por Categoria de Produtos, definindo um nível na dimensão Produto.
Premiar anualmente os vendedores que ultrapassem os objetivos de
venda atribuídos. A análise, neste caso, deverá incluir os vendedores,
as vendas realizadas, os objetivos de venda e o indicador de
cumprimento detalhados por mês para o ano fiscal (O prêmio será
diferente se forem atingidos os objetivos globais para o ano ou se, além
disso, forem atingidos os objetivos em todos os meses em particular).
Sobre estes requerimentos, devemos acrescentar apenas a dimensão
Vendedor, pois as medidas utilizadas serão as mesmas destacadas
anteriormente.
Levando em consideração que a empresa chega aos clientes tanto através
dos supermercados quanto dos hipermercados, poderia ser muito útil realizar
a análise de cada uma das medidas por Tipo de Filial.
Todo Data Warehouse contém informação histórica que a empresa analisará
para diferentes períodos, então, acrescentaremos mais uma dimensão
denominada Tempo.
É comum que seja necessário analisar as vendas obtendo a sua média.
Portanto, vendo esta possível necessidade, seria conveniente desenvolver a
medida Vendas Unidades Média.
Para ver a informação obtida nas análises de uma forma mais clara e
compreensível, é conveniente elaborar uma tabela de entrada dupla onde
colocaremos nas linhas as medidas e nas colunas as dimensões. Nas
intersecções de linhas e colunas, colocaremos uma cruz se é necessário ver a
medida por essa dimensão.
Fato a medir: Venda de Produtos
Dimensões
Medidas Tempo Filial Vendedor Cliente Produto
Vendas_Valor X X X X X
Vendas_Custo X X X X X
Vendas_Unidades X X X X X
Vendas_ValorTotal X X X X X
Vendas_Lucro X X X X X
Vendas_Média X X X X X
Página 15 de 16
É possível compreender mais profundamente a
estrutura de um sistema OLTP.
Foi compreendido onde é utilizado um sistema OLTP.
Foi demonstrado de que forma é estruturado um
sistema OLAP.
Foi abordado em detalhes em quais áreas um sistema
OLAP é utilizado.
Foram abordadas as inconsistências que podem
ocorrer quando um sistema OLAP é alimentado a
partir de um sistema operacional (OLTP).
É possível compreender como transformar os dados
antes de chegar ao sistema OLAP.
Página 16 de 16