Professional Documents
Culture Documents
Anlise de dados
3 Introduo
13 Concluso
15 Sobre o autor
Introduo
INTRODUO
A anlise de dados tem sido uma habilidade cada vez mais requisitada no mercado de trabalho. A quantidade de dados
disponveis enorme, mas poucas pessoas conseguem transform-los em insights para decises de negcios. Muitas vezes
isso acontece porque as pessoas no sabem qual grfico utilizar em cada uma das situaes que lhes so apresentadas.
4
Como feita uma boa
anlise de dados?
Como feita uma boa anlise de dados?
6
Como feita uma boa anlise de dados?
7
Execute a anlise
Comece avaliando a presena de outliers e investigue a razo da ocorrncia desses valores atpicos ou discrepantes.
Caso eles existam, o que voc far? Eles realmente fazem parte da populao em estudo ou so erros de digitao?
Essa uma fase que nos ajuda a fazer uma limpeza dos dados, deixando-os prontos para a anlise.
8
Como feita uma boa anlise de dados?
Com os dados preparados para a anlise, comece respondendo s perguntas iniciais. Para cada grfico preparado,
anote os aprendizados. Lembre-se de que a anlise iterativa, ou seja, as respostas s perguntas iniciais levam
formulao de novas perguntas e esse ciclo segue-se diversas vezes.
Faa um compilado com os principais grficos e resultados. Discuta com outras pessoas. Veja se aparecem novas
dvidas e volte anlise.
Lembre-se de que a qualidade visual importante, assim, faa ajustes nos eixos e legendas
dos grficos para que esses fiquem claros e visveis para sua audincia, mas cuidado para
no rebuscar demais, evitando que as concluses sejam de difcil compreenso quanto
menos tinta melhor!
importante pontuar que preciso desenvolver a habilidade de interpretao grfica. possvel fazer um paralelo
com mdicos que se especializam em interpretar exames como ressonncia magntica. Para uma pessoa que no
foi treinada, provavelmente seja impossvel entender esse tipo de informao. Com os grficos tambm preciso
treino e, por essa razo, colocamos as nossas interpretaes em cada grfico dos exemplos, para ajud-lo a
desenvolver essa habilidade.
9
Conceitos iniciais
para suportar uma
boa anlise de dados
Conceitos iniciais para suportar uma boa anlise de dados
A Estatstica um conjunto de conceitos e tcnicas, utilizado no planejamento da coleta e na anlise de dados, com
o objetivo de resolver problemas reais. Claramente, cientistas, engenheiros, economistas e outros profissionais esto
envolvidos com essas atividades e, portanto, necessitam utilizar a Estatstica. Alm disso, de uma forma ou de outra,
todas as pessoas so afetadas pelo uso da Estatstica. Cada vez mais rgos governamentais e empresas baseiam as
prprias decises, as quais afetam o dia a dia das pessoas, em anlises estatsticas, o que faz com que no apenas
profissionais tenham de adquirir algum conhecimento dessa tcnica.
O que torna essa disciplina de grande utilidade, e nica, que a aplicao dela ocorre em
situaes ou processos em que a incerteza e a variabilidade esto presentes.
Um processo definido como uma combinao de pessoas, materiais, procedimentos, mtodos, polticas e meio
ambiente, cujos elementos integrados formam uma srie de aes que conduzem a determinado resultado. Em
nosso caso, o resultado um produto ou servio. Para avaliar a utilidade de um produto para o consumidor, variveis
so medidas no produto. Dois itens produzidos nas mesmas condies no so, em geral, idnticos, com respeito s
variveis consideradas. Existe uma variabilidade inerente em cada processo.
11
Conceitos iniciais para suportar uma boa anlise de dados
12
Conceitos iniciais para suportar uma boa anlise de dados
Para avaliar a performance do processo e a qualidade do que se est produzindo, preciso dados sobre o processo ou
o produto. Os dados devem ser analisados, e as decises devem ser feitas com respeito ao processo, alm de que elas
devem ser tomadas na presena de variabilidade. A Estatstica a ferramenta adequada para se planejar a coleta de
dados, que sejam relevantes para o problema em estudo, bem como para a anlise.
Tipos de dados
Antes de realizar qualquer anlise, preciso entender qual o tipo de dado que est na sua frente. Quando queremos
colocar um prego na parede utilizamos um martelo, j quando queremos apertar um parafuso podemos usar uma
chave de fenda. Da mesma forma, dependendo do tipo de varivel que coletamos, iremos utilizar uma ferramenta
grfica diferente. Em termos gerais, os dados podem ser de trs tipos, como voc pode observar a seguir.
Contagem: os resultados so nmeros inteiros (nmero de riscos em uma pea, nmero de acidentes no ms,
nmero de cursos vendidos).
Contnuos: os resultados podem ser quaisquer nmeros dentro de um intervalo (peso, comprimento, gasto mensal).
13
Quando, como e
exemplos para grficos
Quando, como e exemploS para grficos
Com esses conceitos em mente, confira em seguida nossas dicas para voc construir e analisar grficos.
Voc perceber que fcil!
Histograma
15
Quando, como e exemploS para grficos
16
Quando, como e exemploS para grficos
Boxplot
17
Quando, como e exemploS para grficos
Exemplo 1: Na figura, a
seguir, voc encontra todas
as informaes apresentadas
em um Boxplot.
18
Quando, como e exemploS para grficos
O centro da distribuio indicado pela linha da mediana (alguns softwares estatsticos tambm representam a mdia
com um smbolo, nesse caso o +). A disperso representada pela altura do retngulo (Q3 Q1), no qual Q3 o terceiro
quartil e Q1 o primeiro quartil. O retngulo contm 50% dos valores do conjunto de dados. A posio da linha mediana no
retngulo informa sobre a assimetria da distribuio. Uma distribuio simtrica teria a mediana no centro do retngulo,
bem prxima mdia no exemplo anterior, o conjunto de dados foi assimtrico. Se a mediana prxima de Q1, ento, os
dados so positivamente assimtricos. Se a mediana prxima de Q3, os dados so negativamente assimtricos.
O comprimento das linhas fora do retngulo (algumas vezes chamadas de whisquers) informam sobre a cauda da distribuio.
Uma utilidade muito importante do Boxplot na comparao grfica de dois ou mais grupos. Nesse caso, o Boxplot
prefervel ao histograma. Essa comparao pode ser feita desenhando-se os Boxplots para cada conjunto de dados,
paralelamente, em um mesmo grfico.
19
Quando, como e exemploS para grficos
20
Quando, como e exemploS para grficos
Grfico de disperso
Quando utilizar: quando queremos estudar a relao entre duas variveis numricas. O
objetivo responder pergunta: a varivel X influencia a varivel Y? Se conseguirmos entender
como ocorre a relao entre as variveis, pode ser possvel propor novos direcionamentos para
um negcio. Por exemplo, podemos descobrir que o tempo para responder a uma proposta
influencia negativamente a chance de sucesso na venda e, com isso, redesenhar as atividades
da rea comercial de modo a diminuir esse tempo de envio de propostas.
Forma: a relao linear (pode ser aproximada por uma reta) ou no linear.
21
Quando, como e exemploS para grficos
22
Quando, como e exemploS para grficos
Alm do grfico, podemos tambm utilizar o Coeficiente de Correlao Linear, que mede o grau de associao entre
duas variveis. Esse coeficiente pode ter valores entre -1 e 1.
Quanto mais prximo de 1 ele estiver, maior ser a relao positiva, e quanto mais
prximo de -1, maior a relao negativa entre as variveis X e Y.
Cuidado especial deve ser tomado em relao a possveis relaes esprias ou viciadas.
23
Quando, como e exemploS para grficos
Grfico de Pareto
24
Quando, como e exemploS para grficos
25
Quando, como e exemploS para grficos
Nesse caso, a anlise do grfico de Pareto permitiu empresa identificar quais eram os defeitos mais recorrentes
e, assim, priorizar a soluo dos problemas relacionados no selagem do topo, no selagem do fundo e no
selagem lateral.
Vamos utilizar esse exemplo para entender como encontrar as categorias vitais. Para isso,
observe a linha azul, que mostra o percentual acumulado.
Perceba, no exemplo analisado, que da primeira para a segunda barra acontece um grande salto.
Da segunda para a terceira barra tambm ocorre um grande salto.
A partir da terceira barra os saltos ficam quase do mesmo tamanho e, com isso, podemos
concluir que encontramos as categorias vitais: as representadas pelas trs primeiras barras.
26
Quando, como e exemploS para grficos
Grfico de tendncia
27
Quando, como e exemploS para grficos
20
fcil perceber, pelo grfico, que houve
15 uma melhoria no indicador entre os meses
10 8 e 9, causando reduo no percentual de
entregas atrasadas.
5
28
Quando, como e exemploS para grficos
29
Quando, como e exemploS para grficos
A situao ideal a que denominamos anlise prospectiva. Quando iniciamos um projeto, coletamos dados do
indicador de um perodo anterior (em geral em torno de 10 pontos suficiente). Colocamos esses pontos em um Grfico
de Tendncia e tentamos avaliar se no h evidncia para rejeitar que o indicador estava estvel no perodo (ateno
para o detalhe: se no h evidncia para rejeitar e no se h evidncia para aceitar stil).
Se no h evidncia para rejeitar que o indicador estava estvel, ento, traamos a linha
de base e a projetamos para o futuro. A partir disso comeamos a colocar novos pontos
no grfico e anotamos mudanas que so realizadas no processo. Se a regra de 8 ou mais
pontos acima ou abaixo da linha de base satisfeita, ento, criamos uma nova linha de base
com esses novos pontos.
Se conseguimos associar a mudana de linha de base com alguma mudana realizada de forma intencional no
processo, timo. Se no conseguimos associar a alterao na linha de base com alguma mudana feita de modo
intencional, ento, devemos tentar identificar alguma transformao que foi executada, s vezes sem nosso
conhecimento, que possa explicar esse impacto no indicador. E assim prosseguimos acompanhando o processo,
alterando a linha de base quando o indicador mostra que algo mudou no processo que impactou o indicador.
30
Quando, como e exemploS para grficos
31
Quando, como e exemploS para grficos
32
Quando, como e exemploS para grficos
33
Quando, como e exemploS para grficos
34
Concluso
Concluso
Bons resultados!
36
Sobre o autor