Professional Documents
Culture Documents
APOSTILA DE
ESTATSTICA
ENGENHARIA ELTRICA
Sigrid Liebold
2013.2
Estatstica Aplicada:
Por que conhecer Estatstica?
Ao longo de nossas vidas, seja no trabalho, no lazer, em casa, no bairro, na cidade onde
moramos ou at mesmo quando estamos consumindo, uma grande quantidade de
informaes que utilizamos em nosso dia a dia expressa na forma de nmeros,
grficos e tabelas.
Muitas decises importantes em nossa vida esto diretamente relacionadas utilizao
de nmeros e seu bom entendimento, pois acarretam avaliao de riscos. O
conhecimento bsico sobre a estatstica ir nos ajudar a compreender estes aspectos e
muitas vezes orientar na melhor deciso a ser tomada. Com base no estudo das
probabilidades, as decises podero estar baseadas em informaes ponderadas em
relao ao risco.
A estatstica se divide em trs grandes reas:
- Estatstica descritiva: organizao, resumo e simplificao de informaes que
podem ser muito complexas. Consiste na coleta, organizao, classificao e tabulao
de dados, dispondo-os em nmeros, facilitando a leitura e interpretao dos mesmos.
Por exemplo, nveis de desemprego, mdias de salrios, etc.;
- Estatstica probabilstica: utilizada em situaes que envolvem o acaso. Por
exemplo, jogos de azar, jogos de dados, etc.;
- Estatstica inferencial: anlise e interpretao de dados amostrais, que consiste em
mensurar uma pequena parte da populao e utilizar esta informao para fazer
inferncia sobre toda populao. Por exemplo, no preciso tomar um copo inteiro de
gua para saber se a gua est gelada.
A estatstica uma cincia que estuda e pesquisa sobre: o levantamento de dados com a
mxima quantidade de informao possvel para um dado custo; o processamento de
dados para a quantificao da quantidade de incerteza existente na resposta para um
determinado problema; a tomada de decises sob condies de incerteza, sob o menor
risco possvel.
Aps coletar os dados, estes devero ser classificados, estabelecendo categorias que
permitam a reunio das informaes coletadas.
Populao: o conjunto formado por indivduos ou objetos que tem pelo menos uma
varivel comum e observvel, podendo ser finita ou infinita.
Amostra: o subconjunto de uma populao.
Censo: Examina todos os elementos de uma populao.
De acordo com Toledo e Ovalle (1985) a palavra Estatstica pode ser distinguida sobre
duas concepes:
No plural a palavra Estatstica indica qualquer coleo consistente de dados numricos,
reunidos com a finalidade de fornecer informaes acerca de uma finalidade qualquer. Por
exemplo, as Estatsticas Demogrficas referem-se aos dados sobre nascimentos,
falecimentos, matrimnios, divrcios; as Estatsticas Econmicas relacionam dados sobre
emprego, produo, preo, vendas.
Fato: falta de gua encanada (constante). No foi alterado para falta de luz, gs ou
qualquer outro produto.
Local: frica, Amrica Latina, sia, Europa (varivel).
Tempo: 2000 (constante).
Srie especfica: dados agrupados segundo a modalidade de ocorrncia. Neste tipo de
srie o local e o tempo permanecem constantes enquanto o fato varia.
O que fazer com o 13. Salrio
Consumidores Paulistanos dezembro/2000
Opes
Valor percentual (%)
Pagar dvidas
53
Fazer compras
14
Poupar ou guardar
14
Investir ou aplicar
7
Gastar nas frias
6
outros
6
Fonte: InformEstado
Fato: pagar dvidas, fazer compras, poupar, etc. (varivel).
Local: So Paulo (constante).
Tempo: dezembro de 2000 (constante).
Sries conjugadas (Tabela de dupla entrada): so sries mistas, pois se pode variar
simultaneamente o tempo, o lugar e o fato.
Terminais telefnicos em servio ( 1991 1993)
Regies
1991
1992
Norte
342.938
375.658
Nordeste
1.287.813
1.379.101
Sudeste
6.234.501
6.729.467
Sul
1.497.315
1.608.989
Centro oeste
713.357
778.935
Fonte: Ministrio das Comunicaes
1993
403.494
1.496.649
7.231.634
1.746.232
884.822
Grficos Estatsticos:
A representao grfica das sries estatsticas tem por finalidade dar uma ideia, a
mais imediata possvel, das informaes, permitindo chegar-se a concluses sobre a
evoluo do fenmeno ou sobre como se relacionam os valores da srie.
Os grficos estatsticos so uma forma de representao dos dados com o objetivo
de permitir uma viso completa e rpida do fato estudado. De forma simplificada, os
grficos podem ser classificados em dois tipos: grficos de informao e grficos de
anlise.
Grfico de colunas
Grfico de linhas
Grfico de curvas
Grfico de setores: sua aplicao s deve ser feita quando todos os dados analisados
corresponderem ao mesmo e a todo o universo de observaes. No deve ser usado para
representao de dados ao longo do tempo, como sries temporais.
Grfico de setores ou pizza
10
11
Cartogramas
Pesquisa de Campo:
A pesquisa de campo procede observao de fatos e fenmenos exatamente como
ocorrem no real, coleta de dados referentes aos mesmos e, finalmente, anlise e
interpretao desses dados, objetivando compreender e explicar o problema pesquisado.
Para se fazer uma pesquisa de campo deve-se determinar as tcnicas de coleta de dados e
as tcnicas que sero empregadas para o registro e anlise. Dependendo das tcnicas de
coleta, anlise e interpretao dos dados, a pesquisa de campo poder ser classificada
como de abordagem predominantemente quantitativa ou qualitativa.
O que tabulao de dados?
a padronizao e codificao das respostas de uma pesquisa. a maneira
ordenada de dispor os resultados numricos para que a leitura e a anlise sejam
facilitadas.
O que anlise de dados?
12
Freqncia (Fi)
34
76
62
36
48
20
276
Tabulao com respostas mltiplas: O entrevistado pode indicar mais que uma alternativa
como resposta.
Exemplo: Amostra: 319 questionrios
Pergunta: Indique o nome de trs pessoas pblicas
Tabulao de perguntas encadeadas: Nesse caso, a segunda pergunta respondida em
funo da primeira.
Exemplo: Amostra: 277 questionrios
Respostas
Sim
nao
fi (%)
67,1
32,9
100
Fi
97
61
20
5
3
186
fi (%)
52,1
32,8
10,8
2,7
1,6
100
13
A anlise dos resultados deve ser feita em funo das duas perguntas. Dos respondidos que
so pais (67,1%), a maioria tem at 2 filhos (52,1%).
Tabulao de perguntas abertas: Padroniza-se as respostas por categoria e procede-se a
tabulao como tabulao de perguntas simples. Exemplo: Amostra: 277 questionrios
Pergunta: o que o Sr. Acha que falta na cidade de Cajueiro Seco quando
o assunto lazer?
Respostas:
Praa
Praas
Praas boas
Dana
Cantor na praa
Pagode
praas
festas
Quadra de futebol
Quadras
Quadra de basquete
quadras de esportes
Solteiro
48
66
114
Casado
66
63
129
Separado
3
7
10
Vivo
1
16
17
Outros
2
2
4
Total
120
154
274
possvel dizer que, em relao ao gnero x estado civil, a maioria das mulheres solteira
(66), ao passo que, na mesma proporo, os homens so casados (66). No entanto, verificase que a maior parte dos respondentes que so separados e vivos so mulheres.
Representao grfica dos resultados: Por meio da representao grfica possvel
estabelecer uma correspondncia entre os nmeros e uma figura geomtrica.
Anlise dos dados e interpretao: A anlise pode ser basicamente de dois tipos:
Anlise Descritiva: mtodo que envolve a apresentao e caracterizao de um conjunto de
dados de modo a descrever apropriadamente as vrias caractersticas deste conjunto. A
Anlise Descritiva se d pelas medidas de tendncia central (mdia, moda, mediana) e as
de disperso (amplitude total, varincia e desvio padro).
Anlise Inferencial: mtodo que torna possvel a estimativa de uma caracterstica de uma
populao ou a tomada de uma deciso referente populao com base somente em
resultados de amostras.
14
Fi
3
2
2
1
4
3
15
Classe
Fi
21
24
27
30
33
36
07
08
01
05
08
01
30
24
27
30
33
36
39
Onde:
Xi = varivel
Fi = n
n = tamanho da amostra
Classes:
So agrupamentos de valores num determinado intervalo de abrangncia. Neste
caso a tabela agrupada em classes chamada de Distribuio de Freqncia em
Classes.
Nmero de Classe (K):
Em geral a distribuio de freqncia deve possuir pelo menos 5 classes e no
mais do que 15.
15
Sturges:
K = 1 + 3,22 Log n
Onde:
n = tamanho da
amostra
K=6
h = 15/6 = 2,5 3
10 |
10
10
Exemplo:
10 |
| 12
limite inferior 10
limite superior 12
Xi = 11
Exemplo:
Xi
0
1
2
Fi
3
5
2
10
Fac
3
8
10
17
Fi
6
12
16
13
7
54
Ponto Mdio Xi
124,5
133,5
142,5
151,5
160,5
Xi . Fi
747,0
1.602,0
2.280,0
1.969,5
1.123,5
7.722,0
Obs.: a partir da coluna Fi, encontraremos a coluna do ponto mdio (Xi) e a coluna
(Xi . Fi).
X = x i Fi
n
= 7.722 = 143 cm
54
Medidas de Posio:
So medidas que dividem a srie em partes iguais.
1.
2.
3.
4.
18
Mediana: Md ( x )
A mediana o valor que divide a amostra ou populao em duas partes iguais com o
mesmo nmero de elementos.
0
50%
100%
|
|
|
Determina-se em primeiro lugar a classe que contem o valor mediano. Neste
caso calcula-se a ordem n/2 sem se preocupar se n par ou mpar.
Abre-se ento a coluna da Freqncia Acumulada (Fac) e identifica-se a
classe mediana.
Aps a identificao da classe mediana aplica-se a frmula abaixo para
buscar o valor numrico da mediana.
X = Lmd + ( n/2 - f) . h
Fmd
Onde:
Exemplo:
Dada a distribuio de estaturas de uma escola infantil, calcular a mediana:
classes
120 129
129 138
138 147
147 156
156 165
Fi
6
12
16
13
7
54
~
X = 138 + (
54
X = Lmd + ( n/2 - f) . h
Fmd
f = 18
n = 54
/2 - 18) 9
16
Fac
6
18
34
47
54
h=9
FMd = 16
X = 143,06
O valor da mediana igual a 143,06 cm significa que metade das crianas tem altura
inferior a 143,06 cm e a outra metade tem altura superior a esse valor.
19
Quartis:
Os quartis dividem um conjunto de dados em quatro partes iguais.
O%
25%
50%
75%
100%
|-----------------|----------------|-----------------|----------------|
Q1
Q2
Q3
Determinao dos Quartis:
Q1 = Valor correspondente observao ordenada n/4
Q2 = Valor correspondente observao ordenada n/2
Q3 = Valor correspondente observao ordenada 3n/4
Q1 = LQ1 + (n/4 - f) . h
FQ1
1 quartil
Q2 = LQ2 + (n/2 - f) . h
FQ2
2 quartil
Q3 = LQ3 + (3n/4 - f) . h
FQ3
3 quartil
Onde,
LQ = limite inferior da classe do quartil
n = tamanho da amostra ou nmero de elementos
f = somatrio das freqncias anteriores classe do quartil
h = amplitude da classe do quartil
FQ = freqncia da classe do quartil
Determina-se a classe que contem o valor quartil atravs de n/4, n/2 ou 3n/4 (1 2
ou 3 quartil respectivamente). Aps a identificao da classe aplica-se a frmula.
Exemplo:
Considerando a distribuio dos pesos dos peixes pescados por um grupo de
pescadores de um barco calcular o 1, 2 e 3 quartil.
Pesos (Kg)
Fi
Fac
10 30
8
8
30 50
26
34
50 70
57
91
70 90
42
133
90 110
27
160
110 130
16
176
176
20
Para Q1 temos:
Q1 = 50 + (176/4 - 34) . 20
57
Q2 = 50 + (176/2 - 34) . 20
57
Q3 = 70 + (3.176/4 - 91) . 20
42
Decis:
So valores que dividem a srie em 10 partes iguais.
Frmula Geral para localizao da classe que contm o valor decil:
Di = i n
10
onde
i = 1, 2, 3, 4, 5, 6, 7, 8, 9
a) Calcula-se Di = i.n
10
b) Identifica-se a classe Di pela Fac.
c) Aplica-se a frmula:
Di = LDi + (in/10 - f) h
FDi
Onde,
LDi = limite inferior da classe do decil
n = tamanho da amostra ou nmero de elementos
f = somatrio das freqncias anteriores classe do decil
h = amplitude da classe do decil
FD = freqncia da classe do decil
21
Exemplo: Considerando a distribuio dos pesos dos peixes pescados por um grupo
de pescadores de um barco calcular o 1, 6 e 8 decil.
Pesos (Kg)
10 30
30 50
50 70
70 90
90 110
10 130
Fi
8
26
57
42
27
16
176
Fac
8
34
91
133
160
176
Para D1 temos:
D1 = i . n = 1 . 176 = 17,6 elem. (2. Classe)
10
10
D1 = 37,38 kg
D1 = 30 + (176/10 - 8) . 20
26
D8 = 90 + (140,8 - 133) . 20
27
Percentis:
So medidas que dividem a srie em 100 partes iguais.
Frmula Geral para localizao da classe que contm o valor percentil:
Pi = i n onde
100
i = 1, 2, 3..50,51....98,99
d) Calcula-se Pi = i.n
100
e) Identifica-se a classe Pi pela Fac.
f) Aplica-se a frmula:
Pi = LPi + (in/100 - f) h
FPi
Onde,
LPi = limite inferior da classe do percentil
n = tamanho da amostra ou nmero de elementos
f = somatrio das freqncias anteriores classe do percentil
22
Fi
8
26
57
42
27
16
176
Fac
8
34
91
133
160
176
P10 = 30 + (17,6 - 8) . 20
26
P85 =i. n = 85. 176 = 149,6 elem. (5. Classe) P85 = 90 + (149,6 133) . 20
100
100
27
P85 = 102,3 kg
Moda:
o valor que ocorre com maior freqncia em uma srie ou distribuio. Esse valor
denominado valor modal.
Clculo da Moda para dados no agrupados:
Em uma srie estatstica em que os dados no so agrupados, o valor modal
corresponde ao valor com maior nmero de repeties.
Exemplo: 3,4,4,5,6,7,8,9,9,9,10,11,12,13. O valor com maior nmero de repeties
Mo = 9, portanto, 9 o valor modal.
Clculo da Moda para dados agrupados em distribuio de freqncia com intervalo
de classes - :
Frmula de Pearson:
Mo 3X 2X
Xi Fi (
Xi Fi)
n
n-1
S =
Desvio Padro:
O desvio padro determina a disperso dos valores em relao mdia. O desvio
padro calculado por meio da raiz quadrada da varincia.
S = S
Exemplo:
Foi feita uma pesquisa entre profissionais que trabalham com consultoria em que se
procurou apurar os valores cobrados por hora na execuo de um trabalho.
Considerando a distribuio abaixo, calcular a varincia e o desvio padro dos
dados.
Valores da
diria (em R$)
30 50
50 70
70 90
90 110
110 130
130 150
Profissionais
consultores (Fi)
4
8
5
7
3
5
32
Ponto Mdio
(Xi)
40
60
80
100
120
140
Xi. Fi
Xi
Xi . Fi
160
480
400
700
360
700
2.800
1.600
3.600
6.400
10.000
14.400
19.600
6.400
28.800
32.000
70.000
43.200
98.000
278.400
Clculo da varincia:
XiFi - (
XiFi)
n
n1
278.400 - (2.800)
32
S2 =
32 1
S = 1.077,42
S = 32,82
Coeficiente de Variao:
Mede a disperso dos dados em relao mdia. O coeficiente de variao a
relao entre o desvio padro e a mdia aritmtica, multiplicada por 100. O
coeficiente de variao expresso em porcentagens. Utiliza-se o coeficiente de
variao na comparao do grau de concentrao em torno da mdia para sries
distintas.
CV = S 100
24
25
Construa uma distribuio simples que mostre quantas faturas continham 0,1,2,3,4
ou 5 erros.
4
35
52
64
71
81
35
53
65
73
84
39
54
65
73
85
41
55
65
74
85
41
55
66
74
88
42
57
66
76
89
45
59
66
77
91
47
60
67
77
94
48
60
68
78
97
140
72
76
80
84
FAC
8
20
35
40
7) Dada a amostra:
28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24
31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 30 30 18 17
18 15 16 17 17 18 19 19 20 29
26
1
2
3
Fi
10
13
16
19
22
6
10
15
10
5
Fi
4
11
15
5
FAC
3
8
18
22
24
12) Calcule para cada uma das distribuies abaixo sua respectiva mdia:
a)
Xi
3
4
7
8
12
Fi
2
5
8
4
3
b)
Xi
10
11
12
13
Fi
5
8
10
6
c)
Xi
2
3
4
5
6
FAC
3
9
19
25
28
d)
Xi
85
87
88
89
90
Fi
5
1
10
3
5
8
14
5
4
4
3
3
6
2
6
9 9
8 10
6
11
14
15
10
13 14
4 4
15
5
16
6
8
7
9
8
5
9
3 2
1 12
3
13
3
1
2
1
0
3
1
4
15
13
11
4
16
Calcular a mediana
Determinar o 3 quartil
Calcular o 4 decil
Calcular o 47 percentil
Determinar o 1 quartil
Determinar a varincia
Determinar o desvio-padro
Qual o valor do coeficiente de variao?
Determine o 7 decil e o 80 percentil.
14) Um empregado perdeu uma das dez notas de compras efetuadas naquele dia. O
valor mdio de todas as 10 notas era de R$ 7,20 e as 9 notas restantes tinham os
valores de R$ 4,80 , R$ 7,10 , R$ 7,90 , R$ 9,55 , R$ 4,45 , R$ 5,72 , R$ 7,54 , R$
8,34 e R$ 9,70. Qual o valor da nota perdida?
Probabilidade:
1
Definio de Probabilidade:
A probabilidade expressa por meio de valores numricos as possibilidades de
ocorrncia dos resultados de um fenmeno.
Conceito:
Probabilidade a medida da incerteza relacionada a um evento.
Probabilidade a possibilidade de que um evento venha a ocorrer.
Evento:
o resultado ocorrido no experimento. Exemplo: Ao jogar um dado a face para
cima foi o nmero quatro.
Eventos independentes:
So eventos tais que a ocorrncia de um no influencia na ocorrncia do outro.
Ex.: Jogar um dado duas vezes.
10
11
P (A) =
n. casos favorveis
n. total de casos
Exemplo 1:
Qual a probabilidade de se extrair um s de um baralho de 52 cartas?
n(S) = 52 cartas
n(A) = 4
P = 4/52
30
P(A) = 1
P(A) 1
P(A) > 0
P() = 0
(figura de Paus)
Exemplos:
Se um atirador A tem a probabilidade de 0,70 de acertar o alvo e um atirador B
tem 0,80 de acertar o mesmo alvo, qual a probabilidade dos dois acertarem, se
cada um atirar uma vez:
P(AB) = P (A) . P(B) = 0,70 . 0,80 = 0,56
Em uma caixa tem 10 peas das quais 4 so defeituosas. So retiradas duas
peas uma aps a outra, com reposio. Calcular a probabilidade de ambas
serem boas.
A= {a 1 pea boa}
P(A) = 6/10
B= { a 2 pea boa}
P (B) = 6/10
P (AB) =
0,36
P(A) = 13/52
B= {a 2 carta de ouros}
P (B) = 13/52
P (AB) =
0,063
Exemplos:
P4 = 4! = 4.3.2.1 = 24
P7 = 7! = 7.6.5.4.3.2.1 = 5040
P10 = 10! = 10.9.8.7.6.5.4.3.2.1 = 3.628.800
Arranjos: arranjos de n objetos tomados r de cada vez (com n r)
An,r =
n!
(n r) !
Exemplos:
Calcule o nmero de arranjos de 7 objetos tomados 5 a 5.
A7,5 =
7!
= 7! = 7.6.5.4.3.2.1 = 5040 = 2.520
(7 5) !
2!
2.1
2
8!
= 8! = 8.7.6.5.4.3.2.1 = 40.320 = 336
(8 3) !
5!
5.4.3.2.1
120
n
r
n!
r! (n-r)!
Onde,
n o nmero total de elementos
r o nmero de elementos do agrupamento
Exemplos:
Escolhem-se dois alunos entre um total de quatro alunos, para construir uma
comisso, sabendo que os alunos disponveis so: Carlos, Fernando, Jos e
Srgio. Questiona-se quantas comisses diferentes podem ser formadas. As
possveis comisses so:
1) Carlos, Fernando
2) Carlos, Jos
3) Carlos, Srgio
4) Fernando, Jos
5) Fernando, Srgio
6) Jos, Srgio
Observamos que em cada comisso formada a ordem da escolha dos alunos
no importa. A comisso formada por alunos Carlos e Fernando a mesma
comisso formada Poe esses mesmos alunos em uma ordem diferente
(Fernando e Carlos). Se fosse efetuado o clculo por meio da frmula de
combinao, o resultado obtido seria:
34
C4,2 =
4!
=
2! (4-2)!
4!
= 24
= 6 comisses
2!.2!
2.1.2.1
c) A
g) A B
d) B
h) B A
35
9) Em uma sala de aula h 5 alunos que pesam entre 54 e 60 quilos e 26 alunos com
peso entre 61 e 70 quilos. Ao selecionarmos ao acaso, qual a probabilidade de um
aluno pesar entre 61 e 70 quilos?
10) Se lanarmos uma moeda 3 vezes, qual a probabilidade de sair cara nos 3
lanamentos?
11) Uma urna contm 3 bolas vermelhas e 2 pretas. Retira-se da urna uma bola. Qual
a probabilidade dela ser vermelha? E de ser preta?
12) De um baralho de 52 cartas retira-se uma carta. Qual a probabilidade dela ser
rei ou carta de espada?
13) Tendo-se jogado dois dados, encontre a probabilidade de cada um dos seguintes
acontecimentos:
a) A soma dos pontos igual a 7.
b) A soma dos pontos 8 e a diferena 4.
c) A soma dos pontos 5 e o produto 4.
14) Lance um dado e uma moeda:
a) Construa o espao amostral.
b) Enumere os seguintes eventos:
A = (coroa, marcado por nmero par).
B = (cara, marcado por nmero mpar).
C = (mltiplos de 3)
c) Expresse os eventos:
I) B
II) A ou B ocorrerem
III) B e C ocorrerem
16) Um cliente de uma loja de roupas e sapatos deseja comprar 4 camisas, 3 calas e
2 sapatos. Ele est em dvida entre 6 camisas, 4 calas e 3 sapatos. De quantas
maneiras ele pode efetuar essa compra?
17) A probabilidade de que um homem esteja vivo daqui a 30 anos de 2/5; a de sua
mulher 2/3. Determine a probabilidade de que daqui a 30 anos:
a) Ambos estejam vivos
b) Somente o homem esteja vivo
c) Somente a mulher esteja viva
d) Nenhum esteja vivo
18) Uma vendedora marcou uma visita tarde com o gerente da Empresa X. Ela
estima que h 60% de probabilidade do gerente confirmar a visita e 70% de
probabilidade de fechar negcios nesta visita. Existe uma probabilidade de 10% de
haver promoo de vendas do produto da vendedora no prximo final de semana
na Empresa X. Determine a probabilidade da vendedora fazer a visita, fechar
negcio e no haver promoo de seus produtos.
19) Num grupo de 300 alunos de uma faculdade, 100 fazem o curso de Administrao
e 80 fazem o curso de Cincias Contbeis (os alunos restantes fazem outros
cursos). Esses dados incluem 30 alunos
que fazem os dois cursos
simultaneamente. Qual a probabilidade de um aluno escolhido aleatoriamente estar
fazendo o curso de:
a)
Administrao (A)
b)
Contbeis (C)
c)
Administrao ou Contbeis (A ou C)
20) No lanamento de um dado consideramos o evento A = {1,5}. Qual a probabilidade
de ocorrer:
a) O evento A
b) O evento complementar de A
21) Considere o espao amostra S = {11,13,14,16,18,21,22,25,27,28} e os seguintes
eventos:
A = {11, 21}
B = {11,14,16,18}
C = {21,22,25,27,28}
D = {18}
E = {11,16,18,21,25}
Calcule:
a) AUB; BUC; DUC
b) AB; BC; DC
c) EUDUB; EDB
d) A; C; D
37
24) Calcule:
a) P4; P6; P9; P11; P10; P8
b) A4,1; A4,4; A5,2; A6,4; A7,6; A8,5; A3,2; A6,1 A10,3; A7,2 ;A5,5; A11,4
c) C4,1; C4,4; C5,2; C6,4; C7,6; C8,5; C3,2; C6,1; C10,3; C7,2; C5,4; C11,4
38
39
41
= C6,0
= C6,1
= C6,2
= C6,3
= C6,4
= C6,5
= C6,6
3. Suponha que haja uma probabilidade de 0,60 de um carro furtado em certa cidade do
sul ser recuperado. Calcular as probabilidades:
a) De no mximo trs dentre 10 carros furtados serem recuperados.
P = 0,60
q = 0,40
n = 10
x < 3 x = 0; x = 1; x = 2; x = 3.
P(0)
P(1)
P(2)
P(3)
=
=
=
=
C10,0
C10,1
C10,2
C10,3
. (0,60)0 .
. (0,60)1 .
. (0,60)2 .
. (0,60)3 .
(0,40)10 0
(0,40)10 1
(0,40)10 2
(0,40)10 3
= 0,0001
= 0,002
= 0,011
= 0,042
P = 0,382= 38,2%
42
b) trs vezes
43
Ento:
P(1) + P(2) + P(3) + P(4) = 0,9375 = 93,75%
Onde:
= (lambda) nmero mdio de sucessos em um determinado intervalo de tempo ou
espao.
t = intervalo de tempo ou espao contnuo de observaes que se est analisando.
x = nmero de sucessos no intervalo desejado.
e = 2,71828 (base do sistema de logaritmos naturais).
Esta frmula aplica-se a muitas situaes em que podemos esperar um nmero fixo de
sucessos por unidade de tempo ou por qualquer outro tipo de unidade.
A distribuio de Poisson largamente empregada quando se deseja contar o nmero de
eventos de certo tipo, que ocorreu em um intervalo de tempo, ou superfcie, ou volume,
tais como:
nmero de chamadas telefnicas recebidas por uma central telefnica durante um
intervalo de tempo;
nmero de falhas de um computador em um dia de operao.
nmero de relatrios de acidentes enviados a uma companhia de seguros em uma
semana.
Exemplos:
1. Se um banco recebe em mdia 6 cheques sem cobertura por dia, qual a probabilidade
de receber 4 cheques sem cobertura em um dia qualquer?
Temos: = 6 x = 4
Ento:
P(4) = e-6.(6)4 = 0,1339 = 13,39%
4!
2. Se podemos esperar 5,6 imperfeies por pea de um determinado tecido, qual a
probabilidade de uma pea conter 3 imperfeies?
44
Temos: = 5,6
Ento:
x=3
3. Uma central telefnica recebe mdia de 5 chamadas por minuto. Qual a probabilidade
de que essa central no receba chamadas durante o intervalo de um minuto?
Temos: = 5
Ento:
x=0
(Nenhuma Chamada)
P(0) = e-2.2.(2.2)0
0!
-2.2
P(1) = e .(2.2)1
1!
-2.2
P(2) = e .(2.2)2
2!
-2.2
P(3) = e .(2.2)3
3!
= 0,0183
= 0,0733
= 0,1465
= 0,1954
Questes
1) Um exame de mltipla escolha consiste em 10 questes, cada uma com 4 opes. A
aprovao no exame exige do aluno pelo menos nota seis, ou seja, o acerto de pelo
menos seis questes. Qual a chance de aprovao se o aluno nada estudou?
a) aproximadamente 27%
b) aproximadamente 56%
c) aproximadamente 20%
d) aproximadamente 10%
e) aproximadamente 10%
2) Supondo que a probabilidade de um casal ter filhos com olhos verdes de 17%, em
400 famlias com 4 crianas cada uma, quantas se esperaria que tivesse nenhum dos
filhos com olhos verdes?
a) 48 famlias
b) 190 famlias
c) 39 famlias
d) 216 famlias
e) 35 famlias
3) Em uma criao de coelhos, 40% so machos. Qual a probabilidade de que nasam
pelo menos 2 coelhos machos num dia que nasceram 20 coelhos?
45
b) 62,70%
d) 99,95%
e) 57,98%
4) Numa central telefnica chegam 240 telefonemas por hora. Qual a probabilidade de
que em um minuto haja uma chamada?
a) 13,45%
b) 7,33%
c) 25%
d) 50%
e) 1,2%
5) Uma pizzaria recebe em mdia 8 chamadas por hora. Qual a probabilidade de que, em
uma hora selecionada aleatoriamente, sejam recebidas exatamente 5 chamadas?
a) 9,16%
b) 18,64%
c) 25%
d) 40%
e) 4,67%
6) Um exame de mltipla escolha consiste em 10 questes, cada uma com 4 opes. A
aprovao no exame exige do aluno pelo menos nota seis, ou seja, o acerto de pelo
menos seis questes. Qual a chance de aprovao se o aluno estudou o suficiente para
poder eliminar duas escolhas, devendo escolher entre duas opes.
7) Supondo que a probabilidade de um casal ter filhos com olhos verdes de 17%, em
400 famlias com 4 crianas cada uma, quantas famlias se esperaria que tivesse dois
filhos com olhos verdes.
8) Uma prova tipo teste tem 50 questes. Cada questo tem 5 alternativas. Apenas uma
delas correta. Se o aluno resolve a prova respondendo a esmo as questes, qual a
probabilidade de acertar 50% da prova?
9) Num livro de 800 pginas h 800 erros de impresso. Qual a probabilidade de que uma
pgina contenha pelo menos 3 erros?
10) Numa central telefnica chegam 300 telefonemas por hora. Qual a probabilidade de
que:
Num minuto no haja nenhum chamado.
Em 2 minutos haja 2 chamadas.
Em t minutos no haja chamadas.
11) Suponha que haja 265 erros de pontuao distribudos aleatoriamente em um contrato
comercial de 458 linhas. Encontre a probabilidade de conter em uma dada linha apenas 2
erros.
12) Um a cada cem carros cai num buraco de uma avenida. Se cem carros passarem,
qual a probabilidade de dois carros carem no buraco?
46
47
Onde,
Z = varivel padronizada.
X = varivel normal.
= mdia.
= desvio padro.
Nesta nova escala, a varivel Z apresenta o afastamento em desvios padres de um valor
da varivel original em relao mdia. Um valor de Z nos diz apenas a quantidade de
desvios padres.
Fazendo:
Ento,
48
Observe que o valor tabelado na distribuio normal padro valor da rea entre 0 e 1,no
entanto, pela simetria da curva, a rea direita do zero igual a 0,5. Portanto,
P(Z > 1) = 0,5 P(0 < Z < 1)
P(Z > 1) = 0,5 0,3413
Fazendo,
Temos,
Z1 = x -
Z1 = 0
= 20 20
3
e
Z2 =1
Z2= x -
=23 20
3
49
Fazendo,
Temos,
Z1 = x -
Z1 = 0,40
= 12 10
5
e
Z2= x -
= 15 - 10
5
Z2 =1
Questes
1) Calcular a probabilidade de a varivel normal padro assumir valores entre 100 e
106,ou seja, P (100 < x < 106), sabendo que = 100 e = 5.
a) 0,3849
b) 0,4032
c) 0,4192
d) 0,4332
b) 0,9053
c) 0,4861
d) 0,4207
e) 0,4222
51
55
57
Estimador ou Estimao
O processo de induo que se pretende realizar sobre uma populao pode ser feito a
partir de uma amostra, de duas maneiras:
Estimao
o processo que usa os resultados extrados da amostra para produzir inferncias sobre
a populao da qual foi extrada, aleatoriamente, a amostra.
Existem dois tipos de estimao:
Estimao por ponto: quando, a partir da amostra, procura-se obter um nico valor de
certo parmetro populacional. Por exemplo, a mdia amostral uma estatstica usada
para fazer uma estimao por ponto da mdia populacional.
Estimao por intervalo: quando a partir da amostra procura-se construir um intervalo
de variao com certa probabilidade de conter o verdadeiro parmetro populacional. Por
exemplo, podemos obter um intervalo que contenha a varincia populacional com 90% de
probabilidade, a partir da varincia amostral.
Teste de hiptese
o processo que usa os resultados extrados da amostra para testar valores de
certos parmetros da populao (testes paramtricos) ou para testar a natureza da
distribuio da populao (testes no paramtricos ou de aderncia). Por exemplo, testar
se a mdia de uma populao 1 conhecendo-se a mdia amostral extrada de certa
amostra (teste paramtrico) ou testar se o nmero de defeitos de um tipo de aparelho
eletrnico produzido em srie numa linha de montagem uma varivel que se comporta
segundo uma distribuio de Poisson (teste no paramtrico).
Estimar a ao de fazer uma suposio generalizada a respeito de um todo
baseado em informaes lgicas.
Os Parmetros so uma funo do conjunto de valores da populao, tal como as
estatsticas mdia aritmtica e varincia, desde que calculadas diretamente com os
dados obtidos na populao.
Estimativa o valor assumido pelo parmetro em determinada amostra.
Hiptese Estatstica:
Uma hiptese estatstica uma afirmao ou conjectura sobre um parmetro ou
parmetros de uma populao; pode tambm se referir ao tipo ou natureza da populao.
So exemplos de hipteses estatsticas:
A proporo de crianas do sexo masculino em determinada localidade nos ltimos 5
anos 0, 5, isto p = 0,5.
A altura mdia do brasileiro 1,68 m, isto = 1,68 m.
Teste de Hiptese:
59
61
62
Z=X-
n
63
Nesta frmula, o numerador mede a distncia a que a mdia aritmtica da amostra X est
da mdia aritmtica da hiptese . O denominador o erro padro da mdia aritmtica de
modo que Z representa quantos desvios padres X est distante de . Se o gerente de
produo decidisse escolher um nvel de significncia de 0,05, o tamanho da regio de
rejeio seria de 0,05 e os valores crticos da distribuio normal poderiam ser
determinados. Esses valores crticos podem ser expressos em unidades de desvio
padro.
Portanto com 5% de significncia, ou seja 95% de confiana temos uma rea da
distribuio normal de 0,475 entre a mdia aritmtica e cada valor crtico. Analisando esta
rea na distribuio normal temos que os valores crticos que dividem as regies de
rejeio e no rejeio so + 1,96 e 1,96.
Suponha que a amostra de 25 caixas de cereais indicasse uma mdia aritmtica da
amostra (X) de 372,5 gramas e desvio padro da populao = 15 gramas, conforme
especificou a empresa. Teramos ento:
Z=
X-
Z = 372,5 - 368
15
25
Z = +1,50
Uma vez que z = +1,50, vemos que 1,96<+1,50<+1,96. Assim sendo, nossa deciso
no rejeitar H0. Concluiramos que a mdia de contedo seria 368 gramas. Como
alternativa, para levar em conta a possibilidade de um erro do tipo II, poderamos
sintetizar nossa deciso em uma frase como no h evidncias de que a mdia do
contedo seja diferente de 368 gramas.
Resumindo os passos do teste de hipteses para nosso exemplo:
1. Formular a hiptese nula H0 e hiptese alternativa H1.:
As hipteses nula e alternativa devem ser declaradas em termos estatsticos. Ao se
testar se a quantidade mdia abastecida era de 368 gramas, a hiptese nula era de que
era igual a 368 e a hiptese alternativa era de que a no era igual a 368 gramas.
2. Escolher o nvel de significncia :
O nvel de significncia especificado de acordo com a importncia relativa dos riscos
de se cometer erro do tipo I e do tipo II no problema. Escolhemos neste caso = 0,05.
3. Escolher a estatstica de teste a ser utilizada (distribuio adequada t ou z):
Se n 30 ou n < 30, populao normalmente distribuda e conhecido, utilizaremos a
distribuio normal z como estatstica de teste. Se n< 30, populao normalmente
distribuda e desconhecido, utilizaremos student como estatstica de teste.
64
0 z x
Um teste unilateral apropriado quando estamos interessados em possveis
desvios em apenas uma direo, a partir do valor hipottico da mdia.Existe apenas uma
regio de rejeio em um teste unilateral. A regio de rejeio de um teste unilateral
encontra-se sempre na cauda que representa apoio para a hiptese alternativa. Tal como
para um teste bilateral, o valor crtico pode ser determinado em termos de um valor de z.
Contudo, os valores crticos para testes unilaterais diferem dos de testes bilaterais porque
a dada proporo de rea encontra-se toda em uma cauda da distribuio. A frmula geral
para estabelecer o valor crtico da mdia da amostra para um teste unilateral :
0 + z x
65
Observe que z pode ter valor negativo, dando como resultado uma subtrao do
segundo termo.
A tabela abaixo apresenta valores de z necessrios para testes unilaterais e bilaterais:
Nvel de significncia
Teste unilateral
Teste bilateral
5%
+1,65 ( ou 1,65)
1,96
1%
+2,33 ( ou 2,33)
2,58
10%
+1,29 ( ou 1,29)
1,65
Exerccios:
1) Um auditor deseja testar a hiptese de que o valor mdio de todas as contas a receber
em uma determinada empresa R$ 260,00. tomando para tanto uma amostra de n = 36
e calculando a mdia amostral. Ele deseja rejeitar o valor hipottico de R$ 260,00
somente se tal valor for claramente contraditado pela mdia da amostra. Determinar os
valores crticos da mdia da amostra para testar a hiptese a um nvel de significncia de
5%. Sabe-se que valor do desvio padro dos valores das contas a receber = R$
43,00.
2) Para o exemplo anterior, suponha que a mdia da amostra seja X = R$ 240,00.
Determinar se a hiptese nula deve ser aceita ou rejeitada.
3) Neste mesmo exemplo, caso o auditor esteja interessado apenas em saber se a
verdadeira mdia pode ser pelo menos R$ 260,00. Determinar as hipteses nula e
alternativa.
4) Suponha que o auditor comece com a hiptese nula de que o valor mdio de todas as
contas a receber , no mnimo R$ 260,00. Dado que a mdia da amostra R$ 240,00,
testar esta hiptese, com nvel de significncia de 5%, especificando o valor crtico e
rejeitando ou aceitando a hiptese nula.
5) Como no exemplo anterior, a hiptese nula a ser testada que a mdia de todas as
contas a receber , no mnimo, R$ 260,00, e este teste deve ser desenvolvido com nvel
de significncia de 5%. O auditor indica que ele consideraria uma mdia efetiva de R$
240,00 (ou menos) como uma diferena importante do valor hipottico da mdia. O
tamanho da amostra de n = 36 contas e o = R$ 43,00. Determinar as probabilidades
de ocorrer erro tipo I e tipo II.
6) Um fabricante de parafusos para automveis afirma que o dimetro de seus parafusos
de 6mm. Uma amostra de 43 parafusos apresentou uma mdia de 5,8 mm e desvio
padro de 0,2 mm. Assumindo = 4%, o que podemos dizer sobre a afirmao do
fabricante?
7) Uma fbrica anuncia que o ndice de nicotina dos cigarros da marca x apresentou-se
abaixo de 26 mg. Por cigarro. Um laboratrio realiza anlises do ndice obtendo:
28,24,28,22,28,25,28,26,28,26. Sabe-se que o ndice de nicotina dos cigarros da marca x
66
67
Uma terceira aplicao da regresso seria predizer valores futuros de uma varivel. Por
exemplo, costuma-se aplicar testes a empregados ou estudantes potenciais para
avaliar o potencial de sucesso na escola ou emprego. Pode-se presumir que haja um
relacionamento matemtico entre o resultado do teste e o potencial futuro.
Alm das equaes lineares, existem outras formas de anlise de regresso, tais como
regresso mltipla (mais de duas variveis) e regresso curvilnea (no linear) que
envolvem extenses dos conceitos utilizados na regresso linear simples.
A Equao Linear
A regresso linear tem como objetivo obter a equao matemtica da reta que ir
representar o melhor relacionamento linear entre as duas variveis. Para isso ir utilizar
a equao linear. Duas importantes caractersticas da equao linear so o coeficiente
angular da reta e a cota da reta em determinado ponto. Uma equao linear tem a
forma y = a + bx, onde a e b so valores que se determinam com base nos dados
amostrais; a a cota da reta em x = 0 e b o coeficiente angular. A varivel y a
varivel que deve ser predita e o x o preditor.
Exemplo: considere a equao linear y = 5 + 3x
y = a + bx
a: coeficiente linear
b: coeficiente angular
x: preditor
y: varivel predita
A reta intercepta o eixo dos y no ponto (0, a), isto , y = a, neste caso no ponto (0,5),
isto , y = 5. Este ponto chamado intercepto-y. O coeficiente angular da reta 3, o
que significa que a cada unidade de variao e x, correspondem 3 unidades de
variao de y.
Podemos usar a equao para determinar valores de y correspondentes a valores de x.
Valor de x
2
3,1
7,2
Relao Curvilnea
No h relao
Observao: Nem toda relao entre duas variveis linear. Os pontos em (b) e (c)
parecem dispor-se segundo um padro linear, o que no ocorre com (a) e (d).
Na regresso, os valores y so preditos com base em valores dados ou
conhecidos de x. A varivel y chamada varivel dependente e a varivel
x varivel independente.
70
72
b =
n ( xy ) - ( x ) ( y )
n ( x2 ) ( x ) 2
Exemplos:
1. Suponha que se tenham obtidos valores para o desempenho (notas) em uma
determinada disciplina e as rendas familiares conforme abaixo.
y = 32,954 3,8045 x
74
y54
32
1 56811
1215x
Encontre a reta dos mnimos quadrados para avaliar, matematicamente, a previso da
deduo em funo do salrio;
Clculo do valor de b:
b = n ( xy ) - ( x ) ( y )
n ( x2 ) ( x ) 2
Clculo do valor de a:
a= y - bx
= 17,8 0,445 x 57
n
6
= - 1,26
y = - 1,26 + 0,445 x
y = 3,19
75
Questes
1) Qual a finalidade da anlise de regresso?
a) Estudar um fenmeno dentro de uma populao.
b) Analisar dados amostrais para saber se e como duas variveis esto relacionadas
uma com a outra em uma populao.
c) Analisar a probabilidade de ocorrncia de um fenmeno.
d) Encontrar uma equao que represente o fenmeno estudado.
e) Determinar a equao no linear entre as variveis.
2) O que uma equao linear dentro de um modelo de regresso?
a) uma equao que descreve o relacionamento entre as variveis em termos
matemticos.
b) uma tcnica que envolve estimao.
c) uma funo do conjunto de valores de uma amostra.
d) uma equao que mede a fora de relacionamento entre uma varivel dependente
e um conjunto de outras variveis.
e) uma tcnica probabilstica.
3) A tabela a seguir representa os custos de produo de certas quantidades de um
determinado artigo em cinco observaes independentes.
Quantidade
10
20
30
40
50
Custos totais
100
230
270
410
490
d) 10 + 5,2 x
e) 9,6 + 12 x
4) A tabela a seguir mostra os custos de manuteno por hora classificados por idade
de mquinas em meses. Determinar a reta de regresso:
Idade
(meses)
6
15
24
33
42
Custos
Mdios
9,7
16,5
19,3
19,2
26,9
a) y = 8,48 + 0,41x
d) y = 0,35 + 6,51x
b) y = 0,41 + 8,48x
e) y = 0,41 + 3,40x
c) y = 6,51 + 0,35x
76
Nmeros
de
estabeleciment
os
A
B
C
D
E
F
G
H
I
16
30
35
70
90
120
160
237
378
Depsito
mdio
por
agncia
(R$10.000,0
0)
14
16
19
30
31
33
35
43
50
Com base nessas informaes, podemos afirmar que a reta da equao pelo mtodo
dos mnimos quadrados igual a:
a) y = 19,5 + 0,1210x
b) y = 25,3 + 2,5647x
c) y = 12,6 + 0,5982x
d) y = 17,94 + 0,0964x
e) y = 0,0964 + 17,94x
77
78
79
80
20
40
60
80
Ou seja:
r prximo de 1: dados prximos da reta de ajuste que decrescente;
r prximo de 1: dados prximos da reta de ajuste que crescente;
r prximo de zero: dados distantes da reta de ajuste pssima estimao;
r = 0 corresponde a no existncia de correlao;
81
n xy x y
i 1
i 1
i 1
i 1
i 1
i 1
i 1
[n x 2 ( x ) 2 ][n y 2 ( y ) 2 ]
Exemplos:
1. A tabela a seguir apresenta dados de amostra de alunos referentes ao nmero de
horas de estudo da disciplina de estatstica, fora da aula, bem como as notas obtidas
em uma prova aplicada ao final do curso. Calcular o coeficiente de Pearson (r) e
interpretar seu resultado.
8 x (15.032)
r=
r = 0,8621
8 x 4.902
- (192) x (608 )
(192)2
8 . 47.094 - (608)2
82
VENDAS ( $ 100)
35
30
25
20
15
10
2
10
12
14
16
DESPESAS ( $ 100 )
i 1
i 1
i 1
i 1
i 1
[ n x ( x ) ][ n y 2 ( y ) 2 ]
i 1
n xy x y
2
i 1
10(2289) 80 * 255
[10 * 756 80 2 ][10 * 7097 (255) 2 ]
r 0,948
Como r = 0,948 est prximo de +1, ento, existe forte relao positiva entre as duas
variveis.
3. Calcule a correlao entre ganhos salariais e deduo de impostos do exemplo
abaixo:
83
196, 2
196, 2
6 201,8 57 17,8
0,9977 r
441 87,8 196, 77
6 615 3.249 6 67, 44 316,84
Questes
1) Qual a funo do coeficiente de correlao simples?
a) Produzir uma equao que ir descrever o relacionamento entre as variveis em
termos matemticos.
b) Determinar uma equao no linear entre as variveis.
c) Medir o grau de relacionamento linear entre duas variveis.
d) Medir o grau de relacionamento entre uma varivel dependente e um conjunto de
outras variveis.
e) Estimar duas variveis.
2) Qual a finalidade da correlao?
a) Determinar se h relacionamento entre duas variveis e em que direo: positiva ou
negativa.
84
Consum
o (y)
65
70
73
77
80
85
84
93
85
Preo(y)
36
33.5
30.7
28
26.6
25.6
h=RK
R = Xmx Xmin
Sturges:
K = 1 + 3,22 log n
n = amostra
X = x
n
X = Lmd+ ( n/2 - f) . h
Fmd
Di = LDi +(in/10 - f ) h
FDi
86
Pi = L Pi + (in/100 - f) h
FPi
Pearson:
Xi Fi (
Xi Fi)
S =
n
n-1
~
Mo 3X 2X
CV= S 100
x
S = S
FORMULRIO: PROBABILIDADE
P (A) 0
P (A) 1
P (S) = 1
P ()= 0
0P1
P (A) = 1 P (A)
P (A) + P (A) = 1
P ( A B ) = P (A) . P (B)
An,r =
n!
(n r) !
Cn,r
n
r
n!
r! (n-r)!
87
88
89