Professional Documents
Culture Documents
Estadual de Londrina
ESTATSTICA
Anlise Exploratria de Dados
Probabilidade
Variveis Aleatrias
LONDRINA
2014
ESTATSTICA
INTRODUO
METODOLOGIA DA ESTATSTICA
Dependendo do objetivo da pesquisa pode-se classificar a metodologia estatstica a ser
aplicada como:
Estatstica Descritiva
Usualmente a expresso estatstica descritiva empregada para descrever, analisar e
interpretar os registros quantitativos relativos aos atributos do fenmeno em estudo.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
Estatstica Indutiva
A estatstica indutiva a parte da Estatstica que tem por objetivo obter e generalizar
concluses para o todo a partir da anlise de uma parcela.
OBTENO DE DADOS
A aplicao da anlise estatstica utilizada a partir dos dados obtidos que descrevem
os elementos observados, tais como: caractersticas de pessoas, animais, empresas, indstrias,
sistema de produo, fenmenos fsicos ou qumicos etc.
A coleta desses elementos pode ser feita atravs de instrumentos, que se adquam ao
tipo de pesquisa, ou seja, questionrios, planilhas de anotaes ou atravs de desenvolvimento
de experimentos.
NOES BSICAS
Populao
o grupo de todos os elementos que possuem caractersticas comuns, que determinam
o universo a ser pesquisado.
Censo
quando no estudo das caractersticas utilizam-se todos os elementos da populao.
Amostra
Quando somente uma parte da populao analisada, retirada com tcnicas estatsticas
adequadas, de forma a garantir a representatividade das caractersticas dos elementos da
populao.
AMOSTRAGEM
Amostragem um procedimento usado utilizado na retirada de amostras
representativas da populao. Para se aplicar a amostragem deve se observar a composio da
populao, o mtodo de amostragem necessrio e o tamanho da amostra.
RETIRADA DA AMOSTRA
Basicamente existem dois mtodos para a composio da amostra: probabilstico e no
probabilstico.
MTODOS PROBABILSTICOS
O mtodo de amostragem probabilstica exige que cada elemento da populao possua
a mesma probabilidade de ser selecionado. Assim, considerando N o tamanho da populao, a
probabilidade de cada elemento ser 1/N. Trata-se de um mtodo que garante cientificamente
a aplicao das tcnicas estatsticas.
Tamanho do estrato
Relao (%)
Tamanho da amostra
50
10
II
150
30
12
III
300
60
24
N= 500
100
Total
n=40
MTODOS NO PROBABILSTICOS
So amostragens em que os elementos so retirados em situaes que no possibilitem
a seleo aleatria. Esse tipo de amostragem pode oferecer boas estimativas das
caractersticas da populao.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
Sexo
Escolaridade
Idade Renda
Masculino
Superior
30
10 s.m
Feminino
Mdio completo
18
3 s.m
VARIVEL
Variveis
- Idade
- Tamanho da famlia
- Renda familiar
- Estado civil
- Emprego
- Tempo de trabalho.
Tipos
Qualitativas
ou
Categricas
Descrio
Exemplos
Ordinal
Com ordenao.
Nmero
de
funcionrios;
nmero
Quantitativas
Contnuas Oriunda de medio.
TAMANHO DA AMOSTRA
n0 .N
n0 N
Exemplos:
1) Se considerar que uma pesquisa ter o nvel de confiana de: 95%, com margem de
erro de 3% para mais e para menos, sendo que a proporo populacional (incidncia)
com o atributo pesquisado seja de 15%. Determine:
a) a amostra mnima inicial;
b) a amostra mnima final, caso a populao tenha 25.486 elementos.
c) a amostra mnima final se a populao tiver 250 elementos.
2) Considerando nvel de confiana de 90%, com margem de erro de 4% e proporo de
incidncia de 30%. Qual o tamanho mnimo da amostra para uma populao infinita?
3) Determine o tamanho da amostra inicial com nvel de confiana de 95% e margem de
erro de 3%?
Quadro do tamanho mnimo da amostra conforme o tamanho da populao, ao nvel de
confiana de 95% e incidncia de 50%.
POPULAO
(N)
AMOSTRA (n)
MARGEM DE ERRO
d=3%
MARGEM DE ERRO
d=5%
100
91
79
1000
516
277
5000
879
356
20000
1013
377
100000
1055
383
500000
1064
384
1000000
1067
384
DADOS
So as informaes inerentes s variveis que caracterizam os elementos que
constituem a populao ou a amostra.
Dados Brutos
So os dados obtidos diretamente da pesquisa, sem terem passados por nenhum
processo de sntese ou anlise.
O grupo dessas informaes obtidas atravs das variveis compe o que se denomina
de Banco de Dados.
idade
26
32
36
20
40
28
41
43
34
23
33
27
10
idade
37
44
30
38
31
39
25
37
30
ROL
Rol o arranjo dos dados brutos numricos em ordem crescente ou decrescente, se os
dados forem qualitativos o rol construdo em ordem alfabtica.
Pode-se, pelo rol, verificar de maneira mais clara e rpida o comportamento dos dados
do conjunto identificando o maior e o menor valor, alm de alguns elementos que podem se
repetir vrias vezes.
REPRESENTAO TABULAR
Consiste em apresentar os dados coletados atravs de tabelas mostrando de forma
resumida o que ocorre com os dados observados.
Para organizar uma srie estatstica ou uma distribuio de frequncias existem
algumas normas nacionais ditadas pela Associao Brasileira de Normas Tcnicas (ABNT) as
quais devem ser respeitadas. Assim, toda tabela estatstica deve conter:
Elementos essenciais
Ttulo indica a natureza do fato estudado (o qu?), o local (onde?) e a poca (quando?).
11
Exemplo:
TTULO
Estados
Percentuais
Minas Gerais
21,92
So Paulo
39,96
17,50
Esprito Santo
7,68
9,56
Santa Catarina
Total
CABEALHO
CORPO
3,38
100,00
RODAP
Sinais Convencionais
Normas de construo
a) As tabelas devem ser fechadas acima e abaixo por linha horizontal, no sendo fechadas
direita e esquerda por linhas verticais.
b) O cabealho, os totais e os subtotais devem ser destacados por traos horizontais;
c) Manter a uniformidade do nmero de casas decimais.
12
Porcentagem
Lacta
35,4
Nestl
31,6
Garoto
22,0
Neugbauer
3,6
Ferrero Rocher
0,9
Outras
6,5
Total
100,0
Fonte: ACB
ndice (%)
Mensal
Anual
Agosto
0,65
5,29
Setembro
0,54
5,85
Outubro
0,61
6,50
Novembro
0,56
7,10
Dezembro
0,56
7,70
Total
Fonte: Indicadores Econmicos da Agncia de notcias Dossi-Dinheiro
13
Frequncia
Absoluta (fi)
Frequncia
Relativa (fr%)
Fundamental
12
33,33
Mdio
18
50,00
Superior
16,67
Total
36
100
Fonte: RH
Frequncia
Relativa (fr%)
20
22,22
22
17
47,22
26
16,67
30
11,11
35
2,78
Total
36
100,00
Idade
Fonte: RH
14
b) contnuos:
Faixa salarial de empregados da seo de oramentos da Companhia MB (2011)
Faixa Salarial (s.m)
fi
fr%
8,00
10
27,78
8,00 | 12,00
12
33,33
12,00 | 16,00
22,22
16,00 | 20,00
13,89
20,00 | 24,00
2,78
Total
36
100
4,00 |
Fonte: RH
Para se agrupar os dados selecionam-se intervalos contnuos, onde cada valor coletado
ser alocado. Estes intervalos so chamados de intervalos de classe.
ou
K 1 3,3. log n,
At
K
Sempre que possvel pode-se arredondar o valor da amplitude dos intervalos para
valores inteiros, o que possibilita melhor leitura da tabela.
4a. Etapa: Definir os limites dos intervalos que podem ser expressos:
a) 20 ||30: contm os extremos 20 e 30;
b) 20| 30: contm o extremo 20 e no contm o extremo 30;
c) 20 |30: no contm o extremo 20, mas contm o extremo 30;
d) 20 30: no contm os extremos 20 e 30.
15
Exemplo:
1)
O conjunto de dados apresenta o nmero de clientes atendidos na LOJA AKI--BARATO nos meses de
maro e abril de 2012.
42
47
51
52
55
56
57
57
58
59
60
60
62
62
63
63
63
63
65
67
68
69
71
72
72
72
72
73
74
74
75
76
77
77
77
79
80
80
80
81
82
84
84
86
86
91
93
95
95
98
99
100
103
105
106
107
108
110
112
113
2)
O conjunto de dados apresenta o nmero de minutos que 50 usurios de Internet gastaram na rede
durante o dia 30 de janeiro de 2013.
7
11
17
17
18
19
20
21
22
23
28
29
29
30
30
31
31
33
34
36
37
39
39
39
40
41
41
42
44
44
46
50
51
53
54
54
56
56
56
59
62
67
69
72
73
77
78
80
86
3) Faturamento (R$ 1000) do Supermercado Pague e Leve Ltda. Nos 40 dias de funcionamento nos meses
janeiro e fevereiro de 2013.
381
389
389
418
429
430
472
486
568
623
669
682
699
728
821
821
822
856
866
904
904
912
924
926
968
973
989
996
1006
1007
1028
1084
1109
1112
1148
1149
1168
1175
1201
1209
REPRESENTAO GRFICA
Ser construdo em uma escala que no desfigure os fatos ou as relaes que se deseja
destacar. A altura de um grfico deve compreender entre 60% a 80% da largura.
16
Colocar a fonte de obteno dos dados, caso no seja o prprio autor que tenha feito a
coleta.
a) Grfico de Colunas
Figura Porcentagem total de produtos exportados em alguns estados do Brasil em maro
de 2010.
b) rfico de Setores
17
c) Grfico de Barras
d) Grfico de Linha
o tipo mais utilizado para representar a evoluo de uma varivel ao longo
do tempo.
Figura Srie de cotaes histricas da arroba do boi gordo no estado de So Paulo, Janeiro
Dezembro 2008.
de 1999
18
19
Histograma
Figura Faturamento em milhes de reais da empresa AJK, 2010.
60
50
40
30
20
10
0
11
13
15
17
19
21
23
25
27
Polgono de Frequncias
60
50
40
30
20
10
0
2
10
12
14
16
18
20
22
24
26
28
20
Ogiva
Figura Faturamento em milhes de reais da empresa AJK, 2010
100%
80%
60%
40%
20%
0%
2
11
13
15
17
19
21
23
25
MTODOS NUMRICOS
Vimos que o resumo dos dados por meio de tabelas, grficos e distribuies de
frequncias nos fornece informaes sobre o comportamento de uma varivel, mais
informaes complementares podem ser obtidas atravs valores representativos do conjunto,
determinados pelas seguintes medidas:
21
MEDIDAS DE POSIO
Mdia Aritmtica
Seja uma amostra de n elementos composta pelos seguintes valores: x1, x2,..., xn. A
mdia aritmtica simples desses elementos a soma das observaes dividida pelo nmero
delas. representada por:
n
xi
i 1
ou simplesmente
x
n
x
N
Exemplo: As taxas de juros recebidas por uma amostra de 10 aes durante certo perodo
foram (medidas em porcentagem):
2,59; 2,64; 2,60; 2,62; 2,57; 2,55; 2,61; 2,50; 2,63; 2,64. Calcule a mdia.
X =
Mediana
A mediana outra medida de tendncia central de uma varivel. A mediana o valor
que fica no meio da sequencia quando os dados so arranjados na ordem ascendente.
Com um nmero mpar de observaes, a mediana o valor do meio, ou seja, que
divide os valores em partes iguais.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
22
50%
Md
Exemplo: Para ilustrar o clculo da mediana vamos considerar os seguintes dados que se
referem aos salrios iniciais pagos para uma amostra de 11 economistas:
2350; 2450; 2550; 2380; 2560; 2210; 2390; 2630; 2440; 2420; 2380
2210; 2350; 2380; 2380; 2390; 2420; 2440; 2450; 2550; 2560; 2630
Uma vez que o nmero de observaes mpar, a mediana o valor que se encontra
exatamente do meio da srie. Assim, a mediana dos salrios 2420.
2350; 2380; 2380; 2390; 2420; 2440; 2450; 2550; 2560; 2630
Assim, a mediana ser a mdia dos dois valores centrais, que so: 2420 e 2440.
Mediana Md
2420 2440
2430
2
Moda
23
FREQUNCIA
19
8
13
5
45
A moda ou o refrigerante mais comprado a Coca-Cola. Para este tipo de dados no tem
sentido falar em mdia ou mediana. A moda fornece a informao de interesse, o elemento
que ocorre com maior freqncia.
MEDIDAS DE DISPERSO
So valores que representam a variabilidade de um conjunto numrico, isto , o
afastamento dos dados em relao a medida central.
Quanto maior a disperso menor poder representativo da medida central (mdia).
Vrios grupos podem ter a mesma mdia, mas serem muito diferentes na composio
dos seus valores. Por exemplo:
GRUPO
A
B
C
5
4
1
VALORES
5
5
5
5
6
9
MDIA
5
5
5
A mdia dos trs grupos a mesma (5), mas no grupo A no h variao entre os
dados, enquanto no grupo B a variao menor que no grupo C.
Verifica se que embora a mdia seja a mesma, mas os elementos so diferentes em
cada grupo, logo a medida de disperso pode representar, atravs de um nico valor, as
distncias entre os elementos e a mdia dos grupos.
Esses valores so determinados pelas seguintes medidas:
Amplitude total.
Varincia.
Desvio padro.
Coeficiente de Variao.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
24
Amplitude Total
VALORES
5
5
5
5
4
1
MDIA
5
5
5
5
6
9
AMPLITUDE TOTAL
0
2
8
Exemplo: Os seguintes dados foram obtidos para o nmero de minutos gastos ouvindo
msica.
8,3
14,3
24,6
37,0
39,2
50,2
59,2
64,9
81,7
90,3
At =
Varincia
Como a amplitude total uma medida que no leva em considerao todos os valores
coletados, o clculo da varincia permite que seja usado todos os valores, sendo que sua
medida corresponde a mdia dos quadrados das diferenas de cada valor com a mdia do
grupo.
calculada pelas as expresses abaixo:
Amostra
Populao
x
x n
s2
2
i
n 1
x
x N
2
i
25
Exemplo 1: A amostra apresenta o preo (R$) recomendvel para diversas aes comerciais
20
22
14
15
25
18
40
3,45
3,41
3,43
3,38
3,48
3,49
3,52
3,45
3,50
3,51
3,39
3,50
Desvio Padro
O desvio padro define-se como a raiz quadrada da varincia o que possibilita uma
medida na mesma unidade dos dados.
Faz-se uma distino entre o desvio padro (sigma) do total de uma populao, e o
desvio padro s de um subconjunto em amostra
Amostra
Populao
s s2
s s2 =
26
Coeficiente de Variao
Para uma varivel quantitativa
s
x
Por ser uma medida sem a influncia das unidades (adimensional), podendo ser
representada na forma percentual, bastando para isso multiplic-la por 100.
PRODUTO
39
50
MDIA
33
52
25
47
DESVIO PADRO
30
49
41
54
36
40
37
43
COEFICIENTE DE VARIAO
A
B
27
ALTURA
PESO
Mdia (X)
168 cm
53 kg
Desvio-padro (s)
30 cm
9,49 Kg
17,86%
17,90%
Observa-se ento, que embora o desvio padro das alturas, seja aproximadamente,
trs vezes maior que o desvio padro dos pesos, os coeficientes de variao so praticamente
iguais para as duas amostras, isso significa que, embora os desvios padro sejam discrepantes
e por possurem unidades diferentes, no podemos fazer esse tipo de comparao diretamente
nos desvios, porm o grau de concentrao dos dados em torno da mdia em cada varivel
aproximadamente igual o que indicam os coeficientes de variao, onde os resultados no
tm influencia das unidades.
Exemplos:
1) Uma varivel contbil, medida em milhares de reais, foi observada em dois grupos de
empresas apresentando os resultados seguintes:
GRUPO
A
B
MDIA
20
10
DESVIO PADRO
4
3
Qual produto que apresenta a maior disperso absoluta e o de maior disperso relativa?
2) Os dados abaixo representam o volume de vendas de dois vendedores em cinco meses.
MS
Janeiro
Fevereiro
Maro
Abril
Maio
VENDEDOR 1
20
22
18
20
20
VENDEDOR 2
30
14
20
12
24
Verifique qual vendedor tem menor variao nas quantidades vendidas mensalmente.
ATIVIDADE 5 MEDIDAS DE POSIO E DISPERSO
28
25%
Q1
25%
Q2
25%
Q3
10%
D1
... 10%...
D2
10%
... D5 ...
10%
D9
1%
. . .
P2
P50
1%
. . .
P98
1%
P99
29
4,47
4,69
4,88
5,00
5,10
5,26
4,48
4,71
490
5,01
5,11
5,27
4,51
4,73
4,90
5,01
5,11
5,27
4,54
4,76
4,95
5,01
5,16
5,29
4,54
4,78
4,95
5,02
5,16
5,32
4,61
4,80
4,96
5,04
5,18
5,35
4,64
4,81
4,97
5,05
5,18
5,46
4,66
4,86
4,98
5,08
5,19
5,50
4,68
4,86
4,98
5,09
5,24
5,85
k .n
,
100
Exemplo: Calcular o percentil 25, que corresponde ao primeiro quartil, que deixa 25% dos
dados abaixo e 75% dos dados acima do seu valor, usa se:
25 .60
L
15
100
Por se tratar de um nmero inteiro, deve se usar o 15 e o 16 valor em seu clculo. Assim:
P25
4,76 4,78
4,77 = Q1.
2
Isto equivale a dizer que 25% das pessoas levaram at 4,77 minutos para serem atendidas.
Para se calcular o percentil 78 (P78), que deixa pelo menos 78% dos dados abaixo do
seu valor, deve se:
78 .60
L
46 ,8 .
Localizar a sua posio na amostra atravs de:
100
Como o valor de L decimal, vamos considerar as duas possibilidades:
1) Interpolao aritmtica: no valor de L est entre as posies 46a e 47a, onde esto
os valores 5,16 e 5,18, observa-se que para uma diferena de uma unidade na posio
tem se uma diferena de 0,02 nos valores dos tempos, assim aplicando uma regra de
trs para determinar o valor para a diferena de 0,06, logo;
30
Posio
Tempo
1
0,02
0,06
X
X = 0,0012
Como a diferena 0,06 com a posio 46a ento basta somar o valor 5,16 e o valor de
X, ento o valor do P78 5,16 +0,0012 = 5,1612. (valor exato)
2) Arredondamento
78 .60
46 ,8 , arredonda se para 47a posio, assim o valor de P78 ser o valor
100
5,18 (valor aproximado).
Sendo
Assim, o valor 5,18 o P78 que representa o tempo mximo gasto para serem
atendidos 78% dos clientes.
Observao: Caso se deseja calcular o quartil ou o decil, devem-se considerar as seguintes
maneiras de determinar a posio do valor procurado.
Para o quartil:
Para o decil:
L
L
k .n
sendo K = 1, 2, ou 3.
4
k .n
sendo o valor de K um nmero de 1 a 9.
10
BOX
31
PLOT
O box plot introduzido pelo estatstico americano John Tukey em 1977 a forma de
representar graficamente os dados da distribuio de uma varivel quantitativa em funo de
seus parmetros. Os cinco itens ou valores: o menor valor (x1), os quartis (Q1, Q2 e Q3) e o
maior valor (xn), importante para se ter uma idia da posio, disperso e assimetria da
distribuio dos dados. Na sua construo so considerados os quartis e os limites da
distribuio, permitindo uma visualizao do posicionamento da distribuio na escala da
varivel. Para melhor compreenso deste box plot, a figura abaixo apresenta um esquema
sintetizado:
Ponto Externo
Limite superior
Limite inferior
Ponto Solto
Valores tpicos
LI
Q1
1,5DQ
Md
DQ
Q3
LS
Valores
1,5DQ
3,0DQ
32
LS = Q3 + B1
2.255
2.350
2.380
2.380
2.390
2.420
2.440
2.450
2.550
2.630
2.825
33
e B2, logo se trata de um ponto solto que deve ser representado por (0). Os dados fora destes
limites so considerados pontos fora da curva. A Figura apresenta um esquema do box plot
com esses resultados:
2.210
2.162,5
2.365
2.405
2.500
2.702,5
2.825
34
Exemplo:
Considere uma amostra com os seguintes valores dos preos praticados em 13
estabelecimentos comerciais:
3
15
17
18
21
21
22
25
27
30
38
49
68
35
0,5
1,0
36
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
Soma
6/6 = 1
Verifica se:
Que os elementos do espao amostral tm a mesma probabilidade, o que determina um
espao amostral considerado equiprovvel.
Todas as probabilidades so positivas.
A soma das probabilidades igual a um, ou seja, para todos os espaos amostrais a
probabilidade a ser: P(S) = 1.
P( A ) = 1 - P(A)
No caso de um evento com o seguinte atributo o nmero ser menor que quatro, o
evento : A={1, 2, 3}, para o clculo da probabilidade associada a esse evento,usa se:
P( A)
P( A)
37
3
0,5 50% .
6
Outros exemplos:
1) Num encontro consiste 25 estudantes de administrao, 10 de economia, 15 de contbeis a
e 8 de engenharia de produo. Se uma pessoa selecionada aleatoriamente pelo o instrutor
para responder a uma pergunta, determine a probabilidade de que o estudante escolhido: a)
seja da administrao; b) seja da engenharia de produo ou contbeis; c) no seja da
economia.
3) Um grupo de pessoas est numa sala e constitudo por: 5 rapazes de mais de 21 anos, 4
rapazes com menos de 21 anos, 6 moas com mais de 21 anos e 3 moas com menos de 21
anos. Uma pessoa escolhida ao acaso dentre as 18. Qual a probabilidade de: a) ter mais de
21 anos; b) ser um rapaz; c) ser uma moa; d) ser moa com menos 21 anos.
4) O sistema escolar do pas S alegria fornece acesso a internet a 21.733 escolas do nvel
fundamental, 7.286 escolas do nvel mdio e 10.682 do nvel superior. Existem no pas 51.745
escolas do nvel fundamental, 14.012 do nvel mdio e 17.229 do nvel superior.
a) se voc escolher aleatoriamente uma escola do nvel fundamental para visitar, qual a
probabilidade de que ela tenha acesso a internet?
b) se voc escolher aleatoriamente uma escola do nvel mdio para visitar, qual a
probabilidade de que ela tenha acesso a internet?
c) se voc escolher aleatoriamente uma escola para visitar, qual a probabilidade de que ela
seja do nvel fundamental?
d) se voc escolher aleatoriamente uma escola para visitar, qual a probabilidade de que ela
tenha acesso a internet?
ATIVIDADE 7 - PROBABILIDADE
38
VARIVEIS ALEATRIAS
POSSVEIS VALORES DA
DISCRETAS
VARIVEL
0,1,2,3,4,5
Inspecionar 50 declaraes de
Imposto de Renda
Verificar as refeies servidas num
restaurante durante um dia
0,1,2,3,...,49,50
no de refeies servidas
0,1,2,3,4,5,...
EXPERIMENTOS
DISTRIBUIO DE PROBABILIDADE
Para uma varivel aleatria discreta x, a distribuio de probabilidade definida por
uma funo de probabilidade, denotada por f(x). Essa funo d a probabilidade para cada um
dos valores da varivel aleatria.
No desenvolvimento de uma funo de probabilidade para qualquer varivel discreta,
duas condies precisam ser satisfeitas:
p(x) 0
p(x) = 1
39
0
54/300
1
117/300
2
72/300
3
42/300
4
12/300
5
3/300
Total
300/300
ESPERANA MATEMTICA
Denotada por E(x), que representa a mdia de uma varivel aleatria. O valor esperado
uma mdia ponderada dos valores que a varivel aleatria pode assumir, onde os pesos so
as probabilidades. A expresso matemtica para representar o valor esperado da varivel
aleatria x :
E ( x ) x. f ( x )
Exemplo: Tendo a distribuio de probabilidade do nmero de automveis vendidos durante
um dia na SOCAR.
X
0
1
2
3
4
5
Total
f(x)
0,18
0,39
0,24
0,14
0,04
0,01
x.f(x)
0
0,39
0,48
0,42
0,16
0,05
1,5
x2.f(x)
0
0,39
0,96
1,26
0,64
0,25
3,5
E ( x ) x . f ( x ) 1,5. Significa que se espera vender em mdia 1,5 carros por dia.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
40
VARINCIA
A varincia uma mdia ponderada dos desvios da varivel aleatria em relao a sua
mdia, elevados ao quadrado, onde os pesos so as probabilidades. A expresso matemtica
usada para o seu clculo est a seguir.
Sendo E ( x 2 )
V( x ) 2
x 2 .f ( x )
( x ) 2 .f ( x )
E ( x 2 ) E ( x ) 2
DESVIO PADRO
O desvio padro da varivel x a raiz quadrada da varincia, isto :
V ( x) =
1,25 1,12
DISTRIBUIO BINOMIAL
Vrios tipos de varivel aleatria so usados com tanta freqncia que receberam
nomes especiais. Uma distribuio de varivel aleatria discreta importante a chamada
distribuio binomial.
A distribuio binomial se aplica a qualquer situao em que se realizam vrias provas
independentes, cada uma das quais comporta apenas um dentre dois resultados possveis.
Esses dois resultados chamam-se sucesso e fracasso. Seja X o nmero de sucessos. Se a
probabilidade de sucesso em cada prova p e a probabilidade de fracasso q = 1 p. Ento a
frmula da funo de probabilidade para a varivel aleatria binomial :
P( x) Cnx . p x .q n x
Onde: p = probabilidade do sucesso (o que se est sendo verificado)
q = probabilidade do fracasso, sendo p + q = 1, logo q = 1 p.
n!
x ! n x !
41
Exemplo 1: Sabendo-se que 80% dos clientes de uma agncia bancria so homens, qual a
probabilidade de se encontrar numa amostra de dez clientes:
a) Exatamente sete clientes homens?
b) Mais de sete clientes homens?
c) Nenhum cliente homem?
d) Calcule a mdia esperada e o desvio padro de
clientes do sexo masculino.
Exemplo 2: Uma firma exportadora sabe que 5% das exportaes algum problema na
documentao. Se ela realizar negcios com seis clientes, determine a probabilidade de:
a) Exatamente dois apresentarem problemas. b) Ao menos um apresentar problema.
c) No mnimo quatro apresentarem problemas. d) Exatamente cinco no apresentarem
problemas. d) Determine a mdia esperada e varincia que descreve o comportamento deste
negcio de exportao.
Exemplo 3: O departamento de qualidade de uma empresa seleciona, aleatoriamente, alguns
itens que chegam a empresa e submete-os a testes. Para avaliar um lote de 150
refrigeradores, o departamento de qualidade selecionou 10 refrigeradores. Ele vai recomendar
a aceitao do lote se no existir item defeituoso na amostra. Supondo que o processo
produtivo desses refrigeradores gera um percentual de 3% de defeituosos, responda: qual a
probabilidade de que o lote venha a ser aceito?
EXEMPLOS:
CONTNUAS
POSSVEIS VALORES V.
A. C.
Tempo
x0
Volume
0 x 300 ml
Tempo
x0
EXPERIMENTOS
V. A.
42
as seguintes condies:
a ) p (x) 0 ,
x R
b)
p( x) dx 1
DISTRIBUIO NORMAL
p( x)
1
.e
2
1 x
para
0
43
Na maioria das vezes em que necessitamos da rea sob a curva normal, devemos
recorrer a uma tabela. Seria impossvel elaborar uma tabela para cada distribuio normal
com todos os valores possveis da mdia e da varincia. Felizmente, podemos achar os
resultados para qualquer distribuio normal apelando para uma tabela de distribuio normal
com mdia = 0 e varincia 2 = 1. Essa distribuio normal especial chamada distribuio
normal padro.
Na prtica, a distribuio normal apresenta um nmero muito grande de combinaes
entre a mdia e o desvio padro. No entanto, atravs da mudana de varivel, contornamos
esse problema, fazendo com que todas as inmeras distribuies normais reduzam-se a apenas
uma, ou seja, distribuio Z. Alm da varivel z ser desprovida da unidade de medida (isto
, constitui um nmero puro), ela serve para qualquer tipo de varivel, independentemente de
sua unidade usando a seguinte frmula:
z
Onde z tem distribuio normal reduzida com a seguinte funo densidade de probabilidade.
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
p(x) =
1
. 2
.e
1 x
44
x
Sendo z
p z
1
2
.e
z2
2
45
46
47
48
6) Construa uma tabela com os dados abaixo, destacando as marcas, frequncias absolutas e as
frequncias relativas percentuais e elabora um ttulo para a tabela. Os dados representam as marcas de
refrigerantes comprados no supermercado Barato que S, em 10 de janeiro de 2010.
Coca-Cola
Pepsi-Cola
Coca-Cola Light
Pepsi-Cola
Sprite
Coca-Cola
Sprite
Coca-Cola
Coca-Cola
Coca-Cola
Coca-Cola Light
Coca-Cola
Pepsi-Cola
Coca-Cola Light
Coca-Cola
Pepsi-Cola
Sprite
Coca-Cola
Sprite
Coca-Cola Light
Coca-Cola
Pepsi-Cola
Coca-Cola Light
Coca-Cola Light
Coca-Cola
Pepsi-Cola
Sprite
Coca-Cola
Pepsi-Cola
S*+- prite
Coca-Cola
Coca-Cola
Coca-Cola Light
Coca-Cola
Pepsi-Cola
Pepsi-Cola
Coca-Cola Light
Coca-Cola Light
Coca-Cola
Sprite
Coca-Cola Light
Pepsi-Cola
Sprite
Pepsi-Cola
Pepsi-Cola
Pepsi-Cola
Coca-Cola Light
Coca-Cola
Coca-Cola Light
Coca-Cola
7) A tabela seguinte apresenta a tabulao cruzada de uma pesquisa sobre o fato de um estudante
possuir habilitao ou no. Encontre o que se pede:
a) tamanho da amostra analisada;
b) nmero de alunos habilitados analisados;
c) nmero de alunos Economia analisados;
d) o percentual de alunos habilitados do curso de Administrao;
e) percentual dos alunos no habilitados que cursam Engenharia.
Distribuio de alunos da Faculdade do Saber, quanto ao curso e a habilitao - 2008
Possui habilitao
Curso
Sim
No
fi
3
2
% linha
60
40
Administrao
% coluna
30
20
% total
15
10
fi
3
6
% linha
33,3
66,7
Economia
% coluna
30
60
% total
15
30
fi
4
2
% linha
66,7
33,3
Engenharia
% coluna
40
20
% total
20
10
fi
10
10
% linha
50
50
Total
% coluna
100
100
% total
50
50
Total
5
100
25
25
9
100
45
45
6
100
30
30
20
100
100
100
49
31
40
44
49
55
32
40
45
49
56
35
41
47
50
56
36
42
47
50
57
36
42
47
51
57
36
42
48
51
60
38
42
48
51
61
39
42
48
54
61
39
43
49
54
62
587
670
325
337
615
688
929
1023
514
292
609
506
871
335
404
1070
723
700
378
540
820
625
794
240
503
853
915
457
447
363
564
852
793
676
704
860
1128
495
778
494
396
670
693
666
627
420
235
396
748
474
483
862
552
345
3) O Departamento de Pessoal da Empresa AZ Ltda. fez um levantamento dos salrios dos 120
funcionrios do setor administrativo, em salrios mnimos conforme a tabela:
a) Complete a tabela com as frequncias possveis e os pontos mdios.
b) Represente graficamente atravs do histograma e polgono de frequncia.
Salrios do setor administrativo da Empresa AZ Ltda. maro/2008
Faixa Salarial (s.m)
1 | 3
3 | 5
5 | 7
7 | 9
Total
fi
30
48
24
18
fi
30
40
70
38
13
09
200
fr%
15
20
35
19
6,5
4,5
100
fi
5
13
50
fr%
Fc
Frc%
32
8
47
3
50
100
6) A tabela a seguir apresenta a distribuio de renda de uma amostra da populao de uma cidade do
nordeste do pas. Faa uma anlise da tabela e descreva o perfil da renda nesta cidade, represente
atravs do histograma e do polgono de frequncia.
Renda (s.m)
1 | 3
3 | 5
5 | 7
Mais que 7
Total
Frc%
72,50
85,00
93,75
100,00
51
10
12
11
14
18
22
24
25
26
28
29
31
32
32
35
5,1
15,8
6,2
16,6
8,6
17,3
9,0
17,3
9,2
19,2
9,6
19,6
11,2
22,9
12,2
30,3
12,3
31,1
12,8
41,6
14,5
52,7
Determine as seguintes medidas: mdia, mediana, moda, desvio padro e o coeficiente de variao.
3) Uma loja vende cinco produtos bsicos A, B, C, D, E. O lucro por unidade comercializada destes
produtos vale respectivamente $200,00; $300,00; $500,00; $1.000,00; $5.000,00. A loja vendeu em
determinado ms 20; 30; 20; 10; 5 unidades respectivamente. Qual foi o lucro mdio comercializado
por esta loja?
4) Os dados abaixo informam os minutos gastos para o atendimento no caixa de um determinado
banco. Calcule: mdia, mediana, moda, desvio padro e coeficiente de variao.
2,0
5,1
6,4
7,5
8,4
10,9
2,4
5,4
6,5
7,7
8,4
10,9
2,7
5,7
6,8
7,8
8,7
11,2
3,0
5,9
6,9
7,8
9
11,3
3,6
6,0
6,9
7,8
9,1
11,8
3,9
6,0
7,2
7,8
9,3
13,2
4,2
6,0
7,2
8,0
9,4
13,6
4,2
6,1
7,4
8,1
9,5
13,8
4,2
6,2
7,5
8,1
10,9
15,3
28
29
29
31
32
33
37
32
33
34
25
30
29
31
32
32
41
35
34
33
52
TURMA
MDIA
DESVIO-PADRO
22,5
4,5
24,0
5,4
8) Deseja-se comparar a qualidade de um produto produzido por duas fbricas. Essa qualidade
definida pela uniformidade com que o produto produzido em cada fbrica. A qualidade das duas
fbricas a mesma conforme as medidas abaixo?
ESTATSTICAS
Tamanho
Mdia
Varincia
A
21
21,15
0,0412
B
117
21,12
0,1734
53
12
18
22
25
12
18
22
25
14
19
23
25
15
19
23
27
15
19
23
27
15
20
23
28
15
21
23
32
16
21
23
2) Um dos objetivos da administrao lucrar o mximo possvel com o capital investido em sua
empresa. Uma medida de bom desempenho o retorno sobre a contrapartida - razo da entrada liquida
pela contrapartida das aes. Mostrados a seguir esto os mais recentes retornos sobre as porcentagens
de contrapartida para 25 empresas.
9,0
17,3
5,0
19,6
31,1
30,3
22,9
9,6
14,7
41,6
8,6
19,2
11,4
11,2
6,2
15,8
12,8
52,7
12,2
17,3
14,5
12,3
9,2
5,1
16,6
1,5
1,8
1,8
1,9
2,0
2,4
2,7
3,0
3,6
3,9
4,2
4,2
4,2
4,2
4,2
4,2
4,5
5,1
5,1
5,4
5,7
5,9
6,0
6,0
6,0
6,0
6,0
6,1
6,2
6,4
6,5
6,8
6,9
6,9
7,2
7,2
7,2
7,4
7,4
7,5
7,5
7,7
7,8
7,8
7,8
7,8
8,0
8,1
8,1
8,1
8,1
8,4
8,4
8,7
9,0
9,1
9,3
9,4
9,5
4)Uma amostra dos salrios iniciais pagos aos novos graduados em economia apresentada a seguir.
Os dados esto em milhares de reais.
2,07
1,98
2,72
2,53
2,93
2,91
2,33
3,06
2,23
a) Quartil 1 e 3
b) Calcule os decis 3 e 6
c) Calcule os percentis 9 e 90
1,82
3,00
3,09
2,42
3,02
3,01
2,27
2,89
3,05
2,38
3,04
2,29
2,07
3,03
3,18
2,21
2,11
2,53
2,59
2,06
2,33
54
ATIVIDADE 7 PROBABILIDADE
1) Numa empresa h 10 homens e 20 mulheres. Metade dos homens e das mulheres casada. Ao
retirar ao acaso uma pessoa, qual a probabilidade de ser:
a) ser mulher
b) ser homem
c) ser homem e casado
d) ser mulher e solteira
e) sabendo que mulher de ser casada?
2) Dois dados so lanados simultaneamente. Qual a probabilidade de:
a) a soma ser menor que quatro b) a soma ser nove c) o primeiro resultado ser maior que o segundo
d) os resultados serem iguais.
3) Um estudo de 500 vos da Voe Alegre selecionados ao acaso mostrou que 430 chegaram no
horrio. Qual a probabilidade de um vo dessa empresa no chegar no horrio?
4) Dentre 400 motoristas selecionados ao acaso na faixa etria de 20 a 24 anos, 136 estiveram
envolvidos em acidentes de carros no ano anterior. Selecionado ao acaso um motorista dessa faixa
etria, qual a probabilidade de ele (ou ela) se envolver em um acidente de carro no prximo?
5) Quanto o antialrgico Tira Tira foi testado clinicamente, 70 pessoas tiveram sonolncia e 711 no.
Com essa amostra estime a probabilidade de um usurio desse antialrgico ter sonolncia.
6) Numa bolsa tem se cinco moedas de R$ 1,00 e quatro de R$ 0,50. Qual a probabilidade de ao se
retirar duas moedas se obtenha R$ 1,50.
7) Em um lote tem oito peas com pequenos defeitos, 12 com grandes defeitos e 15 perfeitas. Qual a
probabilidade ao se retirar: a) uma pea ao acaso e ela seja perfeita ou tenha pequenos defeitos? b)
quatro peas ao acaso, todas tenham grandes defeitos?
8) Se h seis pneus defeituosos em um lote de quinze, escolhem-se trs pneus para uma inspeo, qual
a probabilidade de que: a) um dos pneus defeituosos seja includo? b) no mnimo dois tenham
defeitos? c) no mximo dois sejam perfeitos?
9) Uma empresa de seguros oferece quatro nveis de deduo- nenhum, baixo, mdio e alto- para os
possuidores de aplices de seguros residenciais e trs nveis diferentes (baixo, mdio e alto) para os
possuidores de aplices de seguros de automveis. A tabela a seguir fornece as propores das
diversas categorias de segurados que possuem ambos os tipos de seguros.
RESIDENCIAL
AUTOMVEL
Nenhum
Baixo
Mdio
Alto
Baixo
0,04
0,06
0,05
0,03
Mdio
0,07
0,10
0,20
0,10
Alto
0,02
0,03
0,15
0,15
Suponha que um indivduo que possua ambos os tipos de aplices seja selecionado aleatoriamente.
a) Qual a probabilidade de que o indivduo tenha deduo mdia de automvel e alta de residncia?
b) Qual a probabilidade de que o indivduo tenha deduo Baixa de automvel? Uma deduo baixa
de residncia?
c) Qual a probabilidade de que o indivduo esteja na mesma categoria para dedues de automvel e
residncia?
d) Com base na resposta da parte c, qual a probabilidade de que duas categorias sejam diferentes?
Centro de Cincias Exatas (CCE) Departamento de Estatstica (DSTA)
55
TOTAL
TOTAL
8
7
15
12) A tabela abaixo mostra as promoes oficiais masculinas e femininas de uma grande fora policial
metropolitana.
MASCULINO
FEMININO
TOTAL
Promovidos
288
36
No-promovidos
672
204
TOTAL
Qual a probabilidade de um oficial ser promovido dado que masculino?
13) Em um levantamento com estudantes de MBA, os seguintes dados foram obtidos sobre a razo
principal de ter se ligado escola que eles se matricularam.
Qualidade
Custo/Convenincia
Outras
TOTAL
Tempo Integral
421
393
76
890
Tempo Parcial
400
593
46
1039
TOTAL
821
986
122
1929
a) Se um estudante de tempo integral, qual a probabilidade de que a qualidade tenha sido a razo
de sua escolha?
b) Qual a probabilidade de que o custo/convenincia tenha sido a razo da escolha?
56
57
58
9) Uma mquina automtica de encher de garrafas de refrigerantes est regulada para que o volume
mdio do lquido em cada garrafa seja de 1.000 cm3 e o desvio padro de 10 cm3. Pode-se admitir que
a varivel volume tenha distribuio normal, qual a porcentagem de garrafas em que o volume de
lquido menor que 990 cm3?
10) Uma fbrica de sabonetes sabe que seus produtos pesam, em mdia, 98 gramas, com desvio
padro de 7 gramas. Em um ms de produo, so fabricadas 420.000 unidades. Para garantir, com
92% de probabilidade, a produo mensal, quantas toneladas de matria-prima devem ser adquiridas?
11) H duas mquinas disponveis para o corte de rolhas para garrafas de vinho. A primeira produz
rolhas com dimetros que possuem uma distribuio normal com mdia 3 cm e desvio padro 0,1 cm.
A segunda mquina produz rolhas com dimetros que possuem uma distribuio normal com mdia
3,04 c e o desvio padro 0,2 cm. A s rolhas aceitveis possuem dimetros entre 2,9 cm e 3,1 cm. Que
mquina tem maior probabilidade de produzir uma rolha aceitvel?
59
Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2703
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,05
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,06
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0, 4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,07
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,08
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,09
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990