A Distribuição Normal PDF

1
Captulo 3 A Distribuio Normal

3.1 - Introduo
Experimentos compostos pela repetio, sucessiva e independente de um mesmo experimento bsico
geram sequncias de variveis aleatrias X
1
, X
2
, X
3
, independentes entre si, mas identicamente
distribudas. Tal o caso, por exemplo, da repetio de um mesmo experimento binrio E
p
, ou do nosso
conhecido D
5
, o arremesso de um dado no viciado de cinco lados. Uma questo que surge
naturalmente, nesses casos, se refere distribuio de probabilidades da soma S
n
, dos n primeiros
valores observados: o nmero de sucessos em n repeties de E
p
, ou a pontuao total acumulada em n
arremessos sucessivos e independentes de um dado.
No primeiro caso, j temos a resposta formal rigorosa. O nmero de sucessos em n repeties
independentes e sucessivas de E
p
, o experimento composto E
p
n
, tem distribuio binomial com
parmetros n e p, que representamos por S
n
~b(n, p), com

Como, nesse caso, E(X
i
)=p e V(X
i
)=p(1-p), esperana e varincia de S
n
so determinadas diretamente das
propriedades bsicas: E(S
n
)=np e
V(S
n
)=np(1-p). A figura ao lado uma
representao grfica da b(100, 0,2),
na faixa de 30 a 70, com
probabilidades no extremamente
pequenas. Para valores de n muito
elevados, os clculos podem ser
complicados, mesmo com o uso de
computador.
Nos casos como o D
5
, ou mais gerais,
como D
m
, de um dado hipottico de m lados, os clculos diretos de probabilidade de S
n
, a soma dos
primeiros n resultados individuais em repeties sucessivas do experimento aleatrio elementar ainda
podem ser feitas com o auxlio de
algoritmos como o apresentado no
Captulo 2 para D
5
n
, embora, para m e
n grandes os valores envolvidos para a
cardinalidade de eventos como {S
n
=s}
se agigantem muito rapidamente. A
figura abaixo uma representao
grfica de P{S
20
=s}. Como na figura
acima, a representao se restringiu
faixa relevante de valores possveis.
A semelhana de forma geral das duas figuras no , de forma alguma, acidental, mas se constitui na
manifestao de uma das propriedades mais interessantes de toda a Matemtica e, certamente, um dos
resultados mais importantes da Teoria da Probabilidade: O Teorema Central do Limite. Este teorema,
em uma de suas verses mais simples, assegura que se uma varivel aleatria, como S
n
, a soma de um
nmero n de observaes sucessivas e independentes de uma varivel aleatria X, com esperana e
varincia o
2
, ento, na medida em que n cresce, a sua distribuio se aproxima cada vez mais da
distribuio normal (ou gaussiana), de esperana n e varincia no
2
. Assim, no primeiro caso, com o
nmero de sucessos em 100 repeties de um mesmo E
p
com p=0,2, devemos esperar uma distribuio

2

aproximadamente igual a uma normal, de esperana 20 e varincia 16. No segundo caso, de 20
repeties de D
5
, o resultado acumulado deve ter distribuio aproximadamente Normal, com
esperana 60 e varincia 40.
3.2 - A Distribuio Normal
Uma varivel aleatria contnua X dita ter distribuio Normal, com esperana e varincia o
2
, que se
representa por X~N(, o
2
), se sua f.d.p. for

Com esperana 0 e varincia 1, tem-se a Normal padro, geralmente representada por Z, isto , Z~N(0,
1), dita ter distribuio normal padro. Sua funo
de densidade de probabilidades, representada por
|(z),
, para z real. A figura ao lado

representa a f.d.p. da normal padro. Como se v, a
normal padro concentra praticamente toda a
probabilidade no intervalo (-3, 3). A tabela abaixo d
a probabilidade de eventos do tipo {-i<Z<i}, para i=1,
2, 3, 4 e 5.
Ao final deste
captulo uma tabela mais completa traz a distribuio acumulada da
normal padro

para z=0 at z=3,99, a passos de 0,01. A figura abaixo representa
u(z), a funo de distribuio acumulada de uma varivel aleatria distribuda segundo uma normal
padro.
A transformao
reduz uma varivel

aleatria X~N(, o
2
) sua forma padro Z~N(0, 1).
Assim, a probabilidade de eventos como {X<a} pode
ser extrada da tabela para a normal padro, pois

Exemplo 3.2.1 Uma varivel aleatria X tem distribuio Normal, com esperana 100 e varincia 100,
portanto desvio padro 10. Calcule:
a- P{X<100}

Evento probabilidade
{1 <Z < 1} 0,68268949
{2< Z < 2} 0,95449974
{3< Z < 3} 0,99730020
{4< Z < 4} 0,99993666
{-5 < Z < 5} 0,99999943

3

Como a normal simtrica em torno da esperana, ento P{X<100}= P{X>100}=0,5.
b- P{X<110} e P{X<90}
Ora, o valor 110 est exatamente a um desvio padro acima
da esperana, logo

Da tabela tiramos u(1)=0,84134, portanto P{X>110)=0,1587, e, por simetria P{X<90)=0,1587.
c- P{90<X<110}
Transformando para a normal padro, temos:

Como, por simetria, temos:

Aplicao do Teorema Central do Limite, na verso apresentada, para soma de variveis aleatrias
independentes e identicamente distribudas, nos permite resolver, de forma muito simples, uma
variedade surpreendente de problemas prticos antes intratveis. Vejamos alguns exemplos:
Exemplo 3.2.2 Seja E
p
, um experimento aleatrio binrio, com P{s}=p, o qual repetido sucessiva e
independentemente, gerando resultados parciais X
1
, X
2
, X
3
, , variveis aleatrias independentes e
identicamente distribudas, com distribuio binria de P{X=1}=p. Vamos definir
, respectivamente a soma e a mdia aritmtica dos n primeiros valores

observados. Neste caso particular, S
n
o nmero total de sucessos obtidos e
a freqncia de
sucessos, nas n primeiras repeties. Vamos considerar valores grandes de n.
a- Seja p=0,50 (como no arremesso de uma moeda) e n=10000. Calcule P{4.900<S
n
<5.100}.
A varivel aleatria X, correspondente ao resultado parcial em cada repetio, tem distribuio B(0,5),
portanto E(X)=0,5 e V(X)=0,25. Sendo a soma de 10 mil observaes independentes de X, S
n
tem
esperana 5000 e varincia 2500, logo:

Portanto

Como se pode ver, a faixa de valores realmente possveis para o nmero total de Caras em dez mil
arremessos de uma moeda surpreendentemente estreito e se situa em torno do valor mdio
esperado, 5000.

4

A propsito, atravs de sequncia anloga de operaes, obtm-se P{4850<S
n
<5150} ~ 0,9973.
b- Seja p=0,20 (como na obteno de um 5 em D
5
) e n=1000. Calcule
.
Neste caso, X tem esperana 0,2 e varincia 0,16, logo S
n
tem esperana 200 e varincia 160. Sendo a
soma de mil resultados parciais, a distribuio de S
n
, uma b(1000, 0,2) bem prxima da normal de
mesma esperana e mesma varincia. Ora, se S
n
~N(200, 160), ento
sendo igual a S
n
dividido por n,
tem tambm distribuio aproximadamente normal, com esperana e varincia iguais a 0,2 e 0,00016,
respectivamente. Assim,

Portanto,

Exemplo 3.2.3 Consideremos agora sequncias de repeties independentes de D
5
, com X
1
, X
2
, X
3
, ,
S
n
e
definidos da forma usual. Agora, E(X)=3 e V(X)=2, portanto E(S

n
)=3n e V(S
n
)=2n. Lembrando que
, temos
. Com n no muito pequeno podemos aproximar as

distribuies, tanto de S
n
como de
, Normal, com esperanas e varincias correspondentes. Assim,

com n=100, E(S
n
)=300, V(S
n
)=200,
. Desta forma, embora o conjunto de

valores possveis para S
100
seja o dos inteiros de 100 a 500, a probabilidade de S
100
cair no intervalo
fechado de 270 a 330 superior a 0,95. O clculo mental rpido segue o roteiro: (1) O desvio padro de
S
n
raiz de 200, ou 14,1; (2) portanto o intervalo considerado, [270, 330] se estende, simetricamente
em torno de E(S
n
), por mais que dois desvios padres de S
n
de cada lado; (3) sendo a soma de 100
resultados intermedirios, igualmente distribudos e independentes, a distribuio de S
n
pode ser
considerada aproximadamente Normal; (4) logo um intervalo de dois desvios padres em torno de E(S
n
)
ter probabilidade um pouco acima de 0,95. Um clculo mais cuidadoso, extraindo resultados da tabela,
nos leva a P{270sS
n
s330}=0,965994. Um refinamento ainda usando a aproximao pela normal,
conforme discutiremos adiante, resulta P{270sS
n
s330} = 0,967847. O valor exato, calculado atravs do
algoritmo desenvolvido no Captulo 2, estendido at n=100, 0,969155739. O melhor resultado obtido
atravs da aproximao pela distribuio Normal apresentou, portanto, uma subavaliao relativa de
0,019%, desprezvel para a maioria dos fins. A propsito, existem exatamente 764.529.073.299.384x10
55

maneiras diferentes cada uma com a mesma probabilidade, 5
-100
de se obter a soma dos 100
resultados parciais no intervalo [270, 330]. Vejamos outras questes.
a- Calcule P{S
1000
>3100}.
Com n=1000, E(S
n
)=3000 e V(S
n
)=2000. Assumindo a aproximao Normal para a distribuio de
S
1000
, temos:

Como se v, em 1000 arremessos de um dado no viciado de cinco lados, o total esperado 3000, e
a probabilidade do total superar 3100 de apenas 1,29%.
b- Se o dado for ligeiramente tendencioso, (ver tabela),
calcule P(S
1000
)>3100
A distoro nas probabilidades altera a esperana e a varincia de X. Agora, E(X)=3,04 e
V(X)=1,9984, portanto,
1 2 3 4 5
0,19 0,20 0,20 0,20 0,21

5

A distoro no dado, favorecendo ligeiramente o resultado 5 em detrimento do 1, aumenta a
esperana de S
1000
, elevando a probabilidade de um valor superior a 3100 de 1,29% para 9,01%.

c- De volta ao D
5
no tendencioso e n=1000, determine um inteiro m, tal que P{3000
msS
n
s3000+m}=0,99.
O intervalo em questo , portanto, simtrico em torno de E(S
n
), com meia amplitude igual a m.
Numa normal, o intervalo simtrico em torno da esperana de probabilidade 0,99, tem meia largura
igual a 2,58 desvios padres (da tabela, u(2,58)=0,995), logo 2,58 desvios padres de S
1000
igual a
m, portanto .

d- Dois amigos, A e B disputam uma corrida de dados (para maior agilidade do processo, vamos
supor que o jogo feito com dados simulados no computador). Em rodadas sucessivas, eles vo
arremessando seus dados e acumulando os resultados:
A X
1
, X
2
, X
3
, , S
n
e

B Y
1
, Y
2
, Y
3
, , T
n
e

Qual a probabilidade de que, aps 100 rodadas, B esteja liderando a corrida por mais que 10
pontos?
A soluo simples e comea com a definio de D
n
= T
n
S
n
, a vantagem de B sobre A aps n
rodadas. Como E(S
n
)=E(T
n
), E(D
n
)=0 enquanto que V(D
n
)=V(S
n
)+V(T
n
)=4n. Admitindo-se que S
n
e
T
n
tem distribuio Normal, conclui-se que D
n
~N(0, 4n) e, portanto, D
100
~N(0, 400); logo:

Por simetria, esta tambm a probabilidade de que, aps 100 rodadas, A esteja liderando por
mais que 10 pontos.
e- Na corrida acima, vamos agora supor que os dados sejam ligeiramente distorcidos em favor do
jogador B, como mostra a tabela ao lado. Qual a
probabilidade de B ganhar uma corrida de 1000
rodadas?
Agora E(S
n
)=2,96 e E(T
n
)=3,04, enquanto as duas
varincia so iguais a 1,9984, portanto E(D
n
)=0,08 e V(D
n
)=3,9968n. Com 1000 rodadas,
teremos E(D
1000
)=80 e V(D
1000
)=3996,8 e
u

Como se v, a ligeira distoro d a B enorme vantagem em uma corrida prolongada. Nessas
condies vantajosas, sua probabilidade de vencer uma corrida de dez mil rodadas
u(4,00)=0,999968.

1 2 3 4 5
A 0,21 0,20 0,20 0,20 0,19
B 0,19 0,20 0,20 0,20 0,21

6

A qualidade da aproximao da distribuio de probabilidades de S
n
associadas a D
5
n
por N(3n, 2n) pode
ser bem apreciada atravs da figura abaixo. Nela as barras verticais representam os valores exatos de
P{S
100
=s}, para valores de d na regio relevante, de 250 a 350, calculados atravs do algoritmo
apresentado no Captulo 2,
so sobrepostos por uma
linha envoltria contnua
corresponde f.d.p. da
normal com esperana 300 e
varincia 200. A quase
perfeita coincidncia entre
valores exatos e aproximados
pode ser apreciada. A tabela
abaixo apresenta os dois
grupos de valores da
probabilidade exato e aproximado para um conjunto selecionado de valores de d.
P{S
100
=s}
s
250 260 270 280 290 300
Valor exato 5,196E-05 0,0005113 0,0029794 0,0104059 0,0219665 0,0281636
Aproximao Normal 5,446E-05 0,0005167 0,0029733 0,0103777 0,0219696 0,0282095
Erro percentual 4,81 1,06 -0,20 -0,27 0,01 0,16

Exemplo 3.2.4 As ideias acima so agora aplicadas ao problema geral de amostragem em populaes
muito grandes. Quer-se estimar a taxa de ocorrncia (p) de determinada caracterstica gentica em uma
populao de dezenas de milhes de indivduos. O teste preciso, mas caro e intrusivo, portanto a
amostra deve ser a menor possvel. Sabe-se que p deve estar na faixa de 10 a 25%. Uma amostra de
1200 indivduos inicialmente considerada.
Considerando-se o pior caso em termos da varincia, qual seria a probabilidade de um erro superior a 2
pontos percentuais na estimativa de p?
Primeiro vamos definir como X
i
o resultado relativo ao i-simo indivduo sorteado: X
i
=1 se o indivduo
apresenta a caracterstica gentica estudada, e X
i
=0, caso contrrio. Assim, X
i
~B(p), e E(X
i
)=p e V(X
i
)=p(1-
p), onde p a frao de indivduos com a caracterstica gentica estudada, na populao.
Com uma amostra aleatria de tamanho n, teremos X
1
, X
2
, , X
n
, independentes e com a mesma
distribuio B(p), a distribuio binria ou de Bernoulli. A soma S
n
tem, ento, distribuio binomial com
parmetros n e p: S
n
~b(n, p). A esperana e a varincia de S
n
so, respectivamente, np e np(1-p).
Pelo teorema central do limite, podemos aproximar S
1200
~N(1200p, 1200p(1-p)), logo

Portanto,

O pior caso (com maior probabilidade de erro superior a 2 pontos percentuais), ocorre quando a
varincia mxima. A varincia depende de p e, como se sabe que p est no intervalo (0,10, 0,25), o
pior caso, em termos de varincia ocorre em p=0,25, com V(X)=0,1875. Ento
s

s u
Portanto, nas condies e hipteses do exerccio, com uma amostra de tamanho n=1200, e sabendo a
priori que p se situa entre 10 e 25%, a probabilidade de um erro de estimativa superior a 2 pontos
percentuais , no mximo, 10,96%. Com amostra duas vezes maior este limite superior cai voc pode
fazer as contas para 2,36%. No outro extremo, a menor varincia possvel, correspondente a p=0,10,
V(X)=0,09 e V(S
1200
)=7510
-6
. Neste caso, com n=1200, ou 2,09%; com
n=2400 essa probabilidade cai para 0,1%. Fazer todas essas contas um bom exerccio.
Exerccio 3.2.5 Diversos aspectos importantes relativos s condies gerais de uma grande populao
podem ser monitoradas com preciso e objetividade atravs de pesquisas nas quais apenas uma frao
nfima dos indivduos da populao selecionados por
sorteio aleatrio precisam ser avaliados. Este
exemplo, com dados simulados, mostra como a
escolaridade mdia de jovens brasileiros de 15 anos de
idade, pode ser estimada de forma rpida, econmica e
muito precisa. Suponhamos inicialmente a
subpopulao de jovens de 15 anos, distribuda, por
anos de escolaridade formal completados com sucesso,
como na tabela ao lado. Nela, a escolaridade mdia :

anos, onde N
x
o nmero de
indivduos na subpopulao estudada, com x anos de
escolaridade, e N o tamanho total da subpopulao.
Nesse exemplo, com dados fictcios (mas no de todo
dessemelhantes da situao real)
. O desvio
quadrtico mdio de X na subpopulao, definido como
, pode ser, neste caso,

reescrito como
, igual a 2,745, e mede o quo espalhados os indivduos esto,

em termos de escolaridade, em torno da escolaridade mdia, 8,30.
Suponha agora um experimento aleatrio: sorteio aleatrio de um dos indivduos daquele grupo. Por
sorteio aleatrio, aqui, nos referimos ao sorteio no qual cada um dos indivduos da populao
amostrada tem a mesma chance de vir a ser o escolhido. Seja X, agora, a varivel aleatria
correspondente ao nmero de anos de escolaridade do jovem selecionado. A distribuio deS
probabilidades de X pode ento ser derivada da tabela esquerda, com
. A esperana de X pode
ento ser calculada:
. A esperana de X
Anos de
escola
Populao
0 5.147
1 13.511
2 21.875
3 32.812
4 46.644
5 261.208
6 38.280
7 76.560
8 513.233
9 1.924.812
10 256.061
11 26.056
12 643
Total 3.216.842

x P{X=x}
0 0,0016
1 0,0042
2 0,0068
3 0,0102
4 0,0145
5 0,0812
6 0,0119
7 0,0238
8 0,1595
9 0,5984
10 0,0796
11 0,0081
12 0,0002

8

igual mdia populacional de x, e isto decorre do sorteio aleatrio, que d a cada indivduo na
populao a mesma chance se ser sorteado. De forma anloga pode-se mostrar que
.
Estes dois resultados so importantes e abrem o caminho para a estimativa de , a mdia populacional
de x. Para isto vamos repetir o experimento acima, n vezes. Os resultados parciais so X
1
, X
2
, , X
n
,
independentes e identicamente distribudos, com esperana e varincia
.
Fazendo
temos
e, se n no for muito pequeno,

ter distribuio aproximadamente normal. Seja, por exemplo, uma amostra de n=275 indivduos. Nesse
caso,
N(8,30, 0,01), portanto o desvio padro de
0,10 e, ao realizar a
amostra, a mdia amostral cair a menos de 0,2 ano de distncia do alvo, a mdia populacional
, com probabilidade 0,95.
Este exemplo ilustra o poder da amostragem aleatria: com uma amostra de apenas 275 indivduos, a
mdia de x em uma populao de mais de trs milhes de jovens pode ser estimada com grande
preciso. Com uma amostra quatro vezes maior, n-1100, o desvio padro de
cairia metade, e o
intervalo em torno de com probabilidade 0,95 seria teria largura total de apenas 2 dcimos de ano, ou
. No um mau resultado, considerando que a populao estudada tem mais que
trs milhes e duzentos mil indivduos.

3.4 Construindo intervalos de confiana para a esperana de X
Seja X uma varivel aleatria de esperana , desconhecida. Considere o problema de construir um
intervalo de confiana para , com base em n observaes independentes de X. Primeiro vamos
considerar a situao mais favorvel em que a varincia, o
2
, conhecida. De X
1
, X
2
, X
3
, , X
n
tiramos
. Vamos admitir que n grande o suficiente para que a distribuio de
possa,
com segurana, ser aproximada pela Normal de esperana m e varincia
. Sabemos ento que

Portanto

Podemos ento concluir que, ao realizar as n observaes independentes, a probabilidade do intervalo

incluir o parmetro 0,95. Uma vez realizadas as n observaes e

calculado
poderemos afirmar, com 95% de confiana que,
.
Exemplo 3.3.1 Uma varivel aleatria X tem varincia conhecida, o
2
=12, mas esperana
desconhecida. Com o objetivo de se estimar , 300 observaes independentes so feitas da varivel X.
A soma dos 300 valores observados resultou em 7725, portanto
A varincia de A
varincia de
, portanto, igual a 0,04; seu desvio padro, 0,20. Embora, inicialmente, nada se

9

soubesse de m, podemos agora afirmar, com 95% de confiana, que algum valor no intervalo (25,75-
1,960,20 , 25,75+1,960,20) = (25,358 , 26,142).
Diz-se ento que (25,358 , 26,142) um intervalo de 95% de confiana (resumidamente, um i95%c) para
.
3.4 Construo de intervalos de confiana com a distribuio t de Student
Numa classe mais geral de problemas, quer-se fazer inferncias sobre a esperana de uma varivel
aleatria, como na seo anterior, mas a varincia de X desconhecida. Assim, intervalos de confiana
do tipo
no podero ser construdos, simplesmente porque o parmetro o

desconhecido.
A sada foi encontrada por W. Gosset, que em um artigo de 1.904, sob o pseudnimo Student, deduziu a
expresso algbrica da distribuio da estatstica
. Vamos a este resultado.

Seja X~N(, o
2
), e sejam X
1
, X
2
, , X
n
, n observaes independentes de X, com
. J
sabemos que
tem distribuio N(0, 1) e utilizamos este fato para construir intervalos de

confiana para em situaes em que o conhecido.
Com o desconhecido, lanamos mo de
como substituto para o

2
. De fato, da
mesma forma como
converge para na medida em que n cresce, s

2
converge para o
2
. A prova deste
resultado no ser feita neste captulo.
A ideia de usar intervalos da forma
, com s no lugar de o, ocorre naturalmente,

mas depara com uma dificuldade: a distribuio de
no N(0, 1). Desta forma, no podemos

tirar a constante k da tabela da normal padro, como fizemos com k=1,96, para i95%c.
Student resolveu o problema deduzindo a
expresso da funo de densidade de
probabilidades da varivel aleatria
.
Ela depende de n; sua deduo trabalhosa, mas
elegante e relativamente simples. Ela demanda
alguns conceitos que ainda no foram tratados e
ser apresentada em captulo mais adiante. A
funo de densidade de probabilidades de T
n

, para -<t<
A funo gama que aparece na expresso acima
definida como
. Em justa
homenagem a Gosset, a varivel aleatria T
n

dita ter distribuio t de Student, com (n-1) graus de liberdade.

10

A figura ao lado, representa f.d.p. da t de Student com 5 graus de liberdade, superposta f.d.p. da
normal padro. As semelhanas so bvias, mas a t tem uma cauda mais pesada. Na medida em que os
graus de liberdade vo aumentando, a t vai se aproximando da normal padro, de forma que para 100
ou mais graus de liberdade, as diferenas so irrelevantes para a maioria das aplicaes prticas. Uma
tabela no final deste captulo d valores crticos para a t de Student, para a construo de intervalos de
90, 95 e 99%, para graus de liberdade indo de 1 a 100. Para tamanhos amostrais grandes, usa-se os
valores crticos da N(0,1).
Exemplo 3.4.1 Numa inspeo regular de rotina, tcnicos do IMETRO, percorrendo vrios pontos de
venda na cidade, selecionam uma amostra aleatria de 16 pacotes de determinado detergente, com
peso lquido nominal de 1000 g. Levadas ao
laboratrio e analisadas, as amostras
apresentaram os pesos lquidos reais na tabela
ao lado. Vamos construir um i95%c para o peso
mdio real com que os pacotes esto sendo produzidos pelo fabricante. Temos
=15.928 e

=15.858.572, logo
=
149,87g
2
. Da tabela, tiramos F
-1
(0,975)=2,131, onde F
-1
a inversa da funo acumulada de distribuio
de probabilidades de uma t de Student com 15 graus de liberdade. Logo, o i95%c para a mdia
, ou (989,8, 1002,0).
Com base na amostra, podemos afirmar, com 95% de confiana, que os pacotes vm sendo produzidos
com peso lquido mdio no intervalo (989,8, 1002,0). No d, portanto, para descartar a hiptese de
que a calibrao na fbrica esteja correta, ou seja, que os pacotes vem sendo produzidos com peso
mdio igual a 1000 g, como declarado no rtulo do pacote.
Exemplo 3.4.1 O tempo de resposta de um motorista de caminho a determinado estmulo visual
medido, em milsimos de segundo, quatorze vezes, independentemente, e em condies bem
controladas. Os resultados so dados na tabela abaixo, e so representados no diagrama de pontos.
Queremos aqui construir um intervalo de confiana para t, o tempo mdio de resposta para o
motorista, sob as condies gerais do experimento. Sabendo que

tem distribuio t de
Student, com n-1 graus de liberdade, podemos ento afirmar que

Logo,

Multiplicando os termos a desigualdade por -1, temos que inverter os sinais de desigualdade. Assim:
188 187 210 190 177 192 192 180 173 179 191 187 198 170
1024 988 985 1000 981 1006 999 986
992 975 1001 987 1012 995 998 999

11

E, portanto

Sabemos ento que a probabilidade do intervalo aleatrio
vir a conter
o parmetro desconhecido t igual a 0,95.
Dos valores observados, t
1
, t
2
, ..., t
14
, tiramos:

Da, construmos um intervalo de 95% de confiana para t:

, ou (180,7 , 192,8).
Afirmamos, ento, com 95% de confiana, que sob as condies gerais definidas para o experimento
o tempo mdio de respostado motorista, t, est contido no intervalo (180,7 , 192,7) milissegundos.

Sobre a questo da diviso por (n-1)
No clculo de s
2
, como no exemplo acima, usamos a expresso
. A soma de n
parcelas e a diviso por (n-1), e no por n, sempre causa dvida e desconforto. Vamos explicar, primeiro
no contexto de uma populao finita.
Suponha uma populao de N indivduos, aos quais esto associados valores de uma varivel
quantitativa, X. Sejam X
1
, X
2
, , X
N
os valores de X associados aos indivduos 1, 2, , N, respectivamente.
Definimos agora dois parmetros populacionais,
, respectivamente a mdia e o desvio quadrtico

mdio, populacionais, de X:

Devemos resistir tendncia de chamar S
2
de varincia de X, uma vez que esta um parmetro
associado a uma varivel aleatria e, at o momento no h nada aleatrio no esquema montado: Uma
populao, uma varivel quantitativa e dois parmetros populacionais dessa varivel.
Vamos agora introduzir certo esquema probabilstico: a seleo aleatria de um dos indivduos da
populao e a determinao do valor de X para esse indivduo; seja x esse valor. Agora, x uma varivel

12

aleatria. Se o esquema de sorteio aleatrio adotado foi tal que qualquer dos N indivduos da populao
teve a mesma chance 1/N de ser sorteado, ento

Vemos agora a associao entre V(x) e S
2
: se um indivduo for selecionado ao acaso, de forma que cada
indivduo na populao tenha a mesma chance de vir a ser sorteado, e, fazendo x igual ao valor da
varivel X para aquele indivduo, ento V(x)=S
2
. Vamos ento, respeitando a conveno, representar
por e o
2
, respectivamente.
Suponha agora um sorteio se n indivduos da populao, sendo n<N. Aos valores observados de X,
denominaremos x
1
, x
2
, , x
n
, e seja
. Para garantir a independncia entre os x

i
s, podemos
adotar o sorteio com reposio: cada indivduo selecionado reposto na populao, podendo inclusive
vir a ser selecionado novamente. Desta forma, aps cada sorteio a populao restaurada sua
integridade, e o novo indivduo sorteado o ser em condies exatamente idntica s do anterior,
garantindo a independncia entre os resultados. Sabemos, ento, que

Agora, vejamos o que acontece com o desvio quadrtico mdio amostral,
. Como
veremos, sua esperana no o
2
, logo, se o utilizarmos como o estimador da varincia, teremos um
estimador viciado. Vejamos:

Separando os termos em colchete:

Precisamos agora determinar
. Ora,

13

Como os x
i
s so independentes entre si, ento E(x
i
x
j
) igual a
2
para i=j, e
2
+o
2
para i=j. Logo,

Podemos ento concluir que

Portanto,

Ou seja,

Diferente de o
2
, portanto. Por outro lado,

Usamos, ento,
como o estimador mais apropriado (no tendencioso) de o

2
.
Note que E(x
i
- )
2
=o
2
. Portanto, se no fosse desconhecido, poderamos estimar o
2
pelo desvio
quadrtico amostral mdio,
, cuja esperana exatamente o

2
, um estimador no
tendencioso, portanto. Por no conhecer , calculamos os desvios quadrticos das observaes, no em
torno de , mas de seu estimador,
. Isto reduz um pouco a soma de quadrados pois, como

simples provar, dado um conjunto de valores reais, x
1
, x
2
, , x
n
, a soma de desvios quadrticos destes
valores em torno de um nmero arbitrrio c,
mnima quando
.
Portanto,
, com a igualdade valendo apenas quando coincidir .

Como a esperana da somatria ao lado direito da desigualdade o
2
, a da esquerda tem que ser menor
que o
2
. E , como vimos:
. Multiplicando ambos os lados por
,
restauramos o equilbrio, com
.
Pronto, est explicado.

14

Testando hipteses simples sobre a esperana de uma varivel aleatria X
Um dos recursos bsicos mais poderosos da Estatstica com pea central do Mtodo Cientfico, a
possibilidade que ele oferece para se testar (cientificamente) hipteses sobre a esperana desconhecida
de uma varivel aleatria. Seja a varivel aleatria
X ~ N(, o
2
)
e n observaes independentes de X:
X
1
, X
2
, , X
n
Sejam as estatsticas Z e T definidas como:

onde

A estatstica Z tem distribuio N(0, 1) enquanto T tem distribuio t de Student, com n-1 graus de
liberdade.
Considere agora que a esperana seja desconhecida, e que se queira testar, contra a hiptese nula
H
0
: =
0

a hiptese alternativa
H
1
: >
0

Consideremos primeiro o caso em que o desvio padro o conhecido. claro que um valor de
grande
demais evidncia contra H
0
, e em favor de H
1
. O questo aqui , o que grande demais?
Para um tratamento objetivo deste caso, devemos definir um valor crtico c tal que, se
for maior que c,

consideraremos que grande demais, e rejeitaremos H
0
em favor de H
1
. Por outro lado, se
no for
maior que c, consideraremos que os dados experimentais no trouxeram evidncia suficiente contra H
0
,
e no rejeitaremos, ento a hiptese nula.
Como escolher o valor crtico c? Se escolhermos c grande demais, ser quase impossvel rejeitar
indevidamente a hiptese nula quando ela for verdadeira, mas a probabilidade de no rejeit-la quando
ela for falsa poder ser muito elevada. Dizemos que o critrio de deciso fica conservador demais. Por
outro lado, se escolhermos um valor crtico c pequeno, teremos o problema oposto, com elevada

15

probabilidade de rejeitar H
0
sendo esta hiptese verdadeira. A soluo adotar uma soluo de
compromisso, balanceando as probabilidades dos dois erros opostos possveis: rejeitar uma hiptese
nula verdadeira, ou no rejeitar uma hiptese nula falsa.
Para isto, vamos fixar um valor suficientemente baixo para a probabilidade de rejeitarmos H
0
quando
esta hiptese for verdadeira, isto , a esperana de X for, de fato, igual ao valor fixado
0
. Seja o este
valor suficientemente baixo. A constante c ento escolhida para garantir que, se H
0
for verdadeira,
ento

Ora, se H
0
for verdadeira, a estatstica Z ter distribuio N(0, 1), ento

Portanto,

Podemos ento extrair o valor crtico c, em funo de
0
, o, n e o:

.
Fica ento completamente definida uma abordagem para o problema de testar a hiptese H
0
: =
0
,
contra a hiptese alternativa H
1
: >
0
:
1. Escolhe-se o, um valor suficientemente pequeno para a probabilidade de se rejeitar
indevidamente a hiptese nula H
0
;
2. Define-se n, o nmero de observaes a serem feitas da varivel aleatria X;
3. Faz-se as n observaes independentes de X;
4. Calcula-se a estatstica T;
5. Rejeita-se H
0
se T for maior do que c.
Vejamos um exemplo:
Seja X uma varivel aleatria com distribuio Normal, com mdia e desvio padro o. A esperana de
desconhecida, mas acredita-se que seja igual a 100. Contudo, existe uma corrente de opinio que afirma que
afirma que , na verdade, maior que 100. O desvio padro de X, o=4, conhecido. Para se testar a hiptese
conservadora H
0
: =100, contra a hiptese alternativa, H
0
: >100, decide-se pela abordagem experimental:
sero feitas n observaes independentes de X, rejeitando-se H
0
se
for muito grande. Como proteo contra

a rejeio de H
0
quando esta hiptese for verdadeira, arbitrou-se um valor o=0,05.

16

Neste caso,
Atravs de experimentos cuidadosamente

controlados, realiza-se n=30 observaes independentes de X, portanto o valor crtico c igual a 101,2. Os 30
valores observados esto listados na tabela abaixo. obtendo-se os valores dados na tabela ao abaixo, cuja
mdia
, que, sendo maior

que o valor crtico c=101,2, leva
rejeio de H
0
.

Exerccios para o Teste da Quinta feira
Testando hiptese simples sobre uma mdia
1. O teste de tempo de resposta a objeto em queda, realizado em sala, as distncias percorridas pela
rgua desde o repouso at a reao, em 16 medies sucessivas com o mesmo estudante, so
dadas abaixo, em cm.
observao 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Distncia (cm) 13 17 15 13 15 15 10 13 15 11 16 13 13 11 14 13

Seja t o tempo mdio de resposta do aluno, em milissegundos (ms). Teste
H
0
: t=150 ms versus H
1
: t>150 ms ao nvel de significncia o=0,05
2.

101,7 98,3 94,8 102,1 103,7 99,4 104,0 98,7 101,3 99,9
106,2 101,5 104,2 107,0 106,0 102,1 102,1 110,2 94,5 102,6
104,5 103,0 99,5 104,3 91,5 100,3 99,4 103,6 106,7 100,2

17

Exerccios
1. Em duas regies R
1
e R
2
distintas esto cinco cidades, sendo duas em R
1
e trs em R
2
. Em cada cidade existe
certo nmero de estudantes concluindo o
ensino fundamental. Uma prova de trs
questes ser aplicada a esses estudantes. Seja
N o nmero de questes que um estudante
sabe resolver; N pode, ento, valer 0, 1, 2 ou 3.
A distribuio dos estudantes, por
cidade/regio e nota como mostra a Tabela 1.
Um experimento aleatrio consiste em sortear
um aluno ao acaso, e aplicar-lhe a prova e
registrando em X o nmero de questes que
soube responder corretamente, isto , fazer
X=N. Este experimento repetido sucessiva e
independentemente, n vezes, gerando X
1
, X
2
, X
3
, , X
n
e, da,
e S
n
e conforme definidos.
a. Considerando todos os alunos como um nico grupo, sem distino de regio e cidade, calcule
e
S
2
, respectivamente a mdia e o desvio quadrtico mdio de N.
b. Calcule E(X) e V(X).
c. Calcule P{X=0}\C
1
, isto , a probabilidade condicional de o aluno tirar 0 dado que da cidade 1.
d. Calcule E(X) dado C
1
.
e. Calcule E(X) dado R
2.

f. Calcule V(X) dado R
1
.
g. Calcule a probabilidade que dos primeiros 20 alunos selecionados, exatamente seis respondam
corretamente as trs questes.
h. Qual a probabilidade que o trigsimo aluno sorteado seja de C
2
, dado que ele acertou as trs
questes?
i. Qual a probabilidade do oitavo aluno sorteado no ser de C
5
, dado que ele no acertou as trs
questes.
j. Para n=400, calcule a probabilidade de que, usando
como estimador de
, se cometa um erro
absoluto superior a 1% de
; isto , que
caia fora do intervalo

k. Nesta amostra de 400 alunos, seja n
3
o nmero de alunos com nota perfeita. Calcule P{n
3
=150}
l. Ainda com n=400, construa um intervalo de probabilidade 0,95 para n
0
.
m. Qual deveria ser o tamanho amostral n para que
=0,05?

2. A tabela contm dados simulados, porm com caractersticas semelhantes situao real. Imagine que para
uma prova do ENEM, com 180 questes, hajam 4.817.768 alunos inscritos, e que esses alunos, distribudos por
nmero de questes que conseguem resolver corretamente na prova, formam a tabela apresentada abaixo
(ela pode ser copiada e colada numa planilha Excel; ou pode ser copiada diretamente de EnemSimula no
Teleduc). Numa prova frequentemente o aluno no tira a nota que merece por errar por algum descuido
alguma questo que sabe resolver bem, ou, principalmente em provas com questes de mltipla escolha,
acertar, por sorte no chute questes que no sabe resolver. Vamos admitir que com as questes sendo
corrigidas individualmente, com avaliao completa de todo o desenvolvimento apresentado, esses problemas
podem ser completamente eliminados. Use computador para os clculos.
3. Em mdia, quantas questes os alunos resolvero na prova? Denomine-a M.
4. Numa escala de 0 a 100, qual ser a nota mdia geral? Denomine-a
.
5. Se um aluno for sorteado ao acaso e submetido prova, seja X o nmero de questes que saber responder
corretamente. Calcule E(X) e V(X).
6. Se uma amostra aleatria de n estudantes for sorteada do universo e submetida prova, gerando X
1
, X
2
, X
3
, ,
X
n
e, da,
e S
n
e conforme definidos, determine
.
Tabela 1 Nmero de alunos por cidade e nmero de questes que
consegue resolver corretamente
Regio e
Cidade
Nmero de questes da plrova que o
aluno sabe responder corretamente
Total por
cidade e
por regio
0 1 2 3
R1 C1 1.200 1.950 2.870 2.220 8.240
R1 C2 4.200 8.330 2.140 830 15.500
Total R1 5.400 10.280 5.010 3.050 23.740
R2 C3 1.260 4.320 6.950 5.370 17.900
R2 C4 827 2.895 12.840 6.870 23.432
R2 C5 120 840 5.540 12.640 19.140
Total R2 2.207 8.055 25.330 24.880 60.472
Total 7.607 18.335 30.340 27.930 84.212

18

7. Para n=1000, calcule
, a probabilidade que
caia a mais que dois pontos (duas questes

certas) de distncia de M.
8. Para n=1000, calcule
.
9. Qual deve ser n para que
?
10. E no caso acima, quanto seria

11. Considerando os resultados acima, comente sobre as virtudes de
como um estimador barato e preciso de

M.

Tabela: Distribuio geral dos alunos por nmero de questes da prova que sabe resolver
nota
nmero
de
alunos

nota
nmero
de
alunos

nota
nmero
de
alunos

nota
nmero
de
alunos

nota
nmero
de
alunos

nota
nmero
de
alunos
0 0

30 48693

60 67899

90 36539

120 7832

150 404
1 142

31 51362

61 63942

91 33353

121 7692

151 344
2 522

32 52836

62 67424

92 33603

122 7375

152 306
3 1188

33 52438

63 62679

93 31162

123 6683

153 251
4 1944

34 55470

64 61224

94 30006

124 5950

154 214
5 3010

35 58156

65 60830

95 30163

125 5907

155 168
6 4021

36 56250

66 64751

96 28851

126 5367

156 140
7 5643

37 60134

67 60285

97 27193

127 4918

157 122
8 6799

38 58713

68 59942

98 26928

128 4364

158 97
9 8880

39 62721

69 56661

99 24009

129 4154

159 75
10 10423

40 62675

70 56570

100 24010

130 3879

160 58
11 11765

41 61629

71 56645

101 22722

131 3650

161 46
12 13530

42 62800

72 54812

102 22432

132 3386

162 37
13 15949

43 68441

73 55950

103 21826

133 3066

163 28
14 17305

44 69439

74 52262

104 20278

134 2784

164 21
15 20079

45 65852

75 53477

105 19179

135 2363

165 16
16 21631

46 65925

76 49361

106 17448

136 2312

166 11
17 24971

47 65397

77 52459

107 17540

137 2129

167 7
18 27549

48 69677

78 47002

108 16609

138 1759

168 5
19 27425

49 70524

79 49981

109 16004

139 1729

169 3
20 31799

50 66006

80 45242

110 14834

140 1421

170 2
21 31519

51 69201

81 45360

111 14014

141 1371

171 1
22 36194

52 66818

82 43634

112 13770

142 1169

172 1
23 35284

53 71403

83 45433

113 12435

143 1037

173 0
24 38375

54 70700

84 43774

114 11564

144 892

174 0
25 43203

55 70770

85 40566

115 11048

145 838

175 0
26 42531

56 67419

86 41851

116 11037

146 744

176 0
27 45963

57 68550

87 37850

117 10408

147 651

177 0
28 44525

58 67948

88 38946

118 9081

148 516

178 0
29 49498

59 69660

89 36070

119 8788

149 474

179 0

180 0

0
10.000
20.000
30.000
40.000
50.000
60.000
70.000
80.000
0

1
0

2
0

3
0

4
0

5
0

6
0

7
0

8
0

9
0

1
0
0

1
1
0

1
2
0

1
3
0

1
4
0

1
5
0

1
6
0

1
7
0

1
8
0

19

20

Tabelas de probabilidades na Normal Padro
u(z) = P{ Z < z } , para Z~N(0, 1)

z 0,00 0,01 0,02 0,03 0.04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56750 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59484 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67365 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72241
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76731 0,77035 0,77337 0,77637 0,77935 0,78231 0,78524
0,8 0,78815 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84135 0,84375 0,84614 0,84850 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90148
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92786 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93575 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95544 0,95637 0,95728 0,95819 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97671
2,0 0.977250 0,97778 0,97831 0,97882 0,97933 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98746 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99586 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99737
2,8 0,99745 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99897 0,99900
3,1 0,99903 0,99907 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99982 0,99982 0,99983 0,99984
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99993
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997

21

Tabela Normal Extrema: Valores de P{Z>z}=1-u(z) para z de 2,50 a 4,69 em ppm (partes por milho); de 4,00 a 4,99
em ppb (partes por bilho) e de 5,00 a 7,09, em ppt (partes por trilho)
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,50 6 210 6 037 5 868 5 703 5 543 5 386 5 234 5 085 4 940 4 799
2,60 4 661 4 527 4 396 4 269 4 145 4 025 3 907 3 793 3 681 3 573
2,70 3 467 3 364 3 264 3 167 3 072 2 980 2 890 2 803 2 718 2 635
2,80 2 555 2 477 2 401 2 327 2 256 2 186 2 118 2 052 1 988 1 926
2,90 1 866 1 807 1 750 1 695 1 641 1 589 1 538 1 489 1 441 1 395
3,00 1 350 1 306 1 264 1 223 1 183 1 144 1 107 1 070 1 035 1 001
3,10 968 935 904 874 845 816 789 762 736 711
3,20 687 664 641 619 598 577 557 538 519 501
3,30 483 466 450 434 419 404 390 376 362 349
3,40 337 325 313 302 291 280 270 260 251 242
3,50 233 224 216 208 200 193 185 178 172 165
3,60 159 153 147 142 136 131 126 121 117 112
3,70 108 104 100 96 92 88 85 82 78 75
3,80 72 69 67 64 62 59 57 54 52 50
3,90 48 46 44 42 41 39 37 36 34 33
4,00 32 30 29 28 27 26 25 24 23 22
4,10 21 20 19 18 17 17 16 15 15 14
4,20 13 13 12 12 11 11 10 10 9 9
4,30 9 8 8 7 7 7 7 6 6 6
4,40 5 5 5 5 4 4 4 4 4 4
4,50 3 3 3 3 3 3 3 2 2 2
4,60 2 2 2 2 2 2 2 2 1 1

4,00 31 671 30 359 29 099 27 888 26 726 25 609 24 536 23 507 22 518 21 569
4,10 20 658 19 783 18 944 18 138 17 365 16 624 15 912 15 230 14 575 13 948
4,20 13 346 12 769 12 215 11 685 11 176 10 689 10 221 9 774 9 345 8 934
4,30 8 540 8 163 7 801 7 455 7 124 6 807 6 503 6 212 5 934 5 668
4,40 5 413 5 169 4 935 4 712 4 498 4 294 4 098 3 911 3 732 3 561
4,50 3 398 3 241 3 092 2 949 2 813 2 682 2 558 2 439 2 325 2 216
4,60 2 112 2 013 1 919 1 828 1 742 1 660 1 581 1 506 1 434 1 366
4,70 1 301 1 239 1 179 1 123 1 069 1 017 968 921 876 834
4,80 793 755 718 683 649 617 587 558 530 504
4,90 479 455 433 411 391 371 352 335 318 302

5,00 286 652 272 150 258 357 245 240 232 766 220 905 209 628 198 908 188 717 179 032
5,10 169 827 161 079 152 768 144 871 137 369 130 243 123 475 117 047 110 943 105 147
5,20 99 644 94 420 89 462 84 755 80 288 76 050 72 028 68 212 64 592 61 158
5,30 57 901 54 813 51 884 49 106 46 473 43 977 41 611 39 368 37 243 35 229
5,40 33 320 31 512 29 800 28 177 26 640 25 185 23 807 22 502 21 266 20 097
5,50 18 990 17 942 16 950 16 012 15 124 14 283 13 489 12 737 12 026 11 353
5,60 10 718 10 116 9 548 9 010 8 503 8 022 7 569 7 140 6 735 6 352
5,70 5 990 5 649 5 326 5 022 4 734 4 462 4 206 3 964 3 735 3 519
5,80 3 316 3 124 2 942 2 771 2 610 2 458 2 314 2 179 2 051 1 931
5,90 1 818 1 711 1 610 1 515 1 425 1 341 1 261 1 186 1 116 1 049
6,00 986,6 927,6 872,1 819,8 770,6 724,2 680,6 639,6 600,9 564,6
6,10 530,3 498,2 467,9 439,4 412,6 387,4 363,7 341,4 320,5 300,8
6,20 282,3 264,9 248,6 233,2 218,8 205,2 192,5 180,5 169,3 158,7
6,30 148,8 139,5 130,8 122,6 114,9 107,7 100,9 94,51 88,54 82,94
6,40 77,69 72,76 68,14 63,80 59,74 55,93 52,35 49,00 45,86 42,92
6,50 40,16 37,58 35,15 32,88 30,76 28,77 26,90 25,16 23,52 21,99
6,60 20,56 19,22 17,96 16,78 15,68 14,65 13,69 12,79 11,95 11,16
6,70 10,42 9,731 9,086 8,483 7,919 7,392 6,900 6,439 6,009 5,607
6,80 5,231 4,880 4,552 4,246 3,960 3,692 3,443 3,210 2,993 2,790
6,90 2,600 2,423 2,258 2,104 1,960 1,826 1,701 1,585 1,476 1,374
7,00 1,280 1,192 1,109 1,033 0,961 0,895 0,833 0,775 0,721 0,671

22

TABELA COMPLEMENTAR
Valores Especiais ou Extremos
z u(z) 1-u(z)
0,00000 0,500000000 50%
0,25335 0,600000000 40%
0,52440 0,700000000 30%
0,67449 0,750000000 25%
0,84162 0,800000000 20%
1,28155 0,900000000 10%
1,64485 0,950000000 5%
1,95996 0,975000000 2.5%
2,32635 0,990000000 1%
2,57583 0,995000000 0,5%
3,09023 0,999000000 0,1%
3,29053 0,999500000 500 ppm*
3,71902 0,999900000 100 ppm
3,89059 0,999950000 50 ppm
4,26489 0,999990000 10 ppm
4,41717 0,999995000 5 ppm
4,75342 0,999999000 1 ppm
4,89164 0,999999500 500 ppb**
5,19934 0,999999900 100 ppb
5,32672 0,999999950 50 ppb
5,61200 0,999999990 10 ppb
5,73073 0,999999995 5 ppb
5,99781 0,999999999 1 ppb

23

Tabela t de Student
Valores de t, para P{T<t} iguais a 0,90, 0,95, 09,75 e 0,995, para t de Student com 1 a 140 graus de
liberdade. Para infinitos graus de liberdade, a t de Student coincide com a N(0, 1).
Exemplo de uso da tabela: Numa t de Stutent com 10 graus de liberdade, P{T<2,228}=0,95.
g.l.
P{T<t}

g.l.
P{T<t}
0,900 0,950 0,975 0,990 0,995

0,9 0,95 0,975 0,990 0,995
1 3,078 6,314 12,71 31,821 63,66

31 1,309 1,696 2,040 2,453 2,744
2 1,886 2,920 4,303 6,965 9,925

32 1,309 1,694 2,037 2,449 2,738
3 1,638 2,353 3,182 4,541 5,841

33 1,308 1,692 2,035 2,445 2,733
4 1,533 2,132 2,776 3,747 4,604

34 1,307 1,691 2,032 2,441 2,728
5 1,476 2,015 2,571 3,365 4,032

35 1,306 1,690 2,030 2,438 2,724
6 1,440 1,943 2,447 3,143 3,707

36 1,306 1,688 2,028 2,434 2,719
7 1,415 1,895 2,365 2,998 3,499

37 1,305 1,687 2,026 2,431 2,715
8 1,397 1,860 2,306 2,896 3,355

38 1,304 1,686 2,024 2,429 2,712
9 1,383 1,833 2,262 2,821 3,250

39 1,304 1,685 2,023 2,426 2,708
10 1,372 1,812 2,228 2,764 3,169

40 1,303 1,684 2,021 2,423 2,704
11 1,363 1,796 2,201 2,718 3,106

50 1,299 1,676 2,009 2,412 2,678
12 1,356 1,782 2,179 2,681 3,055

55 1,297 1,673 2,004 2,403 2,668
13 1,350 1,771 2,160 2,650 3,012

60 1,296 1,671 2,000 2,396 2,660
14 1,345 1,761 2,145 2,624 2,977

65 1,295 1,669 1,997 2,390 2,654
15 1,341 1,753 2,131 2,602 2,947

70 1,294 1,667 1,994 2,385 2,648
16 1,337 1,746 2,120 2,583 2,921

75 1,293 1,665 1,992 2,381 2,643
17 1,333 1,740 2,110 2,567 2,898

80 1,292 1,664 1,990 2,377 2,639
18 1,330 1,734 2,101 2,552 2,878

85 1,292 1,663 1,988 2,374 2,635
19 1,328 1,729 2,093 2,539 2,861

90 1,291 1,662 1,987 2,371 2,632
20 1,325 1,725 2,086 2,528 2,845

95 1,291 1,661 1,985 2,368 2,629
21 1,323 1,721 2,080 2,518 2,831

100 1,290 1,660 1,984 2,366 2,626
22 1,321 1,717 2,074 2,508 2,819

105 1,290 1,660 1,983 2,364 2,623
23 1,319 1,714 2,069 2,500 2,807

110 1,289 1,659 1,982 2,362 2,621
24 1,318 1,711 2,064 2,492 2,797

115 1,289 1,658 1,981 2,361 2,619
25 1,316 1,708 2,060 2,485 2,787

120 1,289 1,658 1,980 2,359 2,617
26 1,315 1,706 2,056 2,479 2,779

125 1,288 1,657 1,979 2,358 2,616
27 1,314 1,703 2,052 2,473 2,771

130 1,288 1,657 1,978 2,357 2,614
28 1,313 1,701 2,048 2,467 2,763

135 1,288 1,656 1,978 2,355 2,613
29 1,311 1,699 2,045 2,462 2,756

140 1,288 1,656 1,977 2,354 2,611
30 1,310 1,697 2,042 2,457 2,750

1,282 1,645 1,960 2,353 2,576

A Distribuição Normal PDF

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

A Distribuição Normal PDF

Uploaded by

Copyright:

Available Formats

1

Captulo 3 A Distribuio Normal

, para z real. A figura ao lado

reduz uma varivel

, respectivamente a soma e a mdia aritmtica dos n primeiros valores

definidos da forma usual. Agora, E(X)=3 e V(X)=2, portanto E(S

. Com n no muito pequeno podemos aproximar as

, Normal, com esperanas e varincias correspondentes. Assim,

. Desta forma, embora o conjunto de

, pode ser, neste caso,

, igual a 2,745, e mede o quo espalhados os indivduos esto,

e, se n no for muito pequeno,

N(8,30, 0,01), portanto o desvio padro de

. Vamos admitir que n grande o suficiente para que a distribuio de

. Sabemos ento que

incluir o parmetro 0,95. Uma vez realizadas as n observaes e

poderemos afirmar, com 95% de confiana que,

no podero ser construdos, simplesmente porque o parmetro o

. Vamos a este resultado.

tem distribuio N(0, 1) e utilizamos este fato para construir intervalos de

como substituto para o

converge para na medida em que n cresce, s

, com s no lugar de o, ocorre naturalmente,

no N(0, 1). Desta forma, no podemos

, respectivamente a mdia e o desvio quadrtico

. Para garantir a independncia entre os x

como o estimador mais apropriado (no tendencioso) de o

, cuja esperana exatamente o

. Isto reduz um pouco a soma de quadrados pois, como

, com a igualdade valendo apenas quando coincidir .

. Multiplicando ambos os lados por

for maior que c,

for muito grande. Como proteo contra

Atravs de experimentos cuidadosamente

, que, sendo maior

caia fora do intervalo

caia a mais que dois pontos (duas questes

como um estimador barato e preciso de

You might also like