Professional Documents
Culture Documents
Como, nesse caso, E(X
i
)=p e V(X
i
)=p(1-p), esperana e varincia de S
n
so determinadas diretamente das
propriedades bsicas: E(S
n
)=np e
V(S
n
)=np(1-p). A figura ao lado uma
representao grfica da b(100, 0,2),
na faixa de 30 a 70, com
probabilidades no extremamente
pequenas. Para valores de n muito
elevados, os clculos podem ser
complicados, mesmo com o uso de
computador.
Nos casos como o D
5
, ou mais gerais,
como D
m
, de um dado hipottico de m lados, os clculos diretos de probabilidade de S
n
, a soma dos
primeiros n resultados individuais em repeties sucessivas do experimento aleatrio elementar ainda
podem ser feitas com o auxlio de
algoritmos como o apresentado no
Captulo 2 para D
5
n
, embora, para m e
n grandes os valores envolvidos para a
cardinalidade de eventos como {S
n
=s}
se agigantem muito rapidamente. A
figura abaixo uma representao
grfica de P{S
20
=s}. Como na figura
acima, a representao se restringiu
faixa relevante de valores possveis.
A semelhana de forma geral das duas figuras no , de forma alguma, acidental, mas se constitui na
manifestao de uma das propriedades mais interessantes de toda a Matemtica e, certamente, um dos
resultados mais importantes da Teoria da Probabilidade: O Teorema Central do Limite. Este teorema,
em uma de suas verses mais simples, assegura que se uma varivel aleatria, como S
n
, a soma de um
nmero n de observaes sucessivas e independentes de uma varivel aleatria X, com esperana e
varincia o
2
, ento, na medida em que n cresce, a sua distribuio se aproxima cada vez mais da
distribuio normal (ou gaussiana), de esperana n e varincia no
2
. Assim, no primeiro caso, com o
nmero de sucessos em 100 repeties de um mesmo E
p
com p=0,2, devemos esperar uma distribuio
2
aproximadamente igual a uma normal, de esperana 20 e varincia 16. No segundo caso, de 20
repeties de D
5
, o resultado acumulado deve ter distribuio aproximadamente Normal, com
esperana 60 e varincia 40.
3.2 - A Distribuio Normal
Uma varivel aleatria contnua X dita ter distribuio Normal, com esperana e varincia o
2
, que se
representa por X~N(, o
2
), se sua f.d.p. for
Com esperana 0 e varincia 1, tem-se a Normal padro, geralmente representada por Z, isto , Z~N(0,
1), dita ter distribuio normal padro. Sua funo
de densidade de probabilidades, representada por
|(z),
para z=0 at z=3,99, a passos de 0,01. A figura abaixo representa
u(z), a funo de distribuio acumulada de uma varivel aleatria distribuda segundo uma normal
padro.
A transformao
Exemplo 3.2.1 Uma varivel aleatria X tem distribuio Normal, com esperana 100 e varincia 100,
portanto desvio padro 10. Calcule:
a- P{X<100}
Evento probabilidade
{1 <Z < 1} 0,68268949
{2< Z < 2} 0,95449974
{3< Z < 3} 0,99730020
{4< Z < 4} 0,99993666
{-5 < Z < 5} 0,99999943
3
Como a normal simtrica em torno da esperana, ento P{X<100}= P{X>100}=0,5.
b- P{X<110} e P{X<90}
Ora, o valor 110 est exatamente a um desvio padro acima
da esperana, logo
Da tabela tiramos u(1)=0,84134, portanto P{X>110)=0,1587, e, por simetria P{X<90)=0,1587.
c- P{90<X<110}
Transformando para a normal padro, temos:
Como, por simetria, temos:
Aplicao do Teorema Central do Limite, na verso apresentada, para soma de variveis aleatrias
independentes e identicamente distribudas, nos permite resolver, de forma muito simples, uma
variedade surpreendente de problemas prticos antes intratveis. Vejamos alguns exemplos:
Exemplo 3.2.2 Seja E
p
, um experimento aleatrio binrio, com P{s}=p, o qual repetido sucessiva e
independentemente, gerando resultados parciais X
1
, X
2
, X
3
, , variveis aleatrias independentes e
identicamente distribudas, com distribuio binria de P{X=1}=p. Vamos definir
a freqncia de
sucessos, nas n primeiras repeties. Vamos considerar valores grandes de n.
a- Seja p=0,50 (como no arremesso de uma moeda) e n=10000. Calcule P{4.900<S
n
<5.100}.
A varivel aleatria X, correspondente ao resultado parcial em cada repetio, tem distribuio B(0,5),
portanto E(X)=0,5 e V(X)=0,25. Sendo a soma de 10 mil observaes independentes de X, S
n
tem
esperana 5000 e varincia 2500, logo:
Portanto
Como se pode ver, a faixa de valores realmente possveis para o nmero total de Caras em dez mil
arremessos de uma moeda surpreendentemente estreito e se situa em torno do valor mdio
esperado, 5000.
4
A propsito, atravs de sequncia anloga de operaes, obtm-se P{4850<S
n
<5150} ~ 0,9973.
b- Seja p=0,20 (como na obteno de um 5 em D
5
) e n=1000. Calcule
.
Neste caso, X tem esperana 0,2 e varincia 0,16, logo S
n
tem esperana 200 e varincia 160. Sendo a
soma de mil resultados parciais, a distribuio de S
n
, uma b(1000, 0,2) bem prxima da normal de
mesma esperana e mesma varincia. Ora, se S
n
~N(200, 160), ento
sendo igual a S
n
dividido por n,
tem tambm distribuio aproximadamente normal, com esperana e varincia iguais a 0,2 e 0,00016,
respectivamente. Assim,
Portanto,
Exemplo 3.2.3 Consideremos agora sequncias de repeties independentes de D
5
, com X
1
, X
2
, X
3
, ,
S
n
e
, temos
Como se v, em 1000 arremessos de um dado no viciado de cinco lados, o total esperado 3000, e
a probabilidade do total superar 3100 de apenas 1,29%.
b- Se o dado for ligeiramente tendencioso, (ver tabela),
calcule P(S
1000
)>3100
A distoro nas probabilidades altera a esperana e a varincia de X. Agora, E(X)=3,04 e
V(X)=1,9984, portanto,
1 2 3 4 5
0,19 0,20 0,20 0,20 0,21
5
A distoro no dado, favorecendo ligeiramente o resultado 5 em detrimento do 1, aumenta a
esperana de S
1000
, elevando a probabilidade de um valor superior a 3100 de 1,29% para 9,01%.
c- De volta ao D
5
no tendencioso e n=1000, determine um inteiro m, tal que P{3000
msS
n
s3000+m}=0,99.
O intervalo em questo , portanto, simtrico em torno de E(S
n
), com meia amplitude igual a m.
Numa normal, o intervalo simtrico em torno da esperana de probabilidade 0,99, tem meia largura
igual a 2,58 desvios padres (da tabela, u(2,58)=0,995), logo 2,58 desvios padres de S
1000
igual a
m, portanto .
d- Dois amigos, A e B disputam uma corrida de dados (para maior agilidade do processo, vamos
supor que o jogo feito com dados simulados no computador). Em rodadas sucessivas, eles vo
arremessando seus dados e acumulando os resultados:
A X
1
, X
2
, X
3
, , S
n
e
B Y
1
, Y
2
, Y
3
, , T
n
e
Qual a probabilidade de que, aps 100 rodadas, B esteja liderando a corrida por mais que 10
pontos?
A soluo simples e comea com a definio de D
n
= T
n
S
n
, a vantagem de B sobre A aps n
rodadas. Como E(S
n
)=E(T
n
), E(D
n
)=0 enquanto que V(D
n
)=V(S
n
)+V(T
n
)=4n. Admitindo-se que S
n
e
T
n
tem distribuio Normal, conclui-se que D
n
~N(0, 4n) e, portanto, D
100
~N(0, 400); logo:
Por simetria, esta tambm a probabilidade de que, aps 100 rodadas, A esteja liderando por
mais que 10 pontos.
e- Na corrida acima, vamos agora supor que os dados sejam ligeiramente distorcidos em favor do
jogador B, como mostra a tabela ao lado. Qual a
probabilidade de B ganhar uma corrida de 1000
rodadas?
Agora E(S
n
)=2,96 e E(T
n
)=3,04, enquanto as duas
varincia so iguais a 1,9984, portanto E(D
n
)=0,08 e V(D
n
)=3,9968n. Com 1000 rodadas,
teremos E(D
1000
)=80 e V(D
1000
)=3996,8 e
u
Como se v, a ligeira distoro d a B enorme vantagem em uma corrida prolongada. Nessas
condies vantajosas, sua probabilidade de vencer uma corrida de dez mil rodadas
u(4,00)=0,999968.
1 2 3 4 5
A 0,21 0,20 0,20 0,20 0,19
B 0,19 0,20 0,20 0,20 0,21
6
A qualidade da aproximao da distribuio de probabilidades de S
n
associadas a D
5
n
por N(3n, 2n) pode
ser bem apreciada atravs da figura abaixo. Nela as barras verticais representam os valores exatos de
P{S
100
=s}, para valores de d na regio relevante, de 250 a 350, calculados atravs do algoritmo
apresentado no Captulo 2,
so sobrepostos por uma
linha envoltria contnua
corresponde f.d.p. da
normal com esperana 300 e
varincia 200. A quase
perfeita coincidncia entre
valores exatos e aproximados
pode ser apreciada. A tabela
abaixo apresenta os dois
grupos de valores da
probabilidade exato e aproximado para um conjunto selecionado de valores de d.
P{S
100
=s}
s
250 260 270 280 290 300
Valor exato 5,196E-05 0,0005113 0,0029794 0,0104059 0,0219665 0,0281636
Aproximao Normal 5,446E-05 0,0005167 0,0029733 0,0103777 0,0219696 0,0282095
Erro percentual 4,81 1,06 -0,20 -0,27 0,01 0,16
Exemplo 3.2.4 As ideias acima so agora aplicadas ao problema geral de amostragem em populaes
muito grandes. Quer-se estimar a taxa de ocorrncia (p) de determinada caracterstica gentica em uma
populao de dezenas de milhes de indivduos. O teste preciso, mas caro e intrusivo, portanto a
amostra deve ser a menor possvel. Sabe-se que p deve estar na faixa de 10 a 25%. Uma amostra de
1200 indivduos inicialmente considerada.
Considerando-se o pior caso em termos da varincia, qual seria a probabilidade de um erro superior a 2
pontos percentuais na estimativa de p?
Primeiro vamos definir como X
i
o resultado relativo ao i-simo indivduo sorteado: X
i
=1 se o indivduo
apresenta a caracterstica gentica estudada, e X
i
=0, caso contrrio. Assim, X
i
~B(p), e E(X
i
)=p e V(X
i
)=p(1-
p), onde p a frao de indivduos com a caracterstica gentica estudada, na populao.
Com uma amostra aleatria de tamanho n, teremos X
1
, X
2
, , X
n
, independentes e com a mesma
distribuio B(p), a distribuio binria ou de Bernoulli. A soma S
n
tem, ento, distribuio binomial com
parmetros n e p: S
n
~b(n, p). A esperana e a varincia de S
n
so, respectivamente, np e np(1-p).
Pelo teorema central do limite, podemos aproximar S
1200
~N(1200p, 1200p(1-p)), logo
Portanto,
O pior caso (com maior probabilidade de erro superior a 2 pontos percentuais), ocorre quando a
varincia mxima. A varincia depende de p e, como se sabe que p est no intervalo (0,10, 0,25), o
pior caso, em termos de varincia ocorre em p=0,25, com V(X)=0,1875. Ento
s
s u
Portanto, nas condies e hipteses do exerccio, com uma amostra de tamanho n=1200, e sabendo a
priori que p se situa entre 10 e 25%, a probabilidade de um erro de estimativa superior a 2 pontos
percentuais , no mximo, 10,96%. Com amostra duas vezes maior este limite superior cai voc pode
fazer as contas para 2,36%. No outro extremo, a menor varincia possvel, correspondente a p=0,10,
V(X)=0,09 e V(S
1200
)=7510
-6
. Neste caso, com n=1200, ou 2,09%; com
n=2400 essa probabilidade cai para 0,1%. Fazer todas essas contas um bom exerccio.
Exerccio 3.2.5 Diversos aspectos importantes relativos s condies gerais de uma grande populao
podem ser monitoradas com preciso e objetividade atravs de pesquisas nas quais apenas uma frao
nfima dos indivduos da populao selecionados por
sorteio aleatrio precisam ser avaliados. Este
exemplo, com dados simulados, mostra como a
escolaridade mdia de jovens brasileiros de 15 anos de
idade, pode ser estimada de forma rpida, econmica e
muito precisa. Suponhamos inicialmente a
subpopulao de jovens de 15 anos, distribuda, por
anos de escolaridade formal completados com sucesso,
como na tabela ao lado. Nela, a escolaridade mdia :
anos, onde N
x
o nmero de
indivduos na subpopulao estudada, com x anos de
escolaridade, e N o tamanho total da subpopulao.
Nesse exemplo, com dados fictcios (mas no de todo
dessemelhantes da situao real)
. O desvio
quadrtico mdio de X na subpopulao, definido como
. A esperana de X pode
ento ser calculada:
. A esperana de X
Anos de
escola
Populao
0 5.147
1 13.511
2 21.875
3 32.812
4 46.644
5 261.208
6 38.280
7 76.560
8 513.233
9 1.924.812
10 256.061
11 26.056
12 643
Total 3.216.842
x P{X=x}
0 0,0016
1 0,0042
2 0,0068
3 0,0102
4 0,0145
5 0,0812
6 0,0119
7 0,0238
8 0,1595
9 0,5984
10 0,0796
11 0,0081
12 0,0002
8
igual mdia populacional de x, e isto decorre do sorteio aleatrio, que d a cada indivduo na
populao a mesma chance se ser sorteado. De forma anloga pode-se mostrar que
.
Estes dois resultados so importantes e abrem o caminho para a estimativa de , a mdia populacional
de x. Para isto vamos repetir o experimento acima, n vezes. Os resultados parciais so X
1
, X
2
, , X
n
,
independentes e identicamente distribudos, com esperana e varincia
.
Fazendo
temos
ter distribuio aproximadamente normal. Seja, por exemplo, uma amostra de n=275 indivduos. Nesse
caso,
0,10 e, ao realizar a
amostra, a mdia amostral cair a menos de 0,2 ano de distncia do alvo, a mdia populacional
, com probabilidade 0,95.
Este exemplo ilustra o poder da amostragem aleatria: com uma amostra de apenas 275 indivduos, a
mdia de x em uma populao de mais de trs milhes de jovens pode ser estimada com grande
preciso. Com uma amostra quatro vezes maior, n-1100, o desvio padro de
cairia metade, e o
intervalo em torno de com probabilidade 0,95 seria teria largura total de apenas 2 dcimos de ano, ou
. No um mau resultado, considerando que a populao estudada tem mais que
trs milhes e duzentos mil indivduos.
3.4 Construindo intervalos de confiana para a esperana de X
Seja X uma varivel aleatria de esperana , desconhecida. Considere o problema de construir um
intervalo de confiana para , com base em n observaes independentes de X. Primeiro vamos
considerar a situao mais favorvel em que a varincia, o
2
, conhecida. De X
1
, X
2
, X
3
, , X
n
tiramos
possa,
com segurana, ser aproximada pela Normal de esperana m e varincia
Portanto
Podemos ento concluir que, ao realizar as n observaes independentes, a probabilidade do intervalo
.
Exemplo 3.3.1 Uma varivel aleatria X tem varincia conhecida, o
2
=12, mas esperana
desconhecida. Com o objetivo de se estimar , 300 observaes independentes so feitas da varivel X.
A soma dos 300 valores observados resultou em 7725, portanto
A varincia de A
varincia de
, portanto, igual a 0,04; seu desvio padro, 0,20. Embora, inicialmente, nada se
9
soubesse de m, podemos agora afirmar, com 95% de confiana, que algum valor no intervalo (25,75-
1,960,20 , 25,75+1,960,20) = (25,358 , 26,142).
Diz-se ento que (25,358 , 26,142) um intervalo de 95% de confiana (resumidamente, um i95%c) para
.
3.4 Construo de intervalos de confiana com a distribuio t de Student
Numa classe mais geral de problemas, quer-se fazer inferncias sobre a esperana de uma varivel
aleatria, como na seo anterior, mas a varincia de X desconhecida. Assim, intervalos de confiana
do tipo
. J
sabemos que
.
Ela depende de n; sua deduo trabalhosa, mas
elegante e relativamente simples. Ela demanda
alguns conceitos que ainda no foram tratados e
ser apresentada em captulo mais adiante. A
funo de densidade de probabilidades de T
n
, para -<t<
A funo gama que aparece na expresso acima
definida como
. Em justa
homenagem a Gosset, a varivel aleatria T
n
dita ter distribuio t de Student, com (n-1) graus de liberdade.
10
A figura ao lado, representa f.d.p. da t de Student com 5 graus de liberdade, superposta f.d.p. da
normal padro. As semelhanas so bvias, mas a t tem uma cauda mais pesada. Na medida em que os
graus de liberdade vo aumentando, a t vai se aproximando da normal padro, de forma que para 100
ou mais graus de liberdade, as diferenas so irrelevantes para a maioria das aplicaes prticas. Uma
tabela no final deste captulo d valores crticos para a t de Student, para a construo de intervalos de
90, 95 e 99%, para graus de liberdade indo de 1 a 100. Para tamanhos amostrais grandes, usa-se os
valores crticos da N(0,1).
Exemplo 3.4.1 Numa inspeo regular de rotina, tcnicos do IMETRO, percorrendo vrios pontos de
venda na cidade, selecionam uma amostra aleatria de 16 pacotes de determinado detergente, com
peso lquido nominal de 1000 g. Levadas ao
laboratrio e analisadas, as amostras
apresentaram os pesos lquidos reais na tabela
ao lado. Vamos construir um i95%c para o peso
mdio real com que os pacotes esto sendo produzidos pelo fabricante. Temos
=15.928 e
=15.858.572, logo
=
149,87g
2
. Da tabela, tiramos F
-1
(0,975)=2,131, onde F
-1
a inversa da funo acumulada de distribuio
de probabilidades de uma t de Student com 15 graus de liberdade. Logo, o i95%c para a mdia
, ou (989,8, 1002,0).
Com base na amostra, podemos afirmar, com 95% de confiana, que os pacotes vm sendo produzidos
com peso lquido mdio no intervalo (989,8, 1002,0). No d, portanto, para descartar a hiptese de
que a calibrao na fbrica esteja correta, ou seja, que os pacotes vem sendo produzidos com peso
mdio igual a 1000 g, como declarado no rtulo do pacote.
Exemplo 3.4.1 O tempo de resposta de um motorista de caminho a determinado estmulo visual
medido, em milsimos de segundo, quatorze vezes, independentemente, e em condies bem
controladas. Os resultados so dados na tabela abaixo, e so representados no diagrama de pontos.
Queremos aqui construir um intervalo de confiana para t, o tempo mdio de resposta para o
motorista, sob as condies gerais do experimento. Sabendo que
tem distribuio t de
Student, com n-1 graus de liberdade, podemos ento afirmar que
Logo,
Multiplicando os termos a desigualdade por -1, temos que inverter os sinais de desigualdade. Assim:
188 187 210 190 177 192 192 180 173 179 191 187 198 170
1024 988 985 1000 981 1006 999 986
992 975 1001 987 1012 995 998 999
11
E, portanto
Sabemos ento que a probabilidade do intervalo aleatrio
vir a conter
o parmetro desconhecido t igual a 0,95.
Dos valores observados, t
1
, t
2
, ..., t
14
, tiramos:
Da, construmos um intervalo de 95% de confiana para t:
, ou (180,7 , 192,8).
Afirmamos, ento, com 95% de confiana, que sob as condies gerais definidas para o experimento
o tempo mdio de respostado motorista, t, est contido no intervalo (180,7 , 192,7) milissegundos.
Sobre a questo da diviso por (n-1)
No clculo de s
2
, como no exemplo acima, usamos a expresso
. A soma de n
parcelas e a diviso por (n-1), e no por n, sempre causa dvida e desconforto. Vamos explicar, primeiro
no contexto de uma populao finita.
Suponha uma populao de N indivduos, aos quais esto associados valores de uma varivel
quantitativa, X. Sejam X
1
, X
2
, , X
N
os valores de X associados aos indivduos 1, 2, , N, respectivamente.
Definimos agora dois parmetros populacionais,
Devemos resistir tendncia de chamar S
2
de varincia de X, uma vez que esta um parmetro
associado a uma varivel aleatria e, at o momento no h nada aleatrio no esquema montado: Uma
populao, uma varivel quantitativa e dois parmetros populacionais dessa varivel.
Vamos agora introduzir certo esquema probabilstico: a seleo aleatria de um dos indivduos da
populao e a determinao do valor de X para esse indivduo; seja x esse valor. Agora, x uma varivel
12
aleatria. Se o esquema de sorteio aleatrio adotado foi tal que qualquer dos N indivduos da populao
teve a mesma chance 1/N de ser sorteado, ento
Vemos agora a associao entre V(x) e S
2
: se um indivduo for selecionado ao acaso, de forma que cada
indivduo na populao tenha a mesma chance de vir a ser sorteado, e, fazendo x igual ao valor da
varivel X para aquele indivduo, ento V(x)=S
2
. Vamos ento, respeitando a conveno, representar
por e o
2
, respectivamente.
Suponha agora um sorteio se n indivduos da populao, sendo n<N. Aos valores observados de X,
denominaremos x
1
, x
2
, , x
n
, e seja
Agora, vejamos o que acontece com o desvio quadrtico mdio amostral,
. Como
veremos, sua esperana no o
2
, logo, se o utilizarmos como o estimador da varincia, teremos um
estimador viciado. Vejamos:
Separando os termos em colchete:
Precisamos agora determinar
. Ora,
13
Como os x
i
s so independentes entre si, ento E(x
i
x
j
) igual a
2
para i=j, e
2
+o
2
para i=j. Logo,
Podemos ento concluir que
Portanto,
Ou seja,
Diferente de o
2
, portanto. Por outro lado,
Usamos, ento,
mnima quando
.
Portanto,
,
restauramos o equilbrio, com
.
Pronto, est explicado.
14
Testando hipteses simples sobre a esperana de uma varivel aleatria X
Um dos recursos bsicos mais poderosos da Estatstica com pea central do Mtodo Cientfico, a
possibilidade que ele oferece para se testar (cientificamente) hipteses sobre a esperana desconhecida
de uma varivel aleatria. Seja a varivel aleatria
X ~ N(, o
2
)
e n observaes independentes de X:
X
1
, X
2
, , X
n
Sejam as estatsticas Z e T definidas como:
onde
A estatstica Z tem distribuio N(0, 1) enquanto T tem distribuio t de Student, com n-1 graus de
liberdade.
Considere agora que a esperana seja desconhecida, e que se queira testar, contra a hiptese nula
H
0
: =
0
a hiptese alternativa
H
1
: >
0
Consideremos primeiro o caso em que o desvio padro o conhecido. claro que um valor de
grande
demais evidncia contra H
0
, e em favor de H
1
. O questo aqui , o que grande demais?
Para um tratamento objetivo deste caso, devemos definir um valor crtico c tal que, se
no for
maior que c, consideraremos que os dados experimentais no trouxeram evidncia suficiente contra H
0
,
e no rejeitaremos, ento a hiptese nula.
Como escolher o valor crtico c? Se escolhermos c grande demais, ser quase impossvel rejeitar
indevidamente a hiptese nula quando ela for verdadeira, mas a probabilidade de no rejeit-la quando
ela for falsa poder ser muito elevada. Dizemos que o critrio de deciso fica conservador demais. Por
outro lado, se escolhermos um valor crtico c pequeno, teremos o problema oposto, com elevada
15
probabilidade de rejeitar H
0
sendo esta hiptese verdadeira. A soluo adotar uma soluo de
compromisso, balanceando as probabilidades dos dois erros opostos possveis: rejeitar uma hiptese
nula verdadeira, ou no rejeitar uma hiptese nula falsa.
Para isto, vamos fixar um valor suficientemente baixo para a probabilidade de rejeitarmos H
0
quando
esta hiptese for verdadeira, isto , a esperana de X for, de fato, igual ao valor fixado
0
. Seja o este
valor suficientemente baixo. A constante c ento escolhida para garantir que, se H
0
for verdadeira,
ento
Ora, se H
0
for verdadeira, a estatstica Z ter distribuio N(0, 1), ento
Portanto,
Podemos ento extrair o valor crtico c, em funo de
0
, o, n e o:
.
Fica ento completamente definida uma abordagem para o problema de testar a hiptese H
0
: =
0
,
contra a hiptese alternativa H
1
: >
0
:
1. Escolhe-se o, um valor suficientemente pequeno para a probabilidade de se rejeitar
indevidamente a hiptese nula H
0
;
2. Define-se n, o nmero de observaes a serem feitas da varivel aleatria X;
3. Faz-se as n observaes independentes de X;
4. Calcula-se a estatstica T;
5. Rejeita-se H
0
se T for maior do que c.
Vejamos um exemplo:
Seja X uma varivel aleatria com distribuio Normal, com mdia e desvio padro o. A esperana de
desconhecida, mas acredita-se que seja igual a 100. Contudo, existe uma corrente de opinio que afirma que
afirma que , na verdade, maior que 100. O desvio padro de X, o=4, conhecido. Para se testar a hiptese
conservadora H
0
: =100, contra a hiptese alternativa, H
0
: >100, decide-se pela abordagem experimental:
sero feitas n observaes independentes de X, rejeitando-se H
0
se
e S
n
e conforme definidos.
a. Considerando todos os alunos como um nico grupo, sem distino de regio e cidade, calcule
e
S
2
, respectivamente a mdia e o desvio quadrtico mdio de N.
b. Calcule E(X) e V(X).
c. Calcule P{X=0}\C
1
, isto , a probabilidade condicional de o aluno tirar 0 dado que da cidade 1.
d. Calcule E(X) dado C
1
.
e. Calcule E(X) dado R
2.
f. Calcule V(X) dado R
1
.
g. Calcule a probabilidade que dos primeiros 20 alunos selecionados, exatamente seis respondam
corretamente as trs questes.
h. Qual a probabilidade que o trigsimo aluno sorteado seja de C
2
, dado que ele acertou as trs
questes?
i. Qual a probabilidade do oitavo aluno sorteado no ser de C
5
, dado que ele no acertou as trs
questes.
j. Para n=400, calcule a probabilidade de que, usando
como estimador de
, se cometa um erro
absoluto superior a 1% de
; isto , que
k. Nesta amostra de 400 alunos, seja n
3
o nmero de alunos com nota perfeita. Calcule P{n
3
=150}
l. Ainda com n=400, construa um intervalo de probabilidade 0,95 para n
0
.
m. Qual deveria ser o tamanho amostral n para que
=0,05?
2. A tabela contm dados simulados, porm com caractersticas semelhantes situao real. Imagine que para
uma prova do ENEM, com 180 questes, hajam 4.817.768 alunos inscritos, e que esses alunos, distribudos por
nmero de questes que conseguem resolver corretamente na prova, formam a tabela apresentada abaixo
(ela pode ser copiada e colada numa planilha Excel; ou pode ser copiada diretamente de EnemSimula no
Teleduc). Numa prova frequentemente o aluno no tira a nota que merece por errar por algum descuido
alguma questo que sabe resolver bem, ou, principalmente em provas com questes de mltipla escolha,
acertar, por sorte no chute questes que no sabe resolver. Vamos admitir que com as questes sendo
corrigidas individualmente, com avaliao completa de todo o desenvolvimento apresentado, esses problemas
podem ser completamente eliminados. Use computador para os clculos.
3. Em mdia, quantas questes os alunos resolvero na prova? Denomine-a M.
4. Numa escala de 0 a 100, qual ser a nota mdia geral? Denomine-a
.
5. Se um aluno for sorteado ao acaso e submetido prova, seja X o nmero de questes que saber responder
corretamente. Calcule E(X) e V(X).
6. Se uma amostra aleatria de n estudantes for sorteada do universo e submetida prova, gerando X
1
, X
2
, X
3
, ,
X
n
e, da,
e S
n
e conforme definidos, determine
.
Tabela 1 Nmero de alunos por cidade e nmero de questes que
consegue resolver corretamente
Regio e
Cidade
Nmero de questes da plrova que o
aluno sabe responder corretamente
Total por
cidade e
por regio
0 1 2 3
R1 C1 1.200 1.950 2.870 2.220 8.240
R1 C2 4.200 8.330 2.140 830 15.500
Total R1 5.400 10.280 5.010 3.050 23.740
R2 C3 1.260 4.320 6.950 5.370 17.900
R2 C4 827 2.895 12.840 6.870 23.432
R2 C5 120 840 5.540 12.640 19.140
Total R2 2.207 8.055 25.330 24.880 60.472
Total 7.607 18.335 30.340 27.930 84.212
18
7. Para n=1000, calcule
, a probabilidade que
.
9. Qual deve ser n para que
?
10. E no caso acima, quanto seria
11. Considerando os resultados acima, comente sobre as virtudes de