You are on page 1of 23

Probabilidade Estatstica - Professor: Hiron Pereira Farias

1 Inferncia Estatstica
Seja X uma varivel aleatria com funo de densidade( ou de probabilidade) que abreviaremos
por f.d.p. (f.p.) e que denotaremos por f(x|). Chamaremos de inferncia estatstica o problema
que consiste em especicar um ou mais valores para , baseado em um conjunto de valores obser-
vados de X. No caso de um problema de estimao, o objetivo procurar, segundo algum critrio
especicado, valores que representem adequadamente os parmetros desconhecidos. No caso de
testes de hipteses, o objetivo vericar a validade de armaes sobre o valor do parmetro de-
sconhecido. Por exemplo, quando o interesse vericar se a proporo de eleitores de determindo
candidato igual a 50%, as hipteses a serem testadas so H
0
: = 0,5 versus H
1
: = 0,5.
1.1 Denies importantes
1) O conjunto de valores de uma caracterstica (observvel) associada a uma coleo de indivduos
ou objetos de interesse dito ser uma populao.
2) Uma amostra aleatria simples (AAS) de tamanho n de uma varivel aleatria X, com dada
distribuio, o conjunto de n variveis independentes X
1
, X
2
, . . . , X
n
, cada uma com a mesma
distribuio de X.
3) As quantidades da populao, em geral desconhecidas e sobre as quais temos interesse, so de-
nominados parmetros e geralmente denotados por letras gregas tais como , ,
2
entre outros.
4) O conjunto em que toma valores denominado espao paramtrico.
5) Qualquer estatstica que assuma valores em um estimador para .
6) Qualquer estatstica que assuma valores somente no conjunto dos possveis valores de g() um
estimador para g().
7) Qualquer funo da amostra que no depende de parmetros desconhecidos denominada uma
estatstica.
8) combinao dos elementos da amostra, construdos com a nalidade de representar, ou esti-
mar, um parmetro de interesse na populao, denominamos estimador. Em geral, denotamos os
estimadores por smbolos com acento circunexo:

, ,
2
e

P. Aos valores nmericos assumi-
dos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativas.
Notamos que um estimador, digamos , uma funo das variveis aleatrias constituinte da
amostra, isto ,

= f(X
1
, X
2
, . . . , X
n
). Logo, um estimador tambm uma varivel aleatria.
a correspondente distribuio de probabilidade formar a base das argumentaes probabilsticas
utilizadas na extrapolao da informao da amostra para os parmetros da populao.
Os estimadores mais comuns so:
X =
X
1
+ X
2
+ . . . + X
n
n
=
1
n
n

i=1
x
i
mdia amostra ;
S
2
=
1
n 1
n1

i=1
(X
i
X)
2
varincia amostral .

P =
Y
n
proporo amostral .
em que, Y uma varivel aleatria que determina o nmero de elementos na amostra com a
caracterstica de interesse.
1.2 Propriedades dos Estimadores
Uma propriedade desejvel de um estimador que ele esteja prximo", de alguma maneira
do verdadeiro valor do parmetro desconhecido. Formalmente, dizemos que

um estimador
no-viciado do parmetro se
E(

) = .
Isto ,

um estimador no-viciado de se, "na mdia", seus valores forem iguais a . Note que
isso equivalente a se exigir que a mdia da distribuio amostral de

seja igual a .
Se o estimador for viesado, ento a diferena
E(

)
denominada de Vis do estimador

.
Muito embora seja desejvel que uma estimativa seja no-viesada (ou tendenciosa), haver ocasies
em que poderemos preferir estimativa tendnciosa. possvel encontrar mais de uma estimativa
no tendenciosa para o parmetro desconhecido. a m de realizar a escolha plausvel em tais
situaes, introduziremos o conceito.
Denio: Seja

uma estimativa no tendenciosa de . Diremos que

uma estimativa no-
tendenciosa de varincia mnima (ENTVM) de , se para todas as estimativas

tais que E(

) =
, tivermos V (

) V (

) para todo . Isto , dentre todas as estimativas no-tendenciosas de ,


tem a varincia menor de todas.


possvel obter um limite inferior para a varincia de todos os estimadores no-viesados do
parmetro . Seja

um estimador no viciado do parmetro , com base em uma amostra aleatria
de n observaes, e denote por f(x, ) a distribuio de probabilidade da varivel aleatria X. Ento,
o limite inferior da varincia dos estimadores no viciados de :
LI() =
1
nE

lnf(X|)

Denio: Se X
1
, X
2
, . . . , X
n
for uma amostra de tamanho n, proviniente de uma distribuio com
mdia e varincia
2
, ento a mdia da amostra, X , ser o ENTVM para .
Denio: O erro-padro de um estimador

o seu desvio-padro, dado por

V (

). Se
o erro-padro envolver parmetros desconhecidos que possam ser estimados, ento a substituio
daquele(s) valor(es) em

produzir um erro padro estimado, denotado por S

ou e.p.(

).
Denio: O erro quadrtico mdio (EQM) de um estimador

do parmetro dado por
EQM[

] = E

)
2

= E

E(

) + E(

2
= E

E(

)) + (E(

) ))

2
=
E

E(

2
+ E

E(

) )

2
2E(

E(

))(E(

) )) = V ar[

] + B
2
(

), em que
B(

) = E[

]
denominado o vcio do estimador

. Dizemos que um estimador

no viciado para se
E[

] = ,
para todo , ou seja B(

)= 0, para todo . No caso em que



um estimador no viciado
para , temos que
EQM[

] = Var[

],
ou seja, o erro quadrtico mdio de

reduz sua varincia.
Denio: Chamamos de ecincia de um estimador

, no viciado para o parmetro , o quo-
ciente
e(

) =
LI()
V ar(

)
,
onde LI() o limite inferior da varincia dos estimadores no viciados de .
e()= 1 quando LI()= Var(

), ou seja, quando a varincia de



coincide com o limite inferior da
varincia dos estimadores no viciados de . Nesse caso,

dito ser eciente.
1.3 O Mtodo de Mxima Verossimilhana
Denio: Sejam X
1
, X
2
, . . . , X
n
uma amostra aleatria de tamanho n da varivel aleatria X
comfuno de densidade ( ou de probabilidade) f(x| ), com , onde o espao paramtrico.
A funo de verossimilhana de correspondente amostra aleatria observada dada por
L(; x) =
m

j=1
f(x
i
|).
Denio: O estimador de mxima verossimilhana de o valor que maximiza a funo
de verossimilhana L(; x).
O logaritmo natural da funo de verossimilhana de denotado por
l(; x)=ln L(; x).
No dicil vericar que o valor de que maximiza a funo de verossimilhana L(; x), tambm
maximiza l(; x).
1.4 Verossimilhana para Amostras Independentes
Existem situaes em que temos duas ou mais amostras independentes de distribuies que
dependem de um parmetro de interesse. No caso de duas amostras aleatrias independentes,
X
1
, X
2
, . . . , X
n
e Y
1
, Y
2
, . . . , Y
n
, podemos escrever
L(; x, y) = L(; x) L(; y),
devido independncia entre as amostras. Portanto a verossimilhana conjunta igual ao produto
da verossimilhana correspondente amostra X
1
, X
2
, . . . , X
n
pela verossimilhana correspondente
amostra Y
1
, Y
2
, . . . , Y
n
. De modo que podemos escrever
l(; x, y) = l(; x) + l(; y),
de modo que o logaritmo da verossimilhana conjunta igual ao produto da verossimilhanas
correspondentes a cada uma das amostras.
1.5 Teorema Limite Central
No que foi estudado at o presente momento, consideramos a distribuio amostral da mdia
X , calculada em uma amostra cuja elementos so constitudos por variveis aleatrias indepen-
dentes e com distribuio normal. Na prtica, muitas vezes no temos informaes a respeito da
distribuio das variveis constituintes da amostra, o que nos impede de utilizar o resultado ap-
resentado. Felizmente satisfeitas certas condies, pode ser mostrado que, para um tamanho de
amostra sucientemente grande, a distribuio de probabilidade da mdia amostral pode ser aprox-
imada por uma distribuio normal.
Esse resultado, fundamental na teoria da Inferncia Estatstica, conhecido como Teorema Limite
Central.
denio: Para amostras aleatrias simples (X
1
, X
2
, . . . , X
n
), retiradas de uma populao com
mdia e varincia
2
nita, a distribuio amostral da mdia X aproxima-se, para n grande, de
uma distribuio normal, com mdia e varincia

2
n
.
Esse resultado sugere que, quando o tamanho da amostra aumenta, independentemente da forma
da distribuio da populao, a distribuio amostral de X aproxima-se cada vez mais de uma
distribuio normal.
1.6 Determinao do tamanho de uma amostra
Em nossas consideraes anteriores zemos a suposio que o tamanho da amostra, n, era
conhecido e xo. Podemos, em certas ocasies, querer determinar o tamanho da amostra a ser
escolhida de uma populao, de modo a obter um erro de estimao previamente estipulado, com
determinado grau de conana.
Suponha que estejamos estimando a mdia populacional e para tanto usaremos a mdia amostral,
X , baseada numa amostra de tamanho n. Suponha que se queira determinar o valor de n de modo
que
P(|X | ) ,
com 0 < < 1 e o erro amostral mximo que podemos suportar, ambos valores xados.
Sabemos que
X N(;

2
n
) , logo X N(0;

2
n
) e portanto
P( X ) = P

n(X )

de modo que

= z

do que obtemos nalmente n =



2
z
2

2
1.7 Estimao por Intervalos
At aqui, somente estimadores pontuais foram considerados, pois fornecem como estimativa
um nico valor numrico para o parmetro de interesse. Em muitos problemas de estimao,
entretanto, prefere-se um intervalo que expresse a preciso do estimador. Por serem variveis
aleatrias, os estimadores possuem uma distribuio d probabilidade e, levando este fato em con-
siderao, podemos apresentar uma estimativa mais informativa para o parmetro de interesse que
inclua uma medida de preciso do valor obtido. Esse mtodo de estimao, denominado intervalo
de conna, incorpora, estimativa pontual do parmetro, informaes a respeito de sua varia-
bilidade. Intervalos de conna so obtidos atrves da distribuio amostral dos estimadores. A
interpretao de um intervalo de conna de que se muitas amostras forem coletadas e se for
calculado um intervalo de conna de 100(1 )% de conana para o parmetro a partir de
cada amostra, ento 100(1 )% desses intervalos contero o verdadeiro valor de . Na prtica,
obtemos apenas uma amostra aleatria e calculamos um intervalo de conna. Como esse inter-
valo conter, ou no, o verdadeiro valor de , no razoavel atribuir um nvel de probabilidade a
esse evento especco.
O comprimento do intervalo de conna bilateral uma medida importante da qualidade da infor-
mao obtida da amostra. Ocomprimento do semi-intervalo, chamado de preciso do estimador.
Quanto maior o intervalo de conna, mais conantes estaremos de que o intervalo contenha real-
mente o verdadeiro valor de . Por outro lado, quanto maior o intervalo, menos informao temos
sobre o verdadeiro valor de . Em uma situao ideal, obtemos um intervalo relativemente pequeno
com alta conna. como o comprimento do intervalo de conna mede a preciso da estimao,
vemos que a preciso est inversamente relacionada ao nvel de conna. altamente desejvel
obter um intervalo de conna que seja pequeno o bastante para o proposito de tomada de deciso,
mas que tenha, tambm, a conna adequada. Uma maneira de conseguir isso escolhendo-se o
tamanho n da amostra grande o suciente para resultar em um intervalo de tamanho especicado
com a conna prescrita.
1.7.1 Intervalo de Conna para Populaes Normais
Suponha-se que X tenha distribuio N(;
2
), onde se supe
2
conhecido, enquanto
o parmetro desconhecido. Seja X
1
, X
2
, . . . , X
n
uma amostra aleatria de X e seja X a mdia
amostral.
Sabemos que X tem distribuio N(;

2
n
), portanto, Z =

n(X )

tem distribuio N(0;1).


Observa-se que, muito embora Z depende de , sua distribuio de probabilidade no depende.
Empregamos este fato a nosso favor da seguinte maneira:
Fixado um valor tal que 0 < < 1, podemos encontrar um valor tal que :
P(|Z| < z

2
) = P(z

2
< Z < z

2
) = .
Para xo o valor z

2
pode ser obtido da tabela normal padro.
P(z Z z) = P(z

n(X )

z) = P(z

n
X z

n
) =
P(X z

n
X + z

n
) = 2(z) 1
Assim o intervalo de conana para , com coeciente de conana , dadao por
IC(; ) = [X z

n
; X + z

n
].
A amplitude do intervalo de conana dada pela diferena entre o extremo superior e inferior,
isto , X +z

n
X +z

n
= 2z

n
, o que claramente indica que ela depende da conana
, do desvio-padro e do tamanho da amostra n. usual se referir semi-amplitude, como o erro
envolvido na estimao.
De modo geral o intervalo de conana para um parmetro dado por
IC(; )= [

vt ep(

);

+ vt ep(

)]
em que vt um valor tabelado da distribuio de

e ep(

) o erro-padro do estimador

.
Sabemos que sabemos que a proporo amostral,

P, tem distribuio normal com mdia P e vari-
ncia
P(1 p)
n
, isto ,

P N

P,
P(1 p)
n

e que

P P

p(1p)
n
N(0; 1).
Assim o intervalo de conana para P , com coeciente de conana , dado por
IC(P ; ) =

P z

p(1p)
n
;

P + z

p(1p)
n

.
Como no conhecemos P, que o parmetro a ser estimado, primeiro ao fazermos P =

P, temos
IC(P ; ) =

P z


P(1

P)
n
;

P + z


P(1

P)
n

.
e para P =
1
2
, obtemos
IC(P ; ) =

P z

1
4n
;

P + z

1
4n

.
Consideremos o caso em que temos X
1
, X
2
, . . . , X
n
, uma amostra aleatria da varivel aleatria
X N(
1
;
2
1
) e Y
1
, Y
2
, . . . , Y
m
, uma amostra aleatria da varivel aleatria Y N(
2
;
2
2
), onde
X e Y so independentes. Sabemos que
(X Y ) N

2
;

2
1
n
+

2
2
m

de modo que , sendo =


1

2
, consideremos a quantidade
(X Y ) (
1

2
)

2
1
n
+

2
2
m
N(0; 1)
Sendo
2
1
e
2
2
conhecidas, temos , como no caso anterior, o intervalo
IC(
1

2
; ) =

(X Y ) z

2
1
n
+

2
2
m
; (X Y ) + z

2
1
n
+

2
2
m

Se as varincias
2
1
e
2
2
so conhecidas, e se os tamanhos amostrais n e m so iguais, ento para
determinar o tamanho amostral necessrio tal que o erro na estimativa de
1

2
usando X
1
X
2
seja menor do que com % de conna. O tamanho de cada amostra
n =

2
(
2
1
+
2
2
).
Suponha que X seja normalmente distribuda, com mdia e varincia desconhecidas. Seja
X
1
, X
2
, . . . , X
n
uma amostra aleatria de tamanho n, e seja S
2
a varincia amostral. J demostrou-
se que a distribuio amostral de
(n 1)S
2

2

2
(n1)
.
Portanto dado , podemos determinar q
1
e q
2
de modo que
P

q
1

(n 1)S
2

2
q
2

= .
Considerando o intervalo simtrico, ou seja, P[
2
n1
q
2
] = P[
2
n1
q
1
] =
1
2
, temos o
intervalo de conana para
2
, dado por
IC(
2
; ) =

(n 1)S
2
q
2
;
(n 1)S
2
q
1

1.8 Distribuio t de Student


Sejam Z N(0, 1) e V
2
n
variveis aleatrias independentes. A varivel aleatria
T =
Z

V
n
t
n
tem distribuio t com n graus de liberdade, denotado por T t
n
.
Teorema: Se (X
1
, X
2
, . . . , X
n
) uma amostra aleatria de tamanho n da distribuio N(0,1), ento

n(X )
s
t
(n1)
.
Prova:
Notemos que podemos escrever

n(X )
s
=

n(X )

=
X

(n1)S
2
(n1)
2
t
(n1)
1.8.1 Intervalo de conana para com varincia desconhecida
Quando a varincia desconhecida, construmos intervalos de conna para a mdia popula-
cional utilizando a distribuio t-Student. Supondo uma amostra aleatria (X
1
, X
2
, . . . , X
n
) obtida
de uma populao com distribuio Normal com mdia e varncia desconhecidas, temos que

n(X )
s
t
(n1)
.
Desta forma, xando-se o coeciente de conana (0 < < 1) e utilizando a tabela da dis-
tribuio t-Student com n-1 graus de liberdade, obteremos o valor de t

2
tal que
P

n(X )
S
t

.
Logo, o intervalo com coeciente de conana para , com varncia desconhecida, ser dado
por
IC(; ) =

X t

2
S

n
; X + t

2
S

.
1.8.2 Intervalo de conana para diferena entre mdias
Seja (X
1
, X
2
, . . . , X
n
) uma amostra aleatria de tamanho n de uma distribuio normal com
mdia
1
e varincia
2
1
desconhecida, e seja (Y
1
, Y
2
, . . . , Y
m
) uma amostra aleatria de tamanho
m de uma distribuio normal com mdia
2
e varincia
2
2
desconhecida. Assumiremos que
as duas amostras so independentes uma da outra e que h homogeneidade das varincias, isto ,

2
1
=
2
2
=
2
. Queremos uma estimao intervalar da diferena das mdias populacionais
2

1
.
Sabemos que (Y X) normalmente distribuda com mdia
2

1
e varincia

2
n
+

2
m
, isto
(X Y ) N

2
;

2
1
n
+

2
2
m

e
(X Y ) (
1

2
)

2
n
+

2
m
N(0; 1)
Sabemos tambm que

(X
i
X)
2

2
=
(n 1)S
2

2
tem distribuio qui-quadrado com n-1 graus de liberdade, e

(Y
i
Y )
2

2
=
(m1)S
2

2
tem distribuio qui-quadrado com m-1 graus de liberdade, ento
V =

(X
i
X)
2

2
+

(Y
i
Y )
2

2
=
(n 1)S
2

2
+
(m1)S
2

2
t
(m+n2)
. Finalmente, temos que a varivel aleatria
T =
Z

V
m+n2
t
(m+n2)
tem distribuio t com (m+n-2) graus de liberdade.
Fazendo
S
2
p
=
(m1)S
2
+ (n 1)S
2
m + n 2
,
temos que a estatstica
T =
(X Y ) (
1

2
)
S
P

1
n
+
1
m
,
tem distribuio t com m+n-2 graus de liberdade. Dai
IC(
1

2
; ) =

(X Y ) t

2
S
P

1
n
+
1
m
; (X Y ) + t

2
S
P

1
n
+
1
m

O estimador combinado de
2
, denotado por S
2
P
e denido por
S
2
p
=
(m1)S
2
+ (n 1)S
2
m + n 2
,
pode ser escrito como
S
2
p
=
(m1)S
2
m + n 2
+ S
2
p
=
(n 1)S
2
m + n 2
= wS
2
1
+ (1 w)S
2
2
,
sendo 0 < w 1. Logo, S
2
P
uma mdia ponderada das duas varincias das amostras S
2
1
e
S
2
2
, em que os pesos w e 1-w dependeram dos tamanhos das amostras n
1
e n
2
. Obviamente, se
n
1
= n
2
= n , ento w = 0,5 e S
2
P
ser exatamente igual mdia aritmtica entre S
2
1
e S
2
2
.
1.9 Distribuio F de Snedecor
Sejam U e V variveis aleatrias independentes com m e n graus de liberdade respectivamente.
Ento a varivel aleatria
X =
U
m
V
n
tem distribuio F com m graus de liberdade no numerador e n graus de liberdade no denominador,
denotaremos por X F(m, n).
Se X
1
, X
2
, . . . , X
m
uma amostra aleatria de tamanho m de uma populao normal com mdia

X
e varincia
2
X
, e seja tambm Y
1
, Y
2
, . . . , Y
n
uma amostra aleatria de tamanho n de uma
populao Normal com mdia
Y
e varincia
2
Y
, e se as duas amostras so independentes, ento
isto resulta que
1

2
m

i=1
(X
i
X)
2
tem distribuio qui-quadrado com m-1 graus de liberdade, e
1

2
n

j=1
(Y
i
Y )
2
tem distribuio qui-quadrado com n-1 graus de liberdade, assim a estatstica
F =
1
(m1)
2
X
m

i=1
(X
i
X)
2
1
(n 1)
2
Y
n

j=1
(Y
i
Y )
2
=
S
2
X

2
X
S
2
Y

2
Y
tem uma distribuio F com m-1 e n-1 graus de liberdade.
Um procedimento de teste de hipteses para a igualdade de duas varincias baseado no seguinte
resultado. Sujeita a hiptese nula H
0
:
2
X
=
2
Y
, a estatstica
F =
S
2
X
S
2
Y
,
distribuio F com m-1 e n-1 graus de liberdade.
EXERCCIOS
Professor: Hiron Pereira Farias
Disciplina: Probabilidade e Estatstica
Questo 1: Uma amostra de 25 observaes de uma Normal (; 16) foi coletada e forneceu uma
mdia amostral de 8. Construa intervalos com conana 80%, 85%, 90% e 95%
Resp. a) [6,97; 9,03] ; b) [6,85; 9,15] ; c) [6,69; 9,31] d) [6,43; 9,57].
Questo 2: Por analogia a produtos similares, o tempo de reao de um novo medicamento pode
ser considerado como tendo distribuio Normal com desvio padro igual a 2 minutos. Vinte
pacientes foram sorteados, receberam o medicamento e tiveram seu tempo de reao anotado. Os
dados foram os seguintes ( em minutos ): 2,9; 3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8;
5; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2. Obtenha um intervalo de conana para o tempo mdio de reao.
Use = 96%
Resp. IC(; 96%) = [3,83 ; 5,67]
Questo 3: Ser coletada uma amostra de uma populao Normal com desvio-padro igual a 9.
Para uma conana de = 90%, determine a amplitude do intervalo de conana para a mdia
populacional nos casos em que o tamanho da amostra 30, 50 ou 100.
Resp. para n = 30 A = 5,42; para n = 50 A = 4,2; para n = 100 A = 2,97;
Questo 4: Para uma Normal (5; 10) coletou-se uma amostra de tamanho 25. Calcule:
a) P(X 4,8); ( Resp. 0,3745 )
b) P(4,5 X 5,3); ( Resp. 0,466 )
c) P(X 4,7 ou X 5,1) ( Resp. 0,7556 ).
Questo 5: Qual deve ser o tamanho de uma amostra cujo desvio padro 10 para que a diferena
da mdia amostral para a mdia da populao, em valor absoluto, seja menor que 1. com coe-
ciente de conana igual a:
(a) 95% (Resp. n = 385 ) (b) 99% (Resp. n = 666 )
Questo 6: Uma populao tem desvio padro igual a 10.
(a) Que tamanho deve ter uma amostra para que, com probabilidade 8%, o erro em estimar a mdia
seja superior a uma unidade?( Resp. n = 307)
(b) Supondo-se colhida a amostra no caso anterior, qual o intervalo de conana, se X = 5? Resp.
[49 ; 51]
Questo 7: A vida de um componente usado em um motor de uma turbina de um avio a jato uma
varivel aleatria, com mdia de 5.000 h e desvio-padro de 40h. A distribuio da vida efetiva
razoavelmente prxima da distribuio Normal. O fabricante do motor introduz uma melhoria no
processo de fabricao para esse componente, que aumenta a vida mdia para 5.050 h e diminui
o desvio-padro para 30h. Suponha que uma amostra aleatria de n
1
= 16 componentes seja se-
lecionada do processo antigo e uma amostra aleatria de n
2
= 25 componentes seja selecionada
do processo melhorado. Considere que o processo antigo e o melhorado possam ser considerados
como populaes independentes.
i) Qual a probabilidade de que a diferena nas duas mdias amostrais X
2
X
1
seja no mnimo de
25h? ii) Construir um intervalo de conana para a diferena entre as mdias populacionais dos
dois processos?
Questo 8: Suponha que amostras de tamanho n = 25 sejam selecionadas, ao acaso, de uma po-
pulao normal, com mdia igual a 100 e desvio-padro igual a 10. Qual a probabilidade de que a
mdia amostral caia no intervalo de
X
1,8
X
a
X
+ 1,0
X
?
Questo 9: Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em
relao a um determinado produto, colheu-se uma amostra aleatria de 300 indivduos, dos quais
180 preferiam esse produto.
(a) Determine o intervalo de conana para a proporo da populao que prefere o produto em
estudo; tome = 0,90. (Resp. [0,553 ; 0,647] )
(b) Determine a probabilidade de que a estimativa pontual dessa proporo no dira do verdadeiro
valor em mais de 0,001. (Resp. 2,7%)
Questo 10: Antes de uma eleio em que existam dois candidatos, A e B, foi feita uma pesquisa
com 400 eleitores escolhidos ao acaso, e vericou-se que 208 deles pretendiam votar no candidato
a. Construa um intervalo de conana, com c.c. = 0,95, para a porcentagem de eleitores fa-
vorveis ao candidato A na poca das eleies. (Resp. [0,471 ; 0,569])
Questo 11: Uma amostra aleatria de 625 donas de casa revela que 70% delas preferem a marca
A de detergente. Construir um intervalo de conana para p = proporo das donas de casa que
preferem A. Utilize ( = 90%).
Questo 12: Numa pesquisa com 50 eleitores o candidato Jos Joo obteve 35% da preferncia
dos eleitores. Construa, para a conana de 94%, os intervalos otmista e conservador de conana
para a proporo de votos a serem recebidos pelo candidato mencionado, supondo que a eleio
fosse nesse momento.
Questo 13: Antes de uma eleio, um determinado partido est interessado em estimar a pro-
poro p de eleitores favorveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que
60% dos eleitores eram favorveis ao candidato em questo.
a) Determine o tamanho da amostra necessrio para que o erro cometido na estimao seja de , no
mximo, 0,01 com probabilidade de 80%; (Resp. n = 3.994)
b) Se na amostra nal, com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores
eram favorveis ao candidato em questo, construa um intervalo de conana para a proporo p.
Utilize ( = 95%).
Questo 14: Suponha que estejamos interessados em estimar a porcentagem de consumidores de
um certo produto. Se a amostra de tamanho 300 forneceu 100 indivduos que consomem o dado
produto, determine:
a) o intervalo de conana de p, com coeciente de conana de 95%; (Resp. [0,280 ; 0,386])
b) o tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidades com probabili-
dade de 95%. (Resp. n = 2.133 ou n = 2.401)
Questo 15: Com auxlio da tabela t-Student calcule:
a) P(3,365 t
5
3,365); (Resp. 0,98)
b) P(|t
8
| < 1,4); (Resp. 0,80)
c) O valor de b tal que P(t
16
b) = 0,05; (Resp. -1,746)
d) O valor de c tal que P(|t
11
| c) = 0,10; (Resp. 0,129)
Questo 16: Uma amostra com 10 observaes de uma varivel aleatria Normal forneceu mdia
de 5,5 e varincia amostral 4. Determine o intervalo de conana para com coeciente de con-
ana = 95%
Questo 17: Admitindo que a presso sangunea arterial em homens siga o mdelo Normal, 7 pa-
cientes foram sorteados e tiveram sua presso medida com os seguintes resultados: 84, 81, 77, 85,
69, 80 e 79. Determine o intervalo de conana para com coeciente de conana = 98%
Questo 18: Uma amostra com 10 observaes de uma varivel aleatria Normal forneceu mdia
de 5,5 e varincia amostral 4. Determine o intervalo de conana para com coeciente de con-
ana = 95%
Questo 19: Encontre o c.c. de um intervalo de conana para p, se n = 100, p= 0,6 e a amplitude
do intervalo deve ser igual a 0,090. (Resp. = 0,64)
Questo 20: Esto sendo estudados dois processos para conservar alimentos, cuja principal va-
rivel de interesse o tempo de durao destes. No processo A, o tempo X de durao segue a
distribuio N(
A
; 100), e processo B o tempo Y obedece distribuio N(
B
; 100). Sorteiam-se
duas amostras independentes: a de A, com 16 latas, apresentou tempo mdio de durao igual a 50,
e a de B, com 25 latas, durao mdia igual a 60.
(a) Construa um IC para
A
e
B
, separadamente.
(b) Para vericar se os dois processos podem ter o mesmo desempenho, decidiu-se construir um IC
para a diferena
A

B
. Caso o zero pertena ao intervalo, pode-se concluir que existe evidncia
de igualdade dos processos. Qual seria sua resposta?
Questo 21: O tempo de reao de uma pessoa a certa droga uma varivel aleatria com mdia
5 minutos e desvio padro 3 minutos. Esse tempo foi medido em uma amostra de 80 pessoas esco-
lhidas, sem reposio, na cidade de So Paulo. Pergunta-se a probabilidade:
(a) O tempo mdio amostral ser inferior a 5,5? (Resp. 0,9319)
(b) O tempo mdio na amostra no diferir da verdadeira mdia por mais de 0,4? (Resp. 0,7660)
Questo 22: Numa pesquisa de mercado desejamos estimar a proporo de pessoas que compram
o sabonete Bom-cheiro.
(a) Que tamanho de amostra devemos colher para que, com probabilidade 0,9; a estimativa no se
desvie do verdadeiro valor por mais de 0,05? (Resp. n 269)
(b) Se tivermos a informao adicional de que a aceitao do sabonete Bom-cheiro no mnimo
0,8, qual deve ser ento o tamanho da amostra? (Resp. n 173)
(c) Decidimos colher uma amostra de tamanho 81. Qual o erro mximo cometemos com probabi-
lidade 0,9? (Resp. 0,09 )
(d) Para uma amostra de tamanho 81, qual a probabilidade de que o erro mximo seja 0,08? (Resp.
0,8502 )
Questo 23: Um pesquisador est estudando a resistncia de um determinado material sob de-
terminadas condies. Ele sabe que essa varivel normalmente distribuda com desvio padro de
duas unidades.
(a) Utilizando os valores 4,9; 7; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2 unidades, obtidos de uma amostra
de tamanho 9, determine o intervalo de conana para a resistncia mdia com um coeciente
= 0,90.
(Resp. [5,13 ; 7,32])
(b) Qual o tamanho da amostra necessrio para que o erro cometido, ao estimarmos a resistncia
mdia, no seja superior a 0,01 unidade com probabilidade 0,90? (Resp. n = 108.900)
(c) Suponha que no item (a) no fosse conhecido o desvio padro, determine o intervalo de con-
ana para a resistncia mdia com um coeciente = 0,90.
Questo 24: Uma amostra aleatria de n
1
= 49 selecionada de uma populao
1
normal com
uma mdia de 75 e um desvio -padro igual a 8. Uma segunda amostra aleatria de tamanho
n
2
= 9 retirada de uma outra populao
2
normal com mdia 70 e desvio-padro 12. Faa X
1
e
X
2
serem duas mdias amostrais. Encontre:
a) a probabilidade de X
1
X
2
exceder 4;
b) a probabilidade de 3,5 X
1
X
2
5,5;
c) construir um intervalo de conana para a diferena
1

2
2 Teste de Hipteses
Em muitas situaes temos interesse em tomar a deciso de aceitar ou rejeitar determinda ar-
mao baseando-se em um conjunto de evidncias.
A construo de um teste de hipteses, para um parmetro populacional, pode ser colocado do
seguinte modo. Existe uma varivel X associada a dada populao e tem-se uma hiptese sobre
determinado parmetro dessa populao. Por exemplo, armamos que o verdadeiro valor de

0
. Colhe-se uma amostra aleatria de elementos dessa populao, e com ela deseja-se comprovar
ou no tal hiptese.
Qualquer que seja a deciso tomada, estamos sujeitos a cometer erros. So dois os erros que
podem ser cometidos ao se realizar um teste de hiptese, so eles:
Erro tipo I: rejeitar a hiptese nula quando essa verdadeira. Chamaremos de a probabilidade
de cometer esse erro, isto ,
= P(erro tipo I) = P(rejeitar H
0
|H
0
verdadeira).
Erro tipo II: no rejeitar H
0
quando H
0
falsa. A probabilidade de cometer esse erro denotado
por , logo
= P(erro tipo II) = P(no rejeitar H
0
|H
0
falsa).
O objetivo do teste de hiptese dizer, usando uma estatstica

, se a hiptese H
0
ou no
aceitvel. Essa deciso tomada atravs da considerao de uma regio crtica RC. Caso o valor
observado da estatstica pertena a essa regio, rejeitamos H
0
; caso contrrio, no rejeitamos H
0
.
Esta regio construda de modo que P(

RC|H
0
verdadeira) seja igual a , xado a priori.
A probabilidade de cometer um erro de tipo I um valor arbitrrio e recebe o nome de nvel
de signicncia ou tamanho do teste. O resultado da amostra tanto mais signicante para re-
jeitar H
0
quanto menor for esse nvel , ou seja, quanto menor menor a probabilidade de se
obter uma amostra com estatstica (estimativa) pertencente regio crtica, sendo pouco provvel
a obteno de uma amostra da populao para a qual H
0
seja verdadeira. Geralmente, o valor de
xado em 10%, 5% ou 1%.
Passos para construo de um teste de hipteses:
I) Estabelecer as hipteses nula e alternativa;
II) Fixar ;
III) Denir a forma da regio crtica, com base na hiptese alternativa;
IV) Identicar a distribuio do estimador e obter sua estimativa;
V) Concluir o teste com base na estimativa e na regio crtica.
2.1 P-valor
Ao realizarmos um teste de hipteses, partimos de um valor de , pr-xado, para construir
a regra de deciso uma alternativa deixar a cargo de quem vai utilizar as concluses do teste a
escolha do valor para a probabilidade , que no precisar ser xado priori. A idia consiste em
calcular, supondo que a hiptese nula seja verdadeira, a probabilidade de se obter estimativas mais
desfavorveis ou extremas ( luz da hiptese alternativa) do que a que est sendo fornecida pela
amostra. Esta probabilidade ser o P-valor, denotado por P. Valores pequenos de P evidenciam que
a hiptese nula falsa, pois, sendo a amostra nossa ferramenta de inferncia sobre a populao,
ela fornece uma estimativa que teria probabilidade muito pequena de acontecer, se H
0
fosse ver-
dadeira. O conceito do que pequeno"ca a cargo do pesquisador, que assim decide qual usar
para comparar com o valor P. Daremos agora uma denio formal de um valor P.
denio: O P-valor o menor nvel de signicncia que conduz rejeio da hiptese nula H
0
com dados fornecidos pela amostra. Assim, um valor P carrega informao sobre o peso da evidn-
cia contra H
0
.
2.2 Distribuio F de Snedecor
Sejam U e V variveis aleatrias independentes tendo ambas distribuio qui-quadrado com m
e n graus de liberdade respectivamente. Ento a varivel aleatria
X =
U
m
V
n
tem distribuio F com m graus de liberdade no numerador e n graus de liberdade no denominador,
denotaremos por X F(m, n).
Se X
1
, X
2
, . . . , X
m
uma amostra aleatria de tamanho m de uma populao normal com mdia

X
e varincia
2
X
, e seja tambm Y
1
, Y
2
, . . . , Y
n
uma amostra aleatria de tamanho n de uma
populao Normal com mdia
Y
e varincia
2
Y
, e se as duas amostras so independentes, ento
isto resulta que
1

2
m

i=1
(X
i
X)
2
tem distribuio qui-quadrado com m-1 graus de liberdade, e
1

2
n

j=1
(Y
i
Y )
2
tem distribuio qui-quadrado com n-1 graus de liberdade, assim a estatstica
F =
1
(m1)
2
X
m

i=1
(X
i
X)
2
1
(n 1)
2
Y
n

j=1
(Y
i
Y )
2
=
S
2
X

2
X
S
2
Y

2
Y
tem uma distribuio F com m-1 e n-1 graus de liberdade.
Um procedimento de teste de hipteses para a igualdade de duas varincias baseado no seguinte
resultado. Sujeita a hiptese nula H
0
:
2
X
=
2
Y
, a estatstica
F =
S
2
X
S
2
Y
,
distribuio F com m-1 e n-1 graus de liberdade.
EXERCCIOS
Questo 1: Uma mquina automtica para encher pacotes de caf enche-os segundo uma dis-
tribuio normal, com mdia e varincia sempre igual a 400 g
2
. A mquina foi regulada para
= 500g. Desejamos, periodicamente, escolher uma amostra de 16 pacotes e vericar se a pro-
duo est sob controle, isto , se = 500g ou no. Se uma dessas amostras apresentasse uma
mdia x= 492 g, voc pararia ou no a produo para regular a mquina?
Questo 2: Um relatrio de uma companhia arma que 40% de toda a gua obtida, atravs de
poos artesianos no nordeste, salobra. H muitas controvrsias sobre essa informao, alguns
dizem que a proporo maior, outros que menor. Para dirimir as dvidas, 400 poos foram
sorteados e observou-se, em 120 deles, gua salobra. Qual a concluso ao nvel de 3%.
Questo 3: Deseja-se investigar se uma certa molstia que ataca o rim altera o consumo de ox-
ignio desse rgo. Para indivduos sadios, admite-se que esse consumo tem distribuio Normal
com mdia 12cm
3
/min. Os valores medidos em cinco pacientes com a molstia foram: 14,4; 12,9;
15; 13,7 e 13,5. Qual seria a concluso, ao nvel de 1% de signicncia?
Questo 4: Uma estao de televiso arma que 60% dos televisores estavam ligados no seu pro-
grama especial da ltima segunda-feira. Uma rede competidora deseja contestar essa armao e
decide usar uma amostra de 200 famlias para um teste. Admitindo que, da pesquisa realizada com
as 200 famlias, obtivemos 104 pessoas que estavam assistindo ao programa. Qual a concluso ao
nvel de 5% de signicncia?
Questo 5: Um pesquisador deseja estudar o efeito de certa substncia no tempo de reao de
seres vivos a um certo tipo de estmulo. Um experimento desenvolvido com cobaias, que so
inoculadas com a substncia e submetidas a um estimulo eltrico, com seus tempos de reao (em
segundos) anotados. Os seguintes valores foram obtidos: 9,1; 9,3; 7,2; 7,5; 13,3; 10,9; 7,2; 9,9; 8;
8,6. Admite-se que o tempo de reao segue, em geral, o modelo Normal com mdia 8 e desvio-
padro = 2 segundos. O pesquisador descona, entretanto, que o tempo mdio sofre alterao
por inuncia da substncia. Qual a concluso ao nvel de 6% de signicncia?
Questo 6: Um fabricante arma que seus cigarros contm no mais que 30 mg de nicotina. Uma
amostra de 25 cigarros forneceu mdia de 31,5 mg e desvio padro de 3 mg. No nvel de 5%, os
dados refutam ou no a armao do fabricante?
Questo 7: Para vericar se duas populaes tm a mesma mdia,amostras independntes foram
retiradas. Sabendo que a populao I Normal (
1
, 25) e a populao II Normal (
2
, 40), que con-
cluso pode ser retirada, ao nvel 2% ? Os valores obtidos foram:
Populao Dados
I 12 14 15 14 13 17 14 13
II 13 17 14 13 16 17 18 16
Questo 8: As variveis X e Y seguem a distribuio Normal com mesma varincia. Deseja-se
testar se, tambm, tm a mesma mdia. Doze observaes de cada varivel foram escolhidas e os
resultados foram os seguintes:
12

i=1
x
i
= 48 ;
12

i=1
y
i
= 56 ;
12

i=1
x
2
i
= 4.900 ;
12

i=1
y
2
i
= 5.650.
Qual a concluso ao nvel de signicncia de 5% ?
Questo 9: Para comparar as mdias de duas populaes Normais, amostras aleatrias foram obti-
das. Sabe-se que as varincias populacionais so diferentes, sendo seus valores desconhecidos.
Amostra I 7 9 3 8 11 5 9
Amostra II 2 7 5 15 9 16 8
O que pode ser dito a respeito das mdias das populaes, com = 0,05 ?
Questo 10: Dois medicamentos para tratamento de infeces bucais esto sendo sendo estudados
e o melhor desempenho denido pela rapidez em eliminar a infeco. Pacientes escolhidos ao
acaso receberam um dos medicamentos e tiveram a sua cura classicada em rpida ou no. Deseja-
se testar, ao nvel 10% , se os medicamentos so equivalentes. os dados obtidos so apresentados a
seguir.
Amostra Pacientes com cura rpida
Medicamento A 50 32
Medicamento B 100 48
Qual sua concluso? Indique as hipteses do teste e as suposies necessrias.
Questo 11: Para comparar o grau de diversidade de duas populaes primitivas, uma medida
antropomtrica foi obtida em fsseis coletados em stios arqueolgicos, fornecendo a tabela a
seguir.
caracterstica Stio A (n = 17) Stio B (n = 23)
Mdia (cm ) 15,12 12,21
Varincia (cm
2
) 0,124 0,184
O que pode ser concludo a respeito das varincias? E das mdias populacionais?
Questo 12: Um fabricante de esferas para rolamentos desenvolveu um novo mtodo de produo,
mais barato. Entretanto, ele descona que os novos lotes apresentam variabilidade diferente daque-
les produzidos pelo mtodo, ele selecionou aleatoriamente 15 esferas que forneceram os seguintes
dimetros ( em mm):
X 29,9 29,8 29,8 29,7 29,9 29,8 29,9 29,9 30,1 29,9 30,0 30,0 29,6 30,4 29,9
Y 29,8 29,8 30,4 29,8 30,5 29,6 29,3 29,4 30,3 29,9 29,7 30,3 30,4 29,1 30,0
Questo 13: Uma linha de montagem produz peas cujos pesos, em gramas, obedecem ao modelo
Normal com varincia 30 g
2
. Os equipamentos foram modernizados e, para vericar se o processo
continua sob controle, foi tomada uma amostra de 23 peas, forneceu s
2
obs
= 40g
2
. Existem ev-
idncias indicando que a varincia mudou, considerando = 10% ?
Questo 14: Para avaliar o nvel de tenso ocasionada por exames escolares, doze alunos foram
escolhidos e sua pulsao medida antes e depois do exame.
Estudante 1 2 3 4 5 6 7 8 9 10 11 12
Antes 87 78 85 93 76 80 82 77 91 74 76 79
Depois 83 84 79 88 75 81 74 71 78 73 76 71
Faa um teste, com nvel de signicncia de 1% , para vericar se existe maior tenso (isto , maior
pulsao) antes da realizao dos exames. Indique as suposies necessrias.

You might also like