You are on page 1of 109

Conhecimentos Especficos Mtodos Quantitativos Anatel

Aula 04 Varivel Aleatria Bivariada


Prof. Alexandre Lima

Aula 04

Sumrio
1

Funes de Probabilidade Conjunta ............................................................................... 2


1.1

Variveis Discretas ....................................................................................................... 3

1.2

Variveis Contnuas ...................................................................................................... 4

Funes de Probabilidade Marginal ................................................................................ 6

Funes de Probabilidade Condicional .......................................................................... 9

Variveis Aleatrias Independentes ............................................................................. 17

Esperanas Envolvendo Duas ou Mais Variveis Aleatrias ............................... 18


5.1

Correlao e Covarincia .......................................................................................... 19

5.2

Mdia e Varincia de Uma Combinao Linear de Variveis Aleatrias 27

Regresso ............................................................................................................................... 28
6.1

A Natureza da Anlise de Regresso ................................................................... 28

6.2

Regresso Linear Simples ........................................................................................ 32

6.3

Coeficiente de Determinao .................................................................................. 43

Momentos e Funo Geratriz de Momentos.............................................................. 51


7.1

Momentos de uma Distribuio de Frequncias .............................................. 51

7.2

Momentos de uma Varivel Aleatria.................................................................. 53

7.3

Funo Geratriz de Momentos................................................................................ 54

O Mnimo que Voc Precisa Saber ................................................................................ 60

Exerccios de Fixao ......................................................................................................... 64

10.

Gabarito .............................................................................................................................. 76

11.

Resoluo dos Exerccios de Fixao ....................................................................... 77

1
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Funes de Probabilidade Conjunta

Na aula anterior, estudamos as distribuies de probabilidade para uma nica


varivel aleatria. Entretanto, em muitas situaes prticas, atribumos a um
mesmo ponto amostral os valores de duas ou mais variveis aleatrias ao
descrevermos os resultados de um experimento. Nesta aula, nos
concentraremos no caso de um par de variveis aleatrias.
Exemplo. Considere o lanamento simultneo de duas moedas no viciadas.
Os resultados desse experimento aleatrio so cara-cara (CC), cara-coroa
(CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espao amostral = {CC,
CK, KC, KK}. Defina as variveis aleatrias X=0 se pelo menos uma das
moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma
coroa (Y=+1 para os demais casos). Ento
P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4,
P[X=1] = P[KK] = 1/4 = 1 - P[X=0],
P[Y=-1] = P[CK] + P[KC] = 1/2 e
P[Y=+1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1].
Considere o evento resultante da interseo dos eventos obter pelo menos
uma cara e no obter uma cara e uma coroa, ou seja, {(CC CK KC) (CC
KK)} = {CC}. Esse evento pode ser representado pela notao compacta
(X=0,Y=+1). Como P(CC) = 1/4, temos que
P(X=0,Y=+1) = 1/4. O evento (X=0,Y=+1) dito conjunto porque envolve as
variveis X e Y.
Os demais eventos conjuntos so: (X=0,Y=-1), (X=1,Y=+1) e (X=1,Y=-1).
Diz-se que o par (X,Y) uma varivel aleatria bivariada ou
bidimensional.
Exemplo. A varivel aleatria contnua X representa o comprimento de uma
dimenso de uma pea moldada por injeo, enquanto a varivel aleatria
contnua Y denota o comprimento de outra dimenso. Estamos interessados
em probabilidades que possam ser escritas em termos de X e Y. Suponha que
as especificaes para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milmetros,
respectivamente. Ento podemos estar interessados na probabilidade de uma
pea satisfazer as duas especificaes simultaneamente, ou seja, P[(3,95 < X
< 4,05) e (8,10 < Y < 8,20)].

2
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1.1

Variveis Discretas

Sejam X e Y variveis aleatrias discretas, como no primeiro exemplo da


pgina anterior. Ento a funo discreta de probabilidade conjunta (ou
distribuio conjunta) de X e Y, denotada por f(x,y), satisfaz
(1)

f(x,y) 0

(2)

x y f(x,y) = 1.

(3)

f(x,y) = P(X = x, Y = y)

Exemplo. Um total de 15.064.859 alunos esto matriculados no ensino


superior, divididos entre cursos com durao de 4 anos, de 2 anos e de menos
de 2 anos. A matrcula, separada por sexo, mostrada na tabela a seguir.

Homens
Mulheres

4 anos
4.076.416
4.755.790

2 anos
2.437.905
3.310.086

Menos de 2 anos
172.874
311.788

Fonte: Digest of Educational Statistics 1997, Tabela 170.

Nessa populao, as probabilidades aproximadas de matrcula em um dos tipos


de instituio de ensino superior, por sexo, so

Homens
Mulheres

4 anos
0,27
0,32

2 anos
0,16
0,22

Menos de 2 anos
0,01
0,02

Considere o experimento de extrair aleatoriamente um estudante matriculado


dessa populao. Defina a varivel aleatria X = 0, se um homem
selecionado, e X = 1, se uma mulher selecionada. Defina a varivel aleatria
Y = 1, se o estudante escolhido de um curso de 4 anos, Y = 2, se o
estudante escolhido de um curso de 2 anos e Y = 3, se de um curso de
menos de 2 anos.
Seja f(x,y) a funo discreta de probabilidade conjunta da populao de
homens e mulheres da questo. Sendo assim, temos as seguintes
probabilidades conjuntas:

f ( x = 0, y = 1) = 0,27 = P(homens matriculados em cursos de 4 anos)


f ( x = 0, y = 2) = 0,16 = P(homens matriculados em cursos de 2 anos)
f ( x = 0, y = 3) = 0,01 = P(homens matriculados em cursos < 2 anos)
f ( x = 1, y = 1) = 0,32 = P(mulheres matriculadas em cursos de 4 anos)
f ( x = 1, y = 2) = 0,22 = P(mulheres matriculadas em cursos de 2 anos)
f ( x = 1, y = 3) = 0,02 = P(mulheres matriculadas em cursos < 2 anos)
3
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Note que
2

f ( x , y
i

) = 0,27 + 0,16 + 0,01 + 0,32 + 0,22 + 0,02 = 1

i =1 k =1

a probabilidade do evento certo.


_______________________________________________________
Exemplo (Analista da SUSEP/ESAF/2001). Uma loja vende lavadoras e
secadoras de roupa. A distribuico conjunta do nmero N1 de secadoras e do
nmero N2 de lavadoras vendidas num mesmo dia dada na tabela abaixo.
Assinale a opco que d a probabilidade de que a venda, num mesmo dia, de
lavadoras seja igual de secadoras.
N1|N2
0
1
2
3

0
0,25
0,15
0,08
0,01

1
0,13
0,11
0,06
0,01

2
0,04
0,02
0,05
0,01

3
0,02
0,01
0,02
0,03

A) 0,54
B) 0,50
C) 0,49
D) 0,44
E) 0,19
Resoluo
P(N1=N2) = f(N1=0;N2=0) + f(N1=1;N2=1) + f(N1=2;N2=2) + f(N1=3;N2=3) =
0,25 + 0,11 + 0,05 + 0,03 = 0,44
GABARITO: D
1.2

Variveis Contnuas

Sejam X e Y duas variveis aleatrias contnuas. Neste caso, a distribuio


conjunta das duas variveis caracterizada por uma funo f(x,y) chamada
funo de densidade conjunta de X e Y, que satisfaz
(4)

f(x,y) 0;

4
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(5)

f ( x, y)dxdy = 1 ;

b d

(6)

P(a X b, c Y d ) = f ( x, y )dydx .
a c

A relao (5) nos diz que o volume sob a superfcie representada por f(x,y)
igual a 1. A figura abaixo mostra uma funo de densidade conjunta.

0.15

0.1

0.05

0
2
0
-2

-2

-3

-1

A equao (6) d a probabilidade do par (x,y) estar num retngulo de lados ba e d-c.
Exemplo. Seja f(x,y) = 4xy, 0 x 1, 0 y 1. Ento
1 1

4 xydxdy = 4 xdx ydy = 4[x


0 0

][

/ 2 0 y 2 / 2 0 = 4(1 / 2 0)(1 / 2 0) = 1

e a probabilidade P(X 1/2, Y 1/2) dada por


0, 50 , 5

0,5

0, 5

] [
0,5

0,5

2
2
4 xydxdy = 4 xdx ydy = 4 x / 2 0 y / 2 0 = 4(1 / 8 0)(1 / 8 0) = 4 / 64 = 1 / 16 .

0 0

Exemplo. Suponha que a varivel aleatria (X,Y) esteja uniformemente


distribuda no quadrado da figura abaixo.
5
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Ento f(x,y) = K para 0x1 e 0y1 (K uma constante) e f(x,y) = 0 caso


contrrio. A figura a seguir ilustra a densidade conjunta uniforme ( a
superfcie delimitada pelo permetro azul). Sabemos que o volume do cubo
deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de
probabilidade conjunta igual a 1 por definio. Logo K =1 a altura do cubo.

f(x,y)
1

(1,1)

Funes de Probabilidade Marginal

Dada uma funo densidade de probabilidade conjunta, pode-se obter a funo


densidade de probabilidade de cada uma das variveis aleatrias individuais.
6
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Sejam X e Y variveis aleatrias contnuas com densidade conjunta f(x,y).


Ento fX(x) e fY(y) so denominadas densidades marginais de X e Y,
respectivamente, se so obtidas de f(x,y) por meio das expresses

f X ( x) =

(7)

f ( x, y)dy

(8)

f Y ( y) =

f ( x, y)dx

Note que as funes de densidade de probabilidade marginal fX(x) e fY(y)


correspondem s funes de densidade de probabilidade individuais de X e Y,
respectivamente.
Exemplo. Seja a funo densidade conjunta de X e Y dada por
f(x,y) = e-x-y,

x>0, y>0.

Ento,

f X ( x) = e x y dy =e x e y dy =e x e y
0

= e x [e + e 0 ] = e x [0 + 1] = e x , para x>0.

Note que foi usado o seguinte limite acima: lim e y = lim


y

fY ( y) = e

x y

dx =e

dx =e y e x

1
1
1
= = =0. E
y

e
e

= e y [e + e 0 ] = e y [0 + 1] = e y , para y>0.

_______________________________________________________
Podemos obter resultados similares para variveis aleatrias discretas. Dada a
funo discreta de probabilidade conjunta f(xi,yk), as funes discretas de
probabilidade marginal so dadas por
(9)

f X ( xi ) = f ( xi , y k )
k

(10)

f Y ( y k ) = f ( xi , y k )
i

7
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Exemplo. Considere o terceiro exemplo do item anterior, cuja tabela est


reproduzida abaixo.
4 anos
(Y=1)
0,27
0,32

Homens (X=0)
Mulheres (X=1)

2 anos
(Y=2)
0,16
0,22

Menos de 2 anos
(Y=3)
0,01
0,02

P[X = 0]
(probabilidade de o estudante escolhido
A probabilidade
aleatoriamente ser homem) igual probabilidade marginal f X (x) no ponto x
=0. Vimos que f X ( xi ) = f ( xi , y k ) . Logo,
k

P[ X = 0] = f X ( x = 0) = f ( x = 0, y k ) = f ( x = 0, y = 1) + f ( x = 0, y = 2) + f ( x = 0, y = 3)
k =1

P[ X = 0] = 0,27 + 0,16 + 0,01 = 0,44 soma da 1 linha da tabela.


A probabilidade P[ X = 1] , probabilidade de o estudante selecionado
aleatoriamente ser mulher, igual probabilidade marginal f X ( x) no ponto x
=1. Ento
3

P[ X = 1] = f X ( x = 1) = f ( x = 1, y k ) = f ( x = 1, y = 1) + f ( x = 1, y = 2) + f ( x = 1, y = 3)
k =1

P[ X = 1] = 0,32 + 0,22 + 0,02 = 0,56 soma da 2 linha da tabela.


Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma
das probabilidades de uma funo discreta de probabilidades unitria, por
definio.
A probabilidade P[Y = 1] , que representa a probabilidade de o estudante
escolhido ao acaso estar matriculado em um curso de 4 anos, igual
probabilidade marginal f Y ( y ) no ponto y =1, dada por
2

P[Y = 1] = f Y ( y = 1) = f ( xi , y = 1) = f ( x = 0, y = 1) + f ( x = 1, y = 1)
i =1

P[Y = 0] = 0,27 + 0,32 = 0,59 soma da 1 coluna da tabela.


A probabilidade P[Y = 2] a probabilidade de o estudante estar matriculado em
um curso de 2 anos e igual probabilidade marginal f Y ( y) no ponto y =2:
8
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

P[Y = 2] = f Y ( y = 2) = f ( xi , y = 2) = f ( x = 0, y = 2) + f ( x = 1, y = 2)
i =1

P[Y = 2] = 0,16 + 0,22 = 0,38 soma da 2 coluna da tabela.


Finalmente, a probabilidade P[Y = 3] denota a probabilidade de o estudante
estar matriculado em um curso com durao menor que 2 anos e corresponde
probabilidade marginal f Y ( y ) no ponto y =3:
2

P[Y = 3] = f Y ( y = 3) = f ( xi , y = 3) = f ( x = 0, y = 3) + f ( x = 1, y = 3)
i =1

P[Y = 3] = 0,01 + 0,02 = 0,03 soma da 3 coluna da tabela.


No por acaso, temos que fY(y=1) + fY(y=2) + fY(y=3) = 0,59 + 0,38 = 0,03
= 1.

X=0
X=1
fY(y)

Y=1
0,27
0,32
0,59

Y=2
0,16
0,22
0,38

Y=3
0,01
0,02
0,03

fX(x)
0,44
0,56
1

A tabela acima mostra que as probabilidades marginais fX(x) e fY(y) so


obtidas somando as linhas e colunas, respectivamente.
_______________________________________________________

Funes de Probabilidade Condicional

Exemplo. Considere os dados do exemplo anterior, em especial a ltima


tabela. Qual seria a distribuio das matrculas no ensino superior, sabendo-se
que o curso tem 4 anos de durao? Em outras palavras, queremos calcular as
probabilidades P(X=x|Y=1). Da definio de probabilidade condicional,
obtemos
P ( X = x | Y = 1) =

P( X = x, Y = 1)
.
P (Y = 1)

Assim, P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458 e P(X=1|Y=1)


= P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542. Note que P(X=0|Y=1) +
P(X=1|Y=1) = 0,458 + 0,542 = 1.

9
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A funo discreta de probabilidade condicional (ou simplesmente


distribuio condicional) de X, dado que Y=1, denotada por fX|Y(x|y=1),
est na tabela a seguir.
x
fX|Y(x|y=1)

0
0,458

1
0,542

Podemos calcular a mdia da distribuio condicional de X, dado que Y=1, a


saber
E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542.
Qual seria a distribuio das matrculas no ensino superior, sabendo-se que os
alunos so do sexo feminino? Ou seja, quais so as probabilidades
P(Y=y|X=1)? Aplicando a probabilidade condicional, obtemos
P(Y=1|X=1) = P(Y=1,X=1)/P(X=1) = 0,32/0,56 = 0,571,
P(Y=2|X=1) = P(Y=2,X=1)/P(X=1) = 0,22/0,56 = 0,393,
P(Y=3|X=1) = P(Y=3,X=1)/P(X=1) = 0,02/0,56 = 0,036.
A distribuio condicional de Y, dado que X=1, denotada por fY|X(y|x=1),
est na tabela abaixo.
y
fY|X(y|x=1)

1
0,571

2
0,393

3
0,036

A mdia da distribuio condicional de Y, dado que X=1, igual a


E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465.

Vamos formalizar o que foi visto no exemplo acima? Sejam X e Y variveis


aleatrias discretas com funo de probabilidade conjunta f(xi,yk). Ento as
funes discretas de probabilidade condicional (ou distribuies
condicionais)
P[X=xi|Y=yk] = fX|Y(xi|yk) e
P[Y=yk|X=xi] = fY|X(yk|xi) so definidas como
(11)

f X |Y ( xi | y k ) =

f ( xi , y k )
,
fY ( yk )

fY ( yk ) > 0

10
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(12)

f Y | X ( y k | xi ) =

f ( xi , y k )
,
f X ( xi )

f X ( xi ) > 0

De (11) e (12) resulta que


(13)

f ( xi , y k ) = f X |Y ( xi | y k ) f Y ( y k ) = f Y | X ( y k | xi ) f X ( xi ) .

A esperana condicional de X, dado que Y = yj, dada por


n

(14) E ( X | Y = y j ) = xi P ( X = xi | Y = y j ) .
i =1

Uma definio anloga vale para E(Y|X=xi).


Podemos definir as densidades condicionais associadas a duas variveis
aleatrias contnuas X e Y (com densidade conjunta fXY(x,y) e densidades
marginais fX(x) e fY(y)) de forma similar. A densidade condicional de Y dado o
resultado X = x definida por
(15)

f Y | X ( y | x) =

f XY ( x, y )
,
f X ( x)

f X ( x) > 0

e a densidade condicional de X dado o resultado Y = y como


(16)

f X |Y ( x | y ) =

f XY ( x, y )
,
f Y ( y)

fY ( y) > 0 .

A frmula (13) tambm vlida para o caso de variveis contnuas.


A interpretao de (15) e (16) a seguinte. Seja a densidade conjunta f(x,y)
= z = 1 para 0x1 e 0y1 e f(x,y) = 0 caso contrrio representada na
figura abaixo. Considere o plano paralelo ao plano xz que passa por y=1/2.
Esse plano determina na superfcie f(x,y) a densidade condicional
fX|Y(x|y=1/2). Por exemplo, suponha que X denote o salrio de uma populao
e que Y represente o consumo da mesma populao. Ento, fixado o consumo
y=y0, a densidade condicional fX|Y(x|y0) representa a densidade dos salrios
para o nvel y0 de consumo.

11
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

fX|Y(x|y=1/2)
z=f(x,y)
1

1/2

(1,1)

As densidades condicionais fX|Y(x|y) e fY|X(y|x) tambm


caracterizadas por meio de suas mdias, varincias, etc.

podem

ser

Exemplo. Seja a densidade de (X,Y) dada por


f(x,y) = 6(1-x-y),

0<x<1, 0<y<1-x.

A regio de variao dos pares (x,y) o tringulo delimitado pelos eixos x e y


e pela reta y = 1-x (vide a prxima figura).

1
y = 1-x

Sabemos que a densidade marginal fX(x) resultante da integrao da


densidade conjunta na varivel y. Neste caso, os limites inferior e superior da
12
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

integral em y so y=0 e y=1-x, respectivamente, pois o tringulo da figura


acima percorrido no sentido vertical (de baixo para cima). Ento a densidade
marginal fX(x) dada por:
1 x

1 x

f X ( x) = 6(1 x y )dy = 6 y xy y 2 / 2 0 = 3( x 1) 2 , 0 < x < 1 .


0

A densidade marginal fY(y) calculada pela integrao da densidade conjunta


na varivel x. Os limites inferior e superior da integral em x so x=0 e x=1-y,
respectivamente, pois o tringulo da figura acima percorrido no sentido
horizontal (da esquerda para a direita). Ento a densidade marginal fY(y)
dada por:
1 y

f Y ( y ) = 6(1 x y )dx = 3( y 1) 2 , 0 < y < 1 .


0

Por conseguinte, as densidades condicionais so


f X |Y ( x | y ) =

2(1 x y )
, 0 < x < 1 y ,
( y 1) 2

f Y | X ( y | x) =

2(1 x y )
, 0 < y < 1 x .
( x 1) 2

Vale a pena conferir se fX|Y(x|y) uma densidade de probabilidade vlida, para


y fixado. Temos que

f X |Y ( x | y )dx =

f ( x, y ) / f Y ( y )dx =1 / fY ( y ) f ( x, y )dx = f Y ( y ) / f Y ( y ) = 1

Portanto, fX|Y(x|y) uma densidade de probabilidade vlida.


_______________________________________________________

(ANPEC/2009/Adaptada) Considere duas variveis aleatrias X e Y.


Suponha que X seja distribuda de acordo com a seguinte funo de
densidade:
1, 0 < x < 1
f X ( x) =
c.c.
0,

em que c.c. significa caso contrrio e suponha ainda que

13
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1 / x, 0 < y < x
f Y | X ( y | x) =
c.c.
0,

Calcule E(Y). Multiplique o resultado por 100.


Resoluo
Pede-se a mdia no condicional E(Y), dada por

E (Y ) =

y. f

( y )dy .

Logo, precisamos determinar a densidade marginal fY(y). Vimos que


f ( x, y ) = f X |Y ( x | y ) f Y ( y ) = f Y | X ( y | x) f X ( x)
O enunciado forneceu as densidades fX(x) e fY|X(y|x). Portanto,

f ( x, y ) = f Y | X ( y | x ) f X ( x ) =

1
, 0 < x <1, 0 < y < x .
x

O domnio de f(x,y) o tringulo hachurado da figura a seguir.


y
y=x

A figura a seguir ilustra a densidade conjunta z = f ( x, y ) = 1 / x , 0 < x < 1 , 0 < y < x .

14
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

70
60
50

40
30
20
10
0
1
1
0.8

0.5

0.6
0.4
0

0.2
0

A densidade marginal fY(y) obtida atravs de


1

fY ( y) =
y

1
1
dx = [ln x ]y = 0 ln y = ln y , 0<y<1.
x
Densidade Marginal de Y
7

-lny

0.1

0.2

0.3

0.4

0.5
y

0.6

0.7

0.8

0.9

Finalmente, a esperana de Y dada por


1

E (Y ) = y ( ln y )dy = y ln ydy
Aplicaremos a frmula da integrao por partes:

f ( y) g ' ( y)dy = f ( y) g ( y) g ( y) f ' ( y)dy


15
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

com f ( y ) = ln y e g ' ( y ) = y f ' ( y ) = 1 / y e g ( y) = y 2 / 2 .


Assim,
1

y2
y2 1
y2
y
dy
E (Y ) = ln y
dy = ln y
2
2 0
2
2 y 0

y2
1
1
1 y2
E (Y ) = y 2 ln y ydy = y 2 ln y = y 2 ln y
0
2
2
2 0 2 2
0

Observao: o limite de y2lny quando y tende a zero pela direita (y0+) uma
indeterminao do tipo 0., ou seja,

lim y 2 ln y = 0

y 0 +

Pela regra de LHpital (derivar o numerador e o denominador da razo):

y2
ln y
1/ y
lim y ln y = lim 2 = lim
= lim = 0
y 0 +
y 0 + y
y 0+ 2 y 3
y 0 +
2
2

Ento,
E (Y ) =

1 1
1
1 ln 1 0 + 0 = = 0,25

2 2
4

Resposta: 100.E(Y) = 25
______________________________________________________
A esperana condicional de Y, dado que X=x, dada por

(17) E (Y | x) =

yf

Y|X

( y | x)dy .

Definio anloga pode ser dada para E(X|y). Observe que E(Y|x) uma
funo de x, isto , E(Y|x) = f(x), sendo denominada curva de regresso
de Y sobre x. A regresso ser vista em detalhes mais adiante.
Exemplo. Seja a densidade condicional
fY|X(y|x) = 1/x,

0<y<x.
16

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A esperana condicional E(Y|x) dada por


x

x
x
1
1
1 y2
1 x2
E (Y | x) = y dy = ydy = = 0 = .
x
x0
x 2 0 x 2
2
0
x

Note que E(Y|x) , de fato, uma funo de x.

Variveis Aleatrias Independentes

A noo de independncia para variveis aleatrias muito


parecida com a noo de independncia para eventos. Duas variveis
aleatrias X e Y so independentes se o conhecimento relativo a uma delas
no afeta as probabilidades da outra. Ou seja, observando X no nos diz nada
sobre Y. Quando dois eventos so independentes, a probabilidade dos dois
ocorrerem determinada multiplicando-se as probabilidades para cada evento.
Quando X e Y so independentes a funo de probabilidade conjunta
igual ao produto das funes marginais de probabilidade, ou seja
(18)

f ( x, y ) = f X ( x ) f Y ( y ) .

Exemplo. Vimos que as densidades marginais da densidade conjunta


f(x,y) = e-x-y,

x>0, y>0

so dadas por

f X ( x) = e x , para x>0 e
f Y ( y ) = e y , para y>0.
Como f(x,y) = fX(x)fY(y) = e-x.e-y = e-x-y, conclumos que X e Y so
independentes.
_______________________________________________________

Podemos generalizar a frmula (18). Sejam X1, X2, ..., Xn


variveis aleatrias independentes com funo de probabilidade conjunta
f(x1, x2, ..., xn) e funes marginais de probabilidade f X1 ( x1 ), f X 2 ( x2 ),..., f X n ( xn ) .
Ento vlida a expresso
(19)

f ( x1 , x2 ,..., xn ) = f X1 ( x1 ) f X 2 ( x2 )... f X n ( xn ) .
17
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Se X e Y so independentes, ento a densidade condicional de X, dado que Y =


y ,
(20)

f X |Y ( x | y ) =

f ( x, y ) f X ( x ) f Y ( y )
=
= f X ( x) .
fY ( y)
fY ( y)

e a densidade condicional de Y, dado que X = x ,


(21)

f Y | X ( y | x) =

f ( x, y ) f X ( x ) f Y ( y )
=
= fY ( y) .
f X ( x)
f X ( x)

Esperanas Envolvendo Duas ou Mais Variveis Aleatrias

Conforme j visto nesta aula, muito comum estarmos interessados no


comportamento conjunto de duas ou mais variveis aleatrias. Apresentamos
para voc os conceitos de funes de probabilidade conjunta, marginal e
condicional para variveis discretas e contnuas. Tambm estudamos a noo
de independncia entre variveis aleatrias.
Nesta seo, daremos continuidade ao estudo da associao entre
variveis. Frequentemente, estamos interessados em saber se existe uma
associao entre duas variveis. Considere, por exemplo, a Economia. Em
geral, estamos interessados em investigar as relaes que possam existir entre
variveis econmicas. Por exemplo, quo estreitamente caminham duas
variveis preo X e Y? Em um extremo, se X e Y so independentes,
observaes de X no nos dizem nada sobre Y. Por outro lado, se, digamos, Y
= aX + b (a dependncia entre X e Y do tipo linear), em que a e b so
parmetros constantes, ento a observao do valor de X imediatamente nos
diz o valor de Y. Por exemplo, se a = 1, b = 0 e X =1, ento Y = aX + b = 1.1
+ 0 = 1.
Assim como o valor esperado e a varincia de uma nica varivel aleatria nos
fornecem informaes sobre essa varivel aleatria, no sentido de que
caracterizam a sua distribuio de probabilidades, a covarincia e a
correlao entre duas variveis aleatrias nos do informaes sobre a
relao entre as variveis aleatrias X e Y.
Um alerta. Voc pode estar com a impresso de que j aprendemos
covarincia e correlao na aula 1. Isso verdade at um certo ponto. Mas a
aquela aula no explicou toda a estria. Explico o por qu. Na aula 1,
apresentei covarincia e correlao no contexto das medidas (ou estatsticas)
sobre dados bivariados. Aqui, veremos as esperanas que envolvem duas
(ou mais) variveis aleatrias, tambm denominados momentos conjuntos.
18
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

O enfoque desta aula probabilstico, porque estamos lidando com variveis


aleatrias e distribuies de probabilidades. A covarincia e a correlao so os
momentos conjuntos mais importantes.
5.1

Correlao e Covarincia

Sejam X e Y variveis aleatrias. Ento a covarincia de X e Y definida por

(22)

Cov( X , Y ) = E[( X X )(Y Y )] = E[ XY ] XY .

em que X = E[ X ] e Y = E[Y ] .
Se X e Y so variveis aleatrias discretas e f(xi,yj) sua funo de
probabilidade conjunta, a covarincia entre X e Y dada por
(23)

Cov( X , Y ) = E[( X X )(Y Y )] = [ xi X ][ y j Y ] f ( xi , y j ) .


i

Caso X e Y sejam variveis aleatrias contnuas com funo densidade de


probabilidade conjunta f(x,y), a covarincia calculada pela integral

(24)

Cov( X , Y ) =

(x X )(y Y ) f ( x, y)dxdy .

A covarincia uma medida da intensidade e do sinal da correlao linear


entre duas variveis. Suponha que tenhamos uma amostra de n pares
ordenados (x,y). Neste caso, a covarincia pode ser estimada pela estatstica
(*)

(25)

s xy =

1 n
( xi x )( yi y )
n 1 i=1

em que x a mdia amostral de X, y a mdia amostral de Y e n o nmero


de pares amostrais (x,y).
(*) Temos aqui o problema de se colocar n ou (n1) no denominador da
frmula. Como estamos pensando na covarincia de uma amostra, usaremos
(n1).

19
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Observe que a covarincia depende das unidades de medida das variveis X e


Y. Percebe-se mais claramente o significado da covariao dividindo-se a
covarincia entre X e Y por seus respectivos desvios-padro. Define-se a razo
resultante como a correlao entre as variveis aleatrias X e Y, denotada
pela letra grega (r)

(26)

( X ,Y ) =

cov( X , Y )

X Y

em que X e Y denotam os desvios-padro de X e Y, respectivamente.

A correlao estimada pelo coeficiente de correlao linear


de Pearson (tambm chamado coeficiente de correlao amostral ou
simplesmente coeficiente de correlao), definido por
(27)

r=

s xy
sx s y

em que s xy a covarincia amostral de X e Y (25), sx o desvio-padro


amostral de X
(28)

sx =

1 n
( xi x ) 2

n 1 i=1

e sY o desvio-padro amostral de Y
(29)

sy =

1 n
( yi y ) 2 .

n 1 i =1

Substituindo (25), (28) e (29) em (27), obtemos

(30)

r=

i =1

i =1

( xi x )( yi y )

( xi x ) 2

i =1

S xy

S xx S yy

( yi y ) 2

em que S xy = i=1 ( xi x )( yi y ) , S xx = i=1 ( xi x ) 2 e S yy = i =1 ( yi y ) 2 .


n

20
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A representao abreviada dos somatrios de (30) por meio de S xy , S xx e S yy


til. No difcil mostrar que

(31)

S xy = i=1 xi yi

(32)

S xx =

(33)

S yy = i =1 yi2

1
n

i =1 i

i =1

1
x
n

( x )

1
n

( y )

2
i =1 i

( x )( y )
i

i =1 i

i =1

Combinando as expresses anteriores, podemos tambm chegar frmula


abaixo, para o clculo direto do coeficiente de correlao linear de Pearson:

(34)

r=

n xi yi xi yi
i
i i

2
2


2
2
n xi xi n yi yi
i i
i

i

O COEFICIENTE DE CORRELAO ADIMENSIONAL


O coeficiente de correlao tem as importantes propriedades de ser
adimensional e de variar entre -1 e 1, o que no ocorre com a covarincia. A
vantagem de ser adimensional est no fato de seu valor no ser afetado pelas
unidades adotadas. Por outro lado, o fato de termos 1 r 1 faz com que um
dado valor de r seja facilmente interpretado. Note que r = -1 corresponde ao
caso de correlao linear negativa perfeita e r = 1 corresponde ao caso de
correlao linear positiva perfeita.

CORRELAO NO CAUSALIDADE
Para as crianas, o tamanho do vocabulrio est correlacionado intensamente
com o tamanho do p. Entretanto, a aprendizagem de novas palavras no faz
com que o p cresa, nem o crescimento do p faz com que o vocabulrio
aumente. H um terceiro fator, a idade, que est correlacionada com o
tamanho do sapato e com o vocabulrio. As crianas mais velhas tendem a ter
um sapato maior e um vocabulrio maior, e isso resulta em uma correlao
21
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

positiva entre vocabulrio e tamanho do sapato. Deste modo, um alto valor


do coeficiente de correlao, embora estatisticamente significativo,
pode no implicar qualquer relao de causa e efeito, mas
simplesmente a tendncia de variao conjunta das grandezas em
questo.

A CORRELAO MEDE APENAS A RELAO LINEAR


O coeficiente de correlao mede apenas a relao linear entre X e Y.
Quando a correlao nula, ou seja, se r = 0, no h associao linear entre X
e Y. Mas pode existir uma relao no linear. Por exemplo, sejam X e Y
relacionados pela equao
X 2 + Y 2 =1,

que descreve uma circunferncia centrada em (0,0) e de raio 1. O coeficiente


de correlao nulo neste caso. Contudo, existe uma relao no linear
entre X e Y, pois os pares ordenados (x,y) esto localizados sobre o crculo de
raio unitrio centrado em (0,0).

Uma importante conseqncia da independncia estatstica a


seguinte:
- se X e Y so variveis aleatrias independentes, ento a covarincia e a
correlao entre elas nula

Cov( X , Y ) = ( X , Y ) = 0
e vlida a expresso

E[ XY ] = E[ X ]E[Y ]
Prova
Sejam X e Y variveis aleatrias contnuas. Prova similar pode ser dada para o
caso das variveis serem discretas (tente voc mesmo fazer aps estudar a
nossa soluo para variveis contnuas).
Primeiramente, lembre que f XY ( x, y ) = f X ( x) f Y ( y ) , pois X e Y so independentes.
Aplicando esse conceito na integral de E[XY], obtemos

22
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima


E[ XY ] = xyf XY ( x, y )dxdy = xf X ( x)dx yf Y ( y ) dy = E[ X ]E[Y ]

Variveis independentes so no correlacionadas, pois

Cov( X , Y ) = E[ XY ] XY = 0
Distribuio Normal Bidimensional
A distribuio normal bivariada ou bidimensional um modelo importante para
variveis aleatrias contnuas bidimensionais.
A varivel (X,Y) tem distribuio normal bidimensional se sua densidade
conjunta for dada por
(35)
f ( x, y ) =

1
2 x y

x
1

exp
2

2
1
2(1 ) x

( x x )( y y ) y y

2
+

x
y
y

para < x < , < y < (foi usada a notao exp(x) = ex). Observe que a
densidade normal conjunta depende de cinco parmetros: X e Y (mdias), X
e Y (desvios padres) e (coeficiente de correlao entre Y e X). A figura
abaixo mostra a superfcie normal obtida para os seguintes parmetros: X =
Y = 0, X = Y = 1 e = 0,3.

23
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

0.15

z = f(x,y)

0.1

0.05

0
2
0
-2
-3

-1

-2

A normal bidimensional possui as seguintes propriedades:


(a)

As distribuies marginais de X e Y so normais unidimensionais: X ~


N(x,2x) e Y ~ N(y,2y).

(b)

As distribuies condicionais so normais, com

( x x ), y2 (1 2 ) e
f Y | X ( y | x) ~ N y +
x

f X |Y ( x | y ) ~ N x + x ( y y ), x2 (1 2 ) .

Logo E (Y | x) = y +

( x x ) e E( X | y) = x + x ( y y ) .
x
y

Se X e Y so conjuntamente normais e no correlacionadas (=0),


podemos escrever a densidade (35) como

(36)

f ( x, y ) =

x 2

1 x x

2 x

y 2

1 y y

2 y

ou seja, a densidade conjunta o produto das duas marginais, que so


normais. Isto quer dizer que X e Y so independentes no caso em que X e Y
tiverem densidade conjunta normal com =0.
24
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A no correlao entre X e Y implica independncia estatstica


somente quando X e Y so variveis aleatrias conjuntamente
normais. Isto no verdade quando X e Y tem distribuio conjunta diferente
da normal bidimensional.
Exemplo (Fiscal de Rendas-MS/2006/FGV). Analise as afirmativas a
seguir, a respeito de duas variveis aleatrias X e Y:
I.
II.
III.
IV.

se
se
se
se

X e Y so independentes, ento Cov(X,Y) = 0;


Cov(X,Y) = 0, ento X e Y so independentes;
X e Y so independentes, ento E(XY) = E(X).E(Y);
E(XY) = E(X).E(Y), ento X e Y so independentes.

Assinale:
A) se nenhuma afirmativa estiver correta.
B) se somente as afirmativas I e III estiverem corretas.
C) se somente as afirmativas I e IV estiverem corretas.
D) se somente as afirmativas II e IV estiverem corretas.
E) se todas as afirmativas estiverem corretas.
Resoluo
Sejam X e Y variveis aleatrias. Ento a covarincia de X e Y definida como
Cov(X,Y) = E[(X-X) (Y-Y)] = E(XY) -

XY

em que X = E(X) e Y = E(Y). Se X e Y so variveis aleatrias


independentes, ento a covarincia entre elas nula (o que indica que no h
associao linear entre elas!), ou seja,
Cov(X,Y) = 0 (p/ X e Y independentes) E(XY) =

XY.

Diz-se que X e Y so no correlacionadas quando Cov(X,Y) = 0.


A relao recproca no verdadeira: se X e Y so no correlacionadas no
podemos afirmar que X e Y sejam independentes. Porm, a no correlao
entre X e Y implica independncia estatstica quando X e Y so variveis
aleatrias conjuntamente normais (e somente neste nico caso!).
25
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Anlise das afirmativas:


I. se X e Y so independentes, ento Cov(X,Y) = 0 Verdadeira, por
definio.
II. se Cov(X,Y) = 0, ento X e Y so independentes Falsa, pois a relao
recproca no verdadeira: se X e Y so no correlacionadas no podemos
afirmar que X e Y sejam independentes.
III. se X e Y so independentes, ento E(XY) = E(X).E(Y) Verdadeira, pois
Cov(X,Y) = 0 implica E(XY) = E(X).E(Y).
IV. se E(XY) = E(X).E(Y), ento X e Y so independentes Falsa, pois a no
correlao no implica independncia.
GABARITO: B
Exemplo (Analista da SUSEP/ESAF/2010). Y e X so variveis aleatrias
com distribuio normal conjunta com E(Y) = Y, E(X) = X, e Cov(Y,X) =
YX, onde Y e X so os desvios padres de Y e X, respectivamente, e o
coeficiente de correlao entre Y e X. Qual a expresso da regresso de X em
Y, E(X|Y=y)?
A) Y + Y(x X)/X.
B) Y + X(x X)/Y.
C) Y + Y(y Y)/X.
D) X + X(y Y)/Y.
E) X + Y(y Y)/X.
Resoluo
A mdia condicional
E ( X | y) = x +

x
(y y )
y

uma funo linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) a


regresso de X em Y e isso implica que as opes A e B poderiam ser
descartadas logo de incio, pois ambas so funes da varivel x.
A opo D contm a expresso correta.
GABARITO: D

26
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

5.2 Mdia e Varincia de Uma Combinao Linear de Variveis


Aleatrias
Sejam X e Y variveis aleatrias e Z=g(X,Y) uma funo dessas variveis.
Vamos admitir que essa funo tenha a forma
(37)

Z = aX + bY

em que a e b so constantes. Essa expresso uma combinao linear (ou


soma ponderada). A esperana de (37) dada por

(38)

E[ Z ] = aE[ X ] + bE[Y ] .

A Eq. (38) nos diz que o valor esperado de uma combinao linear de
duas variveis aleatrias a combinao linear de seus respectivos
valores esperados. Essa regra pode ser generalizada para um nmero
arbitrrio de variveis aleatrias, quer elas sejam discretas ou contnuas.
As seguintes regras relativas varincia so vlidas:
1.
(39)

Se X, Y e Z so variveis aleatrias e a, b e c so constantes, ento

var[aX + bY + cZ ] = a 2 var[ X ] + b 2 var[Y ] + c 2 var[Z ] +


2ab cov( X , Y ) + 2ac cov( X , Z ) + 2bc cov(Y , Z )

Note que var(aX + bY ) = a 2 var( X ) + b 2 var(Y ) + 2ab cov( X , Y ).


2.

(40)

Se X, Y e Z so independentes ou no correlacionadas

var[aX + bY + cZ ] = a 2 var[ X ] + b 2 var[Y ] + c 2 var[Z ]

Se fizermos a = b= c =1 em (40), obtemos

(41)

var[ X + Y + Z ] = var[ X ] + var[Y ] + var[Z ] .


27
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A expresso (41) nos diz que a varincia da soma de variveis aleatrias


independentes igual soma das varincias.
As regras sobre a varincia de trs
generalizadas para n variveis aleatrias.

variveis

Regresso

6.1

A Natureza da Anlise de Regresso

aleatrias

podem

ser

Na anlise de regresso simples estamos interessados na dependncia


estatstica entre as variveis X e Y. No podemos confundir a dependncia
estatstica com o conceito de dependncia determinista ou funcional. Por
exemplo, a Segunda Lei de Newton da Fsica clssica (lei determinista) afirma
que
A resultante das foras que agem num corpo igual ao produto de sua massa
pela acelerao adquirida.
Ou seja, Newton postulou que h uma dependncia determinista entre fora e
acelerao, dada pela frmula
r

r
= m a

r
r
em que Fi denota a i-sima fora que age num corpo, m a massa e a a
acelerao. Repare que a frmula acima no contm um termo de
perturbao ou erro aleatrio, sendo, portanto, de carter no
probabilstico, isto , determinista. Outros exemplos de relaes fsicas
deterministas so as duas leis de Kirchhoff dos circuitos eltricos (lei das
malhas e lei dos ns), as quatro equaes de Maxwell do eletromagnetismo e a
lei do gs de Boyle.

Regresso versus Causao


A anlise de regresso ocupa-se do estudo da dependncia de uma varivel, a
varivel dependente, em relao a uma ou mais variveis, as variveis
explicativas (ou independentes), com o objetivo de estimar e/ou prever a
mdia (da populao) ou o valor mdio da dependente em termos dos valores
conhecidos ou fixos (em amostragem repetitiva) das explicativas.
Considere o experimento aleatrio hipottico ilustrado pela prxima figura, em
que a varivel explicativa a estatura do pai (em metros) e a varivel
dependente a estatura do filho (em metros). Essa figura mostra trs
distribuies da estatura do filho correspondentes a valores fixos de estatura
28
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

do pai (1,70 m, 1,80 m e 1,90 m). Note que a uma dada altura do pai
corresponde uma populao (distribuio) com cinco possveis estaturas para o
filho. A reta de regresso na figura (linha tracejada) sugere que a estatura
mdia do filho tende a aumentar quando aumenta a estatura do pai.
Portanto, a regresso linear permite que o valor mdio da varivel dependente
(estatura do filho) seja estimado por meio dos valores observados das
estaturas dos pais (varivel explicativa).

2.2
2.15
2.1
2.05
2
1.95
1.9
1.85
1.8
1.75
1.6

1.65

1.7

1.75

1.8

1.85

1.9

1.95

A regresso no implica necessariamente causalidade ou causao.


Uma relao estatstica, por mais forte que seja, no pode estabelecer uma
relao de causa e efeito; a causao deve vir de fora da estatstica, de outra
teoria.
Por exemplo, considere um agrnomo que esteja interessado em estudar a
dependncia da colheita de soja em relao chuva. Consideramos que a
colheita de soja dependente da precipitao de chuva por uma questo de
bom senso (e esta considerao no estatstica!). Mas a estatstica no teria
nada contra o fato do agrnomo estabelecer que a relao de dependncia
inversa, ou seja, que a precipitao de chuva depende do rendimento da
colheita de soja, apesar disso ser um evidente absurdo.
Uma relao estatstica, por si s, no pode logicamente implicar causalidade.
Para atribuir causalidade, deve-se recorrer a consideraes tericas. Deste
modo, podemos afirmar que o consumo depende da renda real com base na
teoria econmica.

29
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Ideias Fundamentais
Aprendemos que a anlise de correlao tem como objetivo medir a
intensidade ou grau de associao linear entre duas variveis aleatrias. Por
exemplo, podemos estar interessados em determinar a correlao existente
entre o hbito de fumar e a incidncia de cncer no pulmo, entre as notas das
provas de fsica e matemtica do exame vestibular, etc. Por outro lado, na
anlise de regresso estamos interessados em estimar o valor mdio
de uma varivel aleatria (suponha Y) com base nos valores fixos de
outra varivel (admita que X seja a varivel explanatria), ou seja, o
objetivo da anlise de regresso estimar a esperana condicional de Y, dado
que X = x

E (Y | x) = yfY | X ( y | x) dy,

em que E (Y | x) uma funo de x, isto , E (Y | x) = s ( x) , e denominada curva


de regresso de Y sobre x. Na realidade, E (Y | x) o valor da varivel
aleatria E (Y | X ) .
H na anlise de regresso h uma assimetria na maneira como as variveis
dependente e explanatria so tratadas. Supe-se que a varivel
dependente seja estocstica (ou aleatria) e que as variveis
explicativas tenham valores fixados, isto , sejam no estocsticas.
O problema da regresso consiste em determinar a relao funcional entre as
variveis dependente e explicativa. Assim, se os pares ordenados (x,y) se
apresentarem como na figura a seguir, admitiremos existir um relacionamento
funcional entre os valores de y e x, responsvel pelo aspecto do diagrama e
que explica grande parte da variao de y com x. Esse relacionamento
funcional corresponderia linha existente na figura, que seria a linha de
regresso, que pode no ser uma reta, como no caso indicado pela figura.

30
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
2000

2500

3000

3500

4000

4500

Uma parcela da variao, contudo, permanece em geral sem ser explicada, e


ser atribuda ao acaso. Observe, na figura acima, que os valores de y flutuam
aleatoriamente em torna da linha de regresso estimada (essa linha deve ser
calculada por meio de algum mtodo estatstico). Essa flutuao ou variao
em torno da linha de regresso devida existncia de uma variao aleatria
adicional, que chamaremos de variao residual. A funo de regresso,
portanto, nos d o valor mdio de uma das variveis em funo do valor
observado da outra, isto , E(Y|x).
Portanto, uma estratgia conveniente de anlise supor que cada observao
seja formada por duas partes:
observao = previsvel + aleatrio
ou
yi = E[Yi|xi] + ei,

i = 1, 2, ..., n

em que E[Yi|xi] representa a parte previsvel e ei denota a parte aleatria.


O problema da regresso simplificado quando sabemos de antemo qual a
relao funcional ou modelo entre as variveis. Um problema bastante
estudado em Estatstica a questo da seleo ou identificao do modelo (
uma reta? um polinmio de grau 2?). Mas este estudo est fora do escopo
deste curso. No estudo que se segue, admitiremos que a forma da linha
de regresso seja uma reta, em que a curva de regresso da forma

31
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

E(Y|x) = + x
em que , o intercepto, representa o ponto onde a reta corta o eixo das
ordenadas, e , o coeficiente angular, representa o quanto varia a mdia de Y
para um aumento de uma unidade da varivel X. A funo E(Y|x)
chamada Funo de Regresso Populacional (FRP).
Teremos ento o problema da regresso linear simples. O termo simples
significa que apenas duas variveis esto envolvidas.
6.2

Regresso Linear Simples

Seja Y a varivel dependente e X a varivel suposta sem erro, ou seja, no


aleatria. A regresso linear simples pressupe que seja adotado o modelo

(42)

yi = E (Y | xi ) + i = + X + i ,

i = 1,2,...n

em que o intercepto, a declividade e i denota a componente


aleatria da variao de Y.
razovel supor que a varivel aleatria ( i ) tenha mdia nula, a fim de que
toda a variao explicada de Y fique em torno da reta de regresso. Isso
implica que a reta de regresso fornece a mdia de Y para cada valor de x
considerado, como j mencionamos.
Uma outra suposio bsica que pode ser adotada a de que a variao
residual da varivel Y seja independente de x. Ou seja, usualmente
admite-se que a variao de Y em torno da linha terica de regresso pode ser
descrita por um desvio-padro residual que independe do ponto em
considerao.
Por fim, admitiremos que a variao de Y em torno da linha terica de
regresso se d segundo distribuies normais independentes, para
qualquer valor de x; o que implica dizer que as variaes residuais em
relao reta de regresso so independentes e normalmente distribudas
(vide figura a seguir).

32
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

x1

x2

Nota: o professor est ciente do fato de que os resduos do modelo ajustado


nem sempre seguem uma distribuio normal. Contudo, o importante ter em
mente que as variaes residuais em relao reta de regresso so
independentes e normalmente distribudas por hiptese. Isto no implica dizer
que os resduos, de fato, sejam normalmente distribudos. Acredite: h muitos
dados empricos que violam a hiptese de normalidade!
Suponhamos que a reta estimativa de (42) seja
(43)

y = a + bx

em que y denota os valores dados pela reta estimativa, a a estimativa do


parmetro , e b , tambm denominado coeficiente de regresso linear, a
estimativa do parmetro . A reta estimativa tambm denominada
Funo de Regresso Amostral (FRA).
Existem diversos mtodos de estimao da reta de regresso. Podemos at
mesmo estimar a reta visualmente. O mtodo de ajuste visual consiste em
traar diretamente a reta, com auxlio de uma rgua, no diagrama de
disperso, procurando fazer, da melhor forma possvel, com que essa reta
passe por entre os pontos. Esse procedimento, por ser subjetivo, somente ser
razovel se a correlao linear for muito forte, caso contrrio levar a
resultados pobres.
Por outro lado, o ajuste pode ser feito pelo mtodo dos mnimos
quadrados, segundo o qual a reta a ser adotada dever ser aquela que torna
mnima a soma dos quadrados das distncias da reta aos pontos experimentais
(em que a distncia igual ao erro aleatrio no ponto em considerao como
33
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

ilustrado pela prxima figura). Ou seja, devemos procurar a reta para a qual
n
se consiga minimizar a soma dos quadrados dos resduos i=1 ei2 (note
que a figura usa a notao i = ei para o resduo). A idia central desse
procedimento simplesmente a de minimizar a variao residual em torno da
reta estimativa.

Tendo em vista a expresso (43), devemos, portanto, impor a condio


(44)

min i2 = min ( yi y i ) 2 = min ( yi a bxi ) 2 .


i

Demonstra-se que os parmetros a e b que minimizam (44) sero aqueles que


anulam as derivadas parciais de (44)
(45)

i2 = 0
a i

i2 = 0 .
b i

No difcil chegar s expresses


(46)

2 ( yi a bxi ) = 0 ,
i

(47)

2 xi ( yi a bxi ) = 0
i

34
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

as quais fornecem o seguinte sistema de duas equaes a duas incgnitas:


n
n

=
+
y
na
b
xi

i
i =1
i =1
n
n
n
xi yi = a xi + b xi2
i =1
i =1
i =1

(48)

Os pontos (x,y) fornecem os elementos para a montagem de (48), cuja


soluo forneceria os coeficientes a e b. Entretanto, mais fcil considerar de
uma vez a soluo analtica do sistema, segundo a qual

S xy

b=

S xx
a = y bx

(49)

Exemplo. Determine a equao da reta para os pontos


x
Y

1
0,5

2
0,6

3
0,9

4
0,8

5
1,2

6
1,5

7
1,7

8
2,0

utilizando o mtodo dos mnimos quadrados. Trace a reta no diagrama de


disperso e calcule o coeficiente de correlao linear. A Tabela abaixo contm
os valores necessrios para a determinao dos parmetros da reta.

xi

yi

x i yi

x 2i

y 2i

1
2
3
4
5
6
7
8
xi = 36

0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
yi = 9,2

0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
xi yi = 50,5

1
4
9
16
25
36
49
64
x i2 = 204

0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
y i2 = 12,64

Vimos que

35
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

S xy = i=1 xi yi
n

S xx =

1
n

( x )( y )

1
x
n

2
i =1 i

i =1 i

i =1

( x )

i =1 i

S xy

b=

S xx
a = y bx
Fazendo os clculos, temos que

S xy = 50,5

36 9,2
= 9,1
8

S xx = 204

36 2
= 42
8

Logo,
9,1

b = 42 0,217

36
9,2
a = y bx =
0,217 = 0,174
8
8

A equao da reta de mnimos quadrados, ilustrada na figura a seguir,

y = 0,174 + 0,217 x .
Para o clculo do coeficiente de correlao, necessrio usar os valores da
coluna yi2 da Tabela dada:
1
S yy = i =1 y
n
n

2
i

( y )

i =1

9,2 2
S yy = 12,64
2,06
8

r=

S xy
S xx S yy

9,1
0,98
42 2,06

36
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1.5

0.5

0
0

O alto valor do coeficiente de correlao linear de Pearson justifica o traado


da reta de regresso.
Pressupostos do Modelo de Regresso Linear Simples
Comentamos anteriormente alguns dos pressupostos (ou hipteses bsicas) do
modelo de regresso:
I.

o erro aleatrio tem mdia nula;

II.

a reta de regresso fornece a mdia de Y para cada valor de x


considerado;

III.

a variao residual de Y constante com x e

IV.

a variao de Y em torno da linha terica de regresso se d segundo


distribuies normais independentes, para qualquer valor de x, o que
implica dizer que as variaes residuais em relao reta de regresso
so independentes e normalmente distribudas.

usual formular as hipteses do modelo de regresso em termos do erro


aleatrio :
1.

o valor de y para cada valor de x,

Y = + X + .
2.

o valor mdio do erro aleatrio

E ( ) = 0
37
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

pois admitimos que

E (Y ) = + x
3.

a varincia do erro aleatrio constante (homocedasticidade) (*)

var( ) = 2 = var(Y )
4.

a covarincia entre qualquer par de erros aleatrios i e j , i j , nula

(ortogonalidade) (**)
cov( i , j ) = cov(Yi , Y j ) = 0

5.

a varivel x no aleatria.

6.

A varivel tm distribuio normal


~ N (0, 2 )

se Y tem distribuio normal e vice-versa.


(*) Diz-se que h heterocedasticidade caso a varincia do erro aleatrio no
seja constante.
(**) A covarincia nula implica que os termos de erro so no correlacionados.
Exemplo (Analista da SUSEP/ESAF/2010). A partir de uma amostra
aleatria (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as estaststicas:
mdias X = 12,5 e Y = 19, varincias amostrais s x2 = 30 e s y2 = 54 e
covarincia Sxy = 36.
Qual a reta de regresso estimada de Y em X?
A) Yi = 19 + 0,667 X i
B) Yi = 12,5 + 1,2 X i
C) Yi = 4 + 1,2 X i
D) Yi = 19 + 1,2 X i
E) Yi = 80 + 22,8 X i
Resoluo
38
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Primeiramente, lembre que as somas de quadrados so dadas por (*)

1
n

1
S xx = i =1 ( X i X ) = i =1 X
n

S xy = i =1 ( X i X )(Yi Y ) = i =1 X iYi
n

2
i

1
S yy = i =1 (Yi Y ) = i =1Yi
n
n

n
i =1

n
i =1

Xi

)( Y )

Xi

i =1 i

( Y )
n

i =1 i

(*) As frmulas das somas de quadrados foram reescritas com letras


maisculas (a saber X i , X , Yi , Y ) com o intuito de harmonizar a notao adotada
no curso com a notao usada pela banca no problema.
A reta a estimar
Yi = a + bX i ,

em que o parmetro b (estimativa da declividade) dado por

b=

S xy

i =1

S xx

( X i X )(Yi Y )

( X i X )2
i =1

e o parmetro a (estimativa do intercepto) por

a = Y bX .
Observe que estamos usando uma notao diferente do enunciado: a
quantidade Sxy definida acima no a covarincia entre X e Y.
Podemos calcular b adaptando a frmula dada acima:

i =1

b=

( X i X )(Yi Y )

n
i=1 ( X i X ) 2
n

s xy
s x2

Ou seja, b pode ser calculado, de forma alternativa, pela razo entre a


covarincia amostral sxy (estamos usando uma notao diferente da do
39
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

enunciado, mas que est coerente com a vista no texto!) e a varincia


amostral s x2 . Logo,

b=

36
= 1,2
30

a = 19 1,2 12,5 = 4,0 .


Deste modo, a reta de regresso estimada de Y em X Yi = 4 + 1,2 X i .
GABARITO: C
Exemplo (DECEA/Cesgranrio/2009). Um pesquisador estudou a relao
entre o tempo, medido em segundos, que um inspetor leva para reagir a um
estmulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25
inspetores foram coletados e obtidas as seguintes informaes:
25

25

= 2.000

= 235.000

i =1

i =1

25

25

X i = 500

2
i

= 20.000

i =1

i =1

25

X Y

i i

= 65.000

i =1

As estimativas dos mnimos quadrados, para o coeficiente linear e a inclinao


da reta, respectivamente, so:
(A) 80 e 3,25
(B) 50 e 2,85
(C) 30 e 2,50
(D) 20 e 4,0
(E) 10 e 3,62
Resoluo
O modelo de regresso linear simples

y = a + bx
Pede-se os valores de a e b, respectivamente.
40
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1
500 2

S xx = xi xi = 20000
= 10000
n i
25
i

S xy = xi yi
i

1
500 2000
= 25000
xi yi = 65000
n i
25
i

Logo,
b=

S xy
S xx

25000
= 2,5
10000

em que b a inclinao da reta ajustada. Como a nica opo em que a


inclinao 2,50 o item (C), na prova j marcaramos essa opo sem
continuar os clculos.
No obstante, calcularemos o coeficiente linear (ou intercepto).
a = y bx =

2000
500
( 2,5)
= 30
25
25

Assim, encontramos a reta ajustada y = 30 + 2,5 x .


GABARITO: C
Exemplo (ICMS-SP/2009/FCC). O grfico abaixo demonstra a evoluo da
receita tributria anual no estado de So Paulo desde 1999, com os valores
arrecadados em bilhes de reais.

41
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Para estimar a receita tributria em um determinado ano com base no


comportamento sugerido pelo grfico, adotou-se o modelo Yt = + t + t; t =
1, 2, 3, ..., sendo Yt = ln(RTt), em que RTt a receita tributria no ano
(1998+t) em bilhes de reais e ln o logaritmo neperiano (ln e = 1). , so
parmetros desconhecidos e t o erro aleatrio com as respectivas hipteses
consideradas para o modelo de regresso linear simples. Utilizando o mtodo
dos mnimos quadrados, com base nas observaes de 1999 a 2008, obteve-se
para a estimativa de o valor de 0,12, sabendo-se que:
10

= 39,0

t =1

A previso da receita tributria para 2009, em bilhes de reais, em funo da


equao obtida pelo mtodo dos mnimos quadrados igual a
A) e4,58
B) e4,56
C) e4,44
D) e4,32
E) e4,20
Resoluo
Dados: b = = 0,12 , 1998 + t = 2009 t = 11 .
Y = a + bt = a + (0,12 11) = a + 1,32

a = Y bT
Y =

1 10
39,0
Yt =
= 3,9

10 t =1
10

T =

1 + 2 + 3 + ... + 10
= 5,5
10

a = 3,9 0,12 5,5 = 3,24


Logo,
Y = 3,24 + 1,32 = 4,56

Yt = ln RT RTestimada = eYt = e 4,56


42
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

GABARITO: B
6.3

Coeficiente de Determinao

De (43) e (49) resulta que


(50)

y i = y bx + bxi .

Se considerarmos a mdia y de todos os valores yi e tomarmos as diferenas


entre os valores yi e y , teremos
n

i =1

i =1

i =1

( y i y ) 2 = ( y bx + bxi y ) 2 = b 2 ( xi x ) 2 .
Usando (32) e (33) (frmulas de S xx e S yy , respectivamente) e (49) (frmula
do coeficiente b), temos
n

(51)

( y

y ) = b S xx = bS xy =
2

i =1

S xy2
S xx

em que a soma de quadrados

( y

y ) 2 calculada com base nos desvios da

i =1

reta de mnimos quadrados em relao horizontal y , como ilustrado pela


abaixo.

43
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Considerando as diferenas residuais, podemos escrever


n

(y

i =1

i =1

i =1

2
y i ) 2 = ( yi y + bx bxi ) 2 = [( yi y ) b( xi x )] =

= ( yi y ) 2 2b( yi y )( xi x ) + b 2 ( xi x ) 2 .
i =1

Distribuindo o somatrio acima e usando (49) (frmula de a), chega-se


expresso
n

(52)

(y

y i ) 2 = S yy bS xy .

i =1

(y

Substituindo (51) e

y ) 2 = S yy em (52), obtemos

i =1

(53)

i =1

i =1

i =1

( yi y ) 2 = ( yi y i ) 2 + ( y i y ) 2 .

usual escrever (53) usando a notao


(54) SQT = SQE + SQR,
em que
44
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total),


i =1

SQE = ( yi y i ) 2

a soma dos quadrados dos erros (variao

i =1

residual) e

SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao


i =1

explicada).
variao total = variao residual +variao explicada

A soma de quadrados SQT mede a variao total de Y independentemente de


X, a soma de quadrados SQE mede a variao residual e a soma de
quadrados SQR mede o desvio da reta de mnimos quadrados em relao
mdia y ( a variao explicada pela reta de regresso).
Dividindo ambos os membros da equao (54) por SQT, temos
(55) 1 =

SQE SQR
+
SQT SQT

Podemos querer saber quanto representa proporcionalmente a parcela da


variao total de Y que explicada pela reta de regresso, ou seja, quanto
vale a razo SQR/SQT. Utilizando (51), podemos escrever
(56)

SQR bS xy
=
.
SQT
S yy

Substituindo b =

(57)

S xy
S xx

em (56) obtemos

S xy2
SQR S xy S xy
=

=
= R2
SQT S xx S yy S xx S yy

ou
(58)

R2 = 1

SQE
.
SQT

A frmula (57) mostra que o coeficiente R2 de uma regresso linear simples


exprime a porcentagem da variao total de Y (SQT) que explicada
45
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

pela reta de regresso ajustada. Essa grandeza chamada coeficiente de


determinao (1-R2 o coeficiente de indeterminao). O R2 quantifica o
grau de ajuste de um conjunto de dados reta de regresso estimada.
Quanto mais prximo de 1 estiver R2 melhor ter sido nosso trabalho para
explicar a variao em y, com y = a + bx , e maior ser a capacidade de
previso de nosso modelo sobre todas as observaes amostrais.

H uma relao interessante entre o coeficiente de determinao


R e o coeficiente de correlao r
2

r2 = R2
Ou seja, o quadrado do coeficiente de correlao amostral algebricamente
igual ao coeficiente de determinao. Intuitivamente, essa relao tem
sentido: r2 est entre 0 e 1 e mede a fora da associao linear entre X e Y.
Essa interpretao no se afasta muito da de R2: a proporo da variao de Y,
em torno de sua mdia, explicada por X dentro do modelo de regresso.
Exemplo (APOFP-SP/ESAF/2009). Uma amostra aleatria simples (X1,Y1),
(X2,Y2), ..., (Xn,Yn) de duas variveis aleatrias X e Y forneceu as seguintes
quantidades:
11

( X i X ) 2 = 414
i =1

11

(Yi Y ) 2 = 359
i =1

11

(X

X )Yi = 345

i =1

Calcule o valor mais prximo do coeficiente de determinao da regresso


linear de Y em X.
A) 0,85
B) 0,83
C) 0,80
D) 0,88
E) 0,92
Resoluo
Vimos que
2

S xy
SQR
=
R =
SQT S xx S yy
2

Temos que
46
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

11

(X
i =1
11

(Y

X ) 2 = 414 = S xx

Y ) 2 = 359 = S yy

i =1

11

11

i =1

i =1

11

11

11

11

11

11

X i Yi

i =1

i =1

i =1

i =1

i =1

i =1

11

345 = ( X i X )Yi = X iYi XYi = X iYi X Yi = X iYi

=S XY

Logo,

R2 =

345 345
R 2 0,80
414 359

O valor mais prximo 0,80 (C).


GABARITO: C
Exemplo (ICMS-SP/2006/FCC). Em um determinado pas, deseja-se
determinar a relao entre a renda disponvel (Y), em bilhes de dlares, e o
consumo (C), tambm em bilhes de dlares. Foi utilizado o modelo linear
simples Ci = + Yi +

i,

em que Ci o consumo no ano i, Yi o valor da

renda disponvel no ano i e i o erro aleatrio com as respectivas hipteses


para a regresso linear simples. e so parmetros desconhecidos, cujas
estimativas foram obtidas atravs do mtodo dos mnimos quadrados. Para
obteno desta relao considerou-se ainda as seguintes informaes colhidas
atravs da observao nos ltimos 10 anos:
10

10

S1 = Ci = 90

10

S 2 = Yi = 100

i =1

S 3 = Yi Ci = 1.100

i =1

10

S 4 = Yi 2 = 1.250
i =1

i =1

10

S 5 = Ci2 = 1.010
i =1

Para o clculo do coeficiente de correlao de Pearson (R), usou-se a frmula:


Cov (Y , C )
em que Cov(Y , C ) a covarincia de Y e C, DP(Y) o desvioR=
DP (Y ) DP (C )
padro de Y e DP(C) o desvio-padro de C.
Ento,
A) o coeficiente de explicao (R2) correspondente igual a 64%.

47
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

B) utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados,


tem-se que, em um ano, caso a renda disponvel seja igual a 15 bilhes de
dlares, o consumo ser igual a 13 bilhes de dlares.
C) obtendo para um determinado ano uma previso para o consumo de 10
bilhes de dlares, significa que a renda disponvel considerada foi de 12,5
bilhes de dlares.
D) o valor da estimativa encontrado para o parmetro igual a 0,4.
E) o valor da estimativa encontrado para o parmetro igual a 10.
Resoluo
Ateno: a varivel independente
dependente C (consumo).

(renda

disponvel)

Seja um conjunto de n pares ordenados (y1,c1), (y2,c2), ..., (yn,cn) das


variveis Y e C. Vimos que
n

(y

y )(ci c )

i =1

R=

Cov (Y , C )
=
DP (Y ) DP (C ) 1
n

n
n

(y
i =1

y ) 2 (ci c ) 2

S yc
S yy S cc

i =1

Essa quantidade denominada coeficiente de correlao quando Y e C so


tratadas como variveis aleatrias. O quadrado da mesma quantidade
chamado coeficiente de determinao. No contexto da regresso linear
simples, uma das variveis considerada determinstica ou no estocstica (na
questo, a varivel independente ou explicativa Y) e a outra (a varivel
dependente C) considerada aleatria.
O problema da regresso consiste em determinar a relao funcional entre as
variveis dependente e explicativa.
A funo de regresso C = a + by nos d o valor mdio de uma das variveis ( C
) em funo do valor observado da outra ( y ), isto , E[C|y] = C .
Anlise das alternativas:

1
90 100
y i ci = 1.100
= 200

i i
n
10
1
2
100 2
S yy = i yi2 i yi = 1.250
= 250
n
10

A) S yc = i yi c i

48
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

S cc = i ci2

1
n

( c )

i i

= 1.010

90 2
= 200
10

S yc2

200 2
R =
=
= 0,8 0,64 FALSA
S yy S cc 250 200
2

B) b = =

S yc
S yy

= 200 / 250 = 0,8

a = = c by =

90
100
0,8
= 9 8 =1
10
10

Logo,
C = 1 + 0,8 y C = 1 + 0,8 15 = 1 + 12 = 13 (em bilhes de dlares) VERDADEIRA

C) FALSA (vide item B).


D) FALSA (vide item B).
E) FALSA (vide item B).
GABARITO: B
Regresso Linear Mltipla
O modelo de Regresso Linear Simples (RLS) estudado muitas vezes
inadequado na prtica. Vrias aplicaes de anlise de regresso envolvem
situaes em que h mais de um regressor (varivel independente). Um
modelo de regresso que contenha mais de um regressor denominado
modelo de Regresso Linear Mltipla (RLM).
Por exemplo, suponha que a quantidade demandada (varivel dependente Y)
de um produto dependa do preo do produto (regressor X2) e da renda do
comprador (regressor X3). Um modelo de RLM que pode descrever essa relao

(59) Yi = 1 + 2X2i + 3X3i + i


em que 1, 2 e 3 so os parmetros do modelo e denota o termo de erro
aleatrio. Esse um modelo com dois regressores (X2 e X3). O termo linear
usado porque (59) uma funo linear dos parmetros desconhecidos 1, 2 e
3. O modelo (59) descreve um plano no espao tridimensional de Y, X2 e X3. O
coeficiente 1 a interseo do plano com o eixo Y.
Em geral, o modelo de RLM pode ter k parmetros (ou coeficientes)
desconhecidos 1, 2, 3,..., k:
49
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(60) Yi = 1 + 2X2i + 3X3i + ... + kXki + i.


Nota: (y1, x21, x31,..., xk1), ..., (yn, x2n, x3n,..., xkn) so os n vetores de
observaes que sero ajustados ao modelo.
O parmetro k mede o efeito de uma modificao na varivel Xk sobre o valor
esperado de Y, E(Y), mantidas constantes todas as outras variveis. O
parmetro 1 o termo intercepto. A varivel a qual 1 est ligado X2i = 1. O
intercepto 1 representa o valor esperado de Yi quando todas as variveis
explanatrias so iguais a zero.
O modelo (60) com k 4 descreve um hiperplano no espao k dimensional de
regressores, ou seja, quando k 4 no possvel representar o modelo
graficamente.
Os Pressupostos do Modelo
Para tornar completo o modelo (60), devemos fazer algumas suposies sobre
a distribuio de probabilidade dos erros aleatrios i. Os pressupostos que
vamos introduzir so anlogos aos introduzidos para o modelo de RLS. So:
1. E(i) = 0. Cada erro aleatrio tem distribuio de probabilidade com
mdia nula. Alguns erros sero positivos, outros sero negativos; em um
grande nmero de observaes, eles tero mdia zero.
2. Var(i) = 2. As distribuies de probabilidade dos erros aleatrios i
tm a mesma varincia constante 2. A varincia 2 um parmetro
desconhecido e mede a incerteza presente no modelo estatstico. Como
a mesma para cada observao, para nenhuma observao a incerteza
do modelo ser maior, ou menor, nem estar diretamente ligada a
qualquer varivel. Os erros com essa propriedade chamam-se
homocedsticos.
3. Cov(i, j) = 0, para ij. A covarincia entre dois erros correspondentes
a duas observaes diferentes quaisquer zero. O tamanho do erro de
uma observao no tem qualquer influncia sobre o tamanho provvel
do erro de outra observao. Assim, qualquer par de erros distintos
no correlacionado.
4. Admitiremos que os erros aleatrios i
probabilidade normal, isto , i ~ N(0, 2).

tenham

distribuio

de

Como cada observao sobre a varivel dependente Yi depende do termo


aleatrio i, tem-se que cada Yi uma varivel aleatria. As propriedades
estocsticas de Yi decorrem das de i. So:
50
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1. E(Yi) = 1 + 2X2i + 3X3i + ... + kXki. O valor esperado de Yi depende


dos valores das variveis explanatrias e dos parmetros desconhecidos.
Essa suposio equivalente a E(i) = 0. Ela nos diz que o valor mdio
de Yi varia para cada observao, sendo dado pela funo de regresso
E(Yi) = 1 + 2X2i + 3X3i + ... + kXki.
2. Var(Yi) = Var(i) = 2. A varincia dos Yi constante.
3. Cov(Yi, Yj) = Cov(i, j) = 0, para ij. Duas observaes quaisquer da
varivel dependente so sempre no correlacionadas.
4. Admitiremos que os Yi tenham distribuio de probabilidade normal, ou
seja, Yi ~ N[(1 + 2X2i + 3X3i + ... + kXki), 2], o que equivale a dizer
que i ~ N(0, 2).
Alm das suposies sobre o erro aleatrio i e sobre a varivel dependente Yi,
assumiremos dois pressupostos sobre as variveis explanatrias. So:
1. Os regressores no so variveis aleatrias.
2. Nenhuma das variveis explanatrias uma funo linear exata de
qualquer das outras, ou seja, as variveis X no so linearmente
dependentes. Esse pressuposto equivale a afirmar que nenhuma varivel
explanatria redundante, ou seja, desnecessria para a regresso.
Dito de outra forma, este pressuposto afirma que NO existe um
conjunto de coeficientes (2,..., k) (0, ... ,0) tal que
k

X
t

ti

=0

t =2

Momentos e Funo Geratriz de Momentos

7.1

Momentos de uma Distribuio de Frequncias

Por ora, voltemos matria da Aula 1, que abordou a Estatstica Descritiva. O


momento de ordem t associado s observaes x1 , x 2 ,..., x n definido como
(61) M t =

1 n t
xi
n i=1

Define-se o momento de ordem t centrado em relao a uma constante


"a" como
51
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(62) M ta =

1 n
( xi a ) t

n i=1

O caso do momento centrado em relao a mdia x de especial


interesse e ser designado por momento centrado de ordem t, dado por
(63) mt =

1 n
( xi x )t
n i =1

As expresses (61), (62) e (63) podem ser reescritas levando-se em


considerao as frequncias dos k valores existentes do conjunto de
k

observaes (lembre que

= n ). Tem-se, ento, respectivamente,

i =1

(64) M t =

1 k t
xi f i ,
n i=1

(65) M ta =

1 k
( xi a )t f i

n i=1

(66) mt =

1 k
( xi x ) t f i ,

n i=1

Observe que o momento de ordem 1 igual mdia, ou seja,


(67) M 1 = x ,
pois M 1 =

1 n
xi (basta aplicar (61) com t=1).
n i =1

O momento centrado de ordem 1 (ou de primeira ordem) nulo


(68) m1 = 0 ,
porque m1 =

n
1 n

1 n
1 n
( xi x ) = xi x = xi nx = x x = 0 .

n i=1
n i=1
n i=1
i =1

O momento centrado de segunda ordem a varincia


(69) m2 = s x2

52
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

haja vista que, m2 =


7.2

1 n
( xi x ) 2 =s x2 .

n i =1

Momentos de uma Varivel Aleatria

Vimos anteriormente que os momentos caracterizam uma distribuio de


freqncias. Neste item, veremos os momentos que caracterizam a
distribuio de probabilidades de uma dada varivel aleatria.
O r-simo momento de uma varivel aleatria X em torno da sua mdia ,
tambm denominado r-simo momento central, definido como
(70)

r = E[( X ) r ]

em que r = 0,1,2,... . Segue-se que 0 = 1 , 1 = 0 e 2 = 2 (varincia). Temos


(71)

r = (x ) r f (x)

(72)

r =

para varivel discreta,

(x )

f (x)dx

para varivel contnua.

O r-simo momento de X em torno da origem, tambm denominado r-simo


momento ordinrio, definido como

(73)

r = E( X r )

em que r = 0,1,2,... . Temos ento


(74)

r = x r f (x)

(75)

r =

para varivel discreta,

f (x)dx

para varivel contnua.

Note que o primeiro momento em torno da origem apenas a mdia, ou seja,


= E ( X ) = . Alm disso, uma vez que o segundo momento em torno da
1
origem 2 = E ( X 2 ) , tem-se que
(76)

2 = E(X 2 ) [E(X)]2 = 2 2 .

Os momentos ordinrios de uma varivel aleatria podem ser determinados


diretamente, por meio de (74) e (75). No obstante, h um procedimento
alternativo, frequentemente til, que faz uso de uma funo especial, que ser
vista no prximo item.
53
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

7.3

Funo Geratriz de Momentos

A funo geratriz (ou geradora) de momentos da varivel aleatria X o


valor esperado de etX: E(etX) = MX(t). Temos
(77)

M X (t) = e tx f (x)

(78)

M X (t) =

para varivel discreta,

tx

f (x)dx

para varivel contnua.

A funo geratriz de momentos pode ser usada para obter todos os momentos
ordinrios de uma varivel aleatria:

Seja X uma varivel aleatria com funo geratriz de momento MX(t). Ento
(79)

E(X r ) =

d r M X (t)
dt r t = 0

Exemplo. Suponha que X seja uma varivel aleatria com distribuio


binomial

n
f ( x) = p x (1 p ) n x ,
x

x = 0,1,2,..., n .

em que n denota o nmero de tentativas e p representa a probabilidade de


sucesso em uma tentativa. Determine a funo geradora de momentos e use a
mesma para verificar que a mdia e a varincia de X so dadas por = np e 2
= np(1-p), respectivamente.
n
n
n
n
M X (t) = e tx p x (1 p) n x = ( pe t ) x (1 p) n x =
x
x
x=0
x = 0

o ltimo somatrio a expanso binomial (*) de [ pet + (1 p)]n ; deste modo,

M X (t ) = [ pet + (1 p)]n .

(*) O teorema do binmio de Newton afirma que (A+B)n =

x A B
x=0

n x

Tomando a primeira e a segunda derivadas (**), obtemos

54
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

dM X (t )
= M X (t ) = npet [ pet + (1 p )]n 1 = npet [1 + p (et 1)]n 1
dt
d 2 M X (t )
= M X (t ) = npet [ pet + (1 p )]n 1 = npet [1 + p (et 1)]n 1
2
dt

M X (t ) = npet [ pet + (1 p)]n 1 + npet (n 1) pet [ pet + (1 p)]n 2


M X (t ) = npet (1 p + npet )[1 + p(et 1)]n 2
(**) Regras de derivao:

Se f(t) = [v(t)]n, ento f(t) = n[v(t)]n-1v(t)

Se f(t) = u(t).v(t), ento f(t) = u(t).v(t) + u(t).v(t)

(et) = et

Se fizermos t = 0 em M X (t ) obteremos

M X (t )

t =0

= 1 = = np

que a mdia da distribuio binomial. Se fizermos t = 0 em M X (t ) teremos

M X (t )

t =0

= 2 = E ( X 2 ) = np (1 p + np ) .

Consequentemente, a varincia da distribuio binomial dada por

2 = 2 2 = np(1 p + np) (np) 2 = np np 2 = np(1 p) .


Exemplo. Encontre a funo geratriz de momentos da varivel aleatria
normal e use-a para mostrar que a mdia e a varincia dessa varivel aleatria
so e 2, respectivamente.
A funo geratriz de momentos

1
M X (t ) = etx
e
2

1
M X (t ) =
e
2

( x )2
2 2

2 t 2 x
2 2

dx

( x 2 2 x + 2 )
2 2

dx

55
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1
M X (t ) =
e
2

[ x 2 2 ( + t 2 ) x + 2 ]
2 2

dx

Completando o quadrado no expoente, teremos

x 2 2( + t 2 ) x + 2 = [ x ( + t 2 )]2 2t 2 t 2 4
e a funo geratriz de momentos pode ser reescrita na forma

1
M X (t ) =
e
2

M X (t ) = e

t +

{[ x ( + t 2 )]2 2 t 2 t 2 4 }
2 2

2t 2

1
e

dx

[ x ( + t 2 )]2
2 2

dx

fazendo u = [ x ( + t 2 )] / dx = du e a integral acima se torna

M X (t ) = e

t +

2t 2
2

1 u2
e du
2

Note que a integral na expresso acima apenas a rea total sob a densidade
normal, a qual, por definio, igual a 1. Logo,
M X (t ) = e

t +

2t 2
2

Tomando a primeira e a segunda derivadas (*), obtemos


M (t) = ( + t )e
2

'
X

2t 2
2 t + 2

M (t) = e
''
X

t +

2t 2
2

+ ( + t ) e
2

t +

2t 2
2

(*) (ef(t)) = f(t)ef(t).

Se fizermos t = 0 em M X (t ) e M X (t ) , obteremos

M X (t )

t =0

= 1 = .

56
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

M X (t )

t =0

= 2 = 2 + 2

Por conseguinte, a varincia da distribuio normal

var( X ) = 2 2 = 2 + 2 2 = 2 .
Propriedades das Funes Geratrizes de Momentos
A seguir esto listadas, sem as respectivas demonstraes, algumas
propriedades importantes das funes geradoras de momentos que podero
ser cobradas na prova.
(1) Unicidade: a funo geratriz de momentos de uma varivel aleatria
nica
quando ela existe; logo, se tivermos duas variveis aleatrias X e Y
com funes geratrizes de momentos MX(t) e MY(t), respectivamente, ento, se
MX(t) = MY(t), isto quer dizer que X e Y tem a mesma distribuio de
probabilidades.
(2) Seja a uma constante e X uma varivel aleatria. Ento vale
MX+a(t) = eatMX(t).
(3) Seja a uma constante e X uma varivel aleatria. vlida a relao
MaX(t) =MX(at).
(4) Sejam a e b constantes (b 0) e X uma varivel aleatria. Ento
t
M ( X + a ) / b (t ) = e at / b M X .
b

(5) Se X 1 , X 2 ,..., X n forem variveis aleatrias independentes, com funes


geradoras de momento M X 1 (t ), M X 2 (t ),..., M X n (t ) , respectivamente, e se

Y = X 1 + X 2 + ... + X n , ento a funo geratriz de momentos de Y ser


M Y (t ) = M X 1 (t ) M X 2 (t ) ... M X n (t ) .

Exemplo. Seja X uma varivel aleatria de Poisson com distribuio


f ( x) =

e x
,
x!

x = 0,1,2,...

57
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Mostre que a sua funo geradora de momentos M X (t ) = e ( e 1) .


t

Para resolver este exemplo, preciso conhecer a srie

yn

n! = e

n =0

Sendo assim

M X (t) = e e

tx

x!

x=0

= e
x =0

t
t
( e t ) x (e t ) x
=e
= e e e = e ( e 1) .
x!
x!
x=0

Exemplo. Sejam X1 e X2 variveis aleatrias independentes com distribuies


de Poisson, com parmetros 1 e 2, respectivamente. Determine a funo

geratriz de momentos de Y = X1 + X2.


De acordo com o exemplo anterior, temos que as funes geradoras de X1 e X2
t
t
so M X 1 (t ) = e1 ( e 1) e M X 2 (t ) = e2 ( e 1) , respectivamente. Como X1 e X2 so
independentes e Y = X1 + X2 M Y (t ) = M X 1 (t ) M X 2 (t ) . Logo,

M Y (t ) = M X 1 (t ) M X 2 (t ) = e1 ( e 1) e2 ( e 1) = e( 1 + 2 )(e
t

1)

Observe que M Y (t ) = e( 1 + 2 )( e 1) a funo geratriz de momentos de uma varivel


aleatria de Poisson com parmetro = 1 + 2. Portanto, demonstramos que
a soma de duas variveis aleatrias independentes de Poisson, com
parmetros 1 e 2, tambm uma varivel aleatria de Poisson, com
parmetro = 1 + 2.
t

Exemplo (MPE-PE - Estatstica/FCC/2006) Uma distribuio Gama com


parmetros (>-1) e (>0) tem funo geratriz de momentos dada por
m(t) = (1-t)-(+1) para t<1/. Se =1, o momento de ordem dois, no
centrado, de X igual a
A) 2
B) 22
C) 42
D) 62
E) 82
Resoluo
Lembre que:
58
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

M X (t )

t =0

= 2 = E ( X 2 )

M X (t ) = ( + 1) (1 t ) 2 ( ) = ( + 1)(1 t ) 2
M X (t ) = ( 2) ( + 1) (1 t ) 3 ( ) = 2 ( + 1)( + 2)(1 t ) 3
Com =1 M X (t )

t =0

= 2 2 3 (1 0) 4 = 6 2 .

GABARITO: D

59
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

O Mnimo que Voc Precisa Saber

- Varivel discreta (X,Y):


f(x,y)0,

x y f(x,y) = 1 e f(x,y) = P(X=x,Y=y)

- Varivel contnua (X,Y):


f(x,y)0,

b d

f ( x, y )dxdy = 1 e P(a X b, c Y d ) = f ( x, y )dydx .


a c

- Distribuies marginais:

f ( x, y)dy e
(x ) = f (x , y ) e

f X ( x) =

fX

f ( x, y )dx
) = f (x , y

fY ( y) =

para variveis contnuas

fY ( yk

) para variveis discretas

- Distribuies condicionais:
a) Variveis Discretas:
f X |Y ( xi | y k ) =

f ( xi , y k )
f ( xi , y k )
e f Y | X ( y k | xi ) =
fY ( yk )
f X ( xi )

f ( xi , y k ) = f X |Y ( xi | y k ) f Y ( y k ) = f Y | X ( y k | xi ) f X ( xi )
n

E ( X | Y = y j ) = xi P ( X = xi | Y = y j )
i =1
k

E (Y | X = xi ) = y j P (Y = y j | X = xi )
j =1

b) Variveis Contnuas:
f X |Y ( x | y ) =

f ( x, y )
f ( x, y )
e f Y | X ( y | x) =
fY ( y)
f X ( x)

f ( x, y ) = f X |Y ( x | y ) f Y ( y ) = f Y | X ( y | x) f X ( x)
E ( X | y ) = xf X |Y ( x | y )dx
E (Y | x) = yf Y | X ( y | x)dy

- Variveis aleatrias X e Y independentes:


60
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

f ( x, y ) = f X ( x ) f Y ( y )
f X |Y ( x | y ) = f X ( x)
f Y | X ( y | x) = f Y ( y )

- Covarincia: Cov( X , Y ) = E[( X X )(Y Y )]


Cov( X , Y ) = [ xi X ][ y j Y ] f ( xi , y j ) (variveis discretas)
i

Cov( X , Y ) =

(x X )(y Y ) f ( x, y )dxdy (variveis contnuas)

- Covarincia amostral (estimador da covarincia):


s xy =

1 n
( xi x )( yi y )
n 1 i=1

- Correlao: ( X , Y ) =

Cov( X , Y )

X Y

, -11.

- Correlao amostral (estimador da correlao) ou coeficiente de


correlao linear de Pearson r:
r=

s xy
sx s y

ou

r = cov. amostral/(desvio padro amostral de X . desvio padro amostral de Y)


sx =

1 n
( xi x ) 2 (desvio padro amostral de X)

n 1 i=1

sy =

1 n
( yi y ) 2 (desvio padro amostral de Y)

n 1 i =1

- Clculo maceteado do coeficiente de correlao:


r=

S xy
S xx S yy

em que Sxy, Sxx e Syy so as seguintes somas de quadrados:


1

S xy = xi yi xi yi
n i i
i

61
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

S xx = xi xi
n i
i

S yy = yi yi
n i
i

- Se X e Y so variveis aleatrias independentes, ento a covarincia e a


correlao entre elas nula, ou seja, X e Y so no correlacionadas:
Cov( X , Y ) = E[ XY ] X Y = 0
E[ XY ] = XY (a esperana de XY igual ao produto das mdias X e Y).

- Variveis aleatrias X e Y e Z = aX + bY, em que a e b denotam constantes:


E(Z) = aE(X) + bE(Y)
Var(Z) = a2var(X) + b2var(Y) + 2abCov(X,Y)
Var(Z) = a2var(X) + b2var(Y), se X e Y so independentes

- Modelo de regresso linear simples:


Y = + X + ,
em que o intercepto, a declividade e denota a componente
aleatria da variao de Y ( uma varivel aleatria).
y = a + bx (reta estimativa),
em que y denota os valores dados pela reta estimativa, a a estimativa
do parmetro , e b a estimativa do parmetro .
b=

S xy

s xy
2
x

= cov.amostral/(desvio padro amostral de X)2

S xx s
a = y bx = mdia de Y menos (declividade x mdia de X)
SQT = SQE + SQR
n

SQT = S yy = ( yi y ) 2 a soma dos quadrados total (variao total),


i =1

SQE = ( yi y i ) 2 a soma dos quadrados dos erros (variao


i =1

residual) e
n

SQR = ( y i y ) 2 a soma dos quadrados da regresso (variao


i =1

explicada).
62
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

variao total = variao residual +variao explicada


S xy2
SQE
2
=
Coeficiente de determinao: R = 1
SQT S xx S yy

- r-simo momento ordinrio de X:


r = E ( X r ) , em que r = 0,1,2,....

r = x r f (x)

para varivel discreta

r =

f ( x)dx

para varivel contnua

- Funo geratriz (ou geradora) de momentos, MX(t) = E(etX):


M X (t ) = etx f ( x)

para varivel discreta

M X (t ) = etx f ( x)dx

para varivel contnua

E( X r ) =

d r M X (t )
dt r
t =0

63
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Exerccios de Fixao

(ANAC rea 4/Cespe-UnB/2012/Adaptada) Na regio Sul do pas, em


decorrncia de mau tempo durante os meses de inverno, comum o
fechamento de aeroportos. Com base nessa informao e de acordo com a
teoria de probabilidades, julgue os itens de 1 a 3.
1. Sabendo-se que o processo de precipitao da chuva depende da
temperatura ambiente e da temperatura de condensao do ar, considere que
tais grandezas sejam representadas, respectivamente, pelas variveis
aleatrias X e Y contnuas com distribuio conjunta f(X,Y). Nessa situao,
correto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da
temperatura de condensao do ar ser 9 oC igual a f(30,9).
2. Supondo que a probabilidade de no haver vaga no estacionamento de um
aeroporto dependa do fato de ter ocorrido mau tempo na cercania desse
aeroporto, correto afirmar que a probabilidade de no haver vaga no
estacionamento desse aeroporto, caso tenha ocorrido mau tempo na sua
cercania, igual a 1 menos a probabilidade de ter vaga no estacionamento do
referido aeroporto, caso no tenha ocorrido mau tempo em sua cercania.
3. Considere que o nmero de voos atrasados por ms em um aeroporto da
regio Sul seja explicado pela regresso Y = 15 + 5X + , ~ N(0, 2), em
que Y o nmero de voos atrasados no ms, X o nmero de horas que o
aeroporto permaneceu fechado por mau tempo no referido ms e uma
varivel aleatria com distribuio normal de mdia zero e varincia
desconhecida 2. Nesse caso, correto afirmar que o desvio padro de X ser
proporcional a 1/5 do desvio padro de Y.
(ANAC/Cespe-UnB/2012/Adaptada)
regresso, julgue os prximos itens.

Em

relao

aos

modelos

de

4. O modelo de regresso Yi = 0 + 1exp(Xi) + i, i ~ N(0, 2) um modelo


linear simples.
5. O grfico abaixo mostra o consumo de combustvel de aviao (em gales)
por milha nutica voada e o ajuste de uma reta a todos os pontos mostrados
via regresso linear. Sabendo-se que uma primeira regresso linear foi
realizada utilizando-se apenas os pontos com preenchimento e que a incluso
do ponto sem preenchimento levou a um considervel deslocamento dessa
reta, ento correto afirmar que esse ponto denomina-se ponto de inflexo.

64
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(ANAC/Cespe-UnB/2012/Adaptada) A respeito de modelos de regresso e


coeficientes de correlao, julgue os itens que se seguem.
6. A esperana condicional E(Y|X = k) = 0 + 1k3 +2 cos(k) representa um
modelo de regresso linear mltipla.
7. Em um modelo linear simples, se o coeficiente de determinao for 0,81, o
desvio padro da varivel resposta for 1/3 do desvio padro da varivel
explicativa e a inclinao da reta de regresso for negativa, o coeficiente
estimado de inclinao dessa reta ser -0,30.
8. (BACEN - rea 3/FCC/2006) Sejam X e Y duas variveis aleatrias e
I.

E(X) e E(Y) as expectncias de X e Y, respectivamente;

II.

Var(X) e Var(Y) as varincias de X e Y, respectivamente;

III.

Cov(X,Y) a covarincia de X e Y.

Tem-se, em qualquer situao,


A) E(X).E(Y) = E(XY) Cov(X,Y)
B) Cov(X,Y) = Var(X).Var(Y)
C) E(2X+5) = 4E(X)
D) Se E(XY)=E(X).E(Y), ento X e Y so independentes.
E) Var(X+10) = Var(X)+10

9. (AFRF/ESAF/2009) Na anlise de regresso linear simples, as estimativas


e dos parmetros e da reta de regresso podem ser obtidas pelo
mtodo de Mnimos Quadrados.
Nesse caso, os valores dessas estimativas so obtidos atravs de uma amostra
de n pares de valores Xi Yi com (i =1, 2, ....,n), obtendo-se:
65
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Y i= + X i , onde Y i a estimativa de Yi = + Xi. Para cada par de valores Xi

Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resduo aqui denotado


por ei entre a reta de regresso Yi e sua estimativa Y i . Sabe-se que o
Mtodo de Mnimos Quadrados consiste em adotar como estimativas dos
parmetros e os valores que minimizam a soma dos quadrados dos desvios
ei.
Desse modo, o Mtodo de Mnimos Quadrados consiste em minimizar a
expresso dada por:
n

A)

[Y ( X )]

i=1
n

B)

i=1

C)

[Y ( X )]

i=1

D)

[Y

Yi 2 ]

( X i ) 2 ]

i=1

E)

[Y X ]

[Y

i=1

(Inditas) O enunciado a seguir refere-se s questes de nmeros 10 e 11.

A funo densidade de probabilidade conjunta de duas variveis aleatrias


discretas dada pela tabela a seguir:

2
4
6

1
1/8
1/4
1/8

Y
3
1/24
1/4
1/24

9
1/12
0
1/12

10. A covarincia entre X e Y


A) 1
B) 3
C) 4
D) 12
E) 0
11. Assinale a alternativa correta.
66
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A) X e Y no so independentes.
B) X e Y so independentes.
C) X e Y so correlacionadas.
D) X e Y tm distribuio conjuntamente normal.
E) X e Y tm distribuies marginais normais.
(Inditas) O enunciado a seguir refere-se s questes de nmeros 12
e 13.
Considere as variveis aleatrias independentes X 1 , X 2 ,..., X n . Suponha que
essas n variveis possuam a mesma distribuio de probabilidades com mdia
e varincia 2 . Seja
n

X=

1
X .
n i=1 i

12. Podemos afirmar que o valor esperado de X igual a


A) / 2

B) 2
C)
D) 2 / .
E) 0
13. Podemos afirmar que a varincia de X
A) / 2
B) 2 / n
C) n 2
D) 2 /
E) 0
14. (BACEN - rea 3/FCC/2006) Uma empresa, com a finalidade de
determinar a relao entre os gastos anuais com propaganda (X), em R$ 1
000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no
ano i, X i o valor gasto com propaganda no ano i e i o erro aleatrio com as
67
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

respectivas hipteses consideradas para a regresso linear simples ( e so


parmetros desconhecidos).
Considerou, para o estudo, as seguintes
observaes nos ltimos 10 anos da empresa:
10

10

= 100

i=1

referentes

10

X Y

= 60

i i

i=1
10

informaes

= 650

i=1
10

X 2i = 400

i=1

i=1

2
i

= 1.080

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previso

do lucro bruto anual, em mil reais, ser de

A) 84
B) 102,5
C) 121
D) 128,4
E) 158
15. (INDITA) Considere os dados da questo 14. O coeficiente de correlao
de
A) 0
B) 2,5
C) 1,25
D) 0,88
E) 0,63

68
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

16. (ICMS-RJ/FGV/2008) Sejam X, Y e Z trs variveis com correlaes de


Pearson expressas pela matriz abaixo:

X
Y
Z

X
1,000
0,800
0,000

1,000
-0,500

1,000

Pode-se, ento, afirmar que:


A) X e Z so independentes.
B) a correlao parcial entre X e Y, aps a correo para Z, negativa.
C) o coeficiente de determinao da regresso de Y em X maior do que 60%.
D) a correlao entre V = a + b.X e W = c + d.Z, com a 0, c 0, b>0 e d<0
negativa.
E) a covarincia entre X e Y igual a 0,64.
17. (ICMS-RJ/FGV/2009) Utilizando uma anlise de regresso linear
simples, um pesquisador obteve um ajuste Y = a1X + b1 e um coeficiente de
determinao R12 . Um segundo pesquisador analisou os mesmos dados, mas
antes aplicou a cada observao de Y a transformao Y = 10Y + 100, obtendo
um outro ajuste Y = a2X + b2, com um coeficiente de determinao R22 . Considere
as afirmativas abaixo, relativas comparao entre os valores obtidos nas
duas anlises:
I.

a2 = 10a1 ;

II.

b2 = b1 + 100;

III.

R22 = R12 .

Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente as afirmativas I e II forem verdadeiras.
C) se somente as afirmativas I e III forem verdadeiras.
D) se somente as afirmativas II e II forem verdadeiras.
E) se todas as afirmativas forem verdadeiras.
18. (Indita) Seja a funo densidade de probabilidade f ( x) = 2 x para 0 x 1
e f ( x) = 0 para os demais valores de x. Suponha que X1 e X2 sejam variveis
aleatrias independentes, cada uma delas com a funo densidade de
69
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

probabilidade f(x). Ento podemos afirmar que a funo densidade de


probabilidade conjunta f(x1,x2)
A) f ( x1 , x 2 ) = 4 x1 x 2 .
B) f ( x1 , x2 ) = x1 x2 / 4 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.
C) f ( x1 , x2 ) = x1 x2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.
D) f ( x1 , x 2 ) = 4 x1 x 2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.
E) f ( x1 , x2 ) = 4 x1 / x2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio
19. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma
amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se

22

22

22

= 440

(X

= 286

22

(Y Y )
i

X ) 2 = 850 ,

i=1

i=1

i=1

22

= 1.690

i=1

(X

X )(Yi Y ) = 1.105

i=1

Obtenha a reta de regresso linear de Y em X.

A) Yi = 13 + 0,65X i
B) Y = 13 +1,3X
i

C) Yi = 20 + 0,65X i
D) Y = 20 + 2X
i

E) Yi = 13 +1,3X i
20. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) Com os dados da
questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
A) 0,65
B) 0,81
C) 0,85
D) 0,91
E) 0,88
21. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
70
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

medida a dureza de um lote de concreto depende da quantidade de cimento


usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n

SQR = Yi Y
i =1

SQE = Yi Yi

= 5.275,2

i =1

) = 366,6
2

o coeficiente de determinao , aproximadamente,


A) 0

B) 0,064
C) 0,5
D) 0,94
E) 14,38
22. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
I.

Linearidade do fenmeno medido

II.

Varincia no constante dos termos de erro (heterocedasticidade)

III. Normalidade dos erros


IV. Erros correlacionados
V.

A covarincia entre dois erros aleatrios distintos no nula.

So premissas APENAS os itens


A) I e III.
B) II e III.
C) I, III e IV.
D) I, III e V.
E) I, II, III e V.
23. (IBGE/Cesgranrio/2010) Sejam X1, X2, X3 variveis aleatrias
independentes, todas com mdia 100 e varincia 100. O valor esperado e a
X 2X 2 + X 3
varincia de Z = 1
so, respectivamente,
4
A) 100 e 100.
B) 100
e 75/2.
C) 100 e 25/2.
71
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

D) 0 e 75/2.
E) 0 e 25/2.
24. (ICMS-RJ/FGV/2011) A tabela abaixo mostra os valores de duas
variveis, X e Y.
X
4
4
3
2

Y
4,5
5
5
5,5

Sabe-se que

X = 13
Y = 20
XY = 64
X = 45
( X ) = 169
2

O valor de b na regresso simples Y = a + bX


A) 11/5
B) -3/8
C) -4/11
D) -4/17
E) -11/65
25. (ICMS-RJ/FGV/2011) Para duas variveis populacionais, X e Y, o
desvio-padro de X 40, o desvio-padro de Y 20 e a covarincia entre Y e X
100. Assim, o coeficiente de correlao entre X e Y
A) 0,5.
B) 2
C) -0,25
D) -0,125
E) 0,125
26. (Economista-CODEBA/FGV/2010) Sejam
aleatrias para uma amostra de tamanho N.

X1 , X 2 , X3 ,..., X N

variveis

72
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Defina a Mdia amostral ( X ) como:


X + X 2 + X 3 + ... + X N
X= 1
N
Sabendo que E(X i ) = e VAR(X i ) = 2 , avalie as afirmativas abaixo:
I. O valor esperado da mdia amostral E( X) = .
2
.
N
N
N

III. O valor esperado de X i , igual a E X i = N


i =1
i=1
Assinale

II. A varincia da mdia amostral VAR ( X ) =

A) se apenas as afirmativas I e II estiverem corretas.


B) se apenas as afirmativas I e III estiverem corretas.
C) se apenas as afirmativas II e III estiverem corretas.
D) se todas as afirmativas estiverem corretas.
E) se nenhuma das afirmativas estiver correta.

73
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

27. (INEP/Cesgranrio/2008) Considere as informaes apresentadas a


seguir sobre Ensino Mdio.

As concluses a seguir podem ser tiradas a partir do grfico.


I Na unidade da federao com melhor desempenho mdio os alunos
demoram, em mdia, 1,4 anos para a concluso de uma srie do Ensino
Mdio.
II O desempenho mdio nas unidades da federao diretamente
proporcional ao tempo mdio para concluso de uma srie do Ensino Mdio.
III A moda dos tempos mdios para a concluso de uma srie do Ensino
Mdio 1,3 anos.
IV Os estados de So Paulo, Santa Catarina e Esprito Santo apresentaram o
pior desempenho nessa edio do Saeb.
So corretas APENAS as concluses
A) I e III
B) I e IV
C) II e III
D) II e IV
E) I, II e IV

74
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

28. (INEP/Cesgranrio/2008) Considere as afirmaes a seguir a respeito


do Coeficiente de Correlao (r) de Pearson entre duas variveis.
I - Se r=1, as observaes esto todas sobre uma linha reta no diagrama de
disperso.
II - Se r > 0, a varivel independente aumenta quando a varivel dependente
aumenta.
III - Se r < 0, a varivel independente decresce quando a varivel dependente
decresce.
IV- Se r=0, no existe relao entre as duas variveis.
So corretas APENAS as afirmaes
A) I e II
B) I e III
C) II e III
D) II e IV
E) III e IV
29. (INEP/2008/Cesgranrio) Utilizando-se do Mtodo dos Mnimos
Quadrados, a seguinte reta de regresso foi estimada para o desempenho de
um conjunto de candidatos em determinado exame de proficincia, em funo
do nmero mdio de horas de estudo, por dia, para preparao antes da
prova:
Yestt = 249 + 2,02 X
Considerando o modelo ajustado conclui-se que o(a)
A) coeficiente de correlao entre as variveis prximo de 1.
B) coeficiente de determinao de 100%.
C) intercepto tem um efeito muito maior em Y do que a inclinao.
D) relao entre X e Y no linear.
E) variao de uma unidade em X acarreta a variao em Y de 2,02.

75
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

10. Gabarito
1E
2E
3E
4C
5E
6C
7C
8A
9B
10 E
11 A
12 C
13 B
14 B
15 D
16 C
17 C
18 D
19 E
20 C
21 D
22 A
23 D
24 C
25 D
26 D
27 A
28 A
29 E

76
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

11. Resoluo dos Exerccios de Fixao


(ANAC rea 4/Cespe-UnB/2012/Adaptada) Na regio Sul do pas, em
decorrncia de mau tempo durante os meses de inverno, comum o
fechamento de aeroportos. Com base nessa informao e de acordo com a
teoria de probabilidades, julgue os itens de 1 a 3.
1. Sabendo-se que o processo de precipitao da chuva depende da
temperatura ambiente e da temperatura de condensao do ar, considere que
tais grandezas sejam representadas, respectivamente, pelas variveis
aleatrias X e Y contnuas com distribuio conjunta f(X,Y). Nessa situao,
correto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da
temperatura de condensao do ar ser 9 oC igual a f(30,9).
Resoluo
Sejam X e Y variveis aleatrias contnuas. A figura a seguir mostra uma
funo densidade de probabilidade conjunta f(x,y).

0.15

0.1

0.05

0
2
0
-2
y

-3

-2

-1

A integral dupla de f(x,y) ao longo de uma regio R no plano xy (ex.:


a X b, c Y d ) fornece a probabilidade de (X,Y) assumir um valor em R
b d

P{( X , Y ) R} = P(a X b, c Y d ) = f ( x, y )dydx


a c

Essa integral dupla pode ser interpretada como o volume sob a superfcie
f(x,y) ao longo da regio R.

77
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Ora, se a regio R se resume a um ponto P = (x,y) do plano, no caso


(x=30,y=9}, temos que o resultado da integral dupla igual a zero, pois o
volume sob a superfcie f(x,y) nulo em um dado ponto do plano. Logo,
incorreto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da
temperatura de condensao do ar ser 9 oC igual a f(30,9). O valor f(30,9)
fornece a densidade de probabilidade conjunta no ponto (30,9). Item errado
GABARITO: E
2. Supondo que a probabilidade de no haver vaga no estacionamento de um
aeroporto dependa do fato de ter ocorrido mau tempo na cercania desse
aeroporto, correto afirmar que a probabilidade de no haver vaga no
estacionamento desse aeroporto, caso tenha ocorrido mau tempo na sua
cercania, igual a 1 menos a probabilidade de ter vaga no estacionamento do
referido aeroporto, caso no tenha ocorrido mau tempo em sua cercania.
Resoluo
Notao:

Probabilidade de NO haver vaga no estacionamento de um aeroporto


condicionada ao fato de ter ocorrido mau tempo na cercania desse
aeroporto: P(NVG|MT);

Probabilidade de haver vaga no estacionamento de um aeroporto


condicionada ao fato de ter ocorrido mau tempo na cercania desse
aeroporto: P(VG|MT);

Probabilidade de no haver vaga no estacionamento de um aeroporto


condicionada ao fato de NO ter ocorrido mau tempo na cercania desse
aeroporto: P(NVG|NMT);

Probabilidade de haver vaga no estacionamento de um aeroporto


condicionada ao fato de NO ter ocorrido mau tempo na cercania desse
aeroporto: P(VG|NMT);

correto afirmar que


P(NVG|MT) = 1 P(VG|NMT) ?
Sabemos que
P(VG|MT) + P(NVG|MT) = 1 P(NVG|MT) = 1 P(VG|MT)

P(VG|NMT) + P(NVG|NMT) = 1
O item errado, pois
78
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

P(NVG|MT) = 1 P(VG|MT) 1 P(VG|NMT)


GABARITO: E
3. Considere que o nmero de voos atrasados por ms em um aeroporto da
regio Sul seja explicado pela regresso Y = 15 + 5X + , ~ N(0, 2), em
que Y o nmero de voos atrasados no ms, X o nmero de horas que o
aeroporto permaneceu fechado por mau tempo no referido ms e uma
varivel aleatria com distribuio normal de mdia zero e varincia
desconhecida 2. Nesse caso, correto afirmar que o desvio padro de X ser
proporcional a 1/5 do desvio padro de Y.
Resoluo
O enunciado forneceu a equao da verdadeira reta de regresso:

E (Y | X ) = 1 + 2 X = 15 + 5 X
A estimativa da inclinao 2 dada pela frmula:

2 = r

Y
X

em que | r | 1 o coeficiente de correlao, Y e X so os desvios padro


amostrais de X e Y.
No necessrio estimar a inclinao, pois o seu valor verdadeiro j foi dado
pela questo: 2 = 5 . Ento,

2 = 5 = r

Y
X = r Y
5
X

Conclui-se que correto afirmar que o desvio padro dos valores de X ser
proporcional a 1/5 do desvio padro dos valores de Y (o coeficiente de
proporcionalidade o coeficiente de correlao).
GABARITO: C
(ANAC/Cespe-UnB/2012/Adaptada)
regresso, julgue os prximos itens.

Em

relao

aos

modelos

de

4. O modelo de regresso Yi = 0 + 1exp(Xi) + i, i ~ N(0, 2) um modelo


linear simples.
79
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Resoluo
preciso esclarecer o significado do termo "linear".
Linearidade nas Variveis
O primeiro significado de linearidade que a esperana condicional de Y dado
x uma funo linear de x, como por exemplo, no modelo
E(Y|x) = + x
em que a curva de regresso em funo de x uma reta.
Linearidade nos Parmetros
A segunda interpretao de linearidade que a esperana condicional de Y
dado x uma funo linear dos parmetros e ; isso pode ou no ser linear
na varivel X. Nesta interpretao,
E(Y|x) = + .exp(x)
um modelo de regresso linear simples.
De acordo com a segunda interpretao, o modelo de regresso Yi = 0 +
1exp(Xi) + i, i ~ N(0, 2) um modelo linear simples nos parmetros. Item
certo.
GABARITO: C
5. O grfico abaixo mostra o consumo de combustvel de aviao (em gales)
por milha nutica voada e o ajuste de uma reta a todos os pontos mostrados
via regresso linear. Sabendo-se que uma primeira regresso linear foi
realizada utilizando-se apenas os pontos com preenchimento e que a incluso
do ponto sem preenchimento levou a um considervel deslocamento dessa
reta, ento correto afirmar que esse ponto denomina-se ponto de inflexo.

80
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Resoluo
A literatura no reconhece a existncia dessa terminologia chamada "ponto de
inflexo" na regresso linear. Item errado. Sem maiores comentrios.
GABARITO: E
(ANAC/Cespe-UnB/2012/Adaptada) A respeito de modelos de regresso e
coeficientes de correlao, julgue os itens que se seguem.
6. A esperana condicional E(Y|X = k) = 0 + 1k3 +2 cos(k) representa um
modelo de regresso linear mltipla.
Resoluo
Um modelo de regresso que contenha mais de um regressor denominado
modelo de Regresso Linear Mltipla (RLM).
Por exemplo, suponha que a quantidade demandada (varivel dependente Y)
de um produto dependa do preo do produto (regressor X2) e da renda do
comprador (regressor X3). Um modelo de RLM que pode descrever essa relao

Yi = 0 + 1X2i + 2X3i + i = 0 + 1k3 +2cos(k) + i


em que 0, 1 e 2 so os parmetros do modelo e denota o termo de erro
aleatrio. Esse um modelo com dois regressores (X2 e X3). O termo linear
usado porque o modelo acima uma funo linear dos parmetros
desconhecidos 0, 1 e 2.
Deste modo, a esperana condicional E(Y|X = k) = 0 + 1k3 +2cos(k)
representa um modelo de regresso linear (nos parmetros) mltipla, haja
vista os parmetros 0, 1 e 2. Item certo.
81
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

GABARITO: C
7. Em um modelo linear simples, se o coeficiente de determinao for 0,81, o
desvio padro da varivel resposta for 1/3 do desvio padro da varivel
explicativa e a inclinao da reta de regresso for negativa, o coeficiente
estimado de inclinao dessa reta ser -0,30.
Resoluo
Dados: R2 = 0,81, Y = X/3, b = -0,3 (coeficiente estimado de inclinao da
reta de regresso).
Sabemos que R2 = r2. Ento, | r |= R 2 = 0,81 = 0,9 .
r=

s xy
sx s y

s xy
sx s x / 3

3s xy
s x2

O valor absoluto do coeficiente de correlao


| r |=

3 | s xy |

0,9 =

| s xy |

2
x

s x2

(pois a varincia uma quantidade positiva)

3 | s xy |

s x2
=| b |= 0,3

(lembre da frmula b =

s xy
s x2

O mdulo do coeficiente estimado de inclinao da reta 0,3. Como a


inclinao da reta de regresso negativa, ento b = -0,3. Item certo.
GABARITO: C
8. (BACEN - rea 3/FCC/2006) Sejam X e Y duas variveis aleatrias e
I.

E(X) e E(Y) as expectncias de X e Y, respectivamente;

II.

Var(X) e Var(Y) as varincias de X e Y, respectivamente;

III.

Cov(X,Y) a covarincia de X e Y.

Tem-se, em qualquer situao,


82
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

A) E(X).E(Y) = E(XY) Cov(X,Y)


B) Cov(X,Y) = Var(X).Var(Y)
C) E(2X+5) = 4E(X)
D) Se E(XY)=E(X).E(Y), ento X e Y so independentes.
E) Var(X+10) = Var(X)+10
Resoluo
Aprendemos que

Cov( X , Y ) = E[( X X )(Y Y )] = E[ XY ] XY


em que X = E[ X ] e Y = E[Y ] . Portanto, a alternativa correta a (A).
A alternativa (B) est errada porque no est de acordo com a definio de
covarincia.
A alternativa (C) no verdadeira, pois E(2X+5) = 2E(X) + 5.
A alternativa (D) incorreta porque E(XY)=E(X).E(Y) (variveis X e Y no
correlacionadas) no implica independncia (mas a recproca verdadeira, ou
seja, independncia implica a no correlao).
A alternativa (E) falsa porque Var(X+10) = Var(X).
GABARITO: A

9. (AFRF/ESAF/2009) Na anlise de regresso linear simples, as estimativas


e dos parmetros e da reta de regresso podem ser obtidas pelo
mtodo de Mnimos Quadrados.
Nesse caso, os valores dessas estimativas so obtidos atravs de uma amostra
de n pares de valores Xi Yi com (i =1, 2, ....,n), obtendo-se:

Y i= + X i , onde Y i a estimativa de Yi = + Xi. Para cada par de valores Xi


Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resduo aqui denotado
por ei entre a reta de regresso Yi e sua estimativa Y i . Sabe-se que o
Mtodo de Mnimos Quadrados consiste em adotar como estimativas dos
parmetros e os valores que minimizam a soma dos quadrados dos desvios
ei.
Desse modo, o Mtodo de Mnimos Quadrados consiste em minimizar a
expresso dada por:
n

A)

[Y ( X )]
i

i =1

83
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima
n

B)

[Y X ]
i

i =1
n

C)

[Y ( X )]
i

i =1
n

D)

[Y

2
Yi ]

( X i ) 2 ]

i =1
n

E)

[Y

i =1

Resoluo
A questo forneceu todas as informaes necessrias para a resoluo.
Pelo Mtodo dos Mnimos Quadrados temos que minimizar a soma dos
quadrados das diferenas entre os valores de Yi e as respectivas estimativas Y i
, por meio da reta de regresso. Logo teramos:

[Y Y ] = [Y ( + X )] = [Y X ]
n

i =1

i =1

i =1

Logo alternativa correta a B. O gabarito oficial preliminar indicou a


alternativa A, mas est errado.
GABARITO: B
(Inditas) O enunciado a seguir refere-se s questes de nmeros 10 e 11.
A funo densidade de probabilidade conjunta de duas variveis aleatrias
discretas dada pela tabela a seguir:

2
4
6

1
1/8
1/4
1/8

Y
3
1/24
1/4
1/24

9
1/12
0
1/12

10. A covarincia entre X e Y


A) 1
B) 3
C) 4
84
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

D) 12
E) 0
Resoluo
A covarincia entre as variveis aleatrias discretas X e Y dada pela
expresso
Cov( X , Y ) = [ xi X ][ y j Y ] f ( xi , y j ) .
i

Antes, preciso calcular os valores das mdias X = E[ X ] e Y = E[Y ] .


X = E[ X ] = xi g X ( xi ) , em que gX(x) a funo de probabilidade marginal de X,
i

dada por
g X ( xi ) = f ( xi , y j ) . Logo
j

1 1
1 1
1
1 1
g X ( x = 2) = g X ( x = 6) = +
+ = e g X ( x = 4) = + + 0 = .
8 24 12 4
2
4 4
1
1
1
E[ X ] = X = 2 + 4 + 6 = 4
4
2
4
E[Y ] = yhY ( y j ) , em que hY(y) a funo de probabilidade marginal de Y, dada
j

por
hY ( y j ) = f ( xi , y j ) . Logo
i

1 1 1 1
1 1 1 1
1
1 1
hY ( y = 1) = + + = , hY ( y = 3) =
+ +
= e hY ( y = 9) = + 0 + = .
8 4 8 2
24 4 24 3
12
12 6
1
1
1
E[Y ] = Y = 1 + 3 + 9 = 3
2
3
6
Agora j podemos calcular a covarincia, pois temos os valores de X e Y .
Sendo assim,

Cov(X,Y ) = [x i X ][y j Y ] f (x i , y j ) =
i

= (2 4) (1 3) 1 / 8 + (2 4) (3 3) 1 / 24 + (2 4) (9 3) 1 / 12 +
85

www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

+ (4 4) (1 3) 1 / 4 + (4 4) (3 3) 1 / 4 + (4 4) (9 3) 0 +
+ (6 4) (1 3) 1 / 8 + (6 4) (3 3) 1 / 24 + (6 4) (9 3) 1 / 12 =
Cov( X , Y ) = 1 / 2 + 0 1 + 0 + 0 + 0 1 / 2 + 0 + 1 = 0
Logo, X e Y so variveis no correlacionadas.
Voc tambm chegaria ao mesmo resultado se usasse a frmula equivalente

Cov( X , Y ) = E[ XY ] XY
Confirme voc mesmo que E[ XY ] = 12 . Portanto,

Cov( X , Y ) = 12 4 3 = 0
GABARITO: E
11. Assinale a alternativa correta.
A) X e Y no so independentes.
B) X e Y so independentes.
C) X e Y so correlacionadas.
D) X e Y tm distribuio conjuntamente normal.
E) X e Y tm distribuies marginais normais.
Resoluo
Anlise das alternativas:
(A) Se X e Y so independentes, deve valer
f ( xi , y j ) = g X ( xi ) hY ( y j ) para quaisquer valores de X e Y.

Entretanto, observe que

f XY (2,3) =

1
1 1 1
g X (2) hY (3) = =
24
4 3 12

Logo, X e Y no so independentes, apesar de serem no correlacionadas


alternativa CORRETA.
(B) Alternativa INCORRETA, haja vista o explicado acima.
86
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(C) Alternativa INCORRETA, pois X e Y so no correlacionadas.


(D) Nada se pode afirmar sobre a distribuio conjunta de X e Y alternativa
INCORRETA.
(E) Nada se pode afirmar sobre as distribuies marginais de X e Y
alternativa INCORRETA.
GABARITO: A
(Inditas) O enunciado a seguir refere-se s questes de nmeros 12 e 13.
Considere as variveis aleatrias independentes X 1 , X 2 ,..., X n . Suponha que
essas n variveis possuam a mesma distribuio de probabilidades com mdia
e varincia 2 . Seja
n

X=

1
X .
n i =1 i

12. Podemos afirmar que o valor esperado de X igual a


A) / 2

B) 2
C)
D) 2 / .
E) 0
Resoluo

1
1
E[X ] = E (X1 + X 2 + ...+ X n ) = (E[X1 ] + E[X 2 ] + ...+ E[X n ])
n
n
1
n
= ( + + ...+ ) =
=
n
n

GABARITO: C

13. Podemos afirmar que a varincia de X


A) / 2
B) 2 / n
C) n 2
87
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

D) 2 /
E) 0
Resoluo

1
1
1
2
var(X ) = var (X1 + X 2 + ...+ X n ) = 2 var(X1)+ var(X 2 )+ ...+ var(X n ) = 2 n 2 =
n
n
n
n

Observao: os resultados obtidos nas questes 12 e 13 so conseqncia da


Lei (fraca) dos Grandes Nmeros. Por exemplo,
assuma que voc tenha
registrado o conjunto de observaes {x 1 , x 2 ,..., x n } de uma varivel aleatria X
com mdia (desconhecida) e varincia 2 (tambm desconhecida). Suponha
que n seja um nmero suficientemente grande. Ento a mdia pode ser
estimada pela mdia amostral
n

x=

1
x .
n i =1 i

n
1
As questes 12 e 13 mostram que o estimador X = X i no viesado (
n i =1

E[X ] = ) e consistente ( var(X ) 0 para n ). Essas so duas qualidades


desejadas para qualquer estimador (este assunto ser visto com detalhes em
aula posterior).

GABARITO: B

14. (BACEN - rea 3/FCC/2006) Uma empresa, com a finalidade de


determinar a relao entre os gastos anuais com propaganda (X), em R$ 1
000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o modelo
linear simples Yi = + X i + i , em que Yi o valor do lucro bruto auferido no
ano i, X i o valor gasto com propaganda no ano i e i o erro aleatrio com as
respectivas hipteses consideradas para a regresso linear simples ( e so
parmetros desconhecidos).
Considerou, para o estudo, as seguintes
observaes nos ltimos 10 anos da empresa:
10

10

= 100

i =1

referentes

10

X Y

= 60

i i

i =1

10

informaes

= 650

i =1

10

X 2i = 400

i =1

i =1

2
i

= 1.080

88
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previso
do lucro bruto anual, em mil reais, ser de
A) 84
B) 102,5
C) 121
D) 128,4
E) 158
Resoluo
1

S xy = xi yi xi yi ,
n i i
i

1
S xx = xi xi
n i
i

S xy

b=

S xx
a = y bx
Fazendo os clculos, temos que

S xy = 650

60 100
= 50
10

S xx = 400

60 2
= 40
10

Logo,
50

= 1,25
b=

40

60
100
a = y bx =
1,25
= 10 7,5 = 2,5
10
10

A equao da reta de mnimos quadrados


y = 2,5 +1,25x .

Substituindo o valor x = 80 na equao acima obtemos

89
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

y = 2,5 +1,25 80 = 2,5 +100 = 102,5 .

GABARITO: B

15. (INDITA) Considere os dados da questo 14. O coeficiente de correlao


de
A) 0
B) 2,5
C) 1,25
D) 0,88
E) 0,63
Resoluo

r=

S xy
S xx S yy
2

S yy

r=

100 2
1

= y i y i = 1.080
= 80
10
n i
i

50
0,88
40 80

GABARITO: D
16. (ICMS-RJ/FGV/2008) Sejam X, Y e Z trs variveis com correlaes de
Pearson expressas pela matriz abaixo:

X
Y
Z

X
1,000
0,800
0,000

1,000
-0,500

1,000

Pode-se, ento, afirmar que:


A) X e Z so independentes.
B) a correlao parcial entre X e Y, aps a correo para Z, negativa.
C) o coeficiente de determinao da regresso de Y em X maior do que 60%.
D) a correlao entre V = a + b.X e W = c + d.Z, com a 0, c 0, b>0 e d<0
negativa.
90
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

E) a covarincia entre X e Y igual a 0,64.


Resoluo
Anlise das alternativas:
(A) X e Z so independentes.
A tabela indica que X e Z so no correlacionadas, pois RXZ = 0. Contudo, a
no correlao no implica independncia alternativa INCORRETA.
(B) a correlao parcial entre X e Y, aps a correo para Z, negativa.
A tabela indica que a correlao ente X e Y igual a 0,8 (positiva)
alternativa INCORRETA.
(C) o coeficiente de determinao da regresso de Y em X maior do que
60%.
A tabela indica que a correlao ente X e Y R = 0,8. Logo o coeficiente de
determinao R2 = 0,82 = 0,64 = 64% (maior do que 60%) alternativa
CORRETA.
(D) a correlao entre V = a + b.X e W = c + d.Z, com a 0, c 0, b>0 e
d<0 negativa.
Note que V e W so funes lineares de X e Z, respectivamente. Se a
correlao entre X e Z nula, ento a correlao entre V e W tambm nula
alternativa INCORRETA.
(E) a covarincia entre X e Y igual a 0,64.
Aprendemos que R = sxy /( s x s y ) , em que sxy a covarincia amostral entre X e Y,
sx denota o desvio-padro amostral de X e sy denota o desvio-padro amostral
de Y. Como no foram dados os valores de sx e de sy, nada se pode afirmar
sobre o valor da covarincia entre X e Y alternativa INCORRETA.
GABARITO: C
17. (ICMS-RJ/FGV/2009) Utilizando uma anlise de regresso linear
simples, um pesquisador obteve um ajuste Y = a1X + b1 e um coeficiente de
determinao R12 . Um segundo pesquisador analisou os mesmos dados, mas
antes aplicou a cada observao de Y a transformao Y = 10Y + 100, obtendo
um outro ajuste Y = a2X + b2, com um coeficiente de determinao R22 . Considere
91
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

as afirmativas abaixo, relativas comparao entre os valores obtidos nas


duas anlises:
I.

a2 = 10a1 ;

II.

b2 = b1 + 100;

III.

R22 = R12 .

Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente as afirmativas I e II forem verdadeiras.
C) se somente as afirmativas I e III forem verdadeiras.
D) se somente as afirmativas II e II forem verdadeiras.
E) se todas as afirmativas forem verdadeiras.
Resoluo

Y = a1 X + b1 Y ' = 10Y +100 = 10(a1 X + b1 ) +100 = (10a1)X + (10b1 +100) = a2 X + b2


Logo, a2 = 10a1 e b2 = 10b1 + 100 .

Anlise das afirmativas:

(I) VERDADEIRA, pois a2 = 10a1 , conforme demonstrado acima.


(II) FALSA, dado que b2 = 10b1 + 100 .
(III) Dados:
- ajuste y = a1x + b1 implica um coeficiente de determinao R12 ;
- aplicao da transformao linear y, = 10y + 100 resulta no coeficiente de
determinao R22 .
Vimos que a correlao amostral r dada por
r=

s xy
sx s y

e que r2 = R2.
Ento,
92
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

r1 =

r1 =

s xy
sx s y

1
1
( xi x )( yi y )

( xi x )( yi y )
n
n
=
2
1
1
2
2
1

2
2

x
x
y
y
(
)
(
)
i
i
( xi x ) ( yi y )
n
n
n

1
( xi x )( yi y )
n

1
n

( ( x x ) )( ( y

y)2

( x x )( y y )
( ( x x ) )( ( y y ) )

)(

e
r2 =

( x x )( y E[ y ])
( ( x x ) )( ( y E[ y ]) )
,
i

,
i

em que E [ y , ] = E [10 y + 100] = E [10 y ] + E [100] = 10 E [ y ] + 100 = 10 y + 100.


E [ y , ] = 10 y + 100 na expresso acima, obtemos

r2 =

( x x )(10 y + 100 10 y 100)


( x x )(10 y 10 y )
=
=
( ( x x ) )( (10 y + 100 10 y 100) ) ( ( x x ) )( (10 y 10 y ) )
i

10( x

y)2

( x x )( y y )
=r
( ( x x ) )( ( y y ) )

x )( yi y )

( ( x x ) )(100( y
i

r2 =

r2 =

Substituindo

10 ( xi x )( yi y )

100 ( xi x ) 2

)( ( y

y)2

10 ( xi x )( yi y )

=
10

( ( x x ) )( ( y
2

y)2

R22 = R12

Conclui-se que a transformao linear Y = 10Y + 100 no altera a qualidade da


regresso original Y = a1X + b1, uma vez que R22 = R12 . Portanto, a assertiva (III)
VERDADEIRA.
GABARITO: C

18. (Indita) Seja a funo densidade de probabilidade f ( x) = 2 x para 0 x 1


e f ( x) = 0 para os demais valores de x. Suponha que X1 e X2 sejam variveis
aleatrias independentes, cada uma delas com a funo densidade de
probabilidade f(x). Ento podemos afirmar que a funo densidade de
probabilidade conjunta f(x1,x2)
A) f ( x1 , x 2 ) = 4 x1 x 2 .
93
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

B) f ( x1 , x2 ) = x1 x2 / 4 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.


C) f ( x1 , x2 ) = x1 x2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.
D) f ( x1 , x 2 ) = 4 x1 x 2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.
E) f ( x1 , x2 ) = 4 x1 / x2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio
Resoluo
Como x1 e x2 so independentes temos que f ( x1 , x2 ) = f ( x1 ) f ( x2 ) . Sabemos
que para i= 1,2:

f ( xi ) = 2 xi para 0 xi 1 e f ( xi ) = 0 para os demais valores de xi.


Logo,

f ( x1 , x 2 ) = 4 x1 x 2 para 0 x1 1 e 0 x2 1 , e f ( x1 , x2 ) = 0 caso contrrio.


GABARITO: D
19. (Fiscal de Rendas do Municpio do RJ/ESAF/2010) A partir de uma
amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
22

22

= 440

i =1

22

(X

= 286

i =1
22

(Y Y )
i

X ) 2 = 850 ,

i =1
22

= 1.690

i =1

(X

X )(Yi Y ) = 1.105

i =1

Obtenha a reta de regresso linear de Y em X.

A) Yi = 13 + 0,65 X i
B) Y = 13 + 1,3 X
i

C) Yi = 20 + 0,65 X i
D) Yi = 20 + 2 X i
E) Y = 13 + 1,3X
i

Resoluo
Modelo de regresso linear simples:
Y = + X + ,
94
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

em que o intercepto, a declividade e denota a componente aleatria


da variao de Y ( uma varivel aleatria).
Y = a + bX (reta estimativa),
em que Y denota os valores dados pela reta estimativa, a a estimativa do
parmetro , e b a estimativa do parmetro .

b = S xy = s xy = cov.amostral/(desvio padro amostral de X)2

S xx
s x2
a = y bx = mdia de Y menos (declividade x mdia de X)

Dados:
22

- cov. amostral = sxy =

1
1.105
(X i X )(Yi Y ) =

n i =1
n
22

- (desvio padro amostral de X)2 = sx2 =

1
850
(X i X ) 2 =

n i =1
n

22

1
286
- mdia de Y = Y = Yi =
= 13
n i =1
22
22
440
1
- mdia de X = X = X i =
= 20
n i =1
22

Logo,
1.105
sxy
1.105
n
1.105
b= 2 = n =

=
= 1,3
850
n
850
850
sx
n
a = y bx = 13 1,3 20 = 13 26 = 13

Reta estimativa: Y = a + bX i = 13 + 1,3X i (opo E).

GABARITO: E

de Rendas do Municpio do RJ/ESAF/2010) Com os dados da


20. (Fiscal
questo anterior, calcule o valor mais prximo do coeficiente de determinao
R2 da regresso linear de X em Y.
A) 0,65
B) 0,81
C) 0,85
D) 0,91
95
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

E) 0,88
Resoluo
Nunca podemos esquecer os conceitos fundamentais. Lembre que a
correlao entre as variveis aleatrias X e Y, denotada por (X,Y), dada
por:

( X ,Y ) =

Cov( X , Y )

XY

= covarincia/(desvio padro de X . desvio padro de Y)

O mdulo da correlao sempre menor ou igual a 1: -1 (X,Y) 1.


A correlao amostral ou coeficiente de correlao linear de Pearson (r)
o estimador da correlao (X,Y), sendo dada por:
r = cov. amostral/(desv. padro amostral de X . desv. padro amostral de Y)
ou

r=

s xy
sx s y

1 22
( X i X )(Yi Y )
n i=1
=
1 22
1 22
1
2
2
(Xi X )
(Yi Y )

n
n i =1
n i=1

22

r=

(X

X )(Yi Y )
=

i =1

22

(X

X )2

i =1

22

(Y Y )

1 22
( X i X )(Yi Y )
n i=1
22

(X
i =1

X )2

22

(Y Y )

i =1

1.105
1.105
=
= 0,92
850 1.690 29,15 41,11

i =1

r 2 = R 2 = 0,92 2 = 0,85 .
NOTA: no confunda correlao amostral r com correlao (X,Y)! A primeira
uma estimativa da segunda. A correlao um momento estatstico. S
conseguimos calcular a correlao (X,Y) quando conhecemos a distribuio
conjunta de probabilidade de X e Y, ou seja, quando sabemos quem a funo
f(X,Y).
GABARITO: C
21. (IBGE/Cesgranrio/2010) Ajustou-se um modelo de regresso linear
simples a dados provenientes de alguns experimentos executados por um
fabricante de concreto, com o objetivo de determinar de que forma e em que
96
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

medida a dureza de um lote de concreto depende da quantidade de cimento


usada para faz-lo. Quarenta lotes de concreto foram feitos com quantidades
diferentes de cimento na mistura, e a dureza de cada lote foi medida aps sete
dias. Sabendo-se que
n

SQR = Yi Y

= 5.275,2

i =1

SQE = Yi Yi

= 366,6

i =1

o coeficiente de determinao , aproximadamente,


A) 0
B) 0,064
C) 0,5
D) 0,94
E) 14,38
Resoluo
R2 = 1 - SQE/SQT
em que SQE a variao residual (soma dos quadrados dos erros) e SQT a
variao total (soma dos quadrados total). Vimos que
SQT = SQE + SQR = 366,6 + 5.275,2 = 5.641,8
Logo,
R2 = 1 - 366,6/5.641,8 0,94
GABARITO: D
22. (IBGE/Cesgranrio/2010/Adaptada) Dentre os itens abaixo, identifique
as premissas bsicas para o modelo de regresso.
I. Linearidade do fenmeno medido
II. Varincia no constante dos termos de erro (heterocedasticidade)
III. Normalidade dos erros
IV. Erros correlacionados
V. A covarincia entre dois erros aleatrios distintos no nula.
So premissas APENAS os itens
A) I e III.
97
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

B) II e III.
C) I, III e IV.
D) I, III e V.
E) I, II, III e V.
Resoluo
Anlise dos itens:
I) Premissa verdadeira, pois parte-se do princpio de que a relao entre as
variveis independente e dependente linear.
II) Falsa. A varincia
(homocedasticidade).

dos

termos

de

erro

deve

ser

constante

III) Verdadeira. Assumimos que os erros aleatrios so bem modelados pela


distribuio normal.
IV) Falsa. A covarincia entre erros distintos deve ser nula e isto implica que
os erros no devem ser correlacionados.
V) Falsa, conforme explicado acima.
GABARITO: A
23. (IBGE/Cesgranrio/2010) Sejam X1, X2, X3 variveis aleatrias
independentes, todas com mdia 100 e varincia 100. O valor esperado e a
X 2X 2 + X 3
varincia de Z = 1
so, respectivamente,
4
A) 100 e 100.
B) 100
e 75/2.
C) 100 e 25/2.
D) 0 e 75/2.
E) 0 e 25/2.
Resoluo
Valor esperado de Z:

X 2X2 + X3 1
1
E (Z ) = E 1
E (X1 2 X 2 + X 3 ) = {E ( X1 ) 2 E ( X 2 ) + E ( X 3 )}
=

4
4
4

98
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

E(Z) =

100 200 +100


=0
4

Varincia de Z:

X 2 X2 + X3 1
Var( Z ) = Var 1
= 2 {Var( X1 ) + (2) 2 Var( X 2 ) + Var( X 3 )}
4

4
Var ( Z ) =

1
{Var ( X 1 ) + 4Var ( X 2 ) + Var( X 3 )} = 1 (100 + 400 + 100) = 600 = 75
16
16
16
2

Resultados: Valor Esperado = 0, Varincia = 75/2


GABARITO: D
24. (ICMS-RJ/FGV/2011) A tabela abaixo mostra os valores de duas
variveis, X e Y.
X
4
4
3
2

Y
4,5
5
5
5,5

Sabe-se que

X = 13
Y = 20
X Y = 64
X = 45
( X ) = 169
2

O valor de b na regresso simples Y = a + bX


A) 11/5
B) -3/8
C) -4/11
D) -4/17
E) -11/65
Resoluo
99
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

O valor de b na regresso simples dado por


b=

S xy
S xx

b = soma dos produtos soma dos quadrados de X

Lembre que
S xy = XY

( X ) ( Y )
n

( X )

S xx = X

A tabela tem n = 4 pares de dados (X,Y). Agora podemos efetuar as contas:

S xy = 64

260 256 260 4


13 20
= 64
=
=
4
4
4
4

S xx = 45

13 2
169 180 169 11
= 45
=
=
4
4
4
4

b=

S xy
S xx

4
4 4
4
= 4 =
=
11
4 11
11
4

GABARITO: C
25. (ICMS-RJ/FGV/2011) Para duas variveis populacionais, X e Y, o
desvio-padro de X 40, o desvio-padro de Y 20 e a covarincia entre Y e X
100. Assim, o coeficiente de correlao entre X e Y
A) 0,5.
B) 2
C) -0,25
D) -0,125
E) 0,125
Resoluo
Questo imediata. Sabemos que
100
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

( X ,Y ) =

cov( X , Y )

XY

em que (X,Y) denota o coeficiente de correlao entre X e Y, cov(X,Y) a


covarincia entre X e Y, X o desvio padro de X e Y o desvio padro de Y.
Portanto,

( X ,Y ) =

100
1
= = 0,125
40 20
8

GABARITO: D
26. (Economista-CODEBA/FGV/2010) Sejam
aleatrias para uma amostra de tamanho N.

X 1 , X 2 , X 3 ,..., X N

variveis

Defina a Mdia amostral ( X ) como:


X =

X 1 + X 2 + X 3 + ... + X N
N

Sabendo que E ( X i ) = e VAR ( X i ) = 2 , avalie as afirmativas abaixo:


I. O valor esperado da mdia amostral E ( X ) = .

2
.
N
N

N
III. O valor esperado de X i , igual a E X i = N
i =1
i =1
Assinale

II. A varincia da mdia amostral VAR ( X ) =

A) se apenas as afirmativas I e II estiverem corretas.


B) se apenas as afirmativas I e III estiverem corretas.
C) se apenas as afirmativas II e III estiverem corretas.
D) se todas as afirmativas estiverem corretas.
E) se nenhuma das afirmativas estiver correta.
Resoluo
Apesar de o enunciado ter sido omisso quanto independncia das variveis
aleatrias X 1 , X 2 , X 3 ,..., X N , razovel assumir que elas sejam independentes
(*).
Vimos que

101
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

N
1
1
1
E[ X ] = E ( X 1 + X 2 + ... + X n ) = (E[ X 1 ] + E[ X 2 ] + ... + E[ X n ]) = ( + + ... + ) =
=
N
N
N
N

afirmativa I est correta.


1
1
2
1

var(X ) = var ( X 1 + X 2 + ... + X n ) = 2 (var( X 1 ) + var( X 2 ) + ... + var( X n )) = 2 N 2 =


N
N
N
N
afirmativa II est correta.

Alm disso,
E[ X i ] = E[NX ] = NE[X ] = N
N

i =1

afirmativa III est correta.

(*) Entendemos que o enunciado no preciso, haja vista que as observaes


de uma amostra nem sempre so independentes. Por exemplo, isso ocorre em
algumas sries financeiras do mundo real, em que as amostras podem
apresentar um alto grau de correlao.
GABARITO: D
27. (INEP/Cesgranrio/2008) Considere as informaes apresentadas a
seguir sobre Ensino Mdio.

102
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

As concluses a seguir podem ser tiradas a partir do grfico.


I Na unidade da federao com melhor desempenho mdio os alunos
demoram, em mdia, 1,4 anos para a concluso de uma srie do Ensino
Mdio.
II O desempenho mdio nas unidades da federao diretamente
proporcional ao tempo mdio para concluso de uma srie do Ensino Mdio.
III A moda dos tempos mdios para a concluso de uma srie do Ensino
Mdio 1,3 anos.
IV Os estados de So Paulo, Santa Catarina e Esprito Santo apresentaram o
pior desempenho nessa edio do Saeb.
So corretas APENAS as concluses
A) I e III
B) I e IV
C) II e III
D) II e IV
E) I, II e IV
Resoluo
Anlise das concluses:
103
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

I O diagrama de disperso mostra que a unidade da federao com o melhor


desempenho mdia o Distrito Federal (DF), pois possui a maior mdia da
nota padronizada (= 5,4). O tempo mdio para concluso de uma srie do
ensino mdio (em anos) no DF 1,40. Portanto, esta concluso correta.
II Se o desempenho mdio nas unidades da federao (varivel N) fosse
diretamente proporcional ao tempo mdio para concluso de uma srie do
Ensino Mdio (varivel T), os pontos do diagrama de disperso estariam
agrupados em torno de uma reta com inclinao positiva, como na figura a
seguir (*). Mas os pontos do diagrama de disperso esto espalhados,
sugerindo que as variveis N e T no possuem correlao linear positiva. Logo,
a concluso errada.
2.2
2.15
2.1
2.05
2
1.95
1.9
1.85
1.8
1.75
1.6

1.65

1.7

1.75

1.8

1.85

1.9

1.95

(*) A figura acima no representa a regresso linear dos dados desta questo.
Trata-se de outro exemplo, o qual ser descrito a seguir. Considere o
experimento aleatrio hipottico ilustrado pela figura acima, em que a varivel
explicativa a estatura do pai (em metros) e a varivel dependente a
estatura do filho (em metros). Essa figura mostra trs distribuies da estatura
do filho correspondentes a valores fixos de estatura do pai (1,70 m, 1,80 m e
1,90 m). Note que a uma dada altura do pai corresponde uma populao
(distribuio) com cinco possveis estaturas para o filho. A reta de regresso
na figura (linha tracejada) sugere que a estatura mdia do filho tende a
aumentar quando aumenta a estatura do pai. Portanto, a regresso linear
permite que o valor mdio da varivel dependente (estatura do filho) seja
estimado por meio dos valores observados das estaturas dos pais (varivel
explicativa).
III O diagrama indica que
104
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

T = 1,20 para 5 estados (SP, SC, ES, RR e TO);

T = 1,30 para 13 estados (MG, PR, RJ, GO, AC, SE, PB, PE, PA, CE, AL,
MA e RN);

T = 1,40 para 7 estados (DF, RS, MT, RO, AP, BA e PI); e

T = 1,50 para 2 estados (MS e AM).

A moda corresponde ao valor de maior frequncia, ou seja, T = 1,30. Esta


concluso correta.
IV A concluso errada. Observe, por exemplo, que o desempenho do R. G.
do Norte pior que o de So Paulo.
GABARITO: A
28. (INEP/Cesgranrio/2008) Considere as afirmaes a seguir a respeito
do Coeficiente de Correlao (r) de Pearson entre duas variveis.
I - Se r=1, as observaes esto todas sobre uma linha reta no diagrama de
disperso.
II - Se r > 0, a varivel independente aumenta quando a varivel dependente
aumenta.
III - Se r < 0, a varivel independente decresce quando a varivel dependente
decresce.
IV- Se r=0, no existe relao entre as duas variveis.
So corretas APENAS as afirmaes
A) I e II
B) I e III
C) II e III
D) II e IV
E) III e IV
Resoluo
Duas variveis esto relacionadas, ou seja, h correlao entre elas, quando
as alteraes sofridas por uma das variveis so acompanhadas por alteraes
proporcionais na outra varivel.
O diagrama de disperso um grfico cartesiano em que cada um dos
eixos corresponde s variveis. A varivel dependente (y) situa-se no eixo
vertical (ordenadas). A varivel independente situa-se no eixo horizontal
105
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

(abcissas). Na figura a seguir, a despesa a varivel dependente (y) e o PIB


a varivel independente (x).

A linha de tendncia obtida aps a distribuio dos pares ordenados (x, y) no


grfico (veja a prxima figura).

A linha de tendncia (ou curva mdia) a curva que melhor se ajusta,


segundo algum critrio, distribuio dos pontos.
106
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

Diz-se que as variveis no so correlacionadas (r = 0) quando no


possvel ajustar uma linha de tendncia, como exemplificado pela figura a
seguir.
4

-1

-2

-3
-4

-3

-2

-1

Se a linha de tendncia for uma reta (como no diagrama despesa x PIB),


ento x e y tm correlao linear.
A linha de tendncia tambm pode ser uma linha curva (vide figura a seguir).
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
2000

2500

3000

3500

4000

4500

Anlise das afirmaes:


I Verdadeira. Se r = 1, a correlao perfeita e todas as observaes esto
sobre uma linha reta no diagrama de disperso.
107
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

II - Verdadeira. Se r > 0, a varivel independente aumenta quando a varivel


dependente aumenta
III Falsa. Se r < 0, a varivel independente decresce quando a varivel
dependente aumenta.
IV Falsa. Se r = 0, no existe correlao linear entre as duas variveis. Ou
seja, r = 0 indica que no possvel ajustar uma reta a um dado diagrama de
disperso. Mas pode haver uma forte correlao no linear, cujos dados
resultem r = 0.
GABARITO: A
29. (INEP/Cesgranrio/2008) Utilizando-se do Mtodo dos Mnimos
Quadrados, a seguinte reta de regresso foi estimada para o desempenho de
um conjunto de candidatos em determinado exame de proficincia, em funo
do nmero mdio de horas de estudo, por dia, para preparao antes da
prova:
Yestt = 249 + 2,02 X
Considerando o modelo ajustado conclui-se que o(a)
A) coeficiente de correlao entre as variveis prximo de 1.
B) coeficiente de determinao de 100%.
C) intercepto tem um efeito muito maior em Y do que a inclinao.
D) relao entre X e Y no linear.
E) variao de uma unidade em X acarreta a variao em Y de 2,02.
Resoluo
Anlise das alternativas:
A) O coeficiente de correlao (linear) r entre X e Y pode ser calculado pela
frmula

r=

S xy
S xx S yy

em que as somas de quadrados so dadas por


1

S xy = X iYi X i Yi
n i
i
i
108
www.pontodosconcursos.com.br | Prof. Alexandre Lima

Conhecimentos Especficos Mtodos Quantitativos Anatel


Aula 04 Varivel Aleatria Bivariada
Prof. Alexandre Lima

1
S xx = X X i
n i
i

2
i

1
S yy = Yi Yi
n i
i

e n denota o nmero de pontos do diagrama de disperso. Note que os dados


para o clculo de r no foram fornecidos. Logo, no se pode afirmar que
coeficiente de correlao entre as variveis prximo de 1.
B) O coeficiente de determinao dado pelo quadrado do coeficiente de
correlao linear r, ou seja, igual a r2 (*). Conforme explicado acima, os
dados para o clculo de r2 no foram fornecidos. Deste modo, nada se pode
afirmar com relao ao valor do coeficiente de determinao.
(*) Neste curso, temos usado com maior frequncia a notao R2 para o
coeficiente de determinao.
C) O intercepto o ponto onde a reta de regresso intercepta o eixo y. Afirmar
que o intercepto tem um efeito muito maior em Y do que a inclinao no faz
nenhum sentido.
D) Se foi possvel estimar a relao de associao linear entre X e Y
Yestt = 249 + 2,02.X
pelo mtodo dos mnimos quadrados, ento a afirmao a relao entre X e Y
no linear errada.
E) De acordo com a reta estimada (Yestt = 249 + 2,02.X), a variao de uma
unidade em X acarreta a variao em Y de 2,02 unidades. Para verificar que
isso verdade, faa X1 = 0 na equao da reta. Voc obtm Y1 = 249. Agora
faa X2 = 1. Voc obtm Y2 = 251,02. Repare que Y2 Y1 = 251,2 249 =
2,02.
GABARITO: E
Bom estudo e at a prxima aula.
Alexandre Lima
alexandre@pontodosconcursos.com.br

109
www.pontodosconcursos.com.br | Prof. Alexandre Lima

You might also like