Professional Documents
Culture Documents
1. REGRESSO LINEAR
= + +
O modelo era:
Na aula de hoje veremos um modelo em que h mais de uma varivel independente. A ideia
geral do modelo exatamente a mesma da aula passada. S muda um pouco a matemtica
envolvida, pois agora temos que lidar com mais variveis. Para dar conta disso, temos que
usar equaes envolvendo matrizes.
=
+ + +
Nosso modelo com 2 variveis assim:
=
+ +
Os valores estimados de Y ficam:
=
O desvio a diferena entre o verdadeiro valor de Y e sua estimativa:
No mtodo dos mnimos quadrados, queremos minimizar a soma dos quadrados dos
desvios:
=
Para obter os estimadores que minimizam a soma dos quadrados dos desvios, a gente
deriva em relao a cada estimador, e iguala a zero.
Derivando em relao a
:
2
1 = 0
"
= 0
"
+ + = I
Derivando em relao a :
2
= 0
+
+ + = 0
=
+ + II
Derivando em relao a :
2
= 0
+
+ + = 0
=
+ + III
A matriz y ir designar os n valores de Y:
' +
.
$=& *
&.*
.
% )
A matriz representa os parmetros desconhecidos:
= - .
A matriz representa os erros aleatrios:
'.+
=& . *
& *
.
% )
A matriz / representa as variveis independentes:
1
' 1 +
/ = & 1 0 0 *
. . .
% 1 )
$ = / + 1
Da que nosso modelo de regresso fica assim:
Para cada valor de i, estamos em um elemento amostral. Ou seja, para cada valor de i,
=
+ + +
teremos:
Agora observem que a matriz / multiplica . Para qualquer linha que olharmos,
, que
um dos elementos de , sempre deve ser multiplicado por 1. Vejam em vermelho:
= 2
+ + +
E, na obteno da linha i, quem que multiplica
?
Quem faz isso o elemento de / que ocupa a primeira posio da linha i.
Certo?
3 = - .
E seja $4 a matriz dos estimadores de Y:
' +
$4 = & . *
&.*
.
% )
Finalmente, seja 5 a matriz dos estimadores dos desvios:
5
5
'.+
5=& . *
& *
.
%5 )
$4 = /3
A equao que relaciona tais matrizes :
5 = $ $4
Os desvios correspondem s diferenas entre os valores de Y e suas estimativas:
5 = $ /3
5 75
A soma dos quadrados dos desvios fica:
$ /37 $ /3
Onde a linha representa a matriz transposta.
= $ 7 3 7 / 7 $ /3
= $ 7 $ $ 7 /3 3 7 / 7 $ + 3 7 / 7 /3
Agora notem que $ 7 /3 transposta da matriz 3 7 / 7 $
$ 7 : matriz 1 x n
Vamos analisar o primeiro produto.
/: matriz n x 3
Logo, o produto $/ ser uma matriz 1 x 3
$/: matriz 1 x 3
Continuando:
3: matriz 3 x 1
Logo, o produto $/3 ser uma matriz 1 x 1. Ou seja, ser um nmero real.
Com uma anlise similar, descobrimos que 3 7 / 7 $ tambm um nmero real.
Logo: $ 7 /3 = 3 7 / 7 $
Oras, duas matrizes 1 x1 em que uma a transposta da outra so iguais entre si.
= $ 7 $ 23 7 / 7 $ + 3 7 / 7 /3
Assim, a soma dos quadrados dos desvios fica:
/: matriz 3 x n
:3 7 / 7 : matriz 1 x n
O produto das duas matrizes acima, ento ser 1 x n. Continuando:
/: matriz n x 3
2:3 7 / 7 $ + 2:3 7 / 7 /3 = 0
:3 7 / 7 $ / 7 /3 = 0
/ 7 $ / 7 /3 = 0
Logo:
/ 7 $ = / 7 /3
Que exatamente o mesmo sistema de equaes que obtivemos antes.
Vamos checar?
Reescrevendo as matrizes:
1
1 1 1 1 ' + 1 1 1 1
. 1
- . & * = - . < = - .
&.*
. 1
% )
Vamos testar?
Trabalhando com a primeira linha:
= "
+ +
Que exatamente a primeira equao do sistema a que chegamos.
A grande vantagem do sistema matricial
/ 7 $ = / 7 /3
Muito bem. Agora precisamos resolver o sistema. Para tanto, isolamos a matriz 3. Basta
que ele vale para qualquer nmero de variveis independentes.
3 = / 7 /> / 7 $
Estimadores de mnimos quadrados na regresso mltipla
? = @
+ @A + @
mnimo quadrado so dadas por:
( ) ? = @
" + @ + @
( ) ? = @
+ @ + @
( ) ? = @
+ @ + @
Indicando por V - Verdadeiro e F - Falso, temos a opo correta como sendo:
a) V, F, F
b) V, V, F
c) V, F, V
d) F, V, F
e) F, F, V
Resoluo
Esta questo cobra exatamente o que fizemos na parte terica da aula. O resultado que
= "
+ + I
obtivemos foi:
=
+ + II
=
+ + III
? = "@
+ @ + @ I
Ento, adaptando nossa nomenclatura, o resultado passa a ser:
? = @
+ @ + @ II
? = @
+ @ + @ III
S a terceira equao coincide com a informada no enunciado. Logo: F, F, V.
Gabarito: E
Resoluo:
Gabarito: B
$ 7 $ 237 / 7 $ + 3 7 / 7 /3
Fica assim:
Q
A soma de quadrados total (SQT) continua sendo:
2 Q + Q
Desenvolvendo:
= 2Q + " Q
= 2Q"Q + " Q
= "Q
A soma de quadrados do modelo de regresso (SQM) continua sendo:
Q
No veremos como escrever tais grandezas na forma matricial, pois no cobrado nas
provas de concursos.
(
, , . Sero 2 graus de liberdade.
Exemplificando: numa regresso com 2 variveis independentes, so 3 parmetros
Finalmente, para calcular o nmero de graus de liberdade de SQR, basta fazer a diferena
entre os dois anteriores.
U1
Soma de quadrados Nmero de graus de liberdade
"1
Modelo de Regresso
" 1 U 1 = " U
Total
Resduos
A estatstica para o teste F continua sendo:
RTT
V=
RTG
Onde:
RTT: quadrado mdio do modelo de regresso
RTG: quadrado mdio dos resduos
?RT
O coeficiente de determinao continua sendo:
G =
?RS
Ele nos indica o quanto da soma de quadrados total explicada pelo modelo de regresso.
Resoluo:
Sejam:
parmetros (, , W)
- "p": a quantidade de parmetros a serem estimados. Nesta questo, temos trs
?RT
Temos:
G =
?RS
?RT
0,8 =
?RS
?RT = 0,8?RS
Sejam:
O quadrado mdio dado pela respectiva soma de quadrados dividida pelo nmero de
" 1 = 23 1 = 22
A soma de quadrados dos resduos tem " Ugraus de liberdade. Como a amostra tem
Ou seja, SQT tem 22 graus de liberdade.
tamanho 23 (" = 23) e so trs parmetros a serem estimados (U = 3), ficamos com:
" U = 23 3 = 20
Logo, SQR tem 20 graus de liberdade.
Por fim, o nmero de graus de libedade de SQM dado pela diferena entre os valores
22 20 = 2
acima:
V= = =
RTG ?RG 20 0,2 ?RS 20
0,8 2
V= = 40
0,2 20
A questo foi anulada por no estar prevista no edital do concurso.
Gabarito: anulado
a) 2.
b) 5.
c) 6,67.
d) 7.5.
e) 10.
Resoluo:
Sejam SQM e SQR, respectivamente, a soma dos quadrados do modelo de regresso e a
soma dos quadrados dos resduos.
Sejam QMM e QMR os correspondentes quadrados mdios.
soma de quadrados de modelo associamos graus de liberdade, onde "p" a
quantidade de parmetros estimados
Neste caso, temos um coeficiente para cada um dos trs regressores, mais o termo
soma de quadrados dos resduos associamos " U graus de liberdade, onde "n" o
independente. So 4 parmetros (p=4).
RTT
A estatstica teste dada pela relao entre os quadrados mdios:
V=
RTG
?RT U 1
V=
?RG " U
13590 3
V= = 6,67
6795 14 4
Gabarito: C
\ = + + W +
para avaliar a demanda per capita de um determinado produto, com base em observaes
nos ltimos dez anos. Dados:
zi = ln(Qi), em que ln o logaritmo neperiano (ln(e) =1) e Qi um ndice representando
a demanda per capita do produto no ano i;
xi = ln(Pi), em que Pi o ndice de preo do produto no ano i;
yi = ln(Ri), em que Ri a renda per capita do pas no ano i;
, , W so parmetros desconhecidos;
o erro aleatrio com as respectivas hipteses consideradas para o modelo de
regresso linear mltipla.
Considerando a equao do plano obtida pelo mtodo dos mnimos quadrados para esse
pas, o valor da previso em um determinado ano do ndice de demanda per capita Q do
produto analisado em funo do ndice de preo P e uma renda per capita R (P.Q 0) pode
ser obtido pela frmula:
5`
a)
R =
,
I G
,ab
4
b)
R=
I >
, G >
,ab
5`
c)
R =
,
I G >
,ab
c"4
d)
R=
I
, G
,ab
c"4
e)
R=
I >
, G
,ab
Resoluo:
Notem que a questo no se preocupou em adotar smbolos distintos para Q e sua previso.
ln R = 4 0,12 ln I + 0,76 ln G
5 ` 5
,abjk
R=
5
,jl
Lembrando que: 5 jl = I e que 5 jk = G
5 ` G
,ab
R=
I
,
5`
R=
I
, G >
,ab
Gabarito: C
\ = + + W +
exemplo, em um determinado pas, adotou-se o modelo
para avaliar a demanda per capita de um determinado produto, com base em observaes
nos ltimos dez anos. Dados:
zi = ln(Qi), em que ln o logaritmo neperiano (ln(e) =1) e Qi um ndice representando
a demanda per capita do produto no ano i;
xi = ln(Pi), em que Pi o ndice de preo do produto no ano i;
yi = ln(Ri), em que Ri a renda per capita do pas no ano i;
, , W so parmetros desconhecidos;
o erro aleatrio com as respectivas hipteses consideradas para o modelo de
regresso linear mltipla.
Com relao equao do plano ajustado pelo mtodo dos mnimos quadrados e
considerando o quadro de anlise de varincia correspondente, correto afirmar que:
Resoluo
Alternativa A - INCORRETA. Sejam SQT, SQM e SQR, respectivamente, a soma de quadrados
total (variao total), a soma de quadrados do modelo (variao explicada) e a soma de
quadrados dos resduos (variao residual).
Alternativa C - INCORRETA. Como vimos acima, o coeficiente de determinao foi dado pela
relao entre a variao explicada e a variao total.
Alternativa D - CORRETA.
O nmero de graus de liberdade referente variao residual 7.
O nmero de graus de liberdade referente variao explicada 2.
7
A relao entre ambos :
= 3,5
2
Alternativa E - INCORRETA. Seja QMR o quadrado mdio dos resduos. Seja QMM o
quadrado mdio do modelo de regresso.
0,616
pelos nmero de graus de liberdade.
RTT = = 0,308
2
0,014
RTG = = 0,02
7
0,308
A estatstica F dada pela relao entre estes dois quadrados mdios:
V= = 154
0,02
Gabarito: D
Resoluo:
Sejam:
SQT: soma de quadrados total;
SQM: soma de quadrados do modelo de regresso
SQR: soma de quadrados dos resduos
QMT: quadrado mdio total
QMM: quadrado mdio do modelo de regresso
QMR: quadrado mdio dos resduos.
?RT 0,5
parmetros.
RTT = = = 0,25
U1 31
A essa soma de quadrados associamos n-p graus de liberdade, onde "n" o tamanho da
amostra e "p" o nmero de parmetros estimados.
" U = 17 3 = 14
Nesse caso:
?RG 0,14
Finalmente, temos:
RTG = = = 0,01
"U 14
Estatstica teste
0,25
Estatstica teste dada pela relao entre os dois quadrados mdios:
V= = 25
0,01
Gabarito: D
n = 1, 2, , 20
onde ln representa o logaritmo neperiano e, com base em n = 1, EF um ndice de
consumo per capita, IF o quociente de um ndice de preo do vesturio pelo ndice de
custo de vida, GF a renda real per capita, , , Ws o parmetros desconhecidos e os F so
desconhecida K > 0.
realizaes independentes de uma varivel aleatria normal com mdia zero e varincia
de IF e GF que deste modo so tratadas como fixas. As estimativas dos parmetros, de seus
O ajuste do modelo de regresso linear foi levado a efeito condicionalmente s observaes
desvios padro bem como parte da tabela de anlise de varincia so dados a seguir:
o
: = W = 0
Assinale a opo que d o valor da estatstica associada ao teste de
o : 0 q1 W 0
contra a alternativa
a)17/5
b) 250
c) 25
d) 170
e) 5/17
Resoluo:
O quadrado mdio do modelo (QMM) igual diviso entre a soma de quadrados do
modelo (SQM) e o respectivo nmero de graus de liberdade.
O nmero de graus de liberdade de SQM igual a p-1, onde "p" a quantidade de
0,5
parmetros. No presente caso, so trs parmetros . Logo, SQM tem 2 graus de liberdade.
RTT = = 0,25
2
O quadrado mdio dos resduos (QMD) igual diviso entre a soma de quadrados dos
resduos (SQD) e o respectivo nmero de graus de liberdade.
O nmero de graus de liberdade de SQD igual a n-p, onde "n" o tamanho da amostra e
"p" a quantidade de parmetros. No presente caso, so trs parmetros e a amostra tem
0,017
tamanho 20. Logo, SQD tem 20-3=17graus de liberdade.
RTr = = 0,001
17
0,25
A estatstica teste a relao entre os dois quadrados mdios calculados acima:
V= = 250
0,001
Gabarito: B
n = 1, 2, , 20
onde ln representa o logaritmo neperiano e, com base em n = 1, EF um ndice de
consumo per capita, IF o quociente de um ndice de preo do vesturio pelo ndice de
custo de vida, GF a renda real per capita, , , Ws o parmetros desconhecidos e os F so
desconhecida K > 0.
realizaes independentes de uma varivel aleatria normal com mdia zero e varincia
de IF e GF que deste modo so tratadas como fixas. As estimativas dos parmetros, de seus
O ajuste do modelo de regresso linear foi levado a efeito condicionalmente s observaes
desvios padro bem como parte da tabela de anlise de varincia so dados a seguir:
Resoluo:
A ltima tabela do enunciado nos forneceu as seguintes informaes:
Soma de quadrados do modelo: SQM = 0,500
Soma de quadrados dos desvios: SQD = 0,017
0,5
O coeficiente de determinao igual relao entre SQM e SQT:
G = = 0,967
0,517
Gabarito: D
Resoluo:
Como temos trs variveis independentes, ento a quantidade de parmetros (p) do
modelo de regresso 4 (um para cada varivel, mais um termo independente).
U1= 41= 3
O quadrado mdio do modelo de regresso (QMM) tem graus de liberdade igual a:
O quadrado mdio total tem " 1 graus de liberdade, onde "n" o tamanho da amostra.
" 1 = 24 1 = 23
A diferena entre as duas quantias acima corresponde ao nmero de graus de liberdade
23 3 = 20
associado ao quadrado mdio dos resduos (QMR).
RTT
quadrado mdio dos resduos.
V=
RTG
Cada quadrado mdio igual correspondente soma de quadrados dividida pelo nmero
?RT 3
de graus de liberdade:
V=
?RG 20
Onde SQM e SQR representam a soma de quadrados do modelo e a soma de quadrados dos
resduos.
?RT 3
Continuando:
35 =
?RG 20
35 ?RT
?RG =
20 3
20
?RG = ?RT
35 3
4
?RG = ?RT
21
4
Substituindo o valor de SQR:
Gabarito: E
Resoluo:
Num teste de hipteses, temos:
se o p-valor for maior que o nvel de significncia, ento no rejeitamos a hiptese
nula
se o p-valor for menor que o nvel de significncia, ento rejeitamos a hiptese nula.
A constante
tem p-valor muito elevado (0,943). Tal hiptese no ser rejeitada para
nenhum dos nveis de significncia mencionados nas alternativas (10%, 5% e 1%). Podemos
descartar as alternativas que dizem o contrrio disso:
Gabarito: C
? = @
+ @A + @
mnimo quadrado so dadas por:
( ) ? = @
" + @ + @
( ) ? = @
+ @ + @
( ) ? = @
+ @ + @
Indicando por V - Verdadeiro e F - Falso, temos a opo correta como sendo:
a) V, F, F
b) V, V, F
c) V, F, V
d) F, V, F
e) F, F, V
Questo 2 BACEN 2001 [ESAF]
A questo baseia-se no enunciado seguinte:
Um investigador est interessado em estudar a funo consumo de um determinado setor
da economia. Com base em seu conhecimento de Teoria Econmica postula que o consumo
(C) de interesse deve variar com a renda real percapita do pas (R) e com um relativo de
preos (P) do setor. Neste contexto observa uma srie de 17 observaes nessas variveis
uma soma dos quadrados devido regresso de 13 590 e uma soma dos quadrados dos
resduos de 6 795. Dado que foram usadas 14 observaes, calcule o valor mais prximo da
estatstica F para o teste de hiptese da no-existncia da regresso linear estudada.
a) 2.
b) 5.
c) 6,67.
d) 7.5.
e) 10.
Questo 5 BACEN 2006 [FCC]
Considere as seguintes informaes para resolver as questo.
Uma das principais aplicaes da Econometria tem sido sua utilizao na obteno de
modelos que explicam a procura de produtos nos diversos setores da Economia. Por
\ = + + W +
exemplo, em um determinado pas, adotou-se o modelo
para avaliar a demanda per capita de um determinado produto, com base em observaes
nos ltimos dez anos. Dados:
zi = ln(Qi), em que ln o logaritmo neperiano (ln(e) =1) e Qi um ndice representando
a demanda per capita do produto no ano i;
xi = ln(Pi), em que Pi o ndice de preo do produto no ano i;
yi = ln(Ri), em que Ri a renda per capita do pas no ano i;
, , W so parmetros desconhecidos;
o erro aleatrio com as respectivas hipteses consideradas para o modelo de
regresso linear mltipla.
Considerando a equao do plano obtida pelo mtodo dos mnimos quadrados para esse
pas, o valor da previso em um determinado ano do ndice de demanda per capita Q do
produto analisado em funo do ndice de preo P e uma renda per capita R (P.Q 0) pode
ser obtido pela frmula:
5`
a)
R =
,
I G
,ab
4
b)
R=
I >
, G >
,ab
5`
c)
R=
I
, G >
,ab
c"4
d)
R=
I
, G
,ab
e)
s = wxy,2z {y,|}
tuv
Questo 6
BACEN 2006 [FCC]
Considere as seguintes informaes para resolver as questo.
Uma das principais aplicaes da Econometria tem sido sua utilizao na obteno de
modelos que explicam a procura de produtos nos diversos setores da Economia. Por
\ = + + W +
exemplo, em um determinado pas, adotou-se o modelo
para avaliar a demanda per capita de um determinado produto, com base em observaes
nos ltimos dez anos. Dados:
zi = ln(Qi), em que ln o logaritmo neperiano (ln(e) =1) e Qi um ndice representando
a demanda per capita do produto no ano i;
xi = ln(Pi), em que Pi o ndice de preo do produto no ano i;
yi = ln(Ri), em que Ri a renda per capita do pas no ano i;
, , W so parmetros desconhecidos;
o erro aleatrio com as respectivas hipteses consideradas para o modelo de
regresso linear mltipla.
Com relao equao do plano ajustado pelo mtodo dos mnimos quadrados e
considerando o quadro de anlise de varincia correspondente, correto afirmar que:
n = 1, 2, , 20
onde ln representa o logaritmo neperiano e, com base em n = 1, EF um ndice de
consumo per capita, IF o quociente de um ndice de preo do vesturio pelo ndice de
custo de vida, GF a renda real per capita, , , Ws o parmetros desconhecidos e os F so
desconhecida K > 0.
realizaes independentes de uma varivel aleatria normal com mdia zero e varincia
de IF e GF que deste modo so tratadas como fixas. As estimativas dos parmetros, de seus
O ajuste do modelo de regresso linear foi levado a efeito condicionalmente s observaes
desvios padro bem como parte da tabela de anlise de varincia so dados a seguir:
o
: = W = 0
Assinale a opo que d o valor da estatstica associada ao teste de
o : 0 q1 W 0
contra a alternativa
a)17/5
b) 250
c) 25
d) 170
e) 5/17
Questo 9 MDIC 2002 [ESAF]
O texto seguinte diz respeito questo.
Com o objetivo de avaliar os efeitos das variveis preo e renda no consumo per capita do
setor txtil de determinado pas, ajustou-se, utilizando-se para esse fim observaes de 20
n = 1, 2, , 20
onde ln representa o logaritmo neperiano e, com base em n = 1, EF um ndice de
consumo per capita, IF o quociente de um ndice de preo do vesturio pelo ndice de
custo de vida, GF a renda real per capita, , , Ws o parmetros desconhecidos e os F so
desconhecida K > 0.
realizaes independentes de uma varivel aleatria normal com mdia zero e varincia
de IF e GF que deste modo so tratadas como fixas. As estimativas dos parmetros, de seus
O ajuste do modelo de regresso linear foi levado a efeito condicionalmente s observaes
desvios padro bem como parte da tabela de anlise de varincia so dados a seguir:
d) 87%.
e) 84%.
Questo 11 BNDES 2011 [CESGRANRIO]
Para estudar o consumo de refrigerante em funo do preo, da temperatura e da renda
familiar, ajustou-se o seguinte modelo de regresso linear mltipla y = 0 + 1x1 + 2x2 +
3x3 + , onde y representa o consumo de refrigerante em litros, por semana, x1, o preo
do refrigerante em reais, x2, a temperatura em oC e, x3, a renda familiar em reais, por
semana.
4. GABARITO
1 e
2 b
3 anulado
4 c
5 c
6 d
7 d
8 b
9 d
10 e
11 c
12 b