Professional Documents
Culture Documents
Ezequiel Uriel
Universidad de Valencia
09-2013
2.1 Algunas definiciones en el modelo de regresin simple
2.1.1 El modelo de regresin poblacional y la funcin de regresin poblacional
2.1.2 La funcin de regresin muestral
2.2 Obtencin de las estimaciones por Mnimos Cuadrados Ordinarios (MCO)
2.2.1 Diferentes criterios de estimacin
2.2.2 Aplicacin del criterio de mnimo cuadrados
2.3 Algunas caractersticas de los estimadores de MCO
2.3.1 Implicaciones algebraicas de la estimacin
2.3.2 Descomposicin de la varianza de y
2.3.3 Bondad del ajuste: Coeficiente de determinacin (R2)
2.3.4 Regresin a travs del origen
2.4 Las unidades de medida y la forma funcional
2.4.1 Unidades de medida
2.4.2 Forma funcional
2.5 Supuestos y propiedades estadsticas de los MCO
2.5.1 Supuestos estadsticos del MLC en regresin lineal simple
2.5.2 Propiedades deseables de los estimadores
2.5.3 Propiedades estadsticas de los estimadores MCO
Ejercicios
Anexo 2.1 Un caso de estudio: Curvas de Engel para la demanda de productos lcteos
Apndices
Apndice 2.1: Dos formas alternativas de expresar
Apndice 2.2. Demostracin de que
r R
2
xy
40
41
1
1
3
4
4
6
8
8
9
10
12
13
13
14
19
20
22
23
27
34
40
41
42
43
y 1 2 x u
(2-1)
y 1 2 x
(2-2)
yi 1 2 xi ui i 1, 2,, n
(2-3)
(2-4)
que ha sido representada en la figura 2.3 para la observacin i-sima. Sin embargo,
desde un punto de vista emprico, no es posible hacerlo debido a que 1 y 2 son
desconocidos y, consecuentemente, ui es no observable.
2.1.2 La funcin de regresin muestral
El objetivo principal del modelo de regresin es la determinacin o estimacin
de 1 y 2 a partir de una muestra dada.
La funcin de regresin muestral (FRM) es la contrapartida de la funcin de
regresin poblacional (FRP). Dado que la FRM se obtiene para una muestra dada, una
nueva muestra generar otra estimacin distinta.
La FRM, que es una estimacin de la FRP, viene dada por
yi 1 2 xi
(2-5)
ui yi yi yi 1 2 xi
(2-6)
yi yi ui
yi
ui
x
2
2x i
1
y i
yi
y
yi
yi
ui
yi
xi
xi
Min
u
i 1
(2-7)
x2 x1 x3 x1
x1
x3
x2
Si una lnea recta se ajusta de forma que pase a travs de los tres puntos, cada
uno de los residuos tomar el valor cero, de modo que
3
u
i 1
Este ajuste podra ser considerado ptimo. Pero tambin es posible obtener
i 1 i
u 0 . Este
i 1 i
simple ejemplo muestra que este criterio no es adecuado para la estimacin de los
parmetros, ya que, para cualquier conjunto de observaciones, existe un nmero infinito
de lneas rectas que satisfacen este criterio.
Criterio 2
Con el fin de evitar la compensacin de los residuos positivos con los negativos,
de acuerdo con este criterio se toman los valores absolutos de los residuos. En este caso
se minimizara la siguiente expresin:
n
Min ui
(2-8)
i 1
(2-9)
adelante. Por otra parte, frente al primero de los criterios examinados, al tomar los
cuadrados de los residuos se evita que se compensen, mientras que, a diferencia del
segundo de los criterios, los estimadores de mnimos cuadrados son sencillos de obtener.
Es importante sealar que, desde el momento en que tomamos los cuadrados de los
residuos, estamos penalizando ms que proporcionalmente a los residuos grandes frente
a los pequeos (si un residuo es el doble que otro, su cuadrado ser cuatro veces mayor).
Esto caracteriza la estimacin de mnimos cuadrados con respecto a otros
procedimientos posibles.
2.2.2 Aplicacin del criterio de mnimo cuadrados
A continuacin se expone el proceso de obtencin de los estimadores de MC. El
objetivo es minimizar la suma de los cuadrados de los residuos (S). Para ello, en primer
lugar expresamos S como una funcin de los estimadores, utilizando (2-6):
Por lo tanto
T
Min
( yi 1 2 xi ) 2
S Min
u 2 Min
t
1 , 2
1 , 2
1 , 2
t 1
(2-10)
i 1
( y
i
i 1
2 xi ) 0
( y x )x
i
i 1
2 i
(2-11)
(2-12)
En las operaciones con sumatorios se deben tener en cuenta las siguientes reglas: a na
i 1
ax
i 1
a xi
i 1
i 1
i 1
i 1
( xi yi ) xi yi
Operando con las ecuaciones normales, se tiene que
n
i 1
i 1
yi n1 2 xi
n
yx
i 1
i i
i 1
i 1
1 xi 2 xi2
(2-13)
(2-14)
y 1 2 x
(2-15)
1 y 2 x
(2-16)
Por tanto,
i 1
i 1
i 1
yx
y xi 2 x xi 2 xi2
yi xi ( y 2 x ) xi 2 xi2
n
i 1
i i
i 1
i 1
i 1
y x y x
i i
i 1
n
i 1
n
xi2 x xi
i 1
(2-17)
i 1
( y y )( x x )
i
i 1
( xi x )2
(2-18)
i 1
vamos a estimarla utilizando los datos de 6 hogares que aparecen en el cuadro 2.1.
Observ. consi rentai consi rentai renta consi cons rentai renta
2
i
(rentai renta) 2
(rentai renta )
1
2
3
4
5
6
Suma
5
7
8
10
11
13
54
6
9
10
12
13
16
66
30
63
80
120
143
208
644
36
81
100
144
169
256
786
-4
-2
-1
1
2
4
0
-5
-2
-1
1
2
5
0
20
4
1
1
4
20
50
25
4
1
1
4
25
60
Calculando cons y renta , y aplicando la frmula (2-17), o alternativamente (2-18), a los datos de
la cuadro 2.1, obtenemos:
54
66
644 9 66
50
0.83
cons
9 ; renta
11 ;(2-17): 2
0.83 ;(2-18): 2
6
6
786 11 66
60
i 1
(2-19)
ui yi yi yi 1 2 xi
i 1, 2,, n
(2-20)
u ( y
i 1
i 1
1 2 xi ) 0
(2-21)
y y
i 1
i 1
(2-22)
y y
(2-23)
2. La recta de regresin de MCO pasa necesariamente por el punto ( x , y ).
Efectivamente, dividiendo la ecuacin (2-13) por n, se obtiene:
y 1 2 x
(2-24)
x u
i i
i 1
=0
(2-25)
i 1
i 1
xiui xi ( yi 1 2 xi ) 0
dada en (2-12).
4. El producto cruzado muestral entre los valores ajustados ( y ) y los residuos
de MCO es igual a cero.
Es decir,
n
y u
i i
i 1
(2-26)
Demostracin
En efecto, teniendo en cuenta las implicaciones algebraicas 1 -(2-19)- y 3 (2-25)-, se obtiene que
n
y u ( x )u
i 1
i i
2 i
i 1
i 1
i 1
1 ui 2 xi ui 1 0 2 0 0
yi yi ui
(2-27)
yi y yi y ui
Elevando al cuadrado ambos miembros:
yi y
( yi y ) ui ( yi y )2 ui2 2ui ( yi y )
y ( y i y ) 2 ui2 2 ui ( y i y )
2
u ( y y ) u y y u
i
(2-28)
y y ( y y ) u
2
2
i
(2-29)
En palabras,
Suma de cuadrados totales (SCT) =
Suma de cuadrados explicados (SCE)+Suma de los cuadrados de los residuos (SCR)
Debe recalcarse que se debe cumplir la relacin (2-19) para asegurar que (2-28)
es igual a 0. Hay que recordar que (2-19) est asociada a la primera ecuacin normal, es
decir, a la ecuacin correspondiente al trmino independiente. Si en el modelo ajustado
no hay trmino independiente, entonces, en general, no se cumplir la descomposicin
obtenida en (2-29).
Esta descomposicin puede aplicarse a las varianzas, dividiendo ambos
miembros de (2-29) por n:
y y
( y y ) u
2
2
i
(2-30)
En palabras,
Varianza total=varianza explicada+ varianza residual
2.3.3 Bondad del ajuste: Coeficiente de determinacin (R2)
A priori, se han obtenido unos estimadores que minimizan la suma de los
cuadrados de los residuos.
Ahora, una vez hecha la estimacin, podremos ver en qu medida la recta de
regresin muestral se ajusta a los datos.
Una medida que indique el grado de ajuste de la recta de regresin muestral con
los datos se denomina medida de bondad del ajuste. Vamos a estudiar ahora la medida
ms conocida: el coeficiente de determinacin o R cuadrado ( R 2 ). Esta medida se
define de la siguiente manera:
n
R2
( y y )
( y y)
i 1
n
(2-31)
i 1
( y y ) ( y y ) u
2
2
i
R
2
( y y )
i 1
n
( y y)
i 1
( y y ) u
(y y)
2
2
i
i
n
i 1
10
2
i
( y y)
i 1
1
2
SCR
SCT
(2-32)
Casos extremos:
a) Si el ajuste es perfecto, entonces se verificar u 0 i . Esto implica que
y y i ( yi y ) 2 ( yi y ) 2 R 2 1
b) Si y c
y c
( yi y ) 2 0
R2 0
rxy2 R2
(2-33)
SCE
o, alternativamente, R 2
SCR R 2
41.67
0.992
42
0.33
0.992
42
cons
i
4.83
7.33
8.17
9.83
10.67
13.17
54.00
ui
0.17
-0.33
-0.17
0.17
0.33
-0.17
0.00
u
ui rentai cons
i
i
1.00
-3.00
-1.67
2.00
4.33
-2.67
0.00
0.81
-2.44
-1.36
1.64
3.56
-2.19
0.00
consi2
25
49
64
100
121
169
528
11
(consi cons) 2
i2
cons
16 23.36
4 53.78
1 66.69
1 96.69
4 113.78
16 173.36
42 527.67
- cons
)2
(cons
i
17.36
2.78
0.69
0.69
2.78
17.36
41.67
Ahora, vamos a estimar una recta de regresin a travs del origen. El modelo
ajustado es el siguiente:
yi 2 xi
(2-34)
Min
S Min
( yi 2 xi )2
i 1
(2-35)
(2-36)
Resolviendo para 2
n
yx
i 1
n
i i
x
i 1
(2-37)
2
i
Otro problema que se plantea al ajustar una recta de regresin para que pase por
el origen es que sucede en general que:
y ( y i y ) 2 ui2
2
(2-38)
EJEMPLO 2.3
Supongamos la siguiente funcin del consumo estimado, en la que ambas variables se miden en
miles de euros:
i = 0.2 + 0.85renta
cons
i
(2-39)
Si ahora se expresan la renta en euros (multiplicando por 1000) y se designa por rentae, el
modelo ajustado a las nuevas unidades de medida de la renta ser el siguiente:
( yi c) (1 c) (2 c) xi
(2-40)
EJEMPLO 2.4
Si expresamos, en el modelo (2-39), el consumo en euros (multiplicando por 1000) y lo
denominamos conse, el modelo ajustado a las nuevas unidades de medida del consumo ser el siguiente:
(2-41)
yi d ( 1 d ) 2 xi
13
(2-42)
EJEMPLO 2.5
Supongamos que la renta media es de 20 mil euros. Si definimos la variable
rentadi rentai renta y ambas variables se miden en miles de euros, el modelo ajustado con este
cambio en el origen ser el siguiente:
i = -14.8 + 0.85renta
consd
i
Hay que observar que R2 no vara al realizar cambios de unidades de x y/o y, y tampoco varia
cuando se cambia el origen de las variables.
x0
x0
(2-43)
x1
%
x0
(2-44)
(2-45)
14
pequea, pero las diferencias pueden ser importantes cuando el cambio proporcional es
grande, como puede observarse en el cuadro 2.3.
CUADRO 2.3. Ejemplos de cambios proporcionales y cambios en logaritmos.
x1
202
210
220
x0
200
200
200
Cambio proporcional en %
1%
5.0%
10.0%
Cambio en logaritmos en %
1%
4.9%
9.5%
240
200
20.0%
18.2%
300
200
50.0%
40.5%
y/ x
y y0
x x0
(2-46)
y/ x
dy y d ln( y)
dx x d ln( x)
(2-47)
y 1 2 ln( x) u
la variable exgena es x, pero el regresor es ln(x).
El modelo de (2-1) tambin nos indica que la variable endgena y el regresando
son equivalentes. Pero de ahora en adelante, denominaremos regresando a la forma
especfica en la que una variable endgena aparece en la ecuacin. Por ejemplo, en el
modelo
ln( y) 1 2 x u
la variable endgena es y, pero el regresando es ln(y).
Ambos modelos son lineales en los parmetros, aunque no son lineales en la
variable x (el primero) o en la variable y (el segundo). En cualquier caso, si un modelo
es lineal en los parmetros, se puede estimar aplicando el mtodo de MCO. Por el
contrario, si un modelo no es lineal en los parmetros, la estimacin debe hacerse por
mtodos iterativos.
Sin embargo, existen ciertos modelos no lineales que, por medio de
transformaciones adecuadas, pueden convertirse en lineales. Estos modelos son
denominados linealizables.
As, en algunas ocasiones se postulan modelos potenciales en la teora
econmica, como es el caso de la conocida funcin de produccin de Cobb-Douglas. Un
modelo potencial con una nica variable explicativa viene dado por
15
y e1 x 2
Si se introduce el trmino de perturbacin de forma multiplicativa se obtiene
y e1 x 2 eu
(2-48)
ln( y) 1 2 ln( x) u
(2-49)
y e1 x 2 u
En este caso no existe una transformacin que permita convertirlo en un modelo
lineal. Ser, por tanto, un modelo no linealizable.
Ahora, vamos a considerar algunos modelos con formas funcionales alternativas,
pero todos ellos son lineales en los parmetros. Estudiaremos en cada caso la
interpretacin del coeficiente 2 :
a) Modelo lineal
El coeficiente 2 mide el efecto del regresor x sobre y. Veamos esto con detalle.
La observacin i de la funcin de regresin muestral se expresa de acuerdo con (2-5)
por
yi 1 2 xi
(2-50)
yh 1 2 xh
(2-51)
y 1x
(2-52)
donde y yi yh y x xi xh
Por lo tanto, 2 es el cambio producido en y (en las unidades en qu est medida
y) al cambiar x en una unidad (en las unidades en qu est medida x).
Por ejemplo, en la funcin ajustada (2-39), si la renta aumenta en una unidad, el
consumo se incrementar en 0.85 unidades.
La linealidad de este modelo implica que un cambio de una unidad en x tiene
siempre el mismo efecto en y, con independencia del valor de x considerado.
16
EJEMPLO 2.7 Cantidad de caf vendido como una funcin de su precio. Modelo lineal
En un experimento de marketing1 se formul el siguiente modelo para explicar la cantidad de
caf vendido por semana (coffqty) en funcin del precio del caf (coffpric).
coffqty 1 2 coffpric u
La variable coffpric toma el valor 1, el precio habitual, y tambin los valores 0.95 y 0.85 en dos
acciones cuyos efectos estn bajo investigacin. El experimento dur 12 semanas, coffqty est expresado
en miles de unidades y coffpric en francos franceses. Los datos aparecen en el cuadro 2.4 y en el fichero
coffee1.
El modelo ajustado es el siguiente:
- 693.33coffpric R2 0.95 n
coffqty
Interpretacin del coeficiente 2 : si el precio del caf se incrementa en 1 franco francs, la
cantidad vendida de caf se reducir en 693.33 miles de unidades. En la medida que el precio del caf es
una magnitud pequea, es preferible dar la siguiente interpretacin: si aumenta el precio del caf en 1
cntimo de franco francs, la cantidad vendida de caf se reducir en 6.93 miles de unidades.
CUADRO 2.4. Datos sobre cantidades y precios del caf.
semana
1
2
3
4
5
6
7
8
9
10
11
12
coffpric
coffqty
1.00
1.00
1.00
1.00
1.00
1.00
0.95
0.95
0.95
0.85
0.85
0.85
89
86
74
79
68
84
139
122
102
186
179
187
EJEMPLO 2.8 Explicando el valor de mercado de los bancos espaoles. Modelo lineal
Utilizando datos de la Bolsa de Madrid (Bolsa de Madrid) del 18 de agosto de 1995 (fichero
bolmad95, 20 primeras observaciones), se ha estimado el siguiente modelo para explicar el valor de
mercado de bancos e instituciones financieras:
29.42 + 1.219bookval
marktval
R2=0.836
donde
-
n=20
Los datos de este ejercicio se han obtenido de un experimento controlado de marketing, sobre el
gasto en caf en tiendas de Pars. La referencia es A. C.Bemmaor and D. Mouchoux, Measuring the
Short-Term Effect of In-Store Promotion and Retail Advertising on Brand Sales: A Factorial
Experiment. Journal of Marketing Research, 28 ( 1991), 20214.
17
y 1 2 ln( x) u
(2-53)
y 1 2 ln( x)
(2-54)
2
100
ln( y) 1 2 x u
(2-55)
y exp(1 2 x u)
Por esta razn, el modelo (2-55) tambin se llama tambin exponencial.
La funcin de regresin muestral correspondiente a (2-55) es la siguiente
ln(
y ) = b1 + b2 x
(2-56)
y )% = 100 b2Dx
100Dln(
y ) = b1 + b2 ln( x)
ln(
Dln(
y ) = b2D ln( x )
18
(2-57)
) - 5.132ln(coffpric) R 2 0.90
ln(coffqty
Interpretacin del coeficiente 2 : si el precio del caf aumenta en un 1%, la cantidad vendida de
caf se reducir en un 5,13%. En este caso, es el estimador de la elasticidad de la demanda/precio.
2
EJEMPLO 2.10 Explicando el valor de mercado de los bancos espaoles. Modelo doblemente
logartmico (Continuacin del ejemplo 2.8)
Utilizando datos del ejemplo 2.8, se ha estimado el siguiente modelo doblemente logartmico:
ln(
marktval ) 0.6756 + 0.938ln(bookval )
R2=0.928
n=20
1%
logartmico lineal
doblemente
logartmico
1 unidad
( 2 / 100) unidades
(100 )%
1%
2 %
19
y 1 2 x u
(2-58)
x x
S X2
i 1
(2-59)
20
E (ui ) 0,
i 1, 2,3,, n
(2-60)
y (1 4) 2 x v
dnde v u 4 . Por lo tanto, la esperanza de la nueva perturbacin, v, es 0 y la
esperanza de u ha sido absorbida por el trmino independiente.
7) Las perturbaciones tienen una varianza constante
var (ui ) 2
i 1, 2, n
(2-61)
F(u)
y y
x1
y y
x1
2 i
x2
xi
2 i
x2
xi
a)
b)
i j
(2-62)
21
ui ~ NID (0, 2 )
i 1, 2, , n
(2-63)
donde NID indica que las perturbaciones estn normal e independientemente distribuidas.
( )
f b2
f (b2 )
b2(1)
( )
b2 = E b2
b2(2)
b2(1)
b2
b2
E (b2 ) b2(2)
b2
cada muestra de y las x son fijas en repetidas muestra segn el supuesto 2- toma un
valor diferente, pero en promedio, es decir, teniendo en cuenta los infinitos valores que
puede tomar b2 , es igual al parmetro 2. Con cada muestra de y se obtiene un valor
especfico de b , es decir, una estimacin. En la figura 2.8 se han representado dos
2
22
hipotticas estimaciones: b2(1) y b2(2) . Como puede verse b2(1) est ms cerca de 2
que el estimador insesgado b2(1) : es una cuestin de azar. En todo caso, por ser sesgado
no est centrado en promedio sobre el parmetro. No cabe duda que siempre es
preferible un estimador insesgado puesto que, con independencia de lo que ocurra en
una muestra concreta, no tiene una desviacin sistemtica respecto al valor del
parmetro.
La otra propiedad deseable es la eficiencia. Esta propiedad hace referencia a la
varianza de los estimadores. En las figuras 2.10 y 2.11 se han representado dos
hipotticos estimadores insesgados a los que seguiremos llamando b2 y b2 . El primero
de ellos tiene una varianza ms pequea que el segundo.
( )
f (b2 )
f b2
b2
b2(4)
b2
FIGURA 2.10. Estimador con varianza pequea.
b2(3)
b2 b2(3)
b2
FIGURA 2.11. Estimador con una varianza
grande.
b2(4)
tiene b2 .
2.5.3 Propiedades estadsticas de los estimadores MCO
Bajo los supuestos anteriores, los estimadores MCO poseen algunas propiedades
ideales. As, podemos decir que los MCO son estimadores lineales insesgados y
ptimos.
Linealidad e insesgadez de los MCO
El estimador b2 de MCO es insesgado. En el apndice 2.4 se demuestra que es
un estimador insesgado utilizando implcitamente los supuestos 3, 4 y 5, y
explcitamente los supuestos 1, 2 y 6. En dicho anexo tambin se puede ver que es un
23
estimador lineal, utilizando los supuestos 1 y 2. Del mismo modo, se puede demostrar
que el estimador MCO b1 es insesgado.
Recordemos que la insesgadez es una propiedad general del estimador, pero que
para una muestra determinada la estimacin puede estar ms "cerca" o ms "lejos" del
verdadero parmetro. En cualquier caso, la distribucin del estimador est centrada en el
parmetro poblacional.
Varianzas de los estimadores de MCO
Ahora sabemos que la distribucin muestral de nuestro estimador est centrada
en el parmetro poblacional, pero cul es la dispersin de su distribucin? La varianza,
que es una medida de dispersin, de un estimador es un indicador de la precisin de ese
estimador.
Para obtener las varianzas de 1 y 2 se requieren los supuestos 7 y 8, adems
de los seis primeros. Estas varianzas son las siguientes:
n
Var ( 1 )
2 n 1 xi2
Var ( 2 )
i 1
xi x
2
n
xi x
(2-64)
i 1
i 1
Estimador
Lineal
inear
IUnsesgado
nbiased
ELIO
ptimo
10,21
ui yi yi 1 2 xi ui 1 2 xi
ui 1 1 2 2 xi
(2-65)
Por tanto, i no es lo mismo que ui, aunque la diferencia entre ellos 1 1 2 2 xi - tiene un valor esperado que es igual a cero. Por ello, un primer
2
i
i 1
(2-66)
i 1
(2-67)
2
i
i 1
(2-68)
n2
Bajo los supuestos 1-8 (supuestos Gauss-Markov), se obtiene, como puede verse
en el apndice 2.7, que
E ( 2 ) 2
(2-69)
x x
i
i 1
25
(2-70)
2
x x
(2-71)
2
i 1
plim 2 2
n
(2-72)
26
Estimador
Insesgado
Minima Varianza
1 , 2
EIMV
En resumen, hemos visto que los estimadores de MCO tienen propiedades muy
deseables cuando se cumplen los supuestos estadsticos del MLC.
Ejercicios
Ejercicio 2.1 El siguiente modelo ha sido formulado para explicar las ventas anuales
(ventas) de empresas fabricantes de productos de limpieza domstica en funcin de un
ndice de precios relativo (ipr):
ventas 1 2ipr u
donde la variable ventas est expresada en millones de euros e ipr es un ndice de
precios relativos (precios de la empresa/precios de la empresa 1 de la muestra). As, el
valor 110 de la empresa 2 indica que su precio es un 10% mal elevado que en la
empresa 1.
Para ello se dispone de los siguientes datos sobre diez empresas fabricantes de
productos de limpieza domstica:
empresa
1
2
3
4
5
6
7
8
9
10
ventas
ipr
10
8
7
6
13
6
12
7
9
15
100
110
130
100
80
80
90
120
120
90
27
Ejercicio 2.2 Para estudiar la relacin entre consumo de combustible (y) y el tiempo de
vuelo (x) en una compaa area se ha formulado el siguiente modelo:
y 1 2 x u
donde y est expresado en miles de libras y x en horas, utilizndose como unidades de
orden inferior fracciones decimales de la hora.
De las estadsticas de Tiempos de vuelo y consumos de combustible de una
compaa area se han obtenido datos relativos a tiempos de vuelo y consumos de
combustible de 24 trayectos distintos realizados por aviones DC-9. A partir de estos
datos se han elaborado los siguientes estadsticos:
219.719;
x y
i
31.470;
349.486;
2
i
2
i
51.075;
2396.504
Se pide
a) La estimacin de 1 y 2.
b) La descomposicin de la varianza de y en varianza explicada por la
regresin y varianza residual.
c) El coeficiente de determinacin.
d) Qu consumo total estimara, en miles de libras, para un programa de
vuelos compuesto por 100 vuelos de media hora, 200 de una hora y 100
de dos horas?
Ejercicio 2.3 Un analista formula el siguiente modelo:
y 1 2 x u
Utilizando una muestra dada, se estima el modelo obteniendo los siguientes resultados:
n
( xi x )( yi y )
i 1
(x x )
20
i 1
y 8
10
x 4
3
2
1
3
4
5
6
2
-3
0
?
?
yi 1 2 xi ui
28
1 1, 2,, n
Al estimar este modelo con una muestra de tamao 11 se han obtenido los
siguientes resultados:
n
xi 0
i 1
a)
b)
c)
d)
yi 0
i 1
xi2 B
i 1
yi2 E
i 1
x y
i 1
Obtenga la estimacin de 2 y 1.
Obtenga la suma de cuadrados de los residuos.
Calcule el coeficiente de determinacin.
Calcule el coeficiente de determinacin bajo el supuesto de que
2F 2 BE .
N
de horas
7400
9800
4600
12200
14000
8200
5800
17000
29
Ejercicio 2.8 Se han estimado por mnimos cuadrados ordinarios los parmetros 1 y 2
del modelo
y 1 2 x u
con una muestra de tamao 3.
Los valores de xi son {1,2,3}. Se sabe tambin que el residuo correspondiente a
la primera observacin es de 0.5.
A partir de la anterior informacin, es posible calcular la suma de los cuadrados
de los residuos y obtener una estimacin de 2? En caso afirmativo, realice los
correspondientes clculos.
Ejercicio 2.9 Se tienen los siguientes datos, para estimar una relacin entre y y x:
y
-2
-1
0
1
2
x
-2
0
1
0
1
y 1 2 x u
a) Indique en que se basa el cumplimiento, en su caso, de las siguientes
igualdades
n
0;
u
=0;
E xi ui =0;
E ui =0;
n
n
b) Establezca la relacin entre las dos expresiones siguientes:
ui2
2
2
2
=
E ui = ;
nk
u
i 1
i 1
ui ?
i =1
y 1 2 x u
a) Qu supuestos deben cumplirse para que los estimadores de mnimos
cuadrados ordinarios sean insesgados?
b) Qu supuestos se requieren para que su varianza sea mnima dentro del
conjunto de estimadores lineales e insesgados?
Ejercicio 2.15 En lenguaje estadstico se suelen hacer en muchas ocasiones
afirmaciones como la siguiente:
Sea una muestra aleatoria de tamao n extrada de una variable x con
distribucin normal N(,).
a) Exprese la afirmacin anterior con lenguaje economtrico, introduciendo
un trmino de perturbacin.
b) Deduzca la frmula para estimar .
c) Deduzca la frmula para estimar 2.
n
ui ?
i =1
Ejercicio 2.16 Sea el siguiente modelo que relaciona el gasto en educacin (geduc) con
la renta disponible (renta):
geduc=1+2renta+u
Utilizando la informacin obtenida de una muestra de 10 familias se han
obtenido los siguientes resultados:
geduc = 7 renta = 50
10
rentai2 = 30.650
i =1
10
geduci2 = 622
i =1
10
i =1
31
yi=3+2xi+ui
i= 1, 2, 3
y siendo los valores de xi={1,2,3}:
a) Genere 15 muestras de u1, u2 y u3, y obtenga los correspondientes valores
de y, utilizando los nmeros aleatorios N(0,1).
b) Realice las correspondientes estimaciones de 1 y 2 en el modelo:
y 1 2 x u
c) Compare las medias y varianzas muestrales de y con sus
1
sleep 1 2 paidwork u
donde el sleep y la paidwork se miden en minutos por da.
Usando una sub-muestra aleatoria, extrada del archivo timuse03, fueron
obtenidos los siguientes resultados:
550.17 - 0.1783 paidwork
sleep
i
stsfglo 1 2lifexpec u
donde lifexpec es la esperanza de vida al nacer, es decir, el nmero de aos que se
espera que viva un recin nacido.
Utilizando el archivo HDR2010, se obtiene el siguiente modelo ajustado:
1.499 0.1062lifexpec
stsfglo
R2= 0.6135 n=144
a) Interprete el coeficiente de lifexpec.
32
salMBAgr 1 2tuition u
donde salMBApr es el salario medio anual en dlares para los estudiantes matriculados
en el ao 2010 de las 50 mejores escuelas de negocios americanas y tuition son los
derechos de matrcula, incluyendo todos los gastos necesarios para el programa
completo (con exclusin de los gastos de subsistencia).
Utilizando los datos de MBAtui10, se obtuvo el siguiente modelo ajustado:
54242 0.4313tuition
salMBAgr
i
n=50
R =0.4275
a) Cul es la interpretacin del trmino independiente?
b) Cul es la interpretacin del coeficiente de la pendiente?
c) Cul es el valor predicho de salMBAgr para un estudiante de posgrado
que pag 110000 dlares por los derechos de matrcula en un MBA de 2
aos?
33
ln(
wage) 1.919 0.0527educ
R2=0.2445
n=50
donde educ (educacin) se mide en aos y el salario (wage) en euros por hora.
a) Cul es la interpretacin del coeficiente educ?
b) Cuntos aos de educacin ms se requieren para obtener un salario un
10% ms elevado?
c) Sabiendo que educ 10.2 , calcule la elasticidad salario/educacin.
Ejercicio 2.24 Utilizando datos de la economa espaola para el perodo 1954-2010
(fichero consump), se estim la funcin de consumo keynesiana:
288 0.9416incpc
conspc
t
R =0.994
n=57
donde el consumo (conspc) y la renta disponible (incpc) se expresan en euros constantes
per cpita, tomando 2008 como ao de referencia.
a) Cul es la interpretacin del trmino independiente? Opine sobre el
signo y magnitud del trmino independiente.
b) Interprete el coeficiente de incpc. Cul es el significado econmico de
este coeficiente?
c) Compare la propensin marginal a consumir con la propensin media al
consumo para el punto de la media muestral (conspc 8084,
incpc 8896) . Comente el resultado obtenido.
d) Calcule la elasticidad consumo/renta para la media muestral.
34
CUADRO 2.6 Gasto en productos lcteos (dairy), renta disponible (inc) en trminos per
capita. (Unidad: euros por mes)
familia
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
dairy
8.87
6.59
11.46
15.07
15.60
6.71
10.02
7.41
11.52
7.47
6.73
8.05
11.03
10.11
18.65
10.30
15.30
13.75
11.49
6.69
inc
1.250
985
2.175
1.025
1.690
670
1.600
940
1.730
640
860
960
1.575
1.230
2.190
1.580
2.300
1.720
850
780
familia
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
dairy
16.20
10.39
13.50
8.50
19.77
9.69
7.90
10.15
13.82
13.74
4.91
20.99
20.06
18.93
13.19
5.86
7.43
7.15
9.10
15.31
inc
2.100
1.470
1.225
1.380
2.450
910
690
1.450
2.275
1.620
740
1.125
1.335
2.875
1.680
870
1.620
960
1.125
1.875
Modelo lineal
El modelo lineal de la demanda de productos lcteos es el siguiente:
dairy 1 2inc u
(2-73)
Como sabemos la propensin marginal del gasto nos indica cmo cambia el
gasto al variar la renta, y se obtiene derivando el gasto con respecto a la renta en la
ecuacin de demanda. En el modelo lineal la propensin marginal del gasto en
productos lcteos viene dada por
d dairy
2
d inc
(2-74)
35
d dairy
inc
inc 2
d inc
dairy
(2-75)
Estimando el modelo (2-73) con los datos del cuadro 2.6, obtenemos
= 4.012 + 0.005288inc
dairy
R2 = 0.4584
(2-76)
Modelo inverso
En el modelo inverso se establece una relacin lineal entre el gasto y la inversa
de la renta. Por lo tanto, este modelo es directamente lineal en los parmetros. Su
expresin es la siguiente:
dairy 1 2
1
u
inc
(2-77)
El signo del coeficiente ser negativo en el caso normal de que la renta est
correlacionada positivamente con el gasto en el bien. Como puede comprobarse
fcilmente, cuando la renta tiende hacia infinito, el gasto tiende a un lmite que es igual
a . Es decir, representa el mximo consumo que puede haber de ese bien.
En la figura 2.14 puede verse la representacin de la parte sistemtica de este
modelo. En la primera figura se ha representado la relacin entre la variable dependiente
y la variable explicativa. En la segunda se ha representado la relacin entre la
regresando y regresor. La segunda funcin es lineal como se puede ver en la figura.
dairy
dairy
1
E(dairy) = 1 + 2 1/inc
inc
1/inc
d dairy
1
2
d inc
(inc)2
(2-78)
d dairy inc
1
2
d inc dairy
inc dairy
(2-79)
Estimando el modelo (2-77) con los datos del cuadro 2.6, se obtiene
= 18.652 - 8702 1
dairy
inc
36
R 2 = 0.4281
(2-80)
dairy 1 2 ln(inc) u
(2-81)
2
d inc
d inc inc d ln(inc) inc
inc
(2-82)
d dairy inc
d dairy 1
1
2
d inc dairy d ln(inc) dairy
dairy
(2-83)
dairy
E(dairy) = 1 + 2 ln(inc)
inc
ln(inc)
Estimando el modelo (2-81) con los datos del cuadro 2.6, se obtiene
(2-84)
dairy e1 inc 2 eu
(2-85)
ln(dairy) 1 2 ln(inc) u
(2-86)
(2-87)
d dairy inc
d ln(dairy)
2
d inc dairy
d ln(inc)
(2-88)
ln(dairy)
E (dairy ) 1inc 2
ln(inc)
inc
Estimando el modelo (2-86) con los datos del cuadro 2.6, se obtiene
ln(
dairy) = -2.556 + 0.6866ln(inc) R2 = 0.5190
(2-89)
(2-90)
ln(dairy) 1 2inc u
(2-91)
(2-92)
38
exp
dairy
/ inc
d dairy inc
d ln(dairy )
inc 2inc
d inc dairy
d inc
(2-93)
ln(dairy)
E ( dairy ) e 1 2inc
inc
inc
Estimando el modelo (2-91) con los datos del cuadro 2.6 se obtiene
ln(
dairy) = 1.694 + 0.00048inc R2 = 0.4978
(2-94)
1
u)
inc
(2-95)
1
u
inc
(2-96)
d dairy
dairy
2
d inc
(inc)2
(2-97)
y la elasticidad por
invexp
dairy
/ inc
d dairy inc
d ln(dairy )
1
inc 2
d inc dairy
d inc
inc
(2-98)
ln(
dairy ) = 3.049 - 822.02
inc
39
R 2 = 0.5040
(2-99)
Propensin marginal
Modelo
2 =0.0053
Lineal
Inverso
1
inc
Lineal logartmico
=0.0044
1
=0.0052
inc
inc
=0.6505
dairy
Logartmico lineal
2 dairy =0.0055
Logartmico inverso
dairy
inc
0.4279
1
=0.6441
dairy
0.4566
2 =0.6864
0.5188
2 inc =0.6783
0.4976
1
2
=0.5815
inc
0.5038
=0.0047
0.4440
1
=0.5361
dairy inc
dairy
=0.0056
inc
Doblemente logartmico
R2
Elasticidad
Apndices
Apndice 2.1: Dos formas alternativas de expresar 2
Es fcil ver que
n
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
yi xi nxy y xi nyx yi xi y xi
Por otro lado, tenemos que
40
i 1
i 1
i 1
i 1
i 1
i 1
y x y x ( y y )( x x )
i i
i 1
n
2
i
i 1
i 1
n
x xi
i 1
(x x )
i 1
i 1
yi 1 2 xi
De la primera ecuacin normal, tenemos que
y 1 2 x
Restando la segunda ecuacin de la primera:
yi y 2 ( xi x )
Elevando al cuadrado ambos miembros
( yi y ) 2 22 ( xi x )2
y sumando para todo i, tenemos
( y y )
i
22 ( xi x ) 2
(
)
(
)
y
y
x
x
i
i
2
( yi y )( xi x )
n i 1
i 1
R 2 i n1
2
n
( yi y ) 2
( yi y ) 2
( xi x ) 2
i 1
i 1
i 1
( yi y )( xi x )
i 1 n
( xi x )2
i 1
(x x )
i 1
n
( y y)
i 1
rxy2
( y y)
i 1
41
x
ln( x1 ) ln( x0 ) ln 1
x0
x
1
ln(1) 1 1
x0 x1
x0
1 x1
1
1
2 x0 x1
x1
1
x0 x1 1
x0
x0
3
1 x1 2
1
3 2 x0 x 3
1
x0 x1
1
(2-100)
x0
x
1x
1x
1 1 1 1 1 1
x0 2 x0 3 x0
2
x 1 x 1 x
1 1 1
x0 2 x0 3 x0
Por lo tanto, si tomamos la aproximacin lineal en este desarrollo, tenemos que
x x
ln( x) ln( x1 ) ln( x0 ) ln 1 1
x0 x0
(2-101)
Apndice 2.4. Demostracin de que los estimadores MCO son lineales e insesgados
xi x yi y xi x yi
i 1
x x
i 1
i 1
x x
(2-102)
i 1
ya que
i 1
n
i 1
xi x y y xi x y 0 0
Ahora vamos a expresar (2-102) de la siguiente manera:
n
2 ci yi
i 1
(2-103)
donde
ci
xi x
n
( xi x )2
i 1
42
(2-104)
i 1
(2-105)
2
i
i 1
(x x )
i 1
n
2
( xi x )
i 1
1
n
( xi x )2
(2-106)
i 1
ci xi
i 1
(x x )x
i
i 1
n
( xi x )
(2-107)
i 1
2 ci yi ci ( 1 2 xi ui )
i 1
i 1
i 1
i 1
i 1
i 1
1 ci 2 ci xi ci ui 2 ci ui
(2-108)
Asumiendo que los regresores son no estocsticos (supuesto 2), ci ser tambin
no estocstico. Por lo tanto, 2 es un estimador que es funcin lineal de u.
Tomando esperanzas en (2-108) y teniendo en cuenta el supuesto 6, e
implcitamente los supuestos del 3 al 5, se obtiene
n
E ( 2 ) 2 ci E (ui ) 2
i 1
(2-109)
n
n
2
n
i 1
ci2
(x x )
i 1
(2-110)
nS X2
43
lugar, vamos a imponer las restricciones que se requieren para que sea insesgado. En
tercer lugar, se mostrar que la varianza de este estimador arbitrario debe ser mayor, o
por lo menos igual, que la varianza de 2 .
As pues, vamos a definir un estimador arbitrario, 2 , que es lineal en y:
n
2 hi yi
(2-111)
i 1
i 1
i 1
i 1
i 1
i 1
2 hi yi hi ( 1 2 xi ui ) 1 hi 2 hi xi hi ui
(2-112)
hi 0
h x
i 1
i 1
i i
(2-113)
Por lo tanto,
n
2 2 hi ui
(2-114)
i 1
n
2
n
E 2 2 hi ui 2 hi2
i 1
i 1
n
n
x x
x x
x x
2 hi n i
n i
2 hi n i
2
2
2
i 1
i 1
( xi x ) ( xi x )
( xi x )
i 1
i 1
i 1
(2-115)
n
n
x x
x
x
x
x
2 2 hi n i
n i
2 n i
i 1
i 1
( xi x ) 2
( xi x ) 2 ( xi x ) 2
i 1
i 1
i 1
El tercer trmino de la ltima igualdad es 0, como se muestra a continuacin:
x x xi x
n
2 2 hi n i
2
i 1
( xi x ) ( xi x ) 2
i 1
i 1
(2-116)
n
xi x
( xi x ) 2
2
2 2 1 2 2 1 0
2
n
n
i 1
( xi x ) 2
( xi x ) 2
i 1
i 1
n
2 2 hi
i 1
2
E 2 2 2 hi ci 2
i 1
(x x )
i 1
donde ci
(2-117)
xi x
n
(x x )
i 1
(2-118)
yi 1 2 xi ui
(2-119)
y 1 2 x u
(2-120)
yi y 2 xi x ui u
(2-121)
ui yi 1 2 xi
(2-122)
u y 1 2 x
(2-123)
(2-124)
2 2
x x u u
(2-125)
ui2 2 2
i 1
i 1
i 1
( xi x )2 (ui u )2
n
2 2 2 ( xi x )(ui u )
i 1
45
(2-126)
E ui2 ( xi x ) 2 E 2 2 E (ui u ) 2
i 1 i 1
i 1
2 E 2 2 ( xi x )(ui u )
i 1
( xi x ) 2
i 1
n 1 2 2 2 n 2 2
(x x )
i 1
(2-127)
n
n
ui
n
n 2
2
2
2
E (ui u ) E ui nu E ui n i 1
i 1
n
i 1
i 1
1 n
n
E ui2 ui2 ui u j n 2 2 n 1 2
n i 1
n
i j
i 1
E 2 2 ( xi x )(ui u ) E n
( x x )2
i 1
i
i 1
(2-128)
x
x
u
x
x
u
(
)
(
)
i
i
i
i
i 1
i 1
n
( xi x ) E ui
( xi x )2 i1
1
i 1
2
2
2
( xi x ) E ui ( xi x )( xi x ) E ui u j
i j
( xi x )2 i1
1
i 1
(2-129)
De acuerdo con (2-127), se tiene que
n
E ui2 n 2 2
i 1
(2-130)
u
i 1
2
i
n2
ya que
46
(2-131)
E 2
1
n
E ui2 2
n 2 i 1
(2-132)
entonces
plim g () g ( )
(2-133)
xi x yi y
i 1
xi x
xi x yi
i 1
n
xi x
i 1
1 xi x
i 1
x x
i 1
x x (
i 1
i 1
x x
i 1
i 1
n
x x
i 1
2 xi ui )
x x
x x x x x u
i 1
2
n
i 1
x x u
i 1
n
x x
i 1
(2-134)
1 n
plim
x
x
u
i i
xi x ui
n
n
i
i
1
1
2
plim 2 plim 2 n
1 n
2
2
n
n
plim
x
x
i
xi x
n n i 1
i 1
(2-135)
47
plim2 2
cov( x, u )
2
var ( x)
(2-136)
cov( x, u ) E ( x x )u ( x x ) E u ( x x ) 0 0
(2-137)
E ( yi ) 1 2 xi
(2-138)
(2-139)
(2-140)
donde
1 yi 1 2 xi 2
1
f yi
exp
2
2
2
(2-141)
1
2
1 n yi 1 2 xi 2
exp
2
2 i 1
(2-142)
48
n
ln L n ln ln
2
n
n
ln 2 ln
2
2
1 n y 1 2 xi
2 i
2 i 1
2
1 n y 1 2 xi
2 i
2 i 1
2
(2-143)
ln L
1
2
y x 1 0
ln L
1
2
y x x 0
2 i
2 i
ln L
n
1
2 4
2
2
2
(2-144)
y x
1
2 i
yx
i i
n1 2 xi
(2-145)
1 xi 2 xi2
(2-146)
Como puede verse, (2-145) y (2-145) son iguales a (2-13) y (2-14), es decir, los
estimadores de MV, bajo los supuestos del MLC, son iguales a los estimadores de MCO.
Sustituyendo 1 y 2 , -obtenidos al resolver (2-145) y (2-146)- en la tercera
ecuacin de (2-144) se tiene que
1
yi 1 2 xi
n
1
yi 1 2 xi
n
1
ui2
(2-147)
1 n 2 n2 2
E ui
n i 1
n
(2-148)
lim
49
(2-149)