You are on page 1of 34

UNIDAD TEMTICA 01

MODELO DE REGRESIN
LINEAL MLTIPLE.
MNIMOS CUADRADOS ORDINARIOS

INTRODUCCIN

1. FORMULACIN DEL MODELO. HIPTESIS.


2. ESTIMACIN DE PARMETROS DEL MODELO Y DE LA VARIANZA DE LA
PERTURBACIN. MTODO DE LOS MNIMOS CUADRADOS ORDINARIOS.
3. INTERVALOS DE CONFIANZA DE LOS PARMETROS Y DE LA VARIANZA DE LA
PERTURBACIN
4. COEFICIENTE DE DETERMINACIN Y COEFICIENTE DE DETERMINACIN
CORREGIDO.
5. CONTRASTE DE HIPTESIS SOBRE LOS PARMETROS DEL MODELO MEDIANTE
LA UTILIZACIN DEL ESTADSTICO F.
6. PREDICCIN.
7. MODELO DE REGRESIN EN DESVIACIONES RESPECTO DE LA MEDIA

RESUMEN Y CONCLUSIONES

CUESTIONES
2 MODELOS DE REGRESIN LINEAL

INTRODUCCIN

Uno de los principales problemas que pretende resolver la Econometra con los modelos
de regresin es el de cuantificar la relacin que liga a una determinada variable econmica
con los valores de otras variables, para poder predecir de esta forma su valor en ciertas
condiciones.

Algunos ejemplos:

 El consumo de un producto (Y) depende del precio del mismo (X1), del nivel de renta
del comprador (X2), de la oferta (X3), del precio de otros productos sustitutivos (X4), del
precio de otros productos complementarios (X5), del mes del ao (X6), ...
 El precio de una vivienda (Y) depende de la superficie til de la misma (X1), del nmero
de dormitorios (X2) y de baos (X3), de su ubicacin respecto al centro de la ciudad (X4),
de la existencia de ciertos elementos adicionales como una plaza garaje (X5), un
trastero (X6), instalaciones comunitarias (X7), o del ao de construccin (X8), de la
saturacin acstica nocturna (X9), ...

Sin embargo la prediccin no es el nico objetivo, ni puede que sea realmente el ms


importante en los modelos de regresin. Adems de la prediccin de los valores de la variable
estudiada, la metodologa de los modelos de regresin ser capaz de identificar a las variables
presuntamente explicativas que son realmente explicativas, determinando la importancia
relativa de cada una de ellas, indicar si ha quedado fuera del modelo alguna variable
explicativa importante, y tambin mostrar la forma de modificarlo para que se ajuste an
ms a la realidad observada, con lo que se dispondr de una herramienta extremadamente
til y potente.

En la presente unidad temtica se estudiar la metodologa de regresin por mnimos


cuadrados ordinarios (MCO), que permitir analizar problemas como los expuestos
anteriormente, y contrastar as las teoras econmicas con la realidad.

En el primer apartado se propondr un modelo que relacione a la variable explicada con las
variables explicativas, el modelo de regresin. En dicho modelo existirn una serie de
parmetros que cuantificarn la relacin existente entre la variable explicada y cada una de
las variables que la explican, parmetros que sern estimados en el segundo y tercer
apartados, primero de forma puntual y luego por intervalos de confianza. A continuacin, en
el cuarto apartado, se cuantificar la utilidad del modelo propuesto mediante el coeficiente
de determinacin, y en el quinto se presentarn las pruebas de hiptesis que determinarn
(desde varios puntos de vista) la adecuacin de las estimaciones realizadas de los parmetros.
Con el modelo as obtenido, se realizarn previsiones sobre los valores de la variable explicada
en el sexto apartado, y para terminar con la unidad temtica, en el sptimo y ltimo apartado,
se presentar un caso especial del modelo de regresin, la regresin por el origen de las
variables.

Ejemplo 1. En la relacin existente entre la tasa de poblacin activa femenina y la tasa de


desempleo de un pas, existen dos efectos que reciben los nombres de efecto del trabajador
MNIMOS CUADRADOS ORDINARIOS 3

adicional y efecto del trabajador desanimado. En el primer caso, el efecto del trabajador
adicional, un incremento de la tasa de desempleo produce un incremento de la poblacin
activa femenina, y ms exactamente entre las mujeres casadas. Al producirse un aumento en
la tasa de desempleo, la aportacin de dinero a la familia que realizaba el esposo, ahora en
paro, debe realizarla la mujer, y por ello se produce un incremento de la poblacin activa de
las mujeres casadas. Por otra parte, un incremento en la tasa de desempleo puede tener como
consecuencia que una mujer activa sea pesimista respecto al futuro y deje de buscar de forma
activa el empleo, con lo que se tiene as el efecto del trabajador desanimado.

Ambos efectos son contrapuestos, y segn sea el caso, uno de ellos prevalecer sobre el otro.
Con los datos disponibles para la tasa de desempleo y de poblacin activa femenina en Espaa,
observada mensualmente desde marzo de 1977 a diciembre de 2000, cul es el efecto que
prevalece en la economa espaola?

Ejemplo 2. Se desea ajustar una funcin de produccin para un determinado nmero de


empresas del sector comercial espaol. Para ello se dispone de los INGRESOS (millones de
pesetas), de los COSTES de produccin (millones de pesetas) y de la PLANTILLA (unidades). La
relacin propuesta entre las variables es la funcin de Cobb-Douglas:

 =  
 
  

Ajustar el modelo de Cobb-Douglas propuesto y determinar si es posible admitir rendimientos


constantes a escala.

1. FORMULACIN DEL MODELO

La primera cuestin que hay que considerar en la formulacin del modelo de regresin es
que una variable explicada (Y), como el consumo anual de naranjas, es una variable aleatoria,
puesto que no se conoce su valor hasta que termina el ao y se realiza el recuento del
consumo. Como variable aleatoria, quedar completamente definida cuando se conozca la
distribucin que sigue y los parmetros que le corresponden. Lo habitual es que la distribucin
sea normal, con unas determinadas media y desviacin tpica. Esto es lo que se pretende
representar mediante la campana del eje de ordenadas en la Figura 1.

Autoevaluacin 1: Atendiendo a su distribucin, cul es el valor esperado del consumo de naranjas


en el prximo mes? Y dentro de doscientos meses?

Ahora bien, es posible que la variable analizada dependa de otra variable que la ayude a
explicar sus valores.

Como puede observarse en la misma figura, donde se Y


representan las parejas de valores como una trama
FY
de puntos, se tiene que cuando el precio de venta de
las naranjas (X) toma valores altos entonces el Y
consumo de naranjas es bajo, y cuando los de la
primera son altos los de la segunda son bajos. De la
misma forma tambin puede observarse que cuando
el precio es alto el consumo jams toma valores altos X
y viceversa. Figura 1 Relacin existente entre las variables X e Y.
4 MODELOS DE REGRESIN LINEAL

Por lo tanto, conocer el valor del precio de venta de las naranjas ayuda a precisar el valor del
consumo de naranjas. Por ello queda claro que, para explicar de forma ms adecuada el
comportamiento de la variable estudiada Y, es necesario tener en cuenta el valor de la variable
explicativa X, y hay que pasar a trabajar con la distribucin de la variable Y condicionada al
valor de la variable X, en vez de con la variable y la distribucin original. Afortunadamente la
distribucin de la variable condicionada Y/X es tambin normal, aunque habr que determinar
cules son entonces sus parmetros.

En el Ejemplo 1, la tasa de actividad de las mujeres aumenta (o disminuye) con el desempleo,


por lo que conocer la tasa de desempleo ayuda a conocer la tasa de actividad de las mujeres.

1.1 FORMULACIN DEL MODELO

En la Figura 2 se presenta una propuesta del posible valor de los parmetros de la


distribucin condicional Y/X, el consumo de naranjas dado un precio. Al fin y al cabo, y a pesar
de que el precio sea el mismo, el consumo ser diferente en cada uno de los mercados a los
que se acuda para observar su valor.

Como ya se ha mencionado antes, las Y


distribuciones condicionales Y/X son todas 1
normales, con un valor medio que depende FY
F 2
del valor de la variable explicativa X, y una Y
varianza que se considera como constante, F
tal y como se expresa en las siguientes
ecuaciones y en la Figura 2. j
F
 =  +  X1 X2 Xj X
  =  
Figura 2 Distribucin condicional Y/X. Los valores medios de Y/X
se encuentran en la recta +X, y las varianzas son constantes.

La primera ecuacin recibe el nombre de recta de regresin, el objeto de estudio de la


presente unidad temtica. Dicha recta puede generalizarse a un plano (dos variables
explicativas) o un hiperplano (tres o ms variables explicativas), y en este ltimo caso, el
modelo para un total de k variables explicativas (tambin llamadas exgenas), es:

 =  +   +   + +   + 
donde:

Y es la variable estudiada
Xj son las variables explicativas
j son los parmetros que acompaan a las variables explicativas
U es una perturbacin aleatoria que recoge la influencia sobre la variable estudiada (Y) de
otras variables explicativas no consideradas en el modelo
MNIMOS CUADRADOS ORDINARIOS 5

El valor medio (o esperado) y la varianza de la distribucin marginal (Y/X) son entonces:

() =  +   +   + +    =  

En el Ejemplo 1, el modelo para explicar la tasa de actividad de las mujeres se obtiene de la


correspondiente teora econmica, al que se le suma el trmino de perturbacin U:


    !"# =  + 
  $%&'( + 

El trmino final U es necesario en el modelo ya que, aunque se mantuvieran constantes los


valores de todas las variables explicativas Xi, los resultados obtenidos en la variable explicada
Y no seran siempre iguales. Adems del error en la observacin de los datos (error
experimental), existirn una serie de variables explicativas que son desconocidas (o no tenidas
en cuenta), de poca importancia individual, pero que en conjunto tienen un efecto tal que
modifica el resultado final de la observacin. A este efecto se le denomina perturbacin
aleatoria (U).

Si se desea utilizar el modelo propuesto, se deben estimar tanto los valores de los
parmetros j del hiperplano de regresin como el valor de la varianza del error. Para ello hay
que apoyarse en los datos de que se dispone, la observacin de n valores de la variable
explicada y de las variables explicativas. Si se sustituye en el modelo se tiene

 =  +   +   + +   + 


 =  +   +   + +   + 

 =  +   +   + +   + 

un sistema de n ecuaciones con n+k+1 incgnitas (k+1 incgnitas j y n incgnitas Uj), que no
tiene una nica solucin. Como es necesario tener ms ecuaciones para resolver el problema
(k+1 ecuaciones ms), habr que centrar la atencin en la perturbacin U para hallarlas.

A la variable U se le ha llamado perturbacin, pero tambin es un error, puesto que es la


diferencia entre el valor real de la variable y su valor esperado por el modelo. Despejando de
la ecuacin del hiperplano se observa dicha diferencia:

 ( +   +   + +   ) =  ) = 

donde ) es la estimacin de Y.

De acuerdo a esta ltima definicin, sera interesante que el error fuera lo ms pequeo
posible. Dado que el error es una variable aleatoria, lo ms pequeo posible se traduce en
que su valor medio sea cero, y en que su varianza sea (de nuevo) lo ms pequea posible. De
la minimizacin de esa varianza del error se obtendrn las k+1 ecuaciones que faltan, y de aqu
viene el nombre de mtodo de los mnimos cuadrados ordinarios.
6 MODELOS DE REGRESIN LINEAL

En un modelo economtrico existe un trmino, U, que se encarga de cuantificar el error cometido


por el propio modelo. Se denomina error o perturbacin.

1.2 HIPTESIS DEL MODELO

Para poder estimar los parmetros del modelo y la varianza del error es necesario
establecer algunas hiptesis simplificadoras respecto a la perturbacin, respecto a las
variables explicativas y la explicada, y respecto a los parmetros del modelo. De no hacerlo
as, obtener las estimaciones deseadas se convertira en una tarea bastante complicada, si no
imposible.

a) Hiptesis relativas a la perturbacin:

1- Las perturbaciones Uj son variables aleatorias de media nula.

E(Uj) = 0 j

2- Todas las perturbaciones tienen la misma varianza.

Var(Uj) = 2 j

3- Todas las perturbaciones estn incorrelacionadas entre s.

Cov(UiUj) = 0 ij

4- Las perturbaciones tienen una distribucin conjunta normal, cuestin que, junto a la
hiptesis anterior, concluye que las perturbaciones son independientes.

5- La perturbacin no depende de las variables explicativas Xi.

Autoevaluacin 2: Qu significado tienen estas hiptesis establecidas? Cmo se pueden asociar los
conceptos de error sistemtico, misma importancia del error en todas las observaciones,
independencia del error entre observaciones y formulacin adecuada del modelo con las hiptesis
anteriores?

b) Hiptesis relativas a las variables explicativas y la explicada

1- Las variables explicativas, Xi, y la explicada, Y, son obtenidas sin error de observacin.

2- Las variables explicativas Xi son no aleatorias, se puede fijar su valor a voluntad o son
controlables.

3- El valor de Yj es el observado de una variable aleatoria cuyo valor medio es una combinacin
lineal de los valores de Xi, y cuya varianza es constante.
MNIMOS CUADRADOS ORDINARIOS 7

    



 
 
 
     

 
 
      

4- Entre las variables explicativas Xi no deben existir relaciones lineales exactas.

c) Hiptesis relativas a los parmetros del modelo

1- Los parmetros i del modelo (tambin llamados parmetros estructurales) son constantes
y forman parte del modelo de forma lineal.

Autoevaluacin 3: El modelo de Cobb-Douglas es un modelo lineal? Los parmetros del modelo


de Cobb-Douglas aparecen de forma lineal?

El modelo de regresin puede expresarse de forma matricial para poder trabajar con el
mismo, y obtener as las expresiones del estimador de los parmetros y de la varianza del
error. Se definen entonces los vectores correspondientes a la variable a explicar Y, los
parmetros del modelo y el error U, as como la matriz de datos X,

 1   


 
     
1   

  .    
 .    . 

.  .   . 
  

  1    


   

con lo que las ecuaciones pueden expresarse de forma resumida como:

 


Para poder estimar los parmetros del modelo y la varianza del error debemos realizar ciertas
simplificaciones, que ms tarde deberemos comprobar que se cumplen. Sobre todo las del error.

2. ESTIMACIN DE PARMETROS DEL MODELO Y DE LA VARIANZA DE LA PERTURBACIN.


MTODO DE LOS MNIMOS CUADRADOS ORDINARIOS.

Volviendo sobre el mtodo de los mnimos cuadrados ordinarios, ste consiste en


determinar un vector b de estimadores de los parmetros que cumpla con el modelo

  ! " !
propuesto:

" es la estimacin de Y
donde:

e es valor aproximado de U, el error que se comete al tomar " como Y para cada observacin
b es la estimacin de

en particular en la muestra
8 MODELOS DE REGRESIN LINEAL

Entrando en detalle, el mtodo de los mnimos cuadrados ordinarios consiste en la


obtencin de un hiperplano (la recta en la Figura 6) de forma que se minimice la suma de los
cuadrados de las distancias (ei) entre cada una de las observaciones de la variable y dicho
hiperplano.

Posteriormente se ver la relacin existente Y


entre esta suma de cuadrados de las
distancias y la varianza del error, que como se ei Yi
ha propuesto anteriormente debera ser
mnima.
Y = b0 + b1 x
Autoevaluacin 4: Por qu medir distancias en
vertical, y no de otra forma? Horizontal? En la
direccin perpendicular a la recta? X
Figura 3 Hiperplano (recta) de regresin y error cometido (ei).

A las distancias medidas verticalmente del punto a la recta, o a las diferencias entre el valor
real de la variable y el valor previsto por el modelo (que es el error), se les denominan residuos
(ei). La expresin vectorial de los residuos se obtiene de despejar la ecuacin anterior:

! #

Se minimiza la suma de cuadrados de los residuos (SCR) porque es el error que se comete
en el ajuste, error que se mide como distancia vertical de cada observacin a la recta ajustada
(existen otros criterios). Al elevarlos al cuadrado se pierde el signo, y al sumarlos se acumulan
los errores en un solo valor. Es mucho ms manejable un solo valor que un vector de n valores
(residuos). Su expresin es la siguiente:

$%& ' ! ' # "  ' #        


  


  

Los residuos son el error cometido, la diferencia entre el valor real de la variable y el valor propuesto
para ella mediante el modelo. El error se acumula en un solo nmero, la SCR, y permite as hacernos
una idea de lo adecuado del modelo, de lo "cerca" que pasa la recta de las observaciones.

Al minimizar la SCR (derivar parcialmente respecto a bi e igualar a cero), se obtiene el resto de


las ecuaciones necesarias (k+1) para estimar los parmetros del modelo, y finalmente la
expresin de los estimadores b. Su forma matricial se presenta a continuacin:

 

donde Y es el vector de la variable a explicar, X es la matriz de datos, como ya se ha visto


anteriormente.
MNIMOS CUADRADOS ORDINARIOS 9

Para que el sistema de ecuaciones tenga solucin nica (y no sea indeterminado) el producto
de matrices X'X debe ser invertible, y para ello debe cumplirse que:

 el nmero de datos sea mayor que el de los parmetros a estimar, n>k+1


 no deben existir relaciones exactas entre las variables explicativas Xi

Siguiendo con el Ejemplo 2, la funcin de produccin de Cobb-Douglas, se realiza la


estimacin de los parmetros mediante la expresin correspondiente. Una vez estimados, se
obtienen los resultados que aparecen en Cuadro 1. La presentacin de los resultados puede
variar ligeramente de un programa a otro, pero en todos ellos se obtiene lo mismo que
muestra el Statgraphics, una columna con las estimaciones (Estimate) al lado de cada
parmetro.

Cuadro 1 Ajuste de la funcin de produccin de Cobb-Douglas.

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: LOG(INGRESOS)
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 2,17705 0,535389 4,0663 0,0001
LOG(COSTES) 0,735337 0,0510397 14,4072 0,0000
LOG(PLANTILLA) 0,170812 0,0348469 4,9018 0,0000
-----------------------------------------------------------------------------

Por otra parte, para estimar la varianza de la perturbacin (2) hay que utilizar la suma de
cuadrados de los residuos. Se puede demostrar que el estimador de la varianza de la
perturbacin tiene la expresin

 
*  =
+,1

tambin denominada cuadrado medio residual. La expresin anterior es el cociente de la suma


de cuadrados del residuo (SCR) y sus grados de libertad (n-k-1). La suma de cuadrados residual
sigue una distribucin 2, con grados de libertad n-k-1.

Dado que la SCR ha sido minimizada, es obvio que la varianza del error tambin es mnima, tal
y como se exigi anteriormente al decir que el error debera ser lo ms pequeo posible.

En el STATGRAPHICS el resultado aparece en la tabla ANOVA, como se muestra en el Cuadro


2, bien como desviacin tpica (Standard Error of Est.), con valor de 0,279884, bien como
varianza (Mean Square), que es 0,0783351.

Aunque la desviacin tpica tiene las mismas unidades de medida que la variable explicada, al
estar transformada mediante logaritmos no tiene mucho sentido sealarlo en este caso.
10 MODELOS DE REGRESIN LINEAL

Autoevaluacin 5: Qu significa el valor de la desviacin tpica del error 0,279884?

Cuadro 2 Tabla ANOVA del ajuste de la funcin de produccin de Cobb-Douglas.

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 26,7514 2 13,3757 170,75 0,0000
Residual 4,77844 61 0,0783351
-----------------------------------------------------------------------------
Total (Corr.) 31,5298 63

R-squared = 84,8447 percent


R-squared (adjusted for d.f.) = 84,3478 percent
Standard Error of Est. = 0,279884

Estimada la varianza del error, tan slo resta sealar que la matriz de varianzas-covarianzas
de las estimaciones de los parmetros del modelo se realiza con la siguiente expresin,
utilizada para obtener las estimaciones que aparecen en la columna correspondiente
(Standard Error) en el Cuadro 1:

  

Las expresiones anteriores son fundamentales para el ajuste de un modelo de regresin y estn
implementadas en todos los programas de ordenador que ofrecen este tipo de clculo. Sin embargo
jams las utilizaremos, pues no realizaremos clculos "a mano".

3. INTERVALOS DE CONFIANZA DE LOS PARMETROS Y DE LA VARIANZA DE LA


PERTURBACIN

La estimacin realizada de los parmetros del modelo y de la varianza del error debe venir
acompaada del error que se comete al utilizar esa estimacin en vez del valor verdadero. La
forma habitual de expresar ese error es a travs de la varianza (o la desviacin tpica) de la
estimacin (matriz de varianzas-covarianzas), pero no es la nica forma de hacerlo. Existe una
forma ms elaborada de expresar ese error, y es a travs de los intervalos de confianza.

Un intervalo de confianza es un intervalo (lmite inferior y lmite superior) que contiene al


valor verdadero y desconocido del parmetro que se desea estimar, con una cierta
probabilidad (1-) fijada. El valor se denomina nivel de significacin, y corresponde al
porcentaje de veces en que se est dispuesto a aceptar equivocarse, esto es, que el intervalo
no contenga al valor verdadero y desconocido del parmetro.

Para obtener las expresiones de los intervalos de confianza se tendr en cuenta la distribucin
de los estimadores y ese nivel de significacin escogido. En los siguientes apartados se
presentan los intervalos de confianza para los parmetros del modelo y para la varianza del
error.
MNIMOS CUADRADOS ORDINARIOS 11

3.1 INTERVALOS DE CONFIANZA PARA UNO DE LOS PARMETROS i

La distribucin del estimador bi del parmetro i es una t de student, cuyos grados de


libertad son los residuales:

- 
  


a partir de ella, se calcula el intervalo de confianza para el parmetro i cuya expresin es

.-     - +     /


/

o bien se puede expresar como la estimacin ms/menos el error cometido

-    

/

Autoevaluacin 6: Obtener la expresin del intervalo de confianza a partir de su distribucin.

Los intervalos de confianza para las estimaciones de los parmetros en el ejemplo de la


funcin de Cobb-Douglas se calculan con la correspondiente expresin. Eso s, para hacer el
clculo es necesario contar previamente con las estimaciones de parmetros y sus
correspondientes errores. O mejor se buscan en el Statgraphics, como muestra el Cuadro 3.

Aplicando la definicin de intervalo de confianza se tiene:

,
ln0    = 2,17705 1,99*0,535389 = [1,10648;3,24763] = 2,17705 1,06542
,
1    = 0,73534 1,99*0,051039 = [0,63327;0,83739] = 0,73534 0,10157
,
2    = 0,17081 1,99*0,034847 = [0,10113;0,24049] = 0,17081 0,06935

Obsrvese que no se ha estimado el parmetro 0 sino su logaritmo, y es necesario deshacer


la transformacin logartmica, y as el intervalo para el parmetro 0 es [3,0237;25,7293]
millones de pesetas.

Cuadro 3 Intervalos de confianza para los parmetros del modelo de Cobb-Douglas.

95,0% confidence intervals for coefficient estimates


-----------------------------------------------------------------------------
Standard
Parameter Estimate Error Lower Limit Upper Limit
-----------------------------------------------------------------------------
CONSTANT 2,17705 0,535389 1,10648 3,24763
LOG(COSTES) 0,735337 0,0510397 0,633276 0,837397
LOG(PLANTILLA) 0,170812 0,0348469 0,101132 0,240493
-----------------------------------------------------------------------------

Slo resta interpretar los resultados. Por ejemplo, cuando la plantilla aumenta en un 1% se espera que
los ingresos aumenten en un 0,1708%, si bien el valor real se supone que estar entre un 0,1011% y
un 0,2405% (con una probabilidad del 95%). Tambin podemos interpretarlo como que se espera dicho
0,1708% pero puede ser 0,0694% (1,99*0,051039) por arriba o por debajo de ese valor.
12 MODELOS DE REGRESIN LINEAL

Autoevaluacin 7: Resulta razonable el valor 0,85 para el parmetro 1?

3.2 INTERVALO DE CONFIANZA PARA LA VARIANZA

Conocida la distribucin de la suma de cuadrados de los residuos dividida por la varianza


de la perturbacin:

$%&
*



se tiene el intervalo de confianza para la varianza residual.

+  , # - # 1 +  , # - # 1
.  .
* *

 /   /

Autoevaluacin 8: Obtener la expresin del intervalo de confianza a partir de su distribucin.

El intervalo de confianza para la varianza ser, sustituyendo:

2 0,975
61
= 41,30 2 0,025
61
= 84,48 CMR = 0,0783351

tendremos que 0,0566 


0,1157 (con 
= 0,0783351).

Autoevaluacin 9: Interpreta el significado del intervalo de confianza. Es muy grande el error? Se ha


ajustado un modelo til o bueno (por as decirlo)?

Los intervalos de confianza nos ofrecen una idea del cuanto ms o menos es el valor verdadero y
desconocido del parmetro poblacional estimado, y complementa as al valor puntual estimado.

4. COEFICIENTE DE DETERMINACIN Y COEFICIENTE DE DETERMINACIN CORREGIDO.

En el apartado anterior se ha presentado el intervalo de confianza para la varianza del error.


A partir de dicho intervalo, puede decirse si el error es grande o si es pequeo?, puede
decirse si el modelo es til para explicar la variable que se analiza? Pues resulta complicado
hacerlo, porque los valores no son muy informativos. Es por ello que se propone ahora la
definicin de un nuevo parmetro que indique lo bueno o lo malo que es el modelo ajustado,
y que lo haga en trminos sencillos, como puede ser un porcentaje.

Si se pretende cuantificar la variabilidad de una variable, un estadstico calculado


habitualmente para ello es la varianza de dicha variable
MNIMOS CUADRADOS ORDINARIOS 13

 ( 1)
*  =
+1

si bien es el numerador de la expresin el que cuantifica realmente la variabilidad. Centrando


la atencin en ese numerador (en la suma de cuadrados), y si se suma y se resta la estimacin
de la variable en ella, ( + () ) ) 1), y se opera en la expresin resultante, se tiene en
total tres sumas de cuadrados que interpretar:

  

2( 1) = 2() 1) + 2( ) )


     

Suma de cuadrados total


Suma del cuadrado de las diferencias entre cada valor observado de la variable y la media de
los mismos. Indicara si los valores estn muy alejados del valor medio. El numerador en la
expresin de la varianza.



= 2( 1)
 

Suma de cuadrados del residuo


Suma de los cuadrados de las diferencias entre los valores observados y los estimados. Como
ya se ha visto, es una medida del error que se comete al tomar el uno por el otro, puesto que
al elevar al cuadrado se pierde el signo de la diferencia, y al sumarlos se acumulan.
 

  = 2( ) ) = 2( )


   

Suma de cuadrados explicada


Suma de los cuadrados de las diferencias entre las estimaciones y el valor medio de las
observaciones. Indicara si las estimaciones estn muy alejadas de la media de los valores
observados. Obsrvese el parecido con la expresin de la varianza, es la misma, salvo que se
utiliza la estimacin y no el valor de la variable analizada.


  = 2() 1)
 

Si un modelo explicara completamente su variable, la SCR debera ser cero, y las SCT y SCE
iguales. Si por el contrario no existiera relacin entre las variables, explicada y explicativa, la
SCE debera valer cero, y la SCR igual a SCT. Como la suma de cuadrados explicada, SCE, toma
por lo tanto valores entre 0 y SCT, el cociente SCE/SCT toma valores entre 0 y 1, con lo que se
tiene una escala de 0 a 1 (0 a 100%) que cuantifica lo adecuado del ajuste realizado.
14 MODELOS DE REGRESIN LINEAL

4.1 COEFICIENTE DE DETERMINACIN

Para saber si un modelo explica suficientemente a la variable en estudio, si es til para


describirla, se define el coeficiente de determinacin como:

$%
&
$%/

El coeficiente de determinacin siempre toma valores entre cero y uno (0R21), por lo que
se trata de una escala que mide lo adecuado del ajuste, o ms exactamente, mide el porcentaje
de variabilidad de la variable analizada (Y) explicado por el modelo propuesto. Si el coeficiente
de determinacin toma el valor 1 (100%), entonces el modelo ajustado es capaz de explicar
completamente la variabilidad de la variable estudiada, mientras que si su valor es 0 (0%), esto
quiere decir que el modelo no es capaz de explicar en nada a la variable estudiada. Los valores
reales se encuentran, obviamente, entre ambos lmites, siendo deseable que sean lo ms
prximo a 1 posible.

La raz cuadrada de dicho coeficiente recibe el nombre de coeficiente de correlacin

decir entre Y e ".


mltiple, y es el coeficiente de correlacin lineal simple entre la variable y su estimacin, es

El coeficiente de determinacin es el porcentaje de variabilidad de la variable estudiada que est


explicada por el modelo que hemos ajustado. Tambin podemos decir que est explicada por las
variables explicativas, pero tendramos que aadir que lo hacen (explicar) en la forma en que estn
en el modelo.

4.2 COEFICIENTE DE DETERMINACIN CORREGIDO

Pese a que parezca lo contrario, dado su significado, el coeficiente de determinacin no


puede ser utilizado para comparar y elegir entre dos modelos diferentes (por ejemplo, en el
nmero de variables explicativas). El motivo es que el coeficiente de determinacin siempre
aumenta al introducir una variable ms en el modelo, sea o no sea explicativa. Para la seleccin
de un modelo entre varios modelos que explican a una misma variable, con diferentes
variables explicativas se define un nuevo coeficiente a partir del anterior, el coeficiente de
determinacin corregido (por grados de libertad):

$%&, # - # 1 ,#1
&0  1 # 1 # 1 # &  
$%/, # 1 ,#-#1

Autoevaluacin 10: Entre qu lmites toma valores el coeficiente de determinacin corregido?

Definido de esta forma, pierde su significado de porcentaje de explicacin de la variabilidad


de la variable explicada ofrecida por el modelo. Sin embargo, el coeficiente de determinacin
corregido es til para comparar entre s modelos con un mayor o menor nmero de variables
explicativas, ya que su valor puede disminuir al aadir variables no explicativas al modelo.
MNIMOS CUADRADOS ORDINARIOS 15

En el ejemplo de la funcin de Cobb-Douglas, y utilizando las sumas de cuadrados de la tabla


ANOVA del Cuadro 2, el coeficiente de determinacin ser:

 26,7514
    0,848447
 31,5298

con lo que el modelo propuesto explica el 84,845% de la variabilidad de los ingresos, o ms


bien del logaritmo de los ingresos. Esta explicacin es debida a los costes y a la plantilla, pero
lo es en la forma en que se plantean en el modelo. Si ambas variables formaran un modelo
diferente, por ejemplo un modelo aditivo, o un modelo cuadrtico, el porcentaje de explicacin
sera diferente, aunque las variables fueran las mismas.

El coeficiente de determinacin corregido es:

1 64  1
   1  1      1  1  0,848447  0,843478
1 64  2  1

En el STATGRAPHICS los valores aparecen en la tabla ANOVA, como se aprecia en el Cuadro 4.

Cuadro 4 Tabla ANOVA del ajuste de la funcin de produccin de Cobb-Douglas.

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 26,7514 2 13,3757 170,75 0,0000
Residual 4,77844 61 0,0783351
-----------------------------------------------------------------------------
Total (Corr.) 31,5298 63

R-squared = 84,8447 percent


R-squared (adjusted for d.f.) = 84,3478 percent
Standard Error of Est. = 0,279884

El coeficiente de determinacin corregido sirve para escoger el mejor modelo entre los varios
modelos disponibles (adecuados) que explican a una misma variable.

5. CONTRASTE DE HIPTESIS SOBRE LOS PARMETROS DEL MODELO MEDIANTE LA


UTILIZACIN DEL ESTADSTICO F.

En este apartado se presentan las pruebas de hiptesis basadas en el estadstico F para


contrastar si un parmetro, un conjunto de ellos, e incluso todos ellos son igual a cero, o son
distintos de cero. Con la prueba de hiptesis sobre un parmetro se comprobar si una
variable explicativa del modelo es realmente explicativa o no lo es. Con la prueba sobre todos
los parmetros del modelo se comprobar si el modelo resulta adecuado o no lo es. Por
ltimo, con la prueba sobre un conjunto de parmetros se estudiarn las restricciones que la
teora econmica (o la lgica) pueda imponer a sus posibles valores.
16 MODELOS DE REGRESIN LINEAL

5.1 HIPTESIS SOBRE TODOS LOS PARMETROS DEL MODELO

La primera prueba se refiere a todos los parmetros del modelo, excepto el trmino
constante 0. La hiptesis nula es que todos los parmetros son iguales a cero, o lo que es lo
mismo, que el modelo no resulta adecuado. La hiptesis alternativa es que al menos uno de
los parmetros es distinto de cero, o que el modelo podra ser adecuado.

Autoevaluacin 11: Por qu la hiptesis nula se traduce en que el modelo no resulta adecuado?

Para realizar la prueba se calcula un estadstico Fcalc, cociente entre las sumas de cuadrados
explicada y residual, divididas por sus respectivos grados de libertad. Hay que recordar que el
cociente entre una suma de cuadrados y sus grados de libertad se denomina cuadrado medio,
por lo tanto el estadstico calculado es el cociente entre los cuadrados medios explicado y
residual. Se puede demostrar que este estadstico tiene distribucin F con grados de libertad
k y n-k-1.

Formalmente, la prueba de hiptesis es la siguiente:

H0 i=0 i1   , !
3  = = 3   
H1 al menos uno es distinto de cero  + , 1 !

Si Fcalc Fk n-k-1 entonces se acepta H0 (i =0, i1) y el modelo no es adecuado.

Cuando se realiza esta prueba mediante algn programa informtico, resulta ms cmodo
utilizar una forma alternativa de la prueba de hiptesis, basada en el nivel de significacin,
tambin denominado P-Valor (P-Value). El nivel de significacin, para esta prueba, es la
probabilidad de que una variable con distribucin Fk n-k-1 sea mayor que el estadstico Fcalc
calculado.

'( = (3    3  )

Si P-Valor entonces se acepta H0 (i=0, i1) y el modelo no es adecuado.

Todo lo necesario para realizar esta prueba de hiptesis se encuentra recogido en lo que se
conoce como Tabla ANOVA (Tabla 1), que es la forma en la que suelen presentar los resultados
la inmensa mayora de los programas de ordenador.

Tabla 1 Tabla ANOVA

SUMA DE CUADRADO
ORIGEN GDL F RATIO P-VALUE
CUADRADOS MEDIO
Modelo SCE k CME = SCE/k Fcalc = CME/CMR P-Valor
Residual SCR n-k-1 CMR = SCR / n-k-1 - -
Total SCT = SCE+SCR n-1 - - -
k nmero de variables explicativas, n nmero de datos
MNIMOS CUADRADOS ORDINARIOS 17

Autoevaluacin 12: Si una prueba sobre los parmetros incluyese al propio parmetro 0 en su
hiptesis nula, cul sera el significado de la hiptesis?

La prueba de hiptesis para el modelo que explica los ingresos en funcin de los costes y del
personal tiene como hiptesis nula H0 1 = 2 = 0, el modelo no resulta adecuado. La primera
forma de resolver la prueba ser mediante el estadstico F, y la segunda ser utilizando el P-
Valor.

 Mediante el estadstico F

Formalmente la prueba es la siguiente:

H0 1 = 2 = 0   
    
H1 al menos uno es distinto de cero     1 

En la tabla ANOVA se encuentran todos los valores necesarios para realizar la prueba, el
estadstico F, los valores que pueden permitir el clculo del estadstico F, y el P-Valor.

Como Fcalc= 13,3757/0,0783351 = 170,75 F2 610,05 = 3,147se rechaza H0 y se acepta H1 por lo


que el modelo podra ser adecuado.

Cuadro 5 Tabla ANOVA del ajuste de la funcin de produccin de Cobb-Douglas.

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 26,7514 2 13,3757 170,75 0,0000
Residual 4,77844 61 0,0783351
-----------------------------------------------------------------------------
Total (Corr.) 31,5298 63

R-squared = 84,8447 percent


R-squared (adjusted for d.f.) = 84,3478 percent
Standard Error of Est. = 0,279884

Mediante el P-Valor

Una forma mucho ms sencilla de realizar la prueba de


hiptesis en el ejemplo de la funcin de produccin de Cobb-
Douglas es utilizar el P-Valor que aparece en la tabla ANOVA,
como se recoge en el Cuadro 6. 170,75

Como P-Valor = 0,0000 < 0,05 se rechaza H0 y se acepta que 0,05


el modelo podra ser adecuado.

0 3,147

La prueba para el modelo nos dice si ste podra considerarse adecuado, si hay variables explicativas
en el mismo.
18 MODELOS DE REGRESIN LINEAL

5.2 HIPTESIS SOBRE UN PARMETRO INDIVIDUAL

Si se ha realizado la prueba sobre todos los parmetros del modelo, y el resultado ha sido
que al menos uno de ellos es distinto de cero, lgicamente, habra que saber cul o cules de
ellos son distintos de cero. En esta segunda prueba, se trata de contrastar si un parmetro
(cada parmetro), del modelo i es igual a cero o es distinto de cero, si se acepta el valor
estimado por el programa o debe rechazarse.

Sin embargo, lo ms importante de esta prueba es que permite responder a la pregunta de si


una variable explicativa es realmente explicativa o no lo es. En el caso de que el parmetro en
cuestin acompae a una variable explicativa, y se admita que su valor es cero, la conclusin
ser que dicha variable no es realmente explicativa, pues cero por la variable es cero, y por lo
tanto la variable explicativa deja de estar en el modelo.

La prueba de hiptesis para un parmetro que se realiza habitualmente es una prueba


basada en el estadstico t, si bien en muchos libros de econometra se presenta la prueba F,
por dar homogeneidad a todas las pruebas para parmetros. Entonces:

H0 i = 0
el parmetro vale cero y la variable no es explicativa
-
H1 i 0   =   

el parmetro es distinto de cero, se acepta el valor estimado y la
variable es explicativa

Si |5 | 5   entonces se acepta H0 (i = 0), y en caso contrario se rechaza.


/

Mediante el P-Value:

Si P-Valor entonces se acepta H0 (i = 0), y en caso contrario se rechaza.

Si se rechaza la hiptesis nula y el parmetro acompaa a una variable explicativa entonces se


tienen dos conclusiones; la variable en cuestin ayuda a explicar a la variable estudiada, y la
estimacin realizada (valor numrico) resulta adecuada. Si no acompaa a una variable
explicativa (0) entonces tan slo hay una conclusin, que la estimacin realizada del
parmetro resulta adecuada.

Si lo que se desea es contrastar si un parmetro toma un cierto valor determinado ,


entonces la prueba es:

H0 i =
el parmetro vale -
  =   
H1 i 6 
el parmetro es distinto de

Si |5 | 5   entonces se acepta H0 (i = ), y en caso contrario se rechaza.


/
MNIMOS CUADRADOS ORDINARIOS 19

Obviamente podran ser interesantes otras hiptesis, utilizando las pruebas ya conocidas para
la desigualdad:

H0: i
Si     

entonces se acepta H0 (i ), y en caso contrario se rechaza.


H1: i >
H0: i
Si     

entonces se acepta H0 (i ), y en caso contrario se rechaza.


H1: i <

La prueba de significacin del parmetro tambin se puede realizar mediante el clculo de


un estadstico Fcalc, el cociente del cuadrado de la estimacin del parmetro y su varianza. Este
estadstico se distribuye como una F, con grados de libertad 1 y n-k-1. La hiptesis nula es que
el parmetro vale cero, frente a la alternativa que su valor es distinto de cero. Formalmente,
la prueba de hiptesis es la siguiente:

H0 i = 0
el parmetro vale cero y la variable no es explicativa
-
H1 i 0 3  = 3   

el parmetro es distinto de cero, se acepta el valor estimado y
la variable es explicativa

Si Fcalc 7    entonces se acepta H0 (i = 0), y en caso contrario se rechaza.

Veamos si las estimaciones de los parmetros son significativas (obviamente la estimacin de


los parmetros y su error deben ser previamente conocidos):

Para realizar la prueba de hiptesis se recurrir a un estadstico 0,05

t de tablas, con 61 grados de libertad (los residuales) y


,
probabilidad del 5% (en dos colas),  .
2,2465

,
En las tablas,  = 1,99. -1,99 0 1,99

La constante es significativa, H0 ln0=0 rechazada

, ,
| | = = 4,0663  = 1,99 por lo que se rechaza H0
,
(P-Valor = 0,0001<<0,05)

El parmetro que acompaa a la variable explicativa LOG(COSTES) es tambin significativo, y


la variable es realmente explicativa, H0 1=0 rechazada

, ,
| | = = 14,4072  = 1,99 por lo que se rechaza H0
,
(P-Valor = 0,0000<<0,05)

El parmetro que acompaa a la variable explicativa LOG(PLANTILLA) es tambin significativo,


y la variable es realmente explicativa, H0 2=0 rechazada

, ,
| | = = 4,9018  = 1,99 por lo que se rechaza H0
,
(P-Valor = 0,0000<<0,05)
20 MODELOS DE REGRESIN LINEAL

Cuadro 6 Prueba de hiptesis sobre cada parmetro del modelo.

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: LOG(INGRESOS)
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 2,17705 0,535389 4,0663 0,0001
LOG(COSTES) 0,735337 0,0510397 14,4072 0,0000
LOG(PLANTILLA) 0,170812 0,0348469 4,9018 0,0000
-----------------------------------------------------------------------------

Por ltimo, y como ejemplo, se comprueba si el parmetro 1 puede valer 0,85 (H0 1=0,85),
porque hasta ahora era ese su valor, o es un valor habitual en otro tipo de empresas.

H0 1=0,85
H1 10,85


,  
,
,

| |   2,2465   1,99

,




,

Como | |  2,2465   1,99 se rechaza H0 y el parmetro 1 es distinto de 0,85.

Mediante la prueba de cada parmetro podemos determinar si una variable es explicativa o no lo es,
y aceptar el valor estimado por el programa, cuantificacin de su relacin con la variable explicada.

5.3 HIPTESIS SOBRE UN SUBCONJUNTO DE PARMETROS DEL MODELO

La ltima prueba de hiptesis se refiere a un subconjunto de parmetros del modelo.


Adems del significado individual de cada parmetro, es posible que un cierto nmero de ellos
tengan un significado conjunto, y sea interesante hacer preguntas sobre el mismo. Como
hiptesis nula se propone entonces que un subconjunto de parmetros tome unos ciertos
valores, o que exista algn tipo de relacin entre ellos. La teora econmica impone a menudo
que los coeficientes de un modelo deban cumplir una cierta restriccin lineal. Por ejemplo:

 Los rendimientos constantes a escala implican que la suma de exponentes de una funcin
de produccin de Cobb-Douglas debe ser la unidad (1+2=1).
 La ausencia de ilusin monetaria, por parte de los consumidores, implica que la suma de
las elasticidades de la renta monetaria y del precio en una funcin de demanda deben ser
cero (1+2=0).
 Si el consumo de un producto no se ve afectado por el precio de sus competidores, el
conjunto de parmetros que multiplican a dichos precios deben ser cero (1= 2=...=0).

Para realizar la prueba de hiptesis se debe, en primer lugar, ajustar el modelo sin las
restricciones, el modelo original, y obtener su suma de cuadrados residual (SCRc). En segundo
lugar se ajusta el modelo con las restricciones que se desean comprobar, y se obtiene una
MNIMOS CUADRADOS ORDINARIOS 21

segunda suma de cuadrados residual (SCRr). La prueba se basa en el clculo de un estadstico


Fcalc efectuado de la siguiente manera:

H0 1 = 2 = ... = s =0
    
H1 al menos un parmetro      

    1     1
es distinto de cero

Si Fcalc Fs n-k-1 entonces se acepta H0 (1 = 2 = ... = s = 0).

Autoevaluacin 13: Qu modelo debe ajustarse para que la hiptesis de rendimientos a escala
constantes est presente en el mismo?

La funcin de Cobb-Douglas relaciona los INGRESOS con los COSTES y la PLANTILLA, y la


cuestin en este caso es podemos afirmar que el rendimiento a escala es constante, esto es
1+2=1?

Una vez sustituida la hiptesis en el modelo, 1=1-2, se deja en un lado de la igualdad todo
aquello que est multiplicando a un parmetro (junto con el error) y en el otro lado todo lo
que no est multiplicado por un parmetro. Este modelo no tiene ningn inters como modelo
econmico, es slo un modelo auxiliar, por lo que no nos debemos preocupar mucho por el
aspecto del mismo

log#$%&  '()&  *&% +


, + log-*.$#**.  log& , /

y se calcula la suma de cuadrados del residuo, tal y como se tiene en el Cuadro 7.

Cuadro 7 Tabla ANOVA del modelo de Cobb-Douglas que incluye los rendimientos constantes a escala.

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 46,3553 1 46,3553 567,42 0,0000
Residual 5,06508 62 0,0816949
-----------------------------------------------------------------------------
Total (Corr.) 51,4203 63

Como el ajuste sin restriccin aparece en el Cuadro 5, se buscan las sumas de cuadrados de
residuo con y sin restriccin, con lo que el estadstico Fcalc para la prueba se calcula como:

,
,  ,
   3,659    3,99 y se acepta H0, esto es, que 1+2=1 y existen
, 
rendimientos constantes a escala.

La prueba para un conjunto de parmetros permite comprobar si existen ciertas relaciones entre los
parmetros del modelo, y es que, adems de su significado individual, es posible que varios
parmetros tengan un significado conjunto que nos interese comprobar.
22 MODELOS DE REGRESIN LINEAL

6. PREDICCIN

Uno de los objetivos deseados al realizar el ajuste modelos econmicos es el de poder hacer
predicciones de los valores de la variable estudiada, y el modelo ajustado permite predecir el
valor medio o esperado de dicha variable, y encontrar un intervalo que contenga con una
probabilidad determinada al valor real. Existen, por consiguiente, dos formas de realizar las
predicciones de la variable estudiada, la prediccin puntual y la prediccin por intervalos de
confianza, ambas representadas de forma grfica en la Figura 7.

La estimacin (prediccin) puntual para el valor Xp Y


de la variable explicativa es el valor que se obtiene
con el corte de la vertical en ese punto con la recta
ajustada, el valor representado como ) .
Yp
I.C.
Y

La estimacin es el valor esperado de la variable


explicada para los valores dados a las variables
explicativas, el valor que se obtiene sustituyendo en
la ecuacin del modelo estimado. x xp X

Figura 4 Prediccin puntual de Y ( ), y por intervalo
de confianza (I.C.) dado Xp.

El intervalo de confianza para Xp, es el intervalo (I.C.) que se encuentra entre las dos curvas
(a trazos) que hay por encima y por debajo de la recta de regresin. Es un intervalo que
contiene con una probabilidad determinada (elevada) al valor verdadero y desconocido de la
variable explicada para los valores que han sido escogidos de las variables explicativas.

6.1 PREDICCIN PUNTUAL

Si se pretende obtener el valor esperado de la variable estudiada, Y, asociado a unos


determinados valores de las variables explicativas X, lo nico que se debe hacer es sustituir
los valores de las variables explicativas en el modelo ajustado y operar

) = - + -  + -  + + - 

estimacin de Y que corresponde a su valor medio condicionado E(Y/X1...Xn).

En el ejemplo de la tasa de actividad femenina, el modelo estimado es:


 = 100,974 1,35908 


y la tasa de actividad de la mujer es de un 96,897% para una tasa de paro de un 3%, sin ms

que sustituir en la expresin y operar,  = 100,974 1,35908 3 = 96,897

Autoevaluacin 14: Obsrvese que cuando la tasa de paro es cero, la tasa de actividad no es
exactamente del 100%. Cmo poda forzarse a que sea el 100%?
MNIMOS CUADRADOS ORDINARIOS 23

Si el modelo ajustado explica el logaritmo de la variable, como en el modelo de Cobb-


Douglas, entonces el valor predicho est subestimado y debe modificarse. Para ello puede
utilizarse una expresin aproximada:

!
) =    "# ($)
%

donde *  es la estimacin de la varianza del error (cuadrado medio residual).

En la funcin de Cobb-Douglas ajustada:


log    = 2,17705 + 0,73534 log ( ) + 0,170812 log (
)

La estimacin de log(INGRESOS) cuando COSTES = 85000 y PLANTILLA = 1600 es:


log    = 2,17705 + 0,73534 log 85000 + 0,170812 log 1600 = 11,7836

deshaciendo el logaritmo tendremos que INGRESOS = e11,7836 = 131084,84 millones de pesetas,


y teniendo en cuenta que el cuadrado medio residual es de 0,0783351(Cuadro 5) la prediccin
puede ajustarse como e0,0783351/2 e11,7836 = 136320,98 millones de pesetas.

Cuadro 8 Estimacin de los INGRESOS dados los valores de COSTES y PLANTILLA.

Regression Results for LOG(INGRESOS)


-----------------------------------------
Fitted Stnd. Error
Row Value for Forecast
-----------------------------------------
65 11,7836 0,28414
-----------------------------------------

Para realizar la prediccin en el Statgraphics, se introducen los nuevos valores de COSTES y


PLANTILLA al final de los datos, en la ltima fila libre, y solicitando el clculo correspondiente.
El resultado se encuentra reproducido parcialmente en el Cuadro 8.

6.2 PREDICCIN POR INTERVALOS DE CONFIANZA

La prediccin puntual debe complementarse con la varianza de la estimacin, para conocer


as el error en la prediccin. Existe una manera muy til de presentar ambos valores, el
intervalo de confianza.

El primer intervalo de confianza corresponde a la estimacin del valor verdadero y


desconocido de la variable Y. El intervalo de confianza a nivel es:

)     81 + ( & )  

/

Para su clculo es necesario construir la matriz de datos X y el vector de valores escogidos


de las variables explicativas R para el que se pretende realizar la prediccin. Obviamente el
24 MODELOS DE REGRESIN LINEAL

clculo debe hacerse mediante el ordenador.

Para el ejemplo de la funcin de Cobb-Douglas, y cuando COSTES = 85000 y PLANTILLA = 1600


el Statgraphics calcula el intervalo de confianza para la prediccin, como se muestra en el
Cuadro 9.

Cuadro 9 Estimacin por intervalos de confianza para la prediccin de ln INGRESOS.

Regression Results for LOG(INGRESOS)


---------------------------------------------------------------
Lower 95,0% CL Upper 95,0% CL Lower 95,0% CL Upper 95,0% CL
for Forecast for Forecast for Mean for Mean
---------------------------------------------------------------
11,2155 12,3518 11,6857 11,8816
---------------------------------------------------------------

El vector R no es ms que un vector con los valores de las variables explicativas a partir de los
cuales se hace la prediccin, R={1;ln(8500);ln(1600)}. Con este vector y la matriz de datos es
posible obtener el intervalo de confianza al 95% para el logaritmo de INGRESOS, que segn el
programa Statgraphics es [11,2155;12,3518]. El intervalo buscado realmente es para los
INGRESOS, por lo que se deshace la transformacin logartmica y se tiene entonces [74272,79;
231376,15] millones de pesetas.

Autoevaluacin 15: Qu valoracin haces de la amplitud del intervalo de confianza para la


prediccin?

Si se desea puede utilizarse la transformacin ya conocida mediante el cuadrado medio


residual para obtener mejores resultados, y se obtiene el intervalo final [77239,0;240618,40]
millones de pesetas.

El modelo de regresin permite realizar la prediccin del valor de la variable estudiada dados unos
valores de las variables explicativas. La prediccin puede ser puntual, si queremos tener un cierto
valor aproximado al real, o por intervalos de confianza, si queremos saber ms o menos el valor real
de la variable estudiada.

7. MODELO DE REGRESIN EN DESVIACIONES RESPECTO DE LA MEDIA

En ocasiones la teora econmica propone modelos en los que no se considera la existencia


del trmino constante 0, y el valor esperado de la variable explicada es cero cuando son cero
todas las variables explicativas del modelo.

El ajuste correcto de un modelo sin trmino constante exige modificar ciertas cuestiones
en la estimacin de parmetros vista en apartados anteriores, motivo por el que se requiere
este nuevo apartado.
MNIMOS CUADRADOS ORDINARIOS 25

Ejemplo 3. Para explicar los INGRESOS (millones de pesetas) de las empresas a travs de su
PLANTILLA (personas) resultar necesario hacer que la recta pase por el origen de forma que
el INGRESO esperado sea cero cuando la PLANTILLA es cero.

 =  
 + 

Sin embargo, el modelo de regresin propuesto y utilizado hasta ahora incluye al trmino
independiente. El ajuste de INGRESOS frente a PLANTILLA que aparece en el Cuadro 10
corresponde al ajuste teniendo en cuenta su presencia. Como puede verse, el P-Valor de la
estimacin de 0 es de 0,3168, evidentemente ms grande que 0,05, y por lo tanto debe
admitirse que no existe, tal y como indica la teora econmica.

Cuadro 10 Ajuste de INGRESOS frente a PLANTILLA con un modelo que incluye a la constante.

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: INGRESOS
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 25763,3 24307,1 1,05991 0,3168
PLANTILLA 17,9894 1,75831 10,2311 0,0000
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 4,38633E11 1 4,38633E11 104,67 0,0000
Residual 3,7714E10 9 4,19044E9
-----------------------------------------------------------------------------
Total (Corr.) 4,76346E11 10

R-squared = 92,0827 percent R-squared (adjusted for d.f.) = 91,203 percent

Afortunadamente la mayora de los programas estadsticos permiten realizar un ajuste en el


que no est presente el trmino independiente 0, satisfaciendo as los requerimientos del
modelo econmico.

Una vez realizados los clculos, y como se ve en el Cuadro 11, el ajuste ha mejorado
aparentemente. La estimacin del parmetro resulta adecuada, dado que el P-Valor de la
prueba as lo indica, el modelo tambin resulta adecuado, concluido a partir del P-Valor
correspondiente, el coeficiente de determinacin corregido ha aumentado de valor, de
0,91203 a 0,947584, y la explicacin conseguida de la variable INGRESOS es ahora de un
94,7584%. Todos muy buenos resultados.

Sin embargo, tambin puede verse en la tabla que la suma de cuadrados total, es decir, la
variabilidad de los ingresos de las empresas ha cambiado al forzar la eliminacin de la
constante, pasando de valer 4,76346E11 a valer 8,09324E11. Esto es absurdo, dado que la
variable explicada no ha cambiado, y por lo tanto tampoco debera haber cambiado la suma
de cuadrados total. Sin embargo ha cambiado, y siembra serias dudas sobre lo adecuado de
los parmetros estimados y calificados como muy buenos anteriormente.

Si calculamos la varianza de los ingresos, el numerador de la expresin o suma de cuadrados


de los ingresos menos su valor medio, el nmero resultante es el inicial, el valor 4,76346E11.
El segundo nmero se puede comprobar que es simplemente la suma de los cuadrados de los
ingresos, sin restarles el valor medio, y es de 8,09324E11. As que no incluir el trmino
constante parece afectar a los clculos, al no considerar la media.
26 MODELOS DE REGRESIN LINEAL

Cuadro 11 Ajuste de INGRESOS frente a PLANTILLA con un modelo que no incluye a la constante.

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: INGRESOS
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
PLANTILLA 19,1002 1,42056 13,4455 0,0000
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 7,66902E11 1 7,66902E11 180,78 0,0000
Residual 4,24215E10 10 4,24215E9
-----------------------------------------------------------------------------
Total 8,09324E11 11

R-squared = 94,7584 percent R-squared (adjusted for d.f.) = 94,7584 percent

Realizar el ajuste del modelo eliminando sin ms el termino constante, en alguna parte del
programa de clculo, no es la solucin al problema de estimar los parmetros del modelo sin
termino constante. Como se ha observado en el ejemplo anterior, cuando se hace de esta
forma, la variabilidad total de la variable estudiada (el numerador en el clculo de la varianza)
cambia sin razn para ello. Y no hay razn pues nada ha cambiado en la variable a estudiar.
Para solucionar esta discrepancia (error) se realiza la regresin de las variables centradas, esto
es, las variables del modelo, explicada y explicativas, menos su valor medio respectivo.

Esto se puede comprobar fcilmente si partiendo del modelo con constante,

 =  +   +   + +   + 

se toman valores medios en el mismo y se restan, miembro a miembro en el propio modelo.


Al simplificar se tiene que desaparece el parmetro 0

9 =  9 +  9 + +  9 + 9

expresin del modelo de regresin en desviaciones respecto a la media, donde el circulo


puesto sobre cada variable indica que sta est centrada, se le ha restado su propia media.

9 =  1 9 =  1

En el modelo destaca la ausencia del trmino constante 0, que es lo que se pretenda. El


hiperplano pasa necesariamente por el origen, lo cual puede ser de gran utilidad, como se
ver en los siguientes ejemplos y en unidades temticas posteriores.

Autoevaluacin 16: Comprobar que, efectivamente, el parmetro 0 desaparece del modelo de


regresin al tomar valor medio y restar miembro a miembro.
MNIMOS CUADRADOS ORDINARIOS 27

Si se realiza el ajuste con el modelo en diferencias (Cuadro 12), puede comprobarse que la
suma de cuadrados total vuelve a recuperar el valor que le corresponde como medida de la
variabilidad de los INGRESOS.

Adems, hay que destacar que el error estndar en la estimacin del parmetro 1 es menor
ahora que antes. Esto quiere decir que, aunque el valor de la estimacin no ha cambiado
17,9894 millones de pesetas/empleado, el error en su estimacin si lo ha hecho, por lo que
conviene realizar el ajuste en desviaciones respecto a la media cuando el trmino
independiente salga no significativo.

Autoevaluacin 17: Compara los valores del error estndar de 1 de los modelos con constante no
significativa y centrado.

Cuadro 12 Ajuste de INGRESOS frente a PLANTILLA con el modelo centrado. Las diferencias en la suma de cuadrados total es
debida a los redondeos del clculo.

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: INGRESOS-AVG(INGRESOS)
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
PLANTILLA-AVG(PLANTILLA) 17,9894 1,66895 10,7789 0,0000
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 4,38633E11 1 4,38633E11 116,18 0,0000
Residual 3,77534E10 10 3,77534E9
-----------------------------------------------------------------------------
Total 4,76386E11 11

R-squared = 92,075 percent R-squared (adjusted for d.f.) = 92,075 percent

El hecho de que el hiperplano pase por el origen introduce algunos cambios en las expresiones
vistas hasta el momento:

 La definicin de la matriz de datos X cambia, y adems de restar a cada valor Xi su valor


medio, ya no incluye una primera columna de unos. En cuanto al vector de la variable Y,
ste est compuesto de la diferencia entre cada valor observado Yj y el valor medio de la
variable. En ambos casos, este hecho se denota poniendo un crculo sobre la matriz y el
vector.
- = (9 9)  9 

Naturalmente, el vector de estimaciones b no incluye la estimacin de 0.

 Tambin se tiene que la estimacin de la varianza del error o perturbacin se calcula


como el cociente entre la suma de cuadrados residual y n-k, en vez de n-k-1,
28 MODELOS DE REGRESIN LINEAL

dado que ahora los grados de libertad residuales son n-k. Esto es importante a la hora de
realizar las pruebas de hiptesis sobre parmetros, puesto que las expresiones deben
cambiar para recoger los nuevos grados de libertad residuales.

En el Ejemplo 1, el parmetro 0 debe ser 100, por lo que el modelo sera (forzando su valor):

  

  100      

y dejando en un lado de la igualdad todo lo que venga acompaado de un parmetro, y al


trmino de error

  

  100      

queda un modelo sin trmino constante, que debe ajustarse centrando todas las variables del
modelo, en el Cuadro 13. Ahora el modelo ajustado es, aceptando tanto las estimaciones como
el modelo, dado que todos los P-Valor son inferiores a 0,05.

Cuadro 13 Ajuste del modelo de la tasa de actividad de las mujeres forzando el valor del 100%.

Multiple Regression - (TASACTM-100)-AVG(TASACTM-100)


Standard T
Parameter Estimate Error Statistic P-Value
TASAPARO-AVG(TASAPARO) -1,35037 0,0876095 -15,4135 0,0000

Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 1093,18 1 1093,18 237,58 0,0000
Residual 105,832 23 4,60141
Total 1199,01 24
R-squared = 91,1734 percent R-squared (adjusted for d.f.) = 91,1734 percent

  

  100  1,35037  

Autoevaluacin 18: Si la tasa de desempleo es de un 100%, cunto vale la tasa de actividad de la


mujer? Es un 0% segn el modelo? Cmo se fuerza a que una recta pase por dos puntos? La relacin
entre ambas variables es realmente una recta?

En ocasiones necesitamos realizar el ajuste de un modelo que pasa por el origen de las variables, y
la variable explicada vale cero cuando todas las explicativas valen cero. La forma correcta de hacerlo
es restar a cada variable, explicada y explicativas, su propio valor medio.
MNIMOS CUADRADOS ORDINARIOS 29

RESUMEN Y CONCLUSIONES

1. En esta unidad temtica se ha propuesto una metodologa, la regresin por mnimos


cuadrados ordinarios, que permite analizar la adecuacin de un modelo econmico a la
realidad. Esta metodologa es capaz de determinar si una o ms variables resultan tiles
para explicar a otra dada, permite cuantificar la relacin existente entre la variable
explicada y cada una de las variables explicativas, as como determinar la importancia de
cada una de estas ltimas. Con el modelo ajustado por regresin se puede explicar la
evolucin de la variable en la que se est interesado, se realizarn previsiones sobre los
valores de dicha variable, y se determinarn las condiciones que la optimicen de acuerdo
a algn criterio.

2. La metodologa viene acompaada de un modelo, el modelo de regresin, que recoge la


relacin existente entre la variable explicada y las explicativas. Unos parmetros,
denominados , son los encargados de cuantificar la relacin de las variables explicativas
con la explicada, siendo constantes y desconocidos. As mismo, existe un trmino en el
modelo de regresin que cuantifica el error cometido, trmino que recibe el nombre de
error o perturbacin, U, y que es una variable aleatoria de media cero y de varianza
desconocida pero constante.

3. La aplicacin de la metodologa est restringida al cumplimiento por parte del modelo de


unas hiptesis. Estas hiptesis se refieren a las variables explicativas y la explicada, a los
parmetros , y al error o perturbacin U del modelo.

4. Los parmetros del modelo de regresin tienen un significado econmico que es


necesario conocer de forma previa a cualquier clculo. Una vez estimados es
necesario/posible realizar una serie de pruebas de hiptesis sobre su valor real a partir de
la estimacin realizada.

5. La varianza del error o perturbacin, U, tambin debe ser estimada. Su valor mostrar la
adecuacin/utilidad del modelo, utilidad que tambin podr cuantificarse a travs de los
coeficientes de determinacin.

6. Con el modelo estimado es posible realizar predicciones de la variable explicada. Dichas


predicciones pueden realizarse de forma puntual, si se desea conocer el valor esperado de
la variable, o por intervalos de confianza, si se desea tener una idea del posible valor real
de la variable.

7. El modelo de regresin planteado incluye la presencia de un trmino constante, trmino


que, en ocasiones, la teora econmica dice que no existe. En estos casos, se utiliza el
llamado modelo centrado para realizar el ajuste.
30 MODELOS DE REGRESIN LINEAL

CUESTIONES

P1.- Determinar si los siguientes modelos son lineales en los parmetros, y transformarlos, si
es el caso, para que lo sean y puedan ser ajustados.


 =  +  log  +   =     +   =  +  e

log () =  +  log  +   =       = e
 =  +  log  +   =  + log ( ) +   =  +   +    + 
1 1
 =  +  +   =  +  +  =  +  log  +   + 
  + 

P2.- Si se plantean los siguientes modelos para el consumo:

(+"%( =  +  + + 
(+"%( = : + : (+ 11111111
+) + 

Las estimaciones de 0 y 1 sern iguales a 0 y 1 respectivamente? De no ser as, qu


relacin existir entre ellas?

P3.- Se pretende explicar el salario percibido por medio de los aos de experiencia.
Determinar el significado de los parmetros del modelo:

'( =  +  .  +  .   + 

P4.- Proponer un modelo que explique la demanda mensual de discos duros externos
(unidades) a partir de su precio (euros), del nmero de novedades cinematogrficas
mensuales (unidades) y del precio de los DVD de pelculas (euros). Interpretar el significado
de los parmetros del modelo e indicar su signo.

P5.- Interpretar el significado de los parmetros del siguiente modelo de regresin, donde
se explica el consumo de combustible mediante el precio de la energa y la poblacin:

(+"%( =  +  ( +  (-'++' ( (-'+ + 

P6.- Completar los datos faltantes en el siguiente ajuste, en el que se trata de explicar la
produccin agraria a travs del volumen de productos fitosanitarios consumidos, la
produccin de maquinaria agrcola y la financiacin de las cosechas.

Model fitting results for: PRODUCCIN AGRARIA


--------------------------------------------------------------------------------
Independent variable coefficient std. error t-value sig.level
--------------------------------------------------------------------------------
CONSTANT 1.66174E5 2.968423E4 0.0000
V FITOSANITARIOS 69.796901 28.603607 0.0267
P MAQUINARIA -0.706997 0.251824 0.0126
FINANCIACION 0.432674 4.8012 0.0002
--------------------------------------------------------------------------------
MNIMOS CUADRADOS ORDINARIOS 31

Analysis of Variance for the Full Regression


--------------------------------------------------------------------------------
Source Sum of Squares DF Mean Square F-Ratio P-value
--------------------------------------------------------------------------------
Model 363588688059. 421.685 .0000
Error 13795657123.
--------------------------------------------------------------------------------
Total (Corr.) 19
R-squared =
R-squared (Adj. for d.f.) =
Stnd. error of est. =

P7.- Interpretar el significado de los siguientes modelos, as como el de sus parmetros, si se


pretende explicar los ingresos de las salas de cine a travs de la renta de los espectadores.

a) +;( =  +  + +  b) +;( =  +  1/+ + 


c) log (+;() =  +  + +  d) +;( = log ( ) +  log (+) + 

P8.- Proponer un modelo lineal que explique el consumo de caf a travs de la renta de los
consumidores, del precio del caf, de los precios del azcar, de la leche, del ans, del coac y
del ron. Interpretar el significado de los parmetros del modelo y proponer un signo para los
mismos. As mismo, proponer una prueba de hiptesis que permita aceptar que los precios de
las bebidas alcohlicas no influyen en el consumo de caf, y determinar las elasticidades de la
renta y de los precios considerados en el modelo. (Elasticidad=(dY/dX)(X/Y))

P9.- Proponer un modelo de regresin que permita explicar el consumo de manzanas a travs
del precio de las manzanas, de las peras y de las naranjas. Indicar el signo de los
correspondientes parmetros. Plantear detalladamente una prueba de hiptesis que permita
determinar si el consumo de manzanas no se ve afectado por el precio de las otras dos frutas,
indicando la forma de proceder si se deseara realizarlo.

P10.- El personal contratado por los establecimientos hoteleros espaoles (PERSONAL) puede
explicarse mediante el nmero de establecimientos abiertos (NESTABL) y mediante el nmero
de plazas (NPLAZAS) ofertadas a los turistas. Se ha propuesto y ajustado un modelo de
regresin que incluye a ambas variables explicativas, as como su interaccin (multiplicados
por sus respectivos parmetros).

a) Cul es el significado de los parmetros del modelo propuesto y ajustado?


b) Cul es el motivo de realizar el ajuste restando a cada variable su propio valor medio?
c) Determinar si el modelo resulta adecuado, detallando la hiptesis nula y la alternativa, el
estadstico de prueba y la conclusin. Realizar la prueba tanto mediante el estadstico F
como con el P-Valor.
d) Plantear y realizar la prueba de significacin para cada parmetro del modelo, detallando
la hiptesis nula y la alternativa, el estadstico de prueba y la conclusin. Realizar la prueba
tanto mediante el estadstico t como con el P-Valor.
e) Significado de las estimaciones de los parmetros del modelo ajustado.
32 MODELOS DE REGRESIN LINEAL

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: PERSONAL-AVG(PERSONAL)
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
NPLAZAS-AVG(NPLAZ 0,197935 0,0261435 7,57112 0,0000
NESTABL-AVG(NESTA 7,41926 3,39137 2,18769 0,0430
NPLAZAS*NESTABL-A -0,000130802 0,0000584743 -2,23691 0,0390
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 3,82809E8 3 1,27603E8 74,77 0,0000
Residual 2,9011E7 17 1,70653E6
-----------------------------------------------------------------------------
Total 4,1182E8 20

P11.- Determina el significado de los parmetros en los siguientes modelos:

a) Nmero de vehculos matriculados (MATRICULA) y nmero de vehculos producidos


(PRODVEHI) se miden en unidades fsicas, y tanto la poblacin con una edad superior
a los 16 a los (POBL16) como la poblacin activa (ACTIVA) se miden en personas.

!
  =  +  $< +  = 16 + '
 + 

b) Consumo en cada comunidad autnoma (CONSUMO CC.AA.) a travs de su renta


(RENTA), ambas en millones de euros y del nmero de habitantes de la comunidad
(HABITANTES) medido en miles de personas.

! =  +  
+  < =

 + 

c) Consumo de aceite de oliva (CONSUMO AO) en toneladas mtricas, explicado


mediante el precio del aceite de oliva (PRECIO AO), el precio del aceite de girasol
(PRECIO AG), ambos en euros, y las subvenciones recibidas por el aceite de girasol
(AYUDA AG) en miles de euros.

!  =  +     +     + ' $  + 

d) Cociente del ahorro y la renta de los espaoles (AHORRO/RENTA) explicado mediante


el ndice de la bolsa (BOLSA) y el ndice de precios al consumo (IPC).

</
=  +  =  +   + 

e) Consumo de gasolina (CONSG) en millones de euros, explicado mediante los impuestos


por litro (IMPG) en euros, el producto interior bruto (PIB) en millones de euros, el
parque automovilstico (PARQUE) en miles de coches y el ndice de precio de la gasolina
(IPCG).
MNIMOS CUADRADOS ORDINARIOS 33

 =  +  !  +  = + ' > + (   + 

f) La produccin lctea anual de Espaa (PRL), medida en toneladas mtricas, se puede


explicar mediante el consumo leche (CONL) en toneladas mtricas, el nmero de vacas
de ordeo (NVO) y el ndice de precios de la leche (IPCL).

 =  +   +   + '  + 

g) La ley de Engels dice que la participacin de los alimentos en el consumo total


(PCONSALIM) decae al aumentar el INGRESO, ingresos en millones de euros.

 ! =  +   + 

h) El gasto pblico en educacin (GPED) en millones de euros se explica mediante el


nmero de alumnos (NALUMN), el nmero de centros (NCENT) y el nmero de becas
concedidas (NBECAS).

 $ =  +   ! +   
+ ' =  + 

i) El nmero de estaciones de servicio de gasolina (NESG) se explica mediante el


consumo de gasolina (CONSG) en millones de euros y el parque automovilstico
(PARQUE) en miles de coches.

 =  +   +  > + 

j) El nmero de viajeros de la EMT de valencia (VEMTV) puede explicarse por la poblacin


de la ciudad (POBLACION), el parque de automviles (PAUTO), el nmero de motos
(PMOTO) y el nmero de viajeros del tranva (VFGV).

!
 =  +  =  +  
 + ' !
 + ( 3 + 

k) El precio de la vivienda en la ciudad de valencia (PRECIO) en miles de euros depende


de los metros cuadrados de la superficie de la misma (SUPERFICIE), del nmero de
dormitorios y de baos (NDORM, NBAOS) y del precio de venta anterior
(PRECIOANT), medido tambin en miles de euros.

  =  +   3  +  $! + ' =  + (   


+ 

l) La tasa de inflacin de un pas en el instante de tiempo t depende de la tasa de


desempleo en el mismo instante de tiempo y en el instante de tiempo anterior.

3  =  +  (
 $! 
 $!   ) + 
34 MODELOS DE REGRESIN LINEAL

P12.- Plantear una prueba de hiptesis que permita determinar si la distribucin interior de
un tico (nmero de habitaciones y baos) influye o no en su precio. Precio de la vivienda en
la ciudad de valencia (PRECIO) en miles de euros, superficie de la misma (SUPERFICIE), del
nmero de dormitorios y de baos (NDORM, NBAOS).

  =  +   3  +  $! + ' =  + 

P13.- Se ha planteado el siguiente modelo para explicar el nmero de vehculos vendidos


(VEHICULOS) en Espaa, nmero que se explica mediante el ndice de precios de vehculos
(IPV), la renta de los consumidores (RENTA), y las cantidades invertidas en los planes RENOVE
(RENOVE1 y RENOVE2). Qu interpretacin tiene, en este contexto, las siguientes
afirmaciones sobre los parmetros?

<   =  +    +  
+ ' 1 + ( 2 + 

a) 3 = 4 = 0
b) 23 = 4
c) 3 = 4

You might also like