Professional Documents
Culture Documents
Qu es la inferencia en el modelo
lneal?
UNIDAD III
Qu es la inferencia en el modelo
lineal?
Toda empresa extraordinaria slo puede lograrse mediante la aplicacin de una extrema cautela
en lo relacionado con sus comienzos y bases
I Ching
Intervalos de confianza
Coeficientes
De determinacin
De Correlacin
Anlisis de Varianza
Total
Parcial
COMPETENCIAS A LOGRAR
CONCEPTUAL
PROCEDIMENTAL
ACTITUDINAL
y analiza los
Explica que es una Ejecuta el proceso de Valora
inferencia, intervalos y inferencia para explicar modelos de prediccin
coeficientes utilizados.
las variables.
CONCEPTOS CLAVE
Inferencia, intervalos, coeficientes, varianza.
108
LECCIN 1
INTERVALO DE CONFIANZA
1. ESTIMACIN
La estimacin puntual.
La estimacin de intervalo
La estimacin puntual.- Se vale de un estadstico para estimar el parmetro en un slo
valor o punto.
Una estimacin de intervalo.- Es la que define un intervalo probable (nivel de
confianza) dentro del cual puede estar el parmetro desconocido.
Ejemplo de estimadores
Si se desea conocer el nivel de ingresos promedio mensual de los hogares del
departamento de Lima en el ao 2004, es difcil calcular la media de toda la poblacin.
Es ms fcil calcular la media de una muestra de hogares y a partir de ella hacer una
estimacin de la media poblacional.
El ejemplo de estimacin puntual de la media poblacional sera el valor que resulta
de una muestra de n = 500 hogares y hallar X = 437.10 nuevos soles.
El ejemplo de estimacin de intervalo sera asegurar con un 95% de confianza que el
ingreso promedio se encuentra entre 325.60 y 548.60 nuevos soles.
Es decir una estimacin puntual utiliza un nmero o valor nico para determinar una
estimacin del parmetro. Un intervalo de confianza denota un rango o recorrido dentro
del cual se podra encontrar el parmetro dado un nivel de confianza.
Nivel de confianza.
Es la probabilidad (1-), (generalmente expresada en porcentaje) de contener dentro de
sus lmites el valor verdadero del parmetro. Los ms usados convencionalmente son
tres: 99, 95 y 90%. Un ejemplo para este caso estara formado por el ingreso promedio
(media poblacional), de una empresa dedicada a la venta de artculos para oficina que
espera obtener al 95% de probabilidad entre 35000 y 38000 nuevos soles de ingresos
para el mes de junio del 2004.
El principio del intervalo de confianza.- Todo intervalo de confianza tiene un lmite
superior y un lmite inferior de confianza.
109
El nivel de confianza: 1
1t / 2
Lmites de confianza inferior: 1
Lmites de confianza superior: 1 + 1 t / 2
Por lo tanto se tiene que el intervalo de confianza para 1 ser:
Ejemplo ilustrativo:
El cuadro siguiente, presenta los datos observados de las tasas anuales de retorno (Xt)
sobre el fondo Afuture (Yt), un fondo cuyo principal objetivo de inversin es obtener
una ganancia mxima sobre el capital y sobre el portafolio del mercado con base en el
ndice de Fisher (perodo 1990:2001).
AO
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
Yt
67.50
19.20
-35.20
-41.00
63.70
19.20
3.60
20.00
40.30
38.00
21.00
15.30
Xt
19.50
8.50
-29.40
-26.50
61.90
45.00
9.50
14.00
35.00
32.00
11.50
12.20
Solucin
Planteamiento del modelo:
Y = 1 + 2X +
Donde:
Yt = Fondo Afuture
Xt = Tasa anual de retorno
110
Dependent Variable: Y
Method: Least Squares
Date: 08/27/02 Time: 15:13
Sample: 1990 2001
Included observations: 12
Variable
Coefficient
C
2.209520
X
1.061520
R-squared
0.714452
Adjusted R-squared
0.685897
S.E. of regression
18.47822
Sum squared resid
3414.446
Log likelihood
-50.93244
Durbin-Watson stat
0.918447
Std. Error
t-Statistic
6.334633
0.348800
0.212218
5.002038
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.7345
0.0005
19.30000
32.97040
8.822074
8.902892
25.02038
0.000536
P( 1 1t / 2 , < 1 < 1 + 1t / 2 ) = 1 -
P(2.209520 6.334633 * 2.228 < 1 < 2.209520 + 6.334633 * 2.228) = 1 - 0.95 = 0.05
P(- 11.904 < 1 < 16.323) = 5%
Asimismo la razn de aumento del fondo Afuture (2) podr estar entre 0.589 y 1.534
por cada unidad de aumento de la tasa de retorno.
P( 2 2 t / 2 , < 2 < 2 + 2 t / 2 ) = 1 -
P(1.06152 0.212218 * 2.228 < 2 < 1.06152 + 0.212218 * 2.228 ) = 1 - 0.95 = 0.05
P(0.589 < 2 < 1.534) = 5%
111
3. DCIMAS DE HIPTESIS
Se realiza con el fin de determinar si los coeficientes son significativos, es decir
diferentes de cero.
1. Planteamiento de hiptesis
H0: i=0
H1: i0
hiptesis nula
hiptesis alternativa
2. Estadstico de contraste
Utilizando la distribucin t-student el estadstico de contraste se define como:
t=
i i i 0 i
=
=
i
i
i
R.C
/2
R.C
/2
1-
t1-/2
<------Ver tabla
Regla de decisin:
Si: tc > t(n-k, 1-/2) tc< -t(n-k,
entonces se rechaza H0
1-/2)
Donde:
n: Es el tamao de la muestra (nmero de unidades o casos)
k: Es el nmero de parmetros estimados (nmero de variables ms uno)
112
Regla de decisin:
Si el de la Hiptesis nula est dentro del intervalo de confianza se acepta la
hiptesis nula; contrariamente, si el est fuera del intervalo se rechaza la
hiptesis.
Ejemplo:
Utilizando las salidas del ejemplo anterior, verificar si la variable X (Tasa anual de
retorno) explica el comportamiento de la variable Y (Fondo Afuture)
Solucin
- Del ejercicio anterior se tiene:
1 = 2.209520
2 = 1.061520
1 = 6.334633
2 = 0.212218
1. Planteamiento de hiptesis
H0: 2=0 La tasa anual de retorno no explica el comportamiento del Fondo Afuture
H1: 2 0 La tasa anual de retorno explica el comportamiento del Fondo Afuture
2. Estadstico de Contraste
Utilizando la distribucin t-student el estadstico de contraste se define:
tc =
2 0 2 1.061520
=
=
= 5.0020 ,
2
2 0.212218
113
Lo que significa que 2 estar entre 0.589 y 1.534 con un 95% de confianza.
Luego, como la hiptesis nula afirma que 2 = 0; como no pertenece al intervalo
<0.589, 1.534> se rechaza la hiptesis Ho. Es decir, la variable tasa anual de retorno
explica el comportamiento de la variable Fondo Afuture.
114
JB = n A
6
2
+ (C 3 )
24
[E(x ) ]
[E(x ) ]
3 2
A=
E (x )
C=
2 3
[E(x ) ]
2 4
En el grfico adjunto (elaborado en el paquete E-views 1), para el modelo anterior sobre
el fondo Afuture (Yt) en funcin a las tasas anuales de retorno (Xt), podemos observar
una serie de indicadores relacionados con el trmino de perturbacin a partir del anlisis
de los residuales en la serie 1990-2001 (e) que como se sabe son sus estimadores :
8
Series: Residuals
Sample 1990 2001
Observations 12
6
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
Jarque-Bera
Probability
-5.56E-15
0.538596
44.59083
-30.77794
17.61829
0.971084
5.060079
4.007968
0.134797
0
-40
-30
-20
-10
10
20
30
40
50
115
LECCIN 2
COEFICIENTE DE DETERMINACIN, CORRELACIN Y
DETERMINACIN MLTIPLE
1. COEFICIENTE DE DETERMINACIN (R2)
(Xi, Yi)
i
Yi Y
Yi Y
i Y
Y
Xi
2
(Yi Y ) = Yi Y i + Y i Y
i )2 = (Yi 1 2 X i ) 2
SCR = (Yi Y
116
SCE (Suma de los cuadrados explicados): Variacin de los valores estimados Yi con
respecto a su media.
i Y )2 = ( 1 2 X i Y) 2
SCE = (Y
Luego R2 se define como:
R2 =
SCE
SCR
= 1
SCT
SCT
0 R2 1
Propiedades
1. Es una cantidad no negativa.
2. Sus lmites son 0 R 2 1 , por lo que R variar entre cero y uno.
R2=1 cuando el ajuste es perfecto, es decir los valores observados coinciden
perfectamente con la recta estimada
R20 es decir que no hay relacin entre la variable dependiente y las variables
explicativas.
Este R2 no mide el grado de asociacin entre x e y, para ello se acude a otro indicador
que es el Coeficiente de correlacin (R)
117
2. COEFICIENTE DE CORRELACIN
Es una medida de asociacin lineal entre dos variables
Poblacional
r=
Cov (X, Y )
2
x
2
y
Muestral
(X X )(Y Y )
(X X ) (Y Y )
i
n 1
n 1
SCE
SCR
= 1
; siendo el signo de la correlacin el mismo
SCT
SCT
al del coeficiente estimado.
Donde r = R 2 =
Propiedades
Sus lmites estn entre:
1 r 1
Es una medida de asociacin lineal, es decir mide la asociacin lineal entre dos
variables.
El signo negativo indica una relacin inversa es decir a medida que aumenta (o
disminuye) la variable X, la variable Y disminuye (o aumenta), mientras que el
signo positivo indica una relacin directa, es decir a medida que aumenta (o
disminuye) la variable X , la variable Y tambin aumenta (o disminuye)
118
R = 1
(Y Y ) n k = 1 SCR n k
SCT n 1
(Y Y ) n 1
i
Ejercicio ilustrativo:
Volviendo al modelo sobre el fondo Afuture (Yt) en funcin a las tasas anuales de
retorno (Xt), y las salidas, obtenemos el coeficiente de determinacin y el Coeficiente
de determinacin mltiple corregido:
R-squared
Adjusted R-squared
0.714452
0.685897
r = + R 2 = 0.714 = 0.845
Se concluye que la asociacin lineal entre la variable independiente e independiente, es
alta y directa. Es decir, cuando aumenta la tasa de retorno (Xt), aumenta el fondo
Afuture (Yt).
119
LECCIN 3
INFERENCIA EN EL MODELO LINEAL
El anlisis de varianza tiene por finalidad investigar la explicacin conjunta de todas las
variables explicativas que participan en el modelo. Es decir, mide la significancia del
modelo de regresin lineal mltiple, a partir del estudio de los componentes de la
variabilidad total.
SCT = SCR + SCE
Suma de
cuadrados
Cuadrado
Medio
SCE
CME =
SCE
k 1
CMR =
SCR
nk
Residual
n-k
SCR
Total
n-1
SCT=SCE+SCR
Estadstico F
F-calculado
Fc =
CME
CMR
Donde:
SCT: Suma Total del Cuadrado
SCR: Suma de los Cuadrados Residuales
SCE: Suma de los Cuadrados Explicados
CME: Cuadrado Medio Explicada
CMR: Cuadrado Medio Residual
k:
n:
CME
,
CMR
libertad
Fc =
c) Nivel de Significancia ()
1-
R.C
F1-
<------Ver tabla
121
Fuente de Variacin
Debido a:
X1 ,...., X r
SCE I
Debido a:
X1 ,...., X r , X r +1 ,..., X r +s
Debido a:
X r +1 ,..., X r +s
r:
s:
SCE II
SCE s = SCE II - SCE I
SCR II
Total
SCT
G.L.
r1
Media de Cuadrados
SCE I / r 1
SCE s s
SCR II n (r + s)
n-1
SCE s / s
( Valor comparado con el obtenido de tabla)
SCR II / n ( r + s )
a) Planteamiento de hiptesis
H0: r+1 = r+2=.....=s = 0
H1: r+1 r+2..... r+s 0
122
Ejemplo:
Se tiene los siguientes modelos para el consumo (C) de las familias
C = 1 + 21YND
C = 1 + 2 YND + 3PR + 4 IT
(I )
(II)
Donde:
YND : Ingreso Disponible
PR
: Precios
TI
: Tasa de inters
Adems la tabla de anlisis de varianza es:
Fuente de Variacin
Suma de Cuadrados
Debido a: YND
SCEI = 963188.02
SCEII = 1002196.15
Debido a: PR, TI
SCR = 155862.6
Entonces: FC =
Media de
Cuadrados
G.L.
21
963188.02 / 1
(2 1)+2
100219.15 / 3
19 - 4
155862.60 /15...(B)
A 19504.07
=
= 1.877 (que se compara con el de la tabla)
B 10390.84
123
LECCIN 4
CORRECTAMENTE ESPECIFICACIN DEL MODELO:
TEST DE RESET DE RAMSEY
La prueba de Reset de Ramsey permite comprobar la correcta especificacin polinmica
de un modelo estimado.
El contraste se basa en la prueba de regresin aumentada tal como se indica a
continuacin.
- Si la regresin actual es:
Y = X +
Y = X + Z +
Donde las variables en la matriz Z son regresores presumiblemente omitidos en la
regresin original. La prueba de hiptesis que se llevar a cabo, intentar contrastar si
es nulo.
Supongamos por ejemplo que el modelo inicial es el siguiente:
Y = 1 + 2 X 2 + 3X 3 +
Si la verdadera forma del modelo es la que se muestra a continuacin, se tiene una
especificacin incorrecta del modelo inicial, debido a la omisin de la variable X1
elevada al cuadrado.
Y = 1 + 2 X 2 + 3 X 3 + X 32 +
Luego, la estructura de la ecuacin coincide con la planteada para el test.
Para un segundo ejemplo supngase que la especificacin correcta del modelo fuera:
Y = a1X a2 2 X 3a 3 +
Dicha forma corresponde a un modelo no lineal, sin embargo es posible contrastar esta
hiptesis mediante la estructura de la ecuacin de prueba del test de Ramsey, ya que la
matriz Z podra estar construida de las potencias enteras productos cruzados de todas las
variables explicativas incluidas en el modelo original.
Adems para realizar esta prueba no hace falta incluir explcitamente todas las potencias
y variables cruzadas en el modelo de prueba, ya que para este fin puede utilizarse el
trmino ajustado del modelo.
124
2 = (a1 + a 2 X 2 + a 3X 3 ) 2
Y
3 = (a1 + a 2 X 2 + a 3 X 3 )3
Y
En el desarrollo de las potencias anteriores se tendrn potencias y productos cruzados de
todas las variables incluidas en el modelo original.
La implementacin del Test de Ramsey, se realiza en dos etapas.
- En la primera, se estima en el modelo sujeto a anlisis en su forma original:
Y = 1 + 2 X 2 + 3X 3 +
- En la segunda, se toma la serie estimada por los parmetros de la regresin anterior y
se anexan sus potenciales enteras a la misma regresin como parmetros auxiliares:
2 + 3 Y
3 + ...) + u
Y = 1 + 2 X 2 + 3 X 3 + (2 Y
La dcima de hiptesis que se realiza en este caso ser:
2 + 3 Y
3 + .... = 0
H 0 : = 2 Y
H1 : 0
Estadstico de prueba:
F=
(1 R
(R
2
nuevo
2
nuevo
Ejercicio ilustrativo
Retomando el modelo sobre el fondo Afuture (Yt) en funcin a las tasas anuales de
retorno (Xt), y las salidas, obtenemos el test de Ramsey (elaborado en el paquete
Eviews):
La hiptesis:
H0: El modelo est correctamente especificado
H1: El modelo no est correctamente especificado
El nivel de significancia () o la probabilidad de rechazar la hiptesis nula cuando es
verdadera es del 5%. La prueba se hace utilizando el estadstico F
El test de Reset Ramsey indica que aadiendo 2 trminos al test Y2, Y3 el valor del
estadstico F es 1.16 y la probabilidad asociada al error de rechazar la hiptesis nula
cuando es verdadera es de 35.99% mayor al 5%; por lo tanto se acepta que el modelo
est correctamente especificado.
125
0.359856
0.215870
Prob.
0.3549
0.0151
0.3642
0.6200
19.30000
32.97040
8.899894
9.061530
9.390841
0.005340
126
LECCIN 5
ANLISIS DE LA ESTABILIDAD ESTRUCTURAL
Uno de los supuestos que se acepta al estimar el modelo de regresin, es que los valores
de los estimadores de los parmetros se mantienen constantes para la muestra utilizada.
Es decir, la relacin planteada es vlida para todas las observaciones, y que no hay
elementos que muestren patrones de relacin diferente. Para verificar estos supuestos
existen 3 tipos de contrastes: A partir de la prueba de Chow, del anlisis de los
residuales, y del uso de las variables dictomicas. En primer lugar haremos uso de los
dos primeros
Un contraste de mucha importancia, tanto por su inters como por la frecuencia con que
aparece en aplicaciones empricas, es la hiptesis nula donde dos submuestras son
generadas por una misma estructura econmica. Luego se contrasta la hiptesis nula de
ausencia de cambio estructural, y el contraste suele denominarse Test de Chow
Generalmente se produce cuando se tiene informacin acerca de una variacin
estructural que ocurri en algn momento del periodo muestral, y se pretende contrastar
si dicha variacin fue suficientemente importante como para generar cambios en los
coeficientes del modelo.
El modelo restringido (MR) es:
y t = X 't + t
t = 1,2, K, T1 , T2 , K T
Yt = X 't 1 + t
t = 1,2,K, T1
Yt = X 't 2 + t
t = T2 ,K, T
F(k ,n 2 k )
FC =
SR 1 + SR 2
n 2k
127
r 1 = X 'r 1X r 1
X 'r 1Yr 1
donde el subndice r-1, hace referencia al nmero de observaciones que se utilizan para
la estimacin de los parmetros 2.
Una vez estimados los parmetros del modelo con las r-1 primeras observaciones, se
incorpora, para la matriz de regresores, la informacin de la observacin siguiente; es
decir el vector fila Xr , y con sta se realiza una prediccin para la observacin r de la
)
variable endgena Yr . A partir de sta se calcula el error de prediccin para la
observacin r utilizando las primeras r-1 observaciones. Este error de prediccin
formar parte del residuo recursivo wr que se define como una tipificacin de aqul.
wr =
Yr X 'r r 1
1 + X 'r X 'r 1 X r 1
w N 0, 2 I
Estos nuevos residuos permiten analizar la perturbacin del modelo de regresin con
mayor objetividad ya que, a diferencia de los residuos MCO, verifican las hiptesis
deseables para dicha perturbacin puesto que su distribucin s es normal esfrica.
Los contrastes basados en los residuos recursivos los podemos clasificar en dos grupos;
contrastes grficos y contrastes numricos. Los primeros se utilizan de un modo general
para detectar si existe o no estabilidad en el modelo de regresin; puesto que se basan en
anlisis grficos. Son contrastes bastante generales que detectan de modo vago la
presencia de problemas en el modelo.
Los contrastes numricos permiten detectar especficamente si se cumple o no, por
separado, las hiptesis de homocedasticidad e incorrelacin de las perturbaciones.
Como hiptesis nula se especifica la estabilidad, tanto de los parmetros como de las
varianzas de la perturbacin, a lo largo de los n periodos considerados.
2
Ntese que el nmero mnimo de observaciones que se necesita para la estimacin del modelo es r-1= k, siendo k el
nmero de parmetros del modelo de regresin.
128
H0:
H1
1 = 2 = ..... = n =
12 = 22 = .... = 2n =
Wr =
Donde: S =
j= k +1
SCR
nk
{k , a n k } y {n , 3a n k }
{k , - a n k } y {n , - 3a n k }
En caso contrario, es decir cuando los valores de Wr sobrepasen dichas rectas (marcadas
con trazos ms gruesos) se puede considerar falta de estabilidad en el modelo. Para el
clculo de estas rectas se necesita determinar los valores de a que se encuentran
tabulados para distintos niveles de significacin siendo los ms usuales.
(%)
1%
5%
10%
1.143
0.948
0.850
129
Wr
3a n k
a nk
-a n k
- 3a n k
Sr =
j= k +1
n
2
j
w 2j
j= k +1
130
Sr
E(Sr) + C0
k
E(Sr)
E(Sr) - C0
Al igual que en el contraste anterior, se considera que existe evidencia suficiente para
rechazar la hiptesis nula de homogeneidad del modelo, cuando la representacin
grfica de los valores del estadstico Sr se sitan fuera de las bandas (marcadas en trazo
ms grueso). Con respecto a este contraste existe cierta evidencia emprica que permite
considerarlo ms poderoso que el test de suma acumulada (Test CUSUM).
Ejercicio ilustrativo
Yt = fondo Afuture
131
ANEXO
LA INFERENCIA ESTADSTICA Y EL PROGRAMA E-VIEWS
Y
3
1
8
3
5
X1
3
1
5
2
4
X2
5
4
6
4
6
PROCEDIMIENTO:
A. Ingresar al programa E-Views
Inicio
Programas
Eviews (hacer clic)
Aparece el cuadro siguiente:
1
2
1.
2.
3.
4.
Barra de Men
Barra de comandos
Area de Trabajo
Lnea de Estado
132
Seleccionar OK
Se crea vector c y serie de residuos
Aparece el workfile:
En la barra del men Principal, hacer clic en Quick y seleccionar Empty Group
(Edit series)
Se crea grupo
Aparece el siguiente cuadro:
133
Alternativas Adicionales
Para crear una serie haga clic en Objects / New Objects/ Series.
En la ventana emergente escribir el nombre de la serie y OK.
Para llenar o editar una serie generada o importada hacer doble clic en la serie (o
clic derecho en Open).
Una vez abierta la serie en el men hacer clic en Edit +/- y editar la serie y para
finalizar nuevamente Edit +/- .
Copy/paste: Seleccionar las celdas a copiar desde Excel (Copy) y pegarlas en
Eviews (Paste).
134
Para importar informacin desde archivos hojas de clculo, hacer clic en Procs /
Import./ (Read Text-Lotus-Excel)
Aparecer la ventana Open donde se debe buscar y seleccionar el archivo a
utilizar.
Si usted hace doble clic en le nombre del archivo, ver un segundo cuadro de
dilogo pidindole detalles acerca del archivo (Excel Spreadsheet Import)
Para un archivo de hoja de clculo (Excel o Lotus), se debe especificar las
coordenadas de la celda superior-izquierda que contiene la informacin. Por
ejemplo, si los datos empiezan el la celda A2, entonces usted deber especificar
esta celda como celda de datos superior izquierda.
Luego escribir el nombre o los nombres de las series.
Si el archivo cuenta con varias hojas de trabajo, entonces se debe especificar el
nombre de donde se desea importar.
Hacer clic en OK y los datos sern incorporados en el archivo de trabajo.
C. Estimacin de la ecuacin: Yt = 1 + 2X1t + 3X2t +t
Dependent Variable: Y
Method: Least Squares
Date: 07/26/02 Time: 16:28
Sample: 1991 1995
Included observations: 5
Variable
Coefficient Std. Error t-Statistic
C
4.000000 4.474930
0.893869
X1
2.500000 0.866025
2.886751
X2
-1.500000 1.369306 -1.095445
R-squared
0.946429
Mean dependent var
Adjusted R-squared
0.892857
S.D. dependent var
S.E. of regresin
0.866025
Akaike info criterion
Sum squared resid
1.500000
Schwarz criterion
Log likelihood
-4.084760
F-statistic
Durbin-Watson stat
1.666667
Prob(F-statistic)
Prob.
0.4657
0.1020
0.3876
4.000000
2.645751
2.833904
2.599567
17.66667
0.053571
Encabezado
Se especifica cul es la variable dependiente, el nmero de observaciones, las
variables explicativas y el mtodo de estimacin.
Primera Columna
Se refiere a qu parmetro est estimando. Es decir aquel que acompaa a la
variable que se seala.
135
Segunda Columna
Se tienen los valores estimados de los parmetros.
Tercera Columna
Muestra la desviacin estimada de los parmetros.
Cuarta Columna
Se presentan los valores calculados de los estadsticos t donde se tiene como
hiptesis nula que cada uno de los parmetros es igual a cero. Para ello los valores t
calculados para cada parmetro son la divisin de los respectivos valores de la
segunda y tercera columna. La prueba individual de significancia estadstica para un
parmetro es justamente el valor del parmetro calculado dividido por la desviacin
estndar calculada y ello es lo que se obtiene en la cuarta columna.
Quinta Columna
Presenta, el valor de la probabilidad (p-value), de rechazar la hiptesis nula cuando
es verdadera, (nivel de significacin) con los datos estimados de la muestra que
tenemos.
136
137
10
8
6
4
2
1.0
0.5
0.0
-0.5
-1.0
-1.5
1991
1992
Residual
1993
Actual
1994
1995
Fitted
C
X1
X2
C
20.025
3.375
-6
X1
3.375
0.75
-1.125
X2
-6
-1.125
1.875
138
139
LABORATORIO
Ejercicio Aplicativo 1
Al hacer una descripcin de los resultados de la regresin vemos que los test t miden
apropiadamente la significancia estadstica de los parmetros. Adems, todas las
probabilidades asignadas para cada uno de los parmetros son todas iguales a cero por
lo que los parmetros estimados son significativos a un nivel de aceptacin del 95%.
Por otro lado, nuestro modelo tiene un nivel de ajuste del 99.37% tal como lo muestra el
coeficiente de determinacin R2 (y su valor ajustado). Adems la prueba de
significancia global (F- statistic) nos permite afirmar que en conjunto ninguno de los
parmetros estimados es NO significativo. El grado de ajuste, tanto de los valores
realizados como de los estimados, as como los residuos de la ecuacin anterior se
puede apreciar de manera grfica
140
Modelo de Inflacion
Valores realizados, estimados y residuos
8.0
7.5
7.0
0.10
6.5
0.05
0.00
-0.05
-0.10
92
93
94
95
Residual
96
97
Actual
98
Fitted
Para analizar la estabilidad de los parmetros, se propone utilizar los siguientes test:
a.
b.
c.
d.
0.08
0.06
0.04
0.02
0.00
-0.02
-0.04
-0.06
-0.08
93
94
95
Recursive Residuals
96
97
98
2 S.E.
141
Dado que la curva sale fuera de las bandas, en ambos casos, concluimos que los
parmetros estimados son inestables.
Test del CUSUM
30
20
10
0
-10
-20
-30
93
94
95
CUSUM
96
97
98
5% Significance
94
95
CUSUM of Squares
96
97
98
5% Significance
7.059748
20.17847
Probability
Probability
0.000293
0.000156
142
El E-views permite usar el RESET test propuesto por Ramsey (1969). La hiptesis nula
es que el modelo esta bien especificado. A un nivel de 5% de significancia aadiendo 2
trminos al test, la probabilidad asociada es de 43.53% mayor al 5%; por lo tanto se
rechaza la hiptesis nula, concluyndose que el modelo est correctamente especificado.
Ramsey RESET Test:
F-statistic
Log likelihood ratio
0.614881
0.643157
Test Equation:
Dependent Variable: LIPC
Method: Least Squares
Date: 09/22/02 Time: 09:18
Sample: 1992:01 1998:12
Included observations: 84
Variable
Coefficient
C
4.558636
LCIRPROM
0.493996
LTC
0.667595
FITTED^2
-0.025285
R-squared
0.993829
Adjusted R-squared
0.993598
S.E. of regression
0.026011
Sum squared resid
0.054126
Log likelihood
189.3940
Durbin-Watson stat
0.645581
Probability
Probability
0.435271
0.422570
12
Series: Residuals
Sample 1992:01 1998:12
Observations 84
10
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
8
6
4
2
Jarque-Bera
Probability
1.50E-15
0.004828
0.066321
-0.063627
0.025635
-0.302419
3.145839
1.354843
0.507925
0
-0 06
-0 04
-0 02
0 00
0 02
0 04
0 06
143
Suponga que Ud. desea dedicarse a la produccin de Kiwi, producto que requiere gran
cuidado en cuanto a las condiciones del medio ambiente como tambin de riego.
La siguiente informacin corresponde a la experiencia de una cooperativa, suponiendo
que el resto de los factores que inciden en la produccin de Kiwi son homogneos a los
del resto del Per, utilice esta informacin para planificar su produccin.
Ao
1990
1991
1992
1993
1994
1995
1996
1997
Producto
ton./h.
60
50
70
70
80
50
60
40
Cantidad
de agua
9
10
11
10
12
9
11
8
Temperatura
Promedio (C)
13.3
8.3
11.70
11.70
13.3
8.3
6.7
6.7
1. Estime un modelo que considere solamente el agua como variable explicativa y otro
que incluya al agua y la temperatura.
Considerando Solamente al Agua, realizando una regresin lineal simple, tendremos
que la ecuacin de regresin resulta:
Variable
Coefficient
CANT_AGUA
8.333333
C
-23.33333
R-squared
0.694444
Adjusted R-squared
0.643519
S.E. of regression
7.817360
Sum squared resid
366.6667
Log likelihood
-26.65155
Durban-Watson stat
1.856061
Prob.
0.0102
0.3443
60.00000
13.09307
7.162889
7.182749
13.63636
0.010176
Variable
Coefficient Std. Error t-Statistic
CANT_AGUA
6.034483 0.275378 21.91347
R-squared
0.640805
Mean dependent var
Adjusted R-squared 0.640805
S.D. dependent var
S.E. of regression
7.847060 Akaike info criterion
Sum squared resid
431.0345
Schwarz criterion
Log likelihood
-27.29849
Durbin-Watson stat
Prob.
0.0000
60.00000
13.09307
7.074624
7.084554
1.490000
Variable
Coefficient Std. Error t-Statistic
CANT_AGUA
3.661719 0.782738 4.678091
TEMP_PROM
2.378622 0.762748 3.118492
R-squared
0.862946
Mean dependent var
Adjusted R-squared 0.840104
S.D. dependent var
S.E. of regression
5.235532 Akaike info criterion
Sum squared resid
164.4647
Schwarz criterion
Log likelihood
-23.44453
F-statistic
Durbin-Watson stat
1.580261
Prob(F-statistic)
Prob.
0.0034
0.0206
60.00000
13.09307
6.361132
6.380992
37.77838
0.000850
145
Ejercicio Aplicativo 3
I t = 1 + 2 PBI + t
Donde:
I
: Inversin
PBI : Producto Bruto Interno
Ao
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
I
14,758
16,487
21,931
26,374
25,094
28,825
28,255
24,455
23,554
21,663
PBI
83,401
87,375
98,577
107,039
109,709
117,110
116,485
117,590
121,267
121,513
Fuente: BCRP.
Dependent Variable: I
Method: Least Squares
Date: 02/26/03 Time: 10:36
Simple: 1992 2001
Included observations: 10
Variable
Coefficient
C
-4873.554
PBI
0.259365
R-squared
0.603094
Adjusted R-squared
0.553481
S.E. of regression
3092.991
Sum squared resid
76532765
Log likelihood
-93.44261
Durbin-Watson stat
0.565595
Prob.
0.5638
0.0082
23139.60
4628.697
19.08852
19.14904
12.15591
0.008240
I = -4873.553604 + 0.2593652018*PBI
-
146
C
PBI
C
65512622
-597.7039
PBI
-597.7039
0.005534
Para 1 :
Como se tiene un p-valor de 0.5638 el cual es mayor que 0.05 ; se acepta la hiptesis
nula (no es significativo), lo que origina que en este modelo no ser necesario utilizar el
termino constante lo que significa que cuando el PBI sea cero no existir inversin .
Para 2 :
H 0 : 2 = 0 el PBI no explica el comportamineto de la inversin
H 1 : 2 0 el PBI es capaz de explicar el comportamineto de la inversin
Se tiene un p-valor de 0.0082, el cual es menor que 0.05; lo que origina que se rechaze
la hiptesis nula; por lo que se concluye que el PBI puede explicar el comportamiento
de la inversin a partir del modelo inicialmente planteando.
d. Intervalo de confianza al 95% para el segundo parmetro ( 2 )
Se sabe que: P ( 2 - t * Stad Error < 2 < 2 + t * Stad Error) = 0.95, reemplazando
valores:
P (0.259365-2.036* 0.074391 < 2 < 0.259365 +2.036* 0.074391) = 0.95.
P (0.107904924< 2 < 0.410825076) = 0.95
Por lo tanto el valor del segundo parmetro se encuentra entre 0.107904924 y
0.410825076.
e. Verificacin de la significancia global del modelo ( Prueba F)
147
Ejercicio de autoconocimiento
Porqu realizar el proceso de inferencia?
SI
NO
NO S
148
RESUMEN
Los coeficientes de confianza son los niveles de confianza que tenemos en que el
intervalo contiene el valor desconocido del parmetro.
El principio del intervalo de confianza: Tiene un Lmite superior de confianza y un
lmite inferior de confianza.
En: Pr ob( 1 1t / 2 1 1 + 1t / 2 ) = 1
El coeficiente de confianza: 1
Lmites de confianza inferior: 1 1t / 2
Lmites de confianza superior: 1 + 1t / 2
Estimacin de la varianza del trmino de perturbacin:
2 =
e' e
Y' Y ' X' Y
=
(n k )
nk
FORMULA
COEFICIENTE DE
DETERMINACION
SCE
SCR
R =
= 1
SCT
SCT
COEFICIENTE DE
CORRELACION
Poblacional
Cov( x , y)
r=
2x 2y
COEFICIENTE DE
DETERMINACION
MULTIPLE
CORREGIDO
0 R 1
Muestral
(x i x)(x i y)
(x
x)2
n 1
i
(y
y) 2
n 1
i
2
( yi yi ) / n k
2
R = 1
2
( y yi ) / n 1
i
149
EXPLORACION ON LINE
150
LECTURA
Aplicacin estadstica del Anlisis de Varianza
The Wall Street Journal public hace poco un artculo sobre Ruport Murdoch, el editor
nacido en Australia que ha construido un imperio mundial de medios de difusin con
prstamos concedidos por bancos de todo el mundo.
Como afirmaba el Wall Street Journal, ahora se enfrenta al perodo de apalancamiento
al de tomar decisiones difciles en relacin con las amortizaciones.
Gran parte de la deuda se contrajo durante una poca de expansin, en la compra y
formacin de tres nuevas empresas, TV Guide, Sky Lab y la red de televisin Fox (que
atraviesa ciertas
dificultades a pesar del xito de Bart Simpson y su familia de
inadaptados).
El artculo afirmaba que Murdoch tendra que comprara las situaciones deudoras
relativas de cada uno de los tres nuevos aspectos de su aventura empresarial.
Quiz fuera preciso recurrir al
Anlisis de Varianza para comparar los niveles medios de endeudamiento en cada una
de las tres nuevas y arriesgadas empresas.
Allen L. Webster
151
ACTIVIDADES
152
Ao
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
X1
X2
X3
X4
X5
26686
44953
69262
98577
120858
136929
157274
165949
173957
185281
188172
198437
20607
34934
52996
71306
85933
98598
110782
118269
122261
131565
136040
142960
2 067
3566
5568
8672
11786
13827
15487
17296
18854
19717
20290
20703
4613
7780
13376
21931
30013
31283
37952
39321
36894
37545
35082
36563
3260
5628
8627
12590
15118
17975
22272
22076
25855
29851
30020
32612
3862
6954
11304
15922
21991
24754
29219
31014
29907
33396
33260
34402
AUTOEVALUACIN
0> R2> 1.
0 R2 1.
0> R2 1.
Ninguna de las anteriores
Cercano a 1
Cercano a 0
Lejano a 1
Todas las anteriores
c. Los coeficientes
d. Los parmetros
Test de Chow
Test de Cusum
Test de suma acumulada
Ninguno de los anteriores
7. Los datos siguientes corresponden al gasto promedio del hogar segn actividad
econmica del jefe del hogar y corresponden al ao 2002.
Considere:
Y: Gasto mensual del hogar
X1: Alimentos
X2: Vestido y Calzado
X3: Alquiler de Vivienda, Combustible, Electricidad y Conservacin de Vivienda
X4: Muebles y Enseres
X5: Cuidado y conservacin de la salud
X6: Transportes y Comunicaciones
X1
344.13
596.23
628.64
597.22
699.82
559.50
592.19
791.74
676.34
655.51
635.96
367.28
X2
29.50
47.36
68.70
53.36
75.72
49.00
42.84
42.81
61.72
66.57
54.49
27.93
X3
65.50
380.40
237.27
324.35
470.63
266.64
332.73
289.59
346.36
374.11
434.68
373.74
X4
17.12
43.98
51.29
51.58
63.70
37.65
46.96
35.69
59.45
64.67
80.71
40.66
X5
44.56
111.60
151.15
129.70
138.02
84.25
114.69
134.48
133.70
146.09
176.65
128.28
X6
23.43
116.82
136.79
162.37
180.20
68.18
94.26
65.78
173.60
145.50
227.35
124.38
Y
585.08
1 547.68
1 586.46
1 599.22
1 972.95
1 277.54
1 498.61
1 603.19
1 720.58
1 848.41
1 992.75
1 212.56
154
RESPUESTAS DE CONTROL
1. c, 2. b, 3. a, 4. d, 5. c, 6.a 7.c
155