You are on page 1of 11

Repaso varianza de los estimadores

Econometra Cap. 1.3: Signicancia de los estimadores


Matas Cabello

Signicancia en tests de hiptesis

Supuestos adicionales para la validez y factibilidad de una regresin

Signicancia de los coecientes en el MCRL Valores t y p reportados en los software estadsticos

Universidad Diego Portales Facultad de Ingeniera


19 de agosto de 2013

Apndice Distribuciones de uso comn en la econometra

Repaso varianza de los estimadores

Repaso varianza de los estimadores


Contenidos importantes de la ltima clase: El proceso generador de datos vs. regresin muestral. A mayor dispersin en la varianza de los errores de la regresin

Repaso varianza de los estimadores

poblacional ( ), mayor ser la dispersin de los posibles valores estimados de

. ) = var (
2 tras asumir los 5 (xi x )2 i =1
n

Obtuvimos el resultado primeros supuestos.

Una forma de condensar los supuestos 1, 3, 4 y 5 es:

yi

= + xi , ui iid (0, 2 ) i .

Signicancia en tests de hiptesis

Signicancia en tests de hiptesis

Suponga que realiza una estimacin y obtiene un valor

= 10.

Qu tan seguro puede estar respecto a que dicho valor es

Signicancia en tests de hiptesis

cercano a su contraparte poblacional ( )?


Existen dos formas comunes de representar dicha certidumbre: 1. Va un intervalo de conanza 2. Por medio de la signicancia (este es el formato ms usado en econometra)

Signicancia en tests de hiptesis


Figura : Intervalo de conanza

Signicancia en tests de hiptesis


Signicancia estadstica:
Probabilidad de rechazo de una hiptesis nula ( Probabilidad de cometer un error del tipo I.

H0 ).

Cuadro : Decisiones en la prueba de hiptesis


Decisin (resultado del estadstico)
El intervalo de conanza nos dice: con una probabilidad de X % el valor de No se rechaza Se rechaza

se encuentra en algn punto entre

min

max .

H0

H0

H0

Estado de la naturaleza

es verdadera
no hay error

H0

es falsa

error tipo II
no hay error

error tipo I

Note que a mayor varianza, menos acotado se encuentra el rango de posibles valores del parmetro poblacional

Signicancia en tests de hiptesis


H0 se disea falseable y como hiptesis conservadora
nuevo envase es ms resistente que el anterior, resistencia sigue igual, o creencia previa. Por ejemplo, si un productor quiere saber si un

Signicancia en tests de hiptesis


Cmo formulamos

H0 y H1 ? Ejemplos:
N (100; 20)

H0 y H1 corresponden siempre, de forma implcita o explcita, a


casos antagnicos. Por ejemplo,

H1 ser que aument.


0

H0 ser que la
> 0

1. Se quiere saber si un medicamento particular aumenta la presin arterial de los pacientes (denotmosla con que esta se distribuye de acuerdo a Solucin:

como nula vs.

X H0 : = 100, H1 : > 100 X

X ). Se sabe

como alternativa. Sin embargo, ... ... por motivos prcticos,

H0 se suele plantear de forma


< 0

2. Se piensa que el ltimo terremoto disminuy el precio real del m precio se distribuye de acuerdo Solucin:

2 de departamentos sobre el dcimo piso. Se piensa que dicho

simplicada. Si es de inters

conservadora, esta se modela como

H0 : = 0 en lugar de
> 0 .

como hiptesis

H0 : = 40, H1 : < 40

N (40; 12)

< 0 .

Dada una hiptesis nula

H0 : = 0 existen tres formas comunes de plantear la hiptesis alternativa H1

Lo mismo ocurre si la hiptesis conservadora es

3. Se piensa que la ltima crisis econmica cambi la demanda por cierto tipo de activo nanciero, pero no se sabe bien si aument o disminuy. LA distribucin anterior era Solucin:

1. H1 : > 0 , en cuyo caso la hiptesis nula implcita es < 0 2. H1 : < 0 , en cuyo caso la hiptesis nula implcita es > 0 3. H1 : = 0 , siendo explcita H0 .
7

H0 : = 10, H1 : = 10

N (10; 1, 25)

Signicancia en tests de hiptesis


Figura : Estimacin signicativa

Signicancia en tests de hiptesis

Note que la distribucin relevante para el clculo de signicancia es

0 (grcos inferiores de las guras presentadas).Entindase as: se plantea que 0 es la realidad,


la de la hiptesis nula, centrada en

y se ve qu tan probable es rechazarla en dicho caso. Note tambin que la distribucin se puede desplazar a cualquier

0 , esto debido a que su varianza es . independiente del nivel de o


punto elegido como

H0 : = H 0 se disea de forma tal que represente una aseveracin conservadora y falseable. Habitualmente H0 : = 0.
La hiptesis nula

10

Signicancia en tests de hiptesis


Figura : Estimacin no signicativa

Signicancia en tests de hiptesis

Relacin entre varianza y signicancia de un estimador


A mayor varianza de un estimador, mayor es la probabilidad de que el valor estimado caiga dentro de la zona de aceptacin de la hiptesis nula. Por ende, la relacin entre varianza y signicancia

de un estimador es negativa.

La estimacin se torna no signicativa si es que

H 0

o si

) es muy elevado. Var (

es muy cercano a

11

12

Signicancia en tests de hiptesis

Supuestos adicionales para la validez y factibilidad de una regresin

Cmo calcular la signicancia (o el intervalo de conanza) exactamente? Para obtener el valor p no basta con suponer que la varianza de los errores es

2.

Tendremos que asumir normalidad (u otra

distribucin). Antes de pasar a las consecuencias del supuesto de normalidad es til precisar dos supuesto adicionales.

Supuestos adicionales para la validez y factibilidad de una regresin

13

Supuestos adicionales para la validez y factibilidad de una regresin


Supuesto N 6: Contamos con ms observaciones que parmetros por estimar
Si

Supuestos adicionales para la validez y factibilidad de una regresin


Supuesto N 7: Los datos de X no son constantes ni atpicos Necesitamos que los xi no sean todos iguales a una constante.
Formalmente,

es el nmero de parmetros a estimar y

n el nmero de
haber valores

Var (X ) > 0
Con ausencia de valores atpicos nos referimos a que no pueden

observaciones, entonces se requiere de

n>K
Para el modelo

xi

extremos, pues estos nos generarn un sesgo en la

estimacin de la pendiente

yi

Por lo tanto

= + xi + ui , K = 2.

beta.

los parmetros a estimar son El supuesto de variabilidad se necesita para evitar estimar una pendiente innita. El supuesto de ausencia de valores atpicos lo estudiaremos en detalle ms adelante.

14

15

Signicancia de los coecientes en el MCRL

Signicancia de los coecientes en el MCRL


El modelo clsico de regresin lineal (MCLR) simple se completa con el supuesto de normalidad.

Signicancia de los coecientes en el MCRL

Supuesto N 8: Normalidad de los errores Asumimos que el error ui de yi = + xi + ui


Formalmente,

se distribuye de

acuerdo a una distribucin normal con media 0 y varianza

2.

ui

N (0; 2 )

16

Signicancia de los coecientes en el MCRL


Si adems de los supuestos 1 a 5 se cumple el supuesto de normalidad de los errores (supuesto N

Signicancia de los coecientes en el MCRL


Con esto ya podramos asignar signicancia a nuestra estimacin, si no fuera porque: 1. No conocemos

8), entonces se cumple que:

(es un parmetro poblacional, no muestral)

N ,
Si

2 n (x x 2 i =1 i ) 2 n (x x 2 i =1 i )

2. Tener que estimar la distribucin de

t.

incorpora otro grado de libertad y cambia

H0 es cierta, entonces = H 0 y, por lo tanto:


H 0 ) N (
0,

En la prctica, el estimador para

ser

2 =

n2

n u 2 i =1 i
t ser

(1)

y la distribucin resultante para el estadstico

Estandarizando obtenemos:

t=

H 0

2 n (xi x )2 i =1

N (0, 1)
siendo

t=

H 0
n

2 (xi x )2 i =1

tnk 1


17

).

el nmero de coecientes a estima (en nuestro caso son 2,

18

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos

A qu se suele referir un econometrista cuando dice que un coeciente es signicativo?


Si bien el trmino signicancia se aplica a cualquier prueba de hiptesis, muchas veces se utiliza para designar la signicancia un test en particular: el de la hiptesis nula de irrelevancia del coeciente.

H0 : = 0
Figura : Signicancia estadstica reportada en Gretl

19

20

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos
Valores

y P

La signicancia, tambin denominada alpha o valor P (ltima columna en Gretl), se calcula en base al estadstico de t Los errores estndar estimados (antepenltima columna en Gretl) corresponden as a correspondiente a la hiptesis nula columna):

H0 : = 0

(penltima

) = ( ee

) = Var (

)2 (xi x

Valor

t para H0 : i = 0
t= H 0 = ) ) ( ( ee ee

Recuerde que el valor P en ese caso representa la probabilidad de cometer un error del tipo I (rechazar cierta).

H0 cuando en realidad es

21

22

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos
Signicancia o valor P bajo
i )), ( N (0, var
ms extremo que

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos

H0 : i = 0
i i
real es es cero.

Corresponde a la probabilidad de haber obtenido un valor igual de o

cuando la distribucin del

es decir, cuando

Para un parmetro estimado P-val

tenemos

= = = = =

P (rechazar H0 cuando en realidad es cierta) i ))) ( P (rechazar H0 : i = 0 cuando i N (0, var i | icrit pese a que i N (0, var i ))) ( P (que se cumpla | nk ) P (| t | t/ 2 i )) en N (0, 1)) ( (transformamos a i en t y a N (0, var t 2 (1 Fnk (| t |))
23

Figura : Signicancia estadstica reportada en Gretl


Aquellas variables que aparecen como signicativas (con valores P inferiores a un

de 10 %, 5 % o 1 %) son  signicativamente

distintas de cero.

24

Signicancia de los coecientes en el MCRL


Valores t y p reportados en los software estadsticos
Figura : Ejemplo en Getl

Apndice

Apndice

25

Apndice

Distribuciones de uso comn en la econometra


Distribucin normal
La densidad de la distribucin est dada por

Apndice

Distribuciones de uso comn en la econometra

f (x ) =
Usamos la convencin

e 2

(x )2 2 2

X
normal con media

N ( ; )

para denotar una variable aleatoria

que se distribuye de forma

y la desviacin estndar

Destacamos las

siguientes propiedades: 1. Es simtrica en torno a su media. 2. De forma aproximada, 68 % del rea bajo la curva se encuentra en el intervalo intervalo

Figura : Distribucin normal

, 3 .

95 % en el intervalo

y 97.7 % en el

26

27

Apndice

Distribuciones de uso comn en la econometra


3. La probabilidad de que normalizamos

Apndice
y

est dentro de un intervalo se puede

Distribuciones de uso comn en la econometra 5. Teorema del lmite central: Sean X1 , X2 , ...Xn , n variables
aleatorias independientes y con la misma FDP (de

calcular teniendo los valores de

En la prctica

con la expresin

cualquier distribucin) con media

= x N (0; 1)

= X

tamao de muestra con media

Xi /n la media muestral. Entonces, a medida que el n, la distribucin converge hacia una normal

y varianza

y varianza

2.

Sea

para as poder leer la probabilidad de la tabla de probabilidades de la distribucin normal estandarizada. 4. Si

2:

X1 N (1 ; 1 ), X2 N (2 ; 2 ), ... etc., entonces la Y


= aX1 + bX2
+ ...,

N X n
X z = / n

; n

combinacin lineal

Por ende, se tiene tambin la variable normal estandarizada

) n (X N (0; 1).

vale decir, cualquier combinacin lineal de variables aleatorias normales con

X1 , X2 , etc., se distribuir tambin de forma normal, Y


2 + b2 2 ) N (aX1 + bX2 ); (a2 1 2
.

Def.: Teorema del lmite central (central limit theorem)


La media muestral de normal con media

n variables aleatorias con cualquier


y varianza 2 , 2 varianza /n

distribucin comn, con media

es asintticamente

28

29

Apndice

Distribuciones de uso comn en la econometra

Apndice

Distribuciones de uso comn en la econometra

6. El tercer y cuarto momento estn dados por

E (X )3 = 0 4 Curtosis: E (X ) = 3
Asimetra: la normalidad de una variable. 7. Si

(2) (3)

Ms adelante estudiaremos el test de Jarque-Bera para probar

X eY

estn distribuidas normalmente de manera conjunta,

estas son independientes si y solo si la covarianza entre ellas es cero.

Figura : Funcin de densidad de la suma de n lanzamientos de un dado

30

31

Apndice

Distribuciones de uso comn en la econometra


Distribucin ji cuadrada (chi-squared ) o
Si

Apndice
2

Distribuciones de uso comn en la econometra

independientes, entonces

Z1 , Z2 , ..., Zk

son variables normales estandarizadas

Z
donde

k Z 2 2 , i =1 i k
2
con

Esta cuenta las siguientes caractersticas: 1. La distribucin

2 k

representa la distribucin

grados de libertad.

es asimtrica, dependiendo la asimetra de

2 2. La media de la distribucin es y su varianza es 2 . 2 2 3. Si 1 k , 2 k y [ ( 1 , 2 )] = 0, vale decir 1 y 1 2 2 2 son variables independientes con 1 y 2 grados de 2 libertad, entonces la suma 1 + 2 k +k . 1 2

k E COV Z Z Z Z

k.

32

Figura : Distribucin de densidad 2 con distintos grados de libertad k

33

Apndice
Sean

Distribuciones de uso comn en la econometra

Apndice

Distribuciones de uso comn en la econometra

t de Student (Student's t-distribution) Z1 una variable normal estndar y Z2 una variable 2 con k 2 grados de libertad, vale decir Z1 N (0, 1) y Z2 k , entonces
Distribucin
1 t = Z Z 2 /k

kZ1

Z2 tk .

Esto es, la variable student con

se distribuye de acuerdo a la distribucin

de

grados de libertad.

Las propiedades de la distribucin

son:

1. Es simtrica, de aspecto similar a la normal pero ms plana. 2. A medida que aumentan los grados de libertad se aproxima a la distribucin normal. 3. La media es cero y su varianza es

Figura : Densidad de la distr. t con distintos grados de libertad k

k /(k 2).
34 35

Apndice
Sean

Distribuciones de uso comn en la econometra


Distribucin F

Apndice

Distribuciones de uso comn en la econometra

Z1 y Z2 variables 2 independeintes con k1 y k2 grados de F


1 /k1 =Z Z2 /k2 Fk1 ,k2

libertad, respectivamente, entonces

Propiedades: 1. Al igual que la distr. 2. La media es

2 ,

es asimtrica pero converge hacia una

3.

k2 /(k2 2), est denida solo para k2 > 2. La 2 (k +k 2) 2k2 1 2 varianza, denida para k2 > 4 es k1 (k2 2)2 (k2 4) . EL cuadrado de una variable aleatoria con distr. t con k grados de libertad sigue una distribucin F con 1 y k grados de
libertad:

normal a medida que aumentan los grados de libertad.

4. Si el nmero de grados de libertad del denominador, relativamente alto, se cumple

2 =F tk 1,k

k2 , es
36

Figura : Distribucin F para distintos grados de libertad

k1 F

2 k1

37

Apndice

Distribuciones de uso comn en la econometra

Proposicin: Distribuciones relacionadas con la normal


Para un nmero grande de grados de libertad, las distribuciones y

t , 2

se aproximan a la distribucin normal.

38

You might also like