You are on page 1of 54

 Si los datos lo clasificamos de acuerdo a la

entidad a la que pertenecen y al tiempo


tenemos tres tipos de datos:
 Datos de series de tiempo
 Datos de corte transversal
 Datos de panel
 En estos modelos individuos son las
personas, familias, empresas, bancos,
ciudades, regiones, países, universidades,
etc
 personas

familias

individuos
Empresas

Bancos

Etc
 Datos de series de tiempo: son datos que
pertenecen a una sola entidad (individuo)
pero para diferentes momentos del tiempo(
este momento del tiempo puede ser un
quinquenio, un año, un semestre un trimestre
una semana, etc),
 Ejm: las exportaciones del Perú para el
periodo 1990-2015
 Datos de corte transversal: son datos que
pertenecen a diferentes entidades pero para
un solo momento del tiempo, Por ejemplo:
las exportaciones de los países de
Sudamérica para el año 2015
 Son datos que pertenecen a varias
entidades(individuos) y para varios momentos del
tiempo
 son datos que es una combinación de datos se
series de tiempo y de corte transversal.
 Ejemplo: Las exportaciones de los países de
Sudamérica para el periodo 1990-2015
 Los datos panel puede ser útil debido a que le
permite al investigador clasificar efectos
económicos que no puedan ser distinguirse solo
con el uso de datos de corte transversal o de
series de tiempo
 La especificación general de un modelo de regresión
con datos de panel es la siguiente:
Y it = αi + Ʃ Bk Xit + Wit
con i = 1,......N; t = 1,...T.
 Donde i se refiere al individuo o a la unidad de
estudio (corte transversal), t a la dimensión en el
tiempo,
 En este caso, la muestra total de las observaciones en
el modelo vendría dado por N x T.
 A partir de este modelo general, y con base en ciertos
supuestos y restricciones acerca del valor de algunos
de los parámetros, se pueden derivar algunas otras
variantes de modelos de datos de panel,
 Es usual interpretar los modelos de datos de
panel a través de sus componentes de
errores.
 El término de error Wit incluido en la ecuación
anterior, puede descomponerse de la
siguiente manera:
 Wit = εi+ δt+ μit
 Donde:
 εt :representa los efectos no observables que
difieren entre las unidades de estudio pero no en el
tiempo, si se trata de empresas por ejemplo que
generalmente se los asocia a la capacidad
empresarial
 δt :se le identifica con efectos no cuantificables
que varían en el tiempo pero no entre las unidades
de estudio(individuos)
 μit :se refiere al término de error puramente
aleatorio.
En La mayoría de las aplicaciones con datos de
panel utilizan el modelo de componente de error
conocido como “one way” para el cual δt =0.
 Las diferentes variantes para el modelo “one way”
de componentes de errores surgen de los distintos
supuestos que se hacen acerca del término εi
pueden presentarse tres posibilidades:
1)El caso más sencillo es el que considera a
εi =0 , o sea, no existe heterogeneidad no
observable entre los individuos o firmas.
Dado lo anterior, los Wit satisfacen todos los
supuestos del modelo lineal general, por lo
cual el método de estimación de mínimos
cuadrados clásicos(MCO) produce los mejores
estimadores lineales e insesgados.
puesto que: Wit = αi + δt+ εit ,como δt=0 y
εi =0 => Wit = εit
2) La segunda posibilidad consiste en suponer a εi
un efecto fijo y distinto para cada firma. En este
caso, la heterogeneidad no observable se incorpora
a la constante del modelo(dando origen al modelo
de efectos fijos)
3) La tercera alternativa es tratar a εi como una
variable aleatoria no observable que varía entre
individuos pero no en el tiempo.
1)Modelo de datos panel balanceado: se dice
que un panel es balanceado si cada
individuo(persona, familia, empresa ,etc)
tiene el mismo numero de observaciones
2) Panel no balanceado: Si cada individuo tiene
un numero diferente de observaciones se
tiene un panel no balaceado.
En este curso nosotros trabajaremos con
modelos de datos panel balanceados
1)La técnica permite al investigador económico
disponer de un mayor número de observaciones
incrementando los grados de libertad y
reduciendo la colinealidad entre las variables
explicativas y, en última instancia, mejorando la
eficiencia de las estimaciones econométricas.
2)La técnica permite capturar la heterogeneidad no
observable ya sea entre unidades individuales de
estudio como en el tiempo. Con base en lo
anterior, la técnica permite aplicar una serie de
pruebas de hipótesis para confirmar o rechazar
dicha heterogeneidad y cómo capturarla.
3)Los datos en panel suponen, e incorporan en el
análisis, el hecho de que los individuos(personas,
familias, empresas, bancos, países, etc) son
heterogéneos. Los análisis puramente de series
de tiempo, o de corte transversal no tratan de
controlar esta heterogeneidad corriendo el riesgo
de obtener resultados sesgados.
4)Permite estudiar de una mejor manera la
dinámica de los procesos de ajuste. Esto es
fundamentalmente cierto en estudios sobre el
grado de duración y permanencia de ciertos
niveles de condición económica (desempleo,
pobreza, riqueza).
5) Permite elaborar y probar modelos
relativamente complejos de comportamiento
en comparación con los análisis de series de
tiempo y de corte transversal. Tales como el
cambio tecnológico. Un ejemplo claro de
este tipo de modelos, son los que se refieren
a los que tratan de medir niveles de eficiencia
técnica por parte de unidades económicas
individuales (empresas, bancos, etc )
6) Proporciona una información valiosa de los
individuos siguiéndolos a través del tiempo
 En términos generales, las desventajas asociadas
a la técnica de datos de panel se relacionan con
los procesos para la obtención y el
procesamiento de la información estadística
sobre las unidades individuales de estudio,
cuando esta se obtiene por medio de encuestas,
entrevistas o utilizando algún otro medio de
levantamiento de los datos.
 Ejemplos de este tipo de limitaciones son:
cobertura de la población de interés, porcentajes
de respuesta, preguntas confusas, distorsión
deliberada de las respuestas,
 Abandono de la muestra por cierta individuos
, por lo que no es posible realizar su
seguimiento a lo largo del tiempo, en general
se puede solucionar este problema mediante
la observación temporal de individuos con
características muy similares (datos de
cohortes)
 Para estimar los parámetros de los modelos
de datos panel se utilizan los siguiente
métodos:
 El método de datos agrupados de MCO
 El Método de efectos fijos
 El Método de efectos aleatorios
 Tan solo se agrupan o apilan las
observaciones y se estima una regresión, por
MCO sin atender la naturaleza de corte
transversal y de series de tiempo de los
datos.
 En este método se consideran que todos los
coeficientes del modelo o ecuación son
constantes
 Los datos analizan los costos de 6 empresas de aviación
comercial de 1970 a 1984, para un total de 90 observaciones
de datos panel
 Se desea analizar como se comporta el costo total( C) en
relación con la producción(Q), precio del combustible PF), y el
factor de carga(LF)

 Donde:

C: en 1000 USD
Q: Producción, como ingresos por milla por pasajero(un
índice)
PF: precio del combustible
LF: Factor de carga, la utilización promedio de la
capacidad de la flotilla
 Estimando el modelo:
 Cit = B0+ B1 Qit + B2 PFit +B3 LFit +μt
i=1,2,3,4,5,6
 T=1,2,3,…15
 N= 6x15=90
 El modelo estimado es:
 Cit = 1158559+ 2026114Qit +1.225348PFit -3065753LFit
 T=> (3.21293) (32.78134) (11.8138) (-4.40275)
 R2 = 0.94609; Dw=0.4342
 El método de efectos fijos considera que
existe un término constante diferente para
cada individuo, y
supone que los efectos individuales son
independientes entre sí.
 Con este modelo se considera que las
variables explicativas afectan por igual a las
unidades de corte transversal y que éstas se
diferencian por características propias de
cada una de ellas, medidas por medio del
intercepto.
I) El método de efectos fijos con variables
dicótomas
II) El método de efectos fijos dentro del grupo,
intragrupos (within group)
 En el caso de datos panel cuya componente
transversal es la dominante, pocos agentes
individuales(agentes sociales) y muchas
observaciones en el tiempo, este modelo
puede captar la variación existente en la
muestra debido a la presencia de diferentes
individuos(o agentes sociales) con la
inclusión de un conjunto de (N-1) variables
dicótomas Di
 La variable Di toma el valor de 1 en el caso de
que la observación se refiera al agente o
individuo i de la muestra, 0 para el resto de
observaciones
 Con la cual se puede observar que la
inclusión de estos coeficientes αi en el
modelo de regresión estándar esta captando
así pues la variación en la constante o
intercepto B0 del modelo(la cual cambia para
cada agente social de la muestra)
 Se puede hacer lo mismo para el caso de
diferencias a través del tiempo mediante la
inclusión de una serie de variables dicótomas tt
( con los coeficientes Φt asociados a cada una
de las T-1, variables dicótomas que toman el
valor de 1 para un momento del tiempo y 0 para
el resto) así se controla por posibles variaciones
en el termino del intercepto a través del tiempo
 El siguiente modelo capta las diferencias en los
individuos y las diferencias en el tiempo :
Yit =B +α2D2t+ α3D3t+. . .+αNDN t+Φ2ti2+ Φ3ti3+. . .+ΦttiT+ Ʃ Bk Xit +uit
Donde:
Dit => 1( para el iesimo individuo, i=2,3,4…, N
0(en cualquier otro caso)
Tit => 1(para el tesimo periodo, t=2,3,4….T
0( en cualquier otro caso)
 Se ha agregado (N-1) +(T-1) variables dicótomas al modelo y también
hemos omitido las dos restantes, dado que su adición resultaría en una
colinealidad perfecta entre las variables explicativas

 En el modelo de efectos fijos se permite que los efectos


individuales αi y Φt puedan estar correlacionados con las
variables explicativas Xit
 Aplicando el método de efectos fijos con
variables dicótomas para el caso de las
empresas de aviación
 Consideremos que el parámetro de
intersección varia solo con respecto a los
individuos( empresas)
 => el modelo es:
 cit = α1+ α2D2+ α3D3 + α4D4+ α5D5+ α6D6 + B1Qit+B2 PFit
+B3 LFit + uit
 Donde: la empresa base o de referencia es la empresa 1
 D2i =>(1:si pertenece a la empresa2;0: si no pertenece a la empresa 2)
 D3i =>(1:si pertenece a la empresa3;0: si no pertenece a la empresa 3)
 D4i =>(1:si pertenece a la empresa4;0: si no pertenece a la empresa 4)
 D5i =>(1:si pertenece a la empresa5;0: si no pertenece a la empresa 5)
 D6i =>(1:si pertenece a la empresa6;0: si no pertenece a la empresa 6)
variables coeficientes Estadístico t Prob

C -133236.0 -0.374129 0.7093


D2i 601733.2 5.963913 0.0000
D3i 1337180.0 7.182538 0.0000
D4i 1777592.0 8.339126 0.0000
D5i 1828252.0 7.906651 0.0000
D6i 1706474.0 7 .474672 0.0000
Q 3319023 19.369390 0.0000
PF 0.773071 7.943676 0.0000
LF -3797368 -6.186924 0.0000

R2 =0.971642
DW=0.6933
Interpretando el modelo estimado:
a) Primero, que todos los coeficiente de los intercepto
diferenciales son muy estadísticamente significativos , por
lo cual podemos afirmar que las aerolíneas son
heterogéneos
b) Como consecuencia podemos decir que los resultado del
modelo estimado apilando las cifras son dudosos
c) Como consecuencia será necesario comparar ambas
métodos
cit =-131236+601733.2 D2+1337180D3 +177592D4+
1828252D5+1706474D6 + 3319023Qit+0.773071PFit-
3797368LFit

 R2 = 0.971642; DW=0.6932
α1=-131236; Es el valor del intercepto de la aerolínea 1
 Los demás coeficientes α representan el grado en que los valores
de los intercepto de las demás aerolíneas difieren del valor del
intercepto de la primera aerolínea
 Por lo cual: (α1+ α2) es el intercepto de la aerolínea 2

-131236+601733.2=470497.2 es el intercepto de 2
 Por lo cual: (α1+ α3) es el intercepto de la aerolínea 3

-131236+1337180=1205944 es el intercepto de 3

 Por lo cual: (α1+ α4) es el intercepto de la aerolínea 4


 -131236+1777592=1644356 es el intercepto de 4
 Por lo cual: (α1+ α5) es el intercepto de la aerolínea 5
 Por lo cual: (α1+ α6) es el intercepto de la aerolínea 6

 Lo haremos mediante la prueba F restringida

 F= (R2NR - R2R /numero de regresoras nuevas


 (1- R2NR )/N-numero de parámetros en el modelo nuevo

1)F= (0.971642-0.946093)/5
 (1-0.971642) /(90- 9)
F= 14.99
2) H0: D2i = D3i =D4i = D5i= D6i=0
HA :D2i ≠D3i ≠D4i ≠D5i ≠ D6i ≠0
3) Para 5%de significación tenemos un critico F(5,81) =2.37
4)Como F= 14.99>F(5,81)=2.37 => rechazo H0 y acepto la HA ,por lo cual los
intercepto en las 6 empresas de aerolíneas han sido diferentes o
heterogéneos
 Una forma de estimar una regresión es
eliminar el efecto fijo B1i expresando los
valores de las variable dependiente y
explicativas de cada aerolínea como
desviaciones de sus respectivos valores
medios
 Para lo cual a cada valor individual de las
variables de cada aerolínea le restamos su
valor medio; los valores resultantes se llaman
valores corregidos por media
 Cit = B0+ B1 Qit + B2 PFit +B3 LFit +μt
 =>Calculamos las variables:
tcit , qit , pfit , lfit representan lo valores
corregidos por la media,
 El nuevo modelo es:
tcit =B2 qit + B3 pfit + B4lfit+μit
Donde: i: 1,2,3,4,5,6 y t=1,2,3,. . .,15

 Los interceptos para cada aerolínea se obtiene como sigue:

 αi =Ci – B2 Qi –B3PFi – B4 LFi


Variable dependiente DMCT

Variables coeficientes Estadístico t Prob

DMQ 3319023 20.07396 0.0000


DMPF 0.773071 8.232630 0.0000
DMLF -3797368 -6.411976 0.0000
R2 = 0.929366
 Hallando α1
 α1 =C1 – B2 Q2 –B3PF2 – B4 LF2

 El modelo de efectos fijos es un modelo
razonable cuando se posee evidencia de que
la diferencia entre los diferentes individuos o
agentes sociales de la muestra( o bien los
diferentes momentos en el tiempo) son
cambios en el parámetro de intersección de la
función de regresión.
 Este supuesto es útil en el caso de que el numero
de unidades de análisis ( o de instantes en el
tiempo) no sea grande.
 Sin embargo, en otras ocasiones( sobre todo
cuando la unidad de análisis de individuos, son
muchas observaciones a través del tiempo), es
decir, cuando se suponen que las unidades
sociales de la muestra han sido seleccionadas
aleatoriamente de una población de unidades
sociales mucho mas amplia. Para este caso se
recomiendan los modelos de efectos aleatorios
 El modelo de efectos aleatorios se especifica
en la siguiente forma:
 Yit = αi + Ʃ Bk Xit + Wit
 Donde: Wit = εi + δt + μit
 Donde:
 εi = Componente del error del corte transversal
 δt = Componente del error de la serie de tiempo
 μit =Componente del error combinado(aleatorio)
Análisis:
Sabemos que:
1)Wit = εi + δt + μit
2)αi = α + εi+ δt
Donde : α: es una media común para la intersección,
ya que la muestra fue extraída de un universo o
población mucho mas grande y que las diferencias
individuales en los valores de la intersección de cada
individuo se reflejaran en el termino de error εi
3)Yit = αi + Ʃ Bk Xit + μit
Yit = α + εi+ δt + Ʃ Bk Xit+ μit
Yit = α + Ʃ Bk Xit + εi+ δt + μit
Yit = α + Ʃ Bk Xit + Wit
 Los supuestos importantes del método de
efectos aleatorios son:
 Supone que Wit no esta correlacionado con
ninguna variable explicativa del modelo, si no
se cumple este supuesto el método de
efectos aleatorios producirá una estimación
inconsistente de los coeficientes de regresión
 Justamente la prueba de Hausman se basa en
este hecho para decir, que una aplicación
determinada el método de efectos aleatorios
es el inadecuado
 Suponiendo que no hay componente de error
en la serie de tiempo entonces: wit = εi + uit
 =>Var( wit ) = var(εi ) +var( uit ) = σε2+ σμ2
 Por lo cual el método de efectos aleatorios no
se puede estimar por el MCO sino por
Mínimos cuadrados generalizados
 El modelo que se estimará es el siguiente:
 Cit = α + B2 Qit + B2 PFit + B2 LFit + Wit
Variable dependiente: Cit
variables Coeficientes Estadístico t Prob
C 107429.3 3.534251 0.0007
Q 2288588 25.95572 0.0000
PF 1.123591 13.48877 0.0000
LF -3084994 -5.279151 0.0000

Efectos
1 -270615.0
2 -87061.32
3 -21338.40
4 187142.90
5 134488.90
6 57383.00
 En este modelo el valor promedio del
intercepto es 107429.3
 La empresa 1 tienen un valor de intercepto de
-270615.0 menor que el valor del intercepto
común lo que significa que:
 107429.3-270615.0= -163185.7
 La empresa 2 tienen un valor de intercepto de
-87061.32 menor que el valor del intercepto
común, lo que significa que:
 107429.3-87061.32=20367.98
 La empresa 3 tendrá un intercepto de:
107429.3- 21338.4= 86090.9
 Como se puede apreciar, hay una diferencia
muy grande entre los resultados que nos
provee el método de efectos fijos y el método
de efectos aleatorios
 Por lo cual necesitamos saber cual de los dos
métodos es apropiado en este caso para lo
cual hay pruebas de los cuales nosotros
estudiaremos la prueba de Hausman
 ¿Cuál debe preferirse , el modelo de efectos
fijos o el modelo de efectos aleatorios?
 El modelo de efectos aleatorios usa menos
grados de libertad y tienen un atractivo
conceptual como una caracterización amplia
de las fuentes de error en un conjunto de
datos grandes con una variación considerable
en las series de tiempo y los cortes
transversales.

 Sin embargo el modelo de efectos fijos
también tiene ventajas. Permite al
investigador analizar el grado en el que la
variable dependiente para cada unidad del
corte transversal difiere de la media global
del corte transversal. Además no requiere la
suposición de que los efectos individuales
que son incorporados en el termino de error
no están correlacionados con las variables
explicativas en el modelo.
1) H0 : El método de efectos aleatorios es el apropiado
HA : El método de efecto fijos es el apropiado
2)El contraste compara los coeficientes estimables de los
regresores que varían con el tiempo. El estadístico de
contraste mide la “distancia” entre ambas estimaciones:
si es “grande” se rechaza H0
3) H=(BEF- BEA)’[Var(BEF ) – var(BEA )]-1 (BEF- BEA) ~ X2(k)
Donde:
H: valor del test de Hausman
BEF: es el vector de coeficientes estimados del modelo de
efectos fijos
BEA: es el vector de coeficientes estimados del modelo de
efectos aleatorios
 Var(BEF ): matriz de varianzas y covarianzas del modelo
estimado por efectos fijos
Var(BEA ) matriz de varianzas y covarianzas del modelo
estimado por efectos aleatorios
4) Se rechaza la hipótesis nula (H0 ) cuando el valor H del test de
Hausman es mayor que el valor de Xk2 y se acepta la H1 lo que
significa que se acepta de que el modelo de efectos fijos es el
adecuado
Efectos aleatorios correlacionados. Prueba DE HAUSMAN
Prueba de efectos aleatorios de corte transversal
Estadístico ji cuadrado Gl ji cuadrado Prob

49.619687 3 0.0000

Comparaciones de la prueba de efectos aleatorios de corte transversal


Variables fijos aleatorios var(dif) prob
Q 3319023.28 2288587 21587779733 0.0000
PF 0.773071 1.123591 0.002532 0.0000
LF -3797367 -3084994.0 35225469544 0.0000
 En este caso se rechaza la H0 ,porque el valor
estimado de x2 es 49.62 y es mayor que el x2
para 5% de significación de la tabla = 7.81,
por cual rechazamos la H0 y aceptamos la H1
por lo que concluimos que el método de
efectos fijos es el adecuado

You might also like