You are on page 1of 32

Econometría 2

Modelos Truncados y Censurados

Luis Bendezú M.

Ponti…cia Universidad Católica del Perú

Junio 2010

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 1 / 32


Modelos Censurados y Truncados Introducción

Introducción

Se dice que la variable dependiente de un modelo está censurada si


la información referente a dicha variable no está disponible, pero
aquella correspondiente a las variables independientes si lo está.
En contraste, si ambas clases de datos no están disponibles para un
determinado grupo de personas, se dice que los datos están
truncados.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 2 / 32


Modelos Censurados y Truncados Introducción

Introducción

Algunos ejemplos de datos censurados son:


1 Observamos los salarios de mujeres que trabajan, pero no el salario de
reserva de aquellas que no trabajan.
2 Hacemos una encuesta para estudiar la compra de bienes durables. Se
puede calcular sólo el gasto de aquellos que optaron por comprar el
bien, pero se desconoce el máximo que habrían estado dispuestos a
pagar aquellos que no compraron un auto.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 3 / 32


Modelos Censurados y Truncados Introducción

Introducción

Un ejemplo de datos truncados es:


1 Una encuesta menciona que el ingreso promedio es de S/.1500 al mes.
Sin embargo, únicamente se recogieron datos de aquellos jefes de hogar
que tenían ingresos superiores a S/.1000. Por consiguiente, el
promedio no es representativo de la población completa, puesto que
parte de ella ha sido ignorada en los cálculos. En este caso, estamos
hablando de una media condicional.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 4 / 32


Modelos Censurados y Truncados Introducción

Introducción

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 5 / 32


Modelos Censurados y Truncados Truncamiento

Densidad de una variable aleatoria truncada

Es la parte de una distribución que queda por encima o debajo de un


cierto valor dado:
f (x )
f (x j x > a ) =
Pr (x > a)

Esto es, truncar equivale a introducir un factor de escala en la función


de densidad, de manera que integre a 1.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 6 / 32


Modelos Censurados y Truncados Truncamiento

Densidad de una variable aleatoria truncada

En trabajos aplicados se utiliza comúnmente la distribución normal


truncada. Si x N µ, σ2 , entonces:

a µ
Pr (x > a) = 1 Φ =1 Φ (α)
σ
a µ
donde α = σ .
Entonces:
1 x µ 2 1φ x µ
e 2( )
1/2
2πσ2 σ σ σ
f (x j x > a ) = =
1 Φ (α) 1 Φ (α)

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 7 / 32


Modelos Censurados y Truncados Truncamiento

Momentos de una variable aleatoria truncada

Recordemos las de…niciones de valor esperado y varianza de una


distribución truncada:
Z ∞
E (x j x > a ) = xf (x j x > a) dx
a
Z ∞
Var (x j x > a) = (x E (x j x > a))2 f (x j x > a) dx
a

Para una variable aleatoria normal, con esperanza µ y varianza σ2 ,


truncada en cierta constante a, se tiene que:

E (x j truncamiento) = µ + σλ (α)
Var (x j truncamiento) = σ2 (1 δ (α))

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 8 / 32


Modelos Censurados y Truncados Truncamiento

Momentos de una variable aleatoria truncada

Donde:
a µ
α= σ
δ (α) = λ (α) [λ (α) α]
( φ(α)
1 Φ(α)
si x > a
λ (α) = φ(α)
Φ(α)
si x < a
Se tiene además que δ (α) 2 (0, 1) , 8α. (Intuitivamente, si la
varianza de x es σ2 , la varianza de x condicional al truncamiento
debería ser menor a σ2 .
La variable λ (α) se llama la razón de Mills inversa.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 9 / 32


Modelos Censurados y Truncados Truncamiento

Modelo de Regresión Truncada

Sea:
yi = β0 xi + εi εi N 0, σ2
lo cual implica que:
yi j xi N β0 xi , σ2
Supongamos que yi se encuentra truncada por sobre un valor a.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 10 / 32


Modelos Censurados y Truncados Truncamiento

Modelo de Regresión Truncada

Entonces, de acuerdo al valor esperado de una variable aleatoria


sujeta a truncamiento:
a β0 xi
φ σ
E (yi j xi , yi > a) = β0 xi + σ
a β0 xi
1 Φ σ

Equivalentemente, usando la de…nición de la razón de Mills inversa:

E (yi j xi , yi > a) = β0 xi + σλ (αi )

donde:
a β0 xi
φ σ a β0 xi
λ ( αi ) = a β0 xi
, αi = σ
1 Φ σ

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 11 / 32


Modelos Censurados y Truncados Truncamiento

Modelo de Regresión Truncada

Por otra parte, la varianza de yi , condicional en yi > a, viene dada


por:
Var (yi j xi , yi > a) = σ2 [1 δ (αi )]
Adicionalmente, dada la expresión para el valor esperado condicional
al truncamiento, se pueden obtener los efectos marginales para la
subpoblación (es decir, aquellos individuos que cumplen con yi > a):

∂E (yi j xi , yi > a) ∂λ (αi ) ∂αi


= β+σ
∂xi ∂αi ∂xi
= β [1 δ (αi )]

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 12 / 32


Modelos Censurados y Truncados Truncamiento

Estimación de una Regresión Truncada (I): Mínimos


Cuadrados No Lineales
Sea el modelo:

E (yi j xi , yi > a) + ui = β0 xi + σλ (αi ) + ui

donde Var (ui j xi ) = σ2 [1 δ (αi )]. Esto implica que ui es


heterocedástico.
Además, es claro que estimar una regresión de yi , con yi > a en x, el
estimador de β estaría sesgado.
Nótese además que λi es una función no lineal de β y σ. Por ello, en
una primera etapa, puede estimarse la ecuación por mínimos
cuadrados no lineales, ignorando la heterocedasticidad de ui .
Una vez que se cuenta con estimadores de β y σ, se corrige por
heterocedasticidad, a …n de lograr ganancias en e…ciencia.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 13 / 32


Modelos Censurados y Truncados Truncamiento

Estimación de una Regresión Truncada (I): Máxima


Verosimilitud
Para estimar el modelo por MV, partimos de la función de
distribución sujeta a truncamiento:

1φ a β0 xi
σ σ
f (yi j xi , yi > a) =
a β0 xi
1 Φ σ

En este contexto, el logaritmo de la función de verosimilitud de una


muestra de n observaciones independientes viene dado por:
n
n 1

2
ln L = ln (2π ) + ln σ2 yi β0 xi
2 2σ2 i =1
n 0
a β xi
∑ ln 1 Φ
σ
i =1

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 14 / 32


Modelos Censurados y Truncados Truncamiento

Estimación de una Regresión Truncada (I): Máxima


Verosimilitud
Las condiciones de primer orden son:

∂ ln L n
yi β0 xi λi
=∑ xi = 0
∂β i =1 σ2 σ
2
!
∂ ln L n
1 yi β0 xi αi λi
=∑ + =0
∂β i =1 2σ2 2σ4 2σ2
a β0 xi φ ( αi )
donde: αi = σ , λi = 1 Φ ( αi )
La varianza se puede aproximar por:
0 1 1
n b σ
∂ ln yi , xi , β, b σ
b2 ∂ ln yi , xi , β, b2
Var (θ ) = @ ∑ A
i =1 ∂θ ∂θ 0

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 15 / 32


Modelos Censurados y Truncados Truncamiento

Ejemplo:

Rubinfeld llevó a cabo un estudio de decisiones de voto en una


muestra de 95 individuos en un referéndum sobre impuestos escolares
en una comunidad de Michigan.
Las respuestas a la encuesta proporcionaron una lista de atributos de
los votantes, así como estimaciones del ingreso familiar y el precio de
la educación.
Esta variable fue calculada como el costo para un individuo de
…nanciar un dólar extra por alumno por concepto de gasto escolar en
la comunidad.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 16 / 32


Modelos Censurados y Truncados Truncamiento

Ejemplo:

Supongamos que sólo se tiene información del gasto deseado en


educación para aquellos individuos que votaron "sí" en el referéndum.
En nuestra notación, podríamos asumir que el punto de corte del
truncamiento es a = 0.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 17 / 32


Modelos Censurados y Truncados Truncamiento

Ejemplo: Estimación vía Máxima Verosimilitud

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 18 / 32


Modelos Censurados y Truncados Truncamiento

Ejemplo: Estimación vía MCO

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 19 / 32


Modelos Censurados y Truncados Datos Censurados

Introducción

En este caso, todos los valores contenidos en un cierto rango se han


transformado en un único valor. Por ejemplo, consideremos el
número de alumnos que desea inscribirse en una determinada sección
de un curso. Si se llena el total de las vacantes disponibles en dicha
sección, el número de cupos demandados es censurado al número de
cupos totales.
Supongamos, por simplicidad, que tenemos una variable aleatoria y
censurada en cero. Sólo la parte de la distribución por encima de cero
contiene información relevante sobre y .

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 20 / 32


Modelos Censurados y Truncados Datos Censurados

Introducción

Cuando los datos están censurados, la distribución de probabilidades


de la variable a analizar es una mezcla de una distribución discreta y
otra contínua.
De…namos una variable y que posee el siguiente comportamiento:

0 si y 0
y=
y si y > 0

donde y es una variable aleatoria con función de distribución f (y ).

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 21 / 32


Modelos Censurados y Truncados Datos Censurados

Introducción

Por ejemplo, si y N µ, σ2 , se tiene que:


8
< Φ σ =1 Φ σ
µ µ
si y 0
f (y ) =
: 2πσ2 1/2 exp 0.5σ 2 (y µ) 2
si y > 0

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 22 / 32


Modelos Censurados y Truncados Datos Censurados

Momentos de una variable aleatoria normal censurada

Sea y N µ, σ2 una variable censurada en el valor de a:

0 si y a
y=
y si y > a

Entonces el valor esperado y la varianza vienen dados por:

E (y ) = aΦ (α) + [1 Φ (α)] [µ + σλ (α)]


h i
2
Var (y ) = σ [1 2
Φ (α)] 1 δ (α) + (α λ (α)) Φ (α)

a µ φ(α)
donde Pr (y a ) = Φ ( α ), α = σ , λ= 1 Φ(α)
,
δ (α) = λ (α) [λ (α) α]

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 23 / 32


Modelos Censurados y Truncados Datos Censurados

Modelo Tobit

Supongamos que y es una función lineal de x más un componente


aleatorio:
yi = β0 xi + εi
Por ejemplo, supongamos que y mide el gasto efectivo en
automóviles en el caso de aquellos individuos que han comprado y el
gasto deseado en el caso de aquellos que no. El vector de regresores
xi incluye, por ejemplo, el nivel de ingreso y el número de individuos
en el grupo familiar.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 24 / 32


Modelos Censurados y Truncados Datos Censurados

Modelo Tobit

En la práctica, y no es observable para aquellos individuos que no


han comprado. Por consiguiente, esta variable se encuentra censurada
en cero. Como resultado, la variable dependiente está dada por:

0 si yi 0
yi =
yi si yi > 0

Si utilizamos la expresión de valor esperado presentada anteriormente,


obtenemos que:

β0 xi
E (yi j xi ) = Φ β0 xi + σλi
σ

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 25 / 32


Modelos Censurados y Truncados Datos Censurados

Modelo Tobit

Los impactos marginales de xi sobre la esperanza de la variable


observada son:
∂E (yi j xi ) β0 xi
= βΦ
∂xi σ
Mientras que para la variable latente y se tiene:

∂E (yi j xi )

∂xi
De lo anterior, vemos que el primer efecto marginal se calcula
re-escalando el vector β por la probabilidad de ubicarse en la región
censurada, esto es, por la probabilidad de que yi > 0.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 26 / 32


Modelos Censurados y Truncados Datos Censurados

Modelo Tobit

β0 x β0 x
Dado que Φ σ i λi = φ σ i , podemos reescribir el efecto
marginal sobre la variable observada como:

∂E (yi j xi )
= β [ Φi (1 λi ( λi αi )) + φi (λi αi )]
∂xi
= Φi β (1 δi ) + βφi (λi αi )

β0 xi
φi
β0 x i β0 x i β0 x i σ
donde Φi = Φ σ , φi σ , αi = σ , λi = β0 xi
,
Φ σ
δi = λi ( λi αi ).

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 27 / 32


Modelos Censurados y Truncados Datos Censurados

Modelo Tobit

Este efecto marginal puede presentarse de una forma un poco más


intuitiva:
∂E (yi j xi ) ∂E (yi j xi , yi > 0)
= Pr (yi > 0 j xi )
∂xi ∂xi
∂ Pr (yi > 0 j xi )
+E (yi j xi , yi > 0)
∂xi
Con ello, el efecto de un cambio marginal en xi sobre yi puede
descomponerse en dos efectos:
1 El efecto sobre la media yi condicional a que yi > 0.
2 El efecto sobre la probabilidad de que la observación caiga en aquella
parte de la distribución en que yi > 0.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 28 / 32


Modelos Censurados y Truncados Datos Censurados

Estimación (I): Modelo de Heckman en Dos Etapas


Recordemos que:
E (yi j xi , yi > 0) = β0 xi + σλi
Este procedimiento consiste, en una primera etapa, en estimar el ratio
β0 xi
φ σ
inverso de Mills λi = β0 xi
mediante un modelo probit.
Φ σ

Este último es estimado vía máxima verosimilitud distinguiendo


aquellas observaciones para las cuales yi > 0 de aquellas para las
cuales yi 0. Esto es, de…nimos z = 1 si yi > 0 y z = 0 si yi 0.
En una segunda etapa se estima el modelo:
b i + ui
yi j yi > 0 = β0 xi + σλ
es decir, se incluye λi como una variable explicativa adicional. Nótese
que esta regresión se estima únicamente para aquellas observaciones
en las que yi > 0.
Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 29 / 32
Modelos Censurados y Truncados Datos Censurados

Estimación (I): Modelo de Heckman en Dos Etapas

Sin embargo, este procedimiento posee algunos inconvenientes:


1 El error ui es heterocedástico: Var (ui j xi ) = σ2 [1 δ (αi )], con lo
cual los estadígrafos t calculados sin tomar en cuenta este problema
estarán sesgados.
2 Dado que la variable λi es estimada en un paso previo, es una función
de parámetros que tienen asociados una determinada varianza. Ello
conduce a que los errores estándar de la regresión de la segunda etapa
no sean los correctos.

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 30 / 32


Modelos Censurados y Truncados Datos Censurados

Estimación (II): Máxima Verosimilitud

Para una muestra de n observaciones independientes, el logaritmo de


la función de verosimilitud vendrá dado por:
" 2
#
1 yi β0 xi
ln L = ∑ 2
ln (2π ) + ln σ +
y i >0 2 σ2
β0 xi
+ ∑ ln 1 Φ
σ
y i =0

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 31 / 32


Modelos Censurados y Truncados Datos Censurados

Ejemplo:
La siguiente tabla muestra la estimación de un modelo Tobit para los
datos de los votantes del referéndum descritos anteriormente:

Luis Bendezú M. (PUCP) Modelos Truncados y Censurados Junio 2010 32 / 32

You might also like