Professional Documents
Culture Documents
ESCUELA DE POSTGRADO
METODOS CUANTITATIVOS
2017
Modelos de eleccin discreta
La variable dependiente es una v.a. que toma un nmero finito de valores. Se
modeliza la eleccin dentro de un conjunto discreto de alternativas. Ejemplos:
Respuesta binaria
(0, 1)
Datos no ordenados
Modelo
Respuesta mltiple
(1, 2, , J) Datos ordenados
QM 3
MODELOS BINARIOS
Slo dos alternativas (1 y 0)
pi Pi i P ( y 1 / X ) i F(Xi ) i
'
F ( X i' ) ( X i' ) e t
2
2
QM 4
Modelo Lineal de Probabilidad
pi Pi i P ( y 1 / X ) i F ( X i' ) i X i' i
Coeficientes reflejan la variacin en la probabilidad ante un cambio unitario en X.
F(X)
X
Inconvenientes 0 1
Probabilidad no est acotada entre 0 y 1
Las perturbaciones son heteroscedsticas
Impacto de un aumento unitario de xj en la probabilidad es constante
QM 5
Modelo Lineal de probabilidad (MLP)
Estimacin
a) Con datos individuales yi P(yi) i
0 1-Pi -Pi
yi Pi i X i' i
1 Pi 1-Pi
E ( i ) Pi (1 Pi ) (1 Pi ) Pi 0
V ( i ) Pi2 (1 Pi ) (1 Pi ) 2 Pi Pi (1 Pi )
X i' (1 X i' )
Las perturbaciones son heteocedsticas, por lo que aplicamos MCP
QM 6
Procedimiento
2. Obtenemos Pi X i' y wi 1
P ( 1 P )
i i
yi w i 0 w i 1 X 1 wi ... k X k wi i w i
QM 7
Modelo Lineal de probabilidad (MLP)
Estimacin
b) Con datos agrupados
Grupo X1 Xx Xk
muestra N1 N2 Nk
Y=1 p1 p2 pk
i pi Pi
pi Pi i X i' i E(i)= 0
QM 8
Procedimiento
N
2. Obtenemos Pi X i' y wi i
P (1 P )
i i
pi wi 0 wi 1 X 1 w i ... k X k wi i w i
QM 9
Modelo Logit
F(X)
pi Pi i F ( X i' ) i 1
e Xi
'
F ( X i' ) X i'
1 e
X
a) Estimacin con datos agrupados 0
Para estimar transformamos el modelo obteniendo la funcin inversa con
aproximacin de Serie de Taylor de primer orden.
F 1 ( Pi )
F ( pi ) F ( Pi )
1 1
i
Pi
F 1 ( Pi )
Remplazando en F ( pi ) F ( Pi )
1 1
i
P
i
pi Pi i F ( X i' ) i
pi i
ln X i'
obtenemos 1 pi Pi (1 Pi ) E(i)= 0 V(i)= Pi (1-Pi)/Ni
logit i* E(i*)=0
Procedimiento V ( * ) 1
N i Pi ( 1 Pi )
i
1. Por MCO estimamos en el modelo
log it X i' i*
QM 11
2. Calculamos
X MCO
'
i
i
y obtenemos P e X i'
'
y wi N i Pi ( 1 Pi )
1 e X i
X i'
X MCP
' i
y obtenemos P e
Calculamos i '
1 e X i
QM 12
Estimacin de Mxima Verosimilitud
Estimacin para datos individuales pi Pi i Pi F ( X i' )
L (1 F ( X i' ) ) F ( X i' )
yi 0 y i 1
La funcin de
F ( X ) 1 F ( X )
verosimilitud n
' yi ' 1 y i
i i
i 1
n n
ln L yi ln F ( X i' ) (1 yi ) ln[1 F ( X i' )]
i 1 i 1
QM 13
n n
ln L yi ln F ( X i' ) (1 yi ) ln[1 F ( X i' )]
i 1 i 1
ln L
y i f ( X i' )
Xi ( 1 y i ) ( f ( X i' )
Xi 0
1 F ( X i' )
'
F ( X i )
Factorizando tenemos
ln L y F ( X )
'
f (X )Xi
'
i i
0
F ( X )1 F ( X )
' ' i
i i
QM 14
Modelo Logit
b) Estimacin con datos individuales
e Xi
'
eZ F ( z ) ez
F ( X i' ) f (z) F ( Z )[1 F ( z )]
1 e Xi
'
1 eZ z (1 e )
z 2
ln L yi F ( X i' )
f (Xi ' )Xi
F ( X i' )[1 F ( X i' )]
[ yi F ( X i' )] X i 0
Luego
2 ln L
f ( X i ) X i X i F ( X i )[1 F ( X i )] X i X i
QM 15
Modelo Probit
X '
pi Pi i ( X ) i
t2
'
i F ( X ) ( X )
'
i
'
i
e t
2
2
(X)
1
( X )
( X )
X
0
X
a) Estimacin para datos individuales
Aplicando el algoritmo de Scoring
n n1 [ I ( n1 )]1 ln L( n1 )
I ( )
[ yi ( X i' )] [ ( X i' )]2
ln L ( X 'i ) X i
( X i' )[1 ( X i' )]
X i X i'
( X i' )[1 ( X i' )]
QM 16
b) Estimacin con datos agrupados
F 1
( Pi )
pi Pi i F ( X ) i
'
F ( pi ) F ( Pi )
1 1
i
Pi
i
QM 18
4. Por MCP obtenemos MCP utilizando las ponderaciones wi
Z pi wi 0 wi 1 X 1 wi ... k X k wi * i w i
calculamos
QM 19
Interpretacin en los modelos Logit y Probit
Modelo Logit Modelo Probit
X '
e Xi
'
t2
pi Pi i F ( X ) i
'
i X i'
i pi Pi i ( X ) i
'
i
e
2
2
t i
1 e
Pi
f ( X i' ) k
xik
Modelo Logit Modelo Probit
Pi Pi
F ( X i' )[1 F ( X i' )] k Pi (1 Pi ) k ( X i' ) k
xik xik
P
i
xij
f ( X i' ) j Mide la importancia relativa de los efectos
j
que las variables xj y xk tienen sobre la
Pi '
xik f ( X i ) k probabilidad de escoger y =1
k
QM 20
Pi Nos indica la utilidad de decidir por el
El riesgo o utilidad: Odds evento (Y=1) frente al hecho contrario
1 Pi
P
Se utiliza para compara dos situaciones
i
1 P OR >1 la utilidad de i es mayor que la de j
Odds Ratio OR
P
i
j OR <1 la utilidad de j es mayor que la de i
1 P
j
OR =1 la utilidad de i es igual que la de j
Bondad de ajuste
1) El porcentaje de predicciones correctas, respecto de las observaciones
ln L( MSR)
2) R 2 McFaden 1
ln L( MR)
QM 21
Modelo Logit p X i' B
i
1 p e Si el cambio de j a i es
Odds
Pi
e X 'B OR
p
i
X 'j B
e k
unitario solo en la
1 Pi j
variable Xk
1 p
j
e
1. Menos de 70 m2
2. Entre 70 y 90 m2
3. Ms de 90 m2
A estas alternativas se las asocia con un valor entero para la variable dependiente
Yi, as por ejemplo:
0 si el tamao es menor de 70 m2
Yi = 1 si el tamao es entre 70 y 90 m2
2 si el tamao es mayor de 90 m2
QM 24
El enfoque terico se fundamenta en la teora de la utilidad del agente econmico.
Se supone que el agente econmico es racional y que elige la alternativa u opcin que
le va a redituar mayor utilidad
Sea Ui0, Ui1, , Uim,, UiM-1 las utilidades de las M alternativas para el isimo individuo y
sea Yi* una variable latente que depende linealmente de las variables X
Yi* X i' i
El individuo elige una determinada alternativa si la utilidad que sta le proporciona es
mayor que la utilidad que le proporciona el resto de alternativas, es decir:
QM 25
Las perturbaciones i se asume que estn idnticamente distribuidas
Y i*
c1 c2 cM-1
De esta manera
P(Yi 1 / X i , , c) P(c1 Yi* c2 ) P(c1 X i' i c2 X i' ) F (c2 X i' ) F (c1 X i' )
P(Yi 2 / X i , , c) P(c2 Yi* c3 ) P(c2 X i' i c3 X i' ) F (c3 X i' ) F (c2 X i' )
.
P(Yi M 1 / X i , , c ) P(Yi* c M 1 ) P( X i' i c M 1 ) 1 F (c M 1 X i' )
QM 26
Interpretacin del modelo ordenado
La interpretacin de los parmetros se puede efectuar a travs de las derivadas
parciales
QM 27
El riesgo o utilidad:
La utilidad de que se elija una opcin frente al resto de alternativas se mide a travs
de la probabilidad asignada a esta y las probabilidades asignadas al resto de
alternativas, es decir, calculando el Odds o riesgo.
Pi
1 Pi
QM 28
LOGIT MULTINOMIAL
Caractersticas:
- Se modelizan tantas ecuaciones como alternativas tiene Y.
- Para cada variable se estiman tantos parmetros como alternativas de Y
menos una.
- Es necesario identificar una categora de referencia.
Expresin general del modelo:
1
Pr ob(Yi 0) J 1
para j 0
1 e
kj' X ki
j 1
kj' X ki
e
Pr ob(Yi j ) J 1
para j 1, 2, ..., ( J 1)
1 e
kj' X ki
j 1
QM 29
LOGIT MULTINOMIAL
Ejemplo:
Para el caso de 3 alternativas de Y (la primera es la que se toma como
referencia) y 2 variables explicativas
1
Pr ob(Yi 1)
1 e 2 12 X1i 22 X 2 i e3 13 X1i 23 X 2 i
e 2 12 X1i 22 X 2 i
Pr ob(Yi 2)
1 e 2 12 X1i 22 X 2 i e3 13 X1i 23 X 2 i
e3 13 X1i 23 X 2 i
Pr ob(Yi 3) 2 12 X 1i 22 X 2 i 3 13 X 1i 23 X 2 i
1 e e
QM 30
Modelos de Variable limitada
1. Modelo de variable censurada: Aquel en el que los valores de la
variable endgena inferiores o superiores a un determinado valor
no se conocen, es decir, estn sometidos a una barrera o lmite (en
general los lmites pueden ser inferiores, superiores o ambos),
pero si se tiene informacin de los regresores.
( X )
Y i*
a yi
V (Y ) 2 (1 )[(1 ) ( )2 ]
QM 31
Modelos de Variable limitada
2. Modelo de variable truncada: Tan solo se recoge informacin del
regresando cuando su valores se encuentran dentro de
determinado rango y no se dispone tampoco la informacin de los
regresores fuera del rango del regresando.
a P ( yi a ) ( i )
i
( X )
( i ) 1 ( i ) ( yi )
yi f ( yi / yi a )
a 1 ( i )
( i )
E ( yi / yi a ) ( i )
1 ( i )
V ( yi / yi a ) 2 1 [ ( i )[ ( i ) i ]]
2 [1 ( i )] La varianza de la variable truncada es menor que
la de la variable sin truncar
QM 32
Modelo Tobit Truncado
La informacin del regresando toma valores distintos de cero a partir de una
determinada barrera o truncamiento; adems, se dispone de toda la informacin de
las variables exgenas o regresores para la muestra en el rango observado.
V ( yi ) 2 1 [ ( i )[ ( i ) i ]] 2 [1 ( i )]
V ( yi ) 2 1 [ ( i )[ ( i ) i ]] 2 [1 ( i )]
( i )
1 ( )
E (Yi / X i ;Yi a ) ( i )
k k i
k [1 ( i )]
X ki X ki X ki
QM 34
Modelo Tobit Censurado
El regresando Yi presenta dos opciones
Donde Yi* es una variable latente
0 si Yi 0
*
Yi * Yi* X i' i i es N(0,2)
Yi si Yi* 0
Primera parte: Con un modelo probit se asigna la probabilidad de que Yi* =0 frente
a la probabilidad de que Yi* sea >0. En este proceso se define una variable binaria
(0,1)
P(Yi* 0 / X i ) ( X i' ) Pi
Yi* ( X i' ) i Pi i
P(Yi* 0 / X i ) 1 ( X i' ) 1 Pi
QM 35
Segunda parte: Se estima un modelo condicional para Yi a partir de la estimacin
del modelo truncado para los valores de la variable Yi* tal que Yi* sea >0.
'
'
Xi
X i' ( )
E (Yi / X i ) Xi
( Xi )
'
QM 36
Dependent Variable: GASTO
Method: ML - Censored Normal (TOBIT) (Quadratic hill climbing)
Error Distribution
QM 37
Dependent Variable: Y
Method: ML - Censored Normal (TOBIT) (Quadratic hill climbing)
Error Distribution