You are on page 1of 3

Collapse + Reshape

Para cada año, obtenga el ingreso per cápita promedio para cada centil; y guarde en una variable la tasa
de crecimiento anual de dicho ingreso promedio para cada centil.

collapse (mean) ingpc [pw=fac*mie], by(year centil)

reshape wide ingpc, i(centil) j(year)

gen tasa=((ingpc2015/ingpc2005)^(1/10)-1)*100

Correlaciones

¿La proporción de hogares seleccionados que completan la encuesta es menor en los conglomerados
con mayor ingreso promedio? Calcule la correlación entre ambas variables.

use enaho01-2016-100.dta, clear

merge 1:1 conglome vivienda hogar using sumaria-2016, nogen // No usar keep(3) porque me interesan
hogares que me abrieron la puerta y aquellos que no también

*No es necesario poner pesos porque los hogares tienen el mismo peso

gen completo=(result==1)

collapse completo inghog2d, by(conglome)

correl completo ing

*OTRA MANERA

*gen completo=(result==1)

*bys conglome: egen=con_completo=mean(completo)

*bys conglome: egen=con_ingreso=mean(inghog2d)

*bys conglome: gen id_con=_n

*replace con_completo=. if id_con>1

*replace con_ingresoO. if id_con>1

*correl con_completo con_ingreso

¿El % de viviendas con acceso a la red pública de agua es mayor en los departamentos con hogares con
mayor ingreso promedio? Calcule la correlación entre ambas variables.

use enaho01-2016-100.dta, clear


merge 1:1 conglome vivienda hogar using sumaria-2016, nogen keep(3)

gen agua=(p110<3)

bys conglome vivienda: egen agua_viv=total(agua)

replace agua_viv=1 if agua_viv>1

replace agua_viv=. if substr(hogar,1,1)!="1"

gen rural=(estrato>5) // para parte c)

gen dpto=substr(ubigeo,1,2)

collapse agua_viv inghog2d rural [pw=fac], by(dpto) // Solo se agrega rural para la parte c)

pwcorr agua_viv inghog2d, sig

*pval=0.0822>0.1 no puedo rechazar h0 (beta=0)

*¿la correlación es significativa (no 0)? no puedo rechazar

reg agua inghog2d

reg agua inghog2d rural // para parte c)

*pval=0.171>0.1 no puedo rechazar h0

*¿la correlaciones es significativa (no 0)? sí puedo rechazar

PRUEBA DE HIPÓTESIS

svy: mean ingxh

*P-value: probabilidad de observar lo que veo(media es 5.79) o algo más raro(colas) dado lo que
creo(media es 5)

lincom ingxh-5 // Con lineal combination pruebo si el ingxh es 5

*Ho: u_ingxh=5

*Coef: estadístico inicial(mean ingxh) menos

eret list // Devuelve estadísticos más complejos asociados a svy

svy: mean ingxh1 ingxh2

eret list

matrix list e(b) //e(b) es matriz de coef

matrix list e(V) //e(V) es matriz de varianzas y covarianzas


lincom ingxh1-ingxh2 //Rechazo hipótesis nula ||Ingxh2 es mayor a Ingxh1

*Ho: ingxh1=ingxh2

svy: mean ingxh, over(sexo)

lincom [ingxh]hombre-[ingxh]mujer

*¿El beneficio adicional sobre el ingreso por hora por pertenecer al sector

*formal en lugar del sector informal es mayor para las mujeres o para los hombres?

svy: mean ingxh, over(sexo sector)

lincom ([ingxh]_subpop_2-[ingxh]_subpop_1)-([ingxh]_subpop_4-[ingxh]_subpop_3) // Ver subpop en


svy

*P.value<0.05

*Con 95% de confianza, rechazo la hipótesis nula (Ho) de que sean iguales

*Es mayor para los que restan, es decir, es mayor para las mujeres

lincom ([ingxh]_subpop_2-[ingxh]_subpop_1)-([ingxh]_subpop_4-[ingxh]_subpop_3), level(99)

*Con 99% de confianza, no puedo rechazar la hipótesis nula (Ho) de que sean iguales.

*Pvalue mayor a 0.01

*Es posible que el beneficio adicional sea igual para ambos

*Notar que en el primer ej es con 95% de confianza, entonces ver si p-value es menor a 0.05

*Notar que en el segundo ej es con 99% de confianza, entonces ver si p-value es menor a 0.01

*Viendo pvalue concluyo que son iguales

You might also like