You are on page 1of 11

Encuesta Financiera de Hogares:

Manual de uso
de la base de datos
EFH 2007
Julio 2009
El Mercado
Ana Corts (1906-1998)
Ilustracin
Marcelo Riffo Rebello
Contenido
1. Introduccin 5
2. Composicin de la base de datos 5
2.1Identifcadores 5
2.2Variablesdemogrfcas 6
2.3Variablesfnancieras 7
2.3.1Ingresos 7
2.3.2Deudas 7
2.3.3 Activos 8
3. Indicadores de endeudamiento 9
3.1Cargafnanciera 9
3.2 Razones de endeudamiento 9
4. Utilizacin de la base de datos 10
4.1 Las reglas de Rubin 10
4.2 Nmero de bases imputadas 10
4.3 Ejemplo 11
Referencias 11
5
1. Introduccin
La Encuesta Financiera de Hogares (EFH) es una encuesta compleja, que recolecta gran
cantidad de informacin con alto grado de detalle. Las respuestas originales del cuestionario
consideran distintas dimensiones (por ejemplo individuo, hogar) por lo que se reportan
en cuatro bases de datos distintas. A modo de simplificar tanto el anlisis como la lectura
de los datos se gener una base de datos a nivel de hogares, agregando por hogar aquellas
variables disponibles a nivel de individuos, como por ejemplo los ingresos laborales.
Adicionalmente se agruparon algunas variables como "ingresos por pensiones" que considera
todas las pensiones recibidas por el hogar. Finalmente se incorporan en ella los resultados
de los valores simulados para la informacin faltante
1
/.
El presente manual tiene por objetivo definir las variables presentes en la base de datos a
nivel de hogares as como facilitar la utilizacin de las simulaciones para la informacin
faltante.
2. Composicin de la base de datos
Para cada una de las variables se presenta su descripcin detallada como se muestra a
continuacin (tabla 1):
1
/ Tanto las bases de datos originales como la de variables agrupadas a nivel de hogares se pueden solicitar a travs de la pgina web del
Banco Central.
TABLA 1
Presentacin de la informacin
Variable Mdulo Descripcin
edad A Edad del entrevistado.
teda A Tramos de edad del entrevistado.
ylab_h C Ingreso laboral mensual del hogar, incluye: ingresos provenientes del ingreso
principal, otros ingresos relacionados.
a la ocupacin principal (como bonos) y el ingreso secundario.
La primera columna corresponde al nombre de la variable en la base de datos. La segunda,
identifica el mdulo del cuestionario a partir del cual se obtiene y, por ltimo, la tercera
columna describe la variable.
En las secciones que siguen se presentan todas las variables de la base de datos, separadas
en las variables identificadoras, demogrficas y financieras.
2.1 Identificadores
Las variables identificadoras no provienen de un mdulo en particular sino que se predefinen
antes de levantar la encuesta o se generan de otra forma.
banco central de chile
6
Cada observacin corresponde a un hogar determinado, identificado con la variable id, la
que puede tomar valores desde 1 a 4021. Este ltimo corresponde al nmero de encuestas
realizadas.
La base de datos incluye, en realidad, once bases de datos. Esto es, una base con los datos
originales y diez con distintas simulaciones de los valores faltantes. La variable imp identifica
cada base. Esta variable toma valores desde 0 a 10, siendo 0 la base en su estado original,
esto es, sin valores imputados. Los valores 1 al 10 corresponden a las bases que s incorporan
valores simulados para la informacin que no fue reportada por el hogar.
Por otra parte, la variable estrato identifica el estrato de ingreso al que pertenece el hogar
y corresponde al definido en el diseo muestral (tabla 2).
TABLA 2
Variables identifcadoras
Variable Descripcin
id Identifca al hogar en la base de datos (1, 2,, 4021).
imp Identifca la base imputada, siendo imp=0 la base original sin imputaciones.
estrato Identifca el estrato de ingreso.
estrato 1, agrupa los deciles 1 al 5
estrato 2 agrupa los deciles 6, 7 y 8
estrato 3 agrupa los deciles 9 y 10
2.2 Variables demogrficas
Las variables demogrficas contienen tanto variables a nivel individual como a nivel del
hogar. La ms importante es la variable factor, que corresponde al factor de expansin del
hogar, ya que es la que permite llevar las encuestas a una representacin de la poblacin
objetivo, la que en este caso corresponde a los hogares a nivel nacional urbano.
Las variables gnero, edad, teda, educ, tedu y ocup, son las nicas variables que estn a
nivel de individuo y sus valores corresponden al de la persona que, monetariamente, ms
contribuye al hogar.

Por otra parte, se incorpora el nmero de personas que conforman el hogar (numh) as
como el nmero de miembros que estn trabajando (ocuph). Por ltimo, la variable prop
corresponde al rgimen de tenencia de la vivienda principal (tabla 3).
TABLA 3
Variables demogrfcas
Variable Mdulo Descripcin
factor Factor de expansin del hogar.
gnero A Gnero del entrevistado.
edad A Edad del entrevistado.
teda A Tramos de edad del entrevistado.
educ B Aos de educacin del entrevistado.
tedu B Tramos de educacin del entrevistado.
ocup C Identifca situacin laboral del entrevistado.
ocuph C Nmero de miembros del hogar que estn trabajando.
numh A Nmero de miembros que posee el hogar.
prop E Rgimen de tenencia de la vivienda principal.
7
Encuesta Financiera de Hogares
7
2.3 Variables financieras
La informacin obtenida de la encuesta fue procesada en conceptos financieros. De
este modo, las variables presentadas en esta seccin corresponden al autoreporte de los
entrevistados. La recoleccin de informacin se basa en dos etapas. En la primera de ellas
se les pregunta a los miembros del hogar por la tenencia de cierta variable financiera como
por ejemplo deuda de consumo bancaria. En caso de no poseer dicha deuda, se le asigna un
valor cero a dicha variable. Si por el contrario, algn miembro del hogar declara tener este
tipo de deuda se le pregunta a continuacin por el monto de esta deuda. Este autoreporte se
considera como el valor de la deuda. En caso de que el entrevistado no entregue informacin
precisa del monto se le presenta una tabla con tramos de valores posibles donde podra
encontrarse este monto y se toma el punto medio de dicho tramo para asignar el valor de la
deuda. Finalmente, si no se entrega informacin del monto se considera como informacin
faltante y es imputada de acuerdo a un proceso multivariado. De esta forma, se obtienen
las variables de ingreso, deudas y activos.
2.3.1 Ingresos
El ingreso de los hogares, corresponde a la suma de los ingresos de todos los individuos del
hogar que reportan ingresos positivos. Estos valores estn en trminos mensuales (tabla 4).
TABLA 4
Variables de ingreso
Variable Mdulo Descripcin
ylab_h C Ingreso laboral mensual del hogar, incluye: ingresos provenientes del ingreso
principal, otros ingresos relacionados a la ocupacin principal (como bonos)
y el ingreso secundario.
ypen_h D Ingreso por pensiones que recibe el hogar, incluye: ingresos por pensiones (como
de vejez o invalidez), subsidios, ayudas de familiares, rentas vitalicias,
montepos y otros.
yot_h C Otros ingresos del hogar que no se reportaron anteriormente (como retiro de
utilidades del negocio o arriendos de propiedades agricolas o
vehculos de transporte).
yai E Ingreso por alquiler imputado de la vivienda propia que recibe el hogar.
yaotp E Ingreso por alquiler efectivo de otras propiedades que recibe el hogar.
yact H Ingreso por activos fnancieros del hogar.
ytoth Ingreso total del hogar
2.3.2 Deudas
Las deudas se agruparon en distintas categoras (tabla 5). Para las deudas hipotecarias, los
montos se estimaron a partir de la informacin del monto de los dividendos pagados, las
tasas de inters y los plazos residuales reportados por el entrevistado.
banco central de chile
8
2.3.3 Activos
Los activos del hogar, se separaron en dos grupos, los activos reales (la vivienda principal,
otras propiedades y activos automotrices) y los activos financieros (aquellos que tienen
retornovariableylosderetornofijo)(tabla6).
TABLA 5
Variables de deuda
Variable Mdulo Descripcin
dtcc F Valor de la deuda con casas comerciales por compras a crdito. No incluye prstamos
en efectivo.
dfn F Valor de prstamos de consumo en fnancieras o prstamos en efectivo de casas comerciales.
dauto F Valor de crditos automotrices.
dsocial F Valor de los crditos sociales, incluye: deuda con cajas de compensacin, cooperativas u otros.
deduc F Valor de las deudas educacionales.
dotros F Valor de otras deudas, incluye: prstamos de parientes o amigos, crditos de prestamistas,
casa de crdito prendiario ("ta rica"), fado y otras deudas.
dhip_vp E Monto de deuda de la vivienda principal..
dhip_otp E Monto de deuda con otras propiedades.
dcbco F Valor de prstamos de consumo bancario
dtbco F Valor de la deuda de tarjetas de crdito y lneas de crdito bancario.
dconsh Valor de la deuda de consumo total del hogar, incluye: tarjetas de crdito
y lneas de crdito bancaria, deuda con casas comerciales, prstamos de
consumo bancario, prstamos de consumo en fnancieras o casas comerciales,
crditos automotrices, crditos sociales, deudas educacionales y otras deudas.
dhiph Valor del total de la deuda hipotecaria, incluye: deuda de la vivienda principal
y la deuda de otras propiedades.
dtoth Valor del total de las deudas del hogar.
TABLA 6
Activo
Variable Mdulo Descripcin
otp E Valor total de activos reales distintos a la vivienda principal, incluye: Otras viviendas
y/o parcelas de agrado, construcciones industriales, parcelas agrcolas y/o galpones,
bodegas y/o estacionamientos, tiendas, ofcinas, y/o locales comerciales, pensiones,
hospedajes y/u hoteles, otras.
a_auto E Valor de los activos automotrices del hogar e incluye: autos o camionetas, motos,
furgones o utilitarios, maquinarias y equipos, animales y otros (como embarcaciones,
aviones, etc.).
a_var H Valor del monto invertido del hogar en activos con retorno variable, incluye: acciones,
fondos mutuos o de inversin, otros activos fnancieros (opciones, futuros, swaps, otros),
participacin en sociedades.
a_fjo H Valor del monto invertido del hogar en activos con retorno fjo, incluye: cuentas de
ahorro (personales, vivienda, educacin), ahorro previsional (APV, Cuenta 2, depsitos
convenidos), renta fja como depsitos a plazo.
vp E Valor de la vivienda principal del hogar.
atoth Valor del total de los activos del hogar.
9
Encuesta Financiera de Hogares
9
3. Indicadores de endeudamiento
3.1 Carga financiera
La carga financiera corresponde a los pagos mensuales que realiza el hogar por cada tipo
dedeudadefinidoanteriormente(tabla7).Estainformacinseobtienedirectamentedel
cuestionario. Sin embargo, no todos los hogares reportan su carga financiera, por lo que
en una segunda etapa esta se calcul utilizando el monto original de la deuda, el plazo
reportado y la tasa de inters.
TABLA 7
Carga fnanciera
Variable Mdulo Descripcin
cfdtcc F Estimacin del pago mensual de tarjeta casas comerciales.
cfdauto F Estimacin del pago mensual de crditos automotrices.
cfdsocial F Estimacin del pago mensual de crditos sociales.
cfdeduc F Estimacin del pago mensual de deudas educaionales.
cffn F Estimacin del pago mensual de prstamos de consumo en fnancieras o casas comerciales.
cfdcbco F Estimacin del pago mensual de prstamos de consumo bancario.
cfdtbco F Estimacin del pago mensual de tarjetas de crdito y lneas de crdito bancario.
div_m E Estimacin del dividendo mensual pagado por la vivienda principal.
div_m_otp E Estimacin del dividendo mensual pagado por otras propiedades.
div E Estimacin del dividendo total pagado por el hogar.
cf_dna F Estimacin de la carga fnanciera de la deuda no hipotecaria de los hogares, incluye: pago de
tarjetas de casas comerciales, crditos automotrices, crditos sociales, deudas educacionales,
tarjetas y lneas de crdito bancario, prstamos de consumo bancario, prstamos de consumo
en fnancieras o casas comerciales.
cf_dt Estimacin del total de la carga fnanciera de los hogares.
3.2 Razones de endeudamiento
Los dos principales indicadores de endeudamiento son una variable de stock la razn
deuda sobre ingreso (RDI), que se calcula como la deuda total del hogar como porcentaje
del ingreso total anual del hogar y una variable de flujo la carga financiera sobre ingreso
(RCI) que corresponde a la carga financiera como porcentaje del ingreso total mensual del
hogar (tabla 8).
TABLA 8
Indicadores de endeudamiento
Variable Descripcin
rdi_da Razn deuda hipotecaria sobre ingreso total anual del hogar.
rdi_dna Razn deuda no hipotecaria sobre ingreso total anual del hogar.
rdi_dt Razn deuda total sobre ingreso total anual del hogar.
rci_da Razn carga fnanciera de la deuda hipotecaria sobre ingreso total mensual del hogar.
rci_dna Razn carga fnanciera de la deuda no hipotecaria sobre ingreso total mensual del hogar.
rci_dt Razn carga fnanciera total sobre ingreso total mensual del hogar.
banco central de chile
10
4. Utilizacin de la base de datos
La aplicacin de estas metodologas es contingente al problema en cuestin. En el caso
deencuestasmicroeconmicassimilaresalaEFH,Barcel(2006)desarrollaendetalleel
procedimiento utilizado en la Encuesta Financiera de las Familias que realiza el Banco de
Espaa, mientras que Alfaro y Fuenzalida (2008) presentan resultados para la imputacin
de ingresos de la EPS 2004. Un completo documento sobre el procedimiento de imputacin
empleado en la EFH se encuentra en preparacin.
4.1 Las reglas de Rubin
Una de las complejidades de la base de datos es que tiene versiones de la base original con
datos imputados, las cuales se denominan bases imputadas y se encuentran identificadas
con la variable imp. Cualquier anlisis estadstico debe repetirse en cada una de las bases
imputadasycombinarelresultadoutilizandolasreglasdeRubin(Schafer,1997).Por
ejemplo, para el anlisis descriptivo se tiene que la media (H) y varianza (V) combinadas
se calculan como:

=
=
m
t
t
Q
m
H
1
1
(

|
.
|

\
|
+ + =

= =
m
t
t
m
t
t
H Q
m m
V
m
V
1
2
1
) (
1
1 1
1
1
y
donde Q
t
y V
t
corresponden al promedio y varianza estimados en la base t. La primera
expresin en V es el promedio de las varianzas obtenidas (within imputation variance), mientras
que la expresin en corchetes es un estimador de la dispersin de los promedios obtenidos
(between imputation variance). En el caso de anlisis ms complejos como regresin lineal el
procedimiento se aplican las mismas frmulas pero en su versin matricial.
4.2 Nmero de bases imputadas
Schafer(1997)discuteendetallesobreelnmeroapropiadodebasesdedatosimputadas
que deben considerarse en el anlisis de imputaciones mltiples. Una mayor cantidad de
bases imputadas proporciona una mejor aproximacin de la incertidumbre asociada a la
falta de informacin de la base de datos. Sin embargo, para un porcentaje reducido de
informacin faltante dos o tres bases de datos son suficientes. En efecto, la eficiencia que se
logra al aumentar el nmero de bases de datos imputadas cambia marginalmente (tabla 9).
Por este motivo, cinco bases de datos ha resultado ser un nmero apropiado a utilizar en
la prctica (Royston 2005). No obstante, en la base de datos se proporcionan diez bases de
datos para lograr una eficiencia sobre el 90% independiente a la cantidad de informacin
faltante existente en la base de datos.
TABLA 9
Indicadores de endeudamiento

m 0,1 0,3 0,5 0,7 0,9


3 97 91 86 81 77
5 98 94 91 88 85
10 99 97 95 93 92
20 100 99 98 97 96
Donde corresponde a la razn de informacin faltante y m es el nmero de bases
imputadas.
11
Encuesta Financiera de Hogares
11
4.3 Ejemplo
Para ejemplificar las reglas anteriormente descritas, a continuacin se presenta un ejemplo
para la variable prstamos de consumo bancario (dcbco). El caso de esta variable tenemos
un 8% de informacin faltante, lo que expandido equivale a 10%. El promedio de este
tipo deuda en los datos originales es de 4 millones de pesos. Al imputar las observaciones
con informacin faltante notamos que el promedio flucta entre 4,1 y 4,7 millones. Al
combinar dicha informacin obtenemos un promedio de 4,4 millones. Producto del proceso
deimputacinelerrorestndardelaestimacindeestepromedioaumentade226.895a
317.403(tabla10).
Referencias
Alfaro, R. y M. Fuenzalida (2008) Anlisis de Informacin Faltante en Encuestas Microeconmicas Estudios
Econmicos EstadsticosN67,BancoCentraldeChile.
Barcel,C.(2006)Imputationofthe2002WaveoftheSpanishSurveyofHouseholdFinances(EFF)Working
PaperN0603,CentralBankofSpain.
Little,R.yD.Rubin(2002)StatisticalAnalysiswithMissingData,SecondEditionJ.Wiley&Sons,NewYork.
Royston, P. (2005) Multiple imputation of missing values: update Stata Journal 5(2): 188-201.
Rubin,D.(1987)MultipleImputationforNonresponseinSurveys,J.Wiley&Sons,NewYork.
Schafer,J.(1997)AnalysisofIncompleteMultivariateData,Chapman&Hall/CRC.
TABLA 10
Ejemplo para los prstamos de consumo bancario
Prstamos de consumo bancarios
Variable Nmero de observaciones Promedio Error estndar
Base original 513.342 4.002.057 226.895
Base 1 569.982 4.140.476 240.616
Base 2 569.982 4.214.922 248.957
Base 3 569.982 4.572.423 271.865
Base 4 569.982 4.557.646 269.418
Base 5 569.982 4.283.681 253.202
Base 6 569.982 4.428.303 264.306
Base 7 569.982 4.425.748 260.720
Base 8 569.982 4.413.146 263.367
Base 9 569.982 4.703.530 283.981
Base 10 569.982 4.436.033 263.213
Base 1 - 10 4.417.591 317.403
Fuente: EFH 2007.

You might also like