Professional Documents
Culture Documents
7: 5 24 (2007)
ISSN 1814-6333
DESCOMPOSICIN EN REGRESIN LINEAL: UN NUEVO MTODO PARA ANLISIS DE
DETERMINANTES Y TOMA DE DECISIONES
Ernesto Cup C.
Centro de Investigaciones Econmicas y Empresariales (CIEE)
Universidad Privada Boliviana (UPB)
ecupe@upb.edu
RESUMEN
En el contexto de los modelos de regresin lineal, se presenta una novedosa metodologa para la descomposicin del
indicador R2 en trminos de las variables independientes. La metodologa se basa en la existencia de una base ortogonal
de vectores singulares para el espacio generado por las variables independientes expresadas en trminos de desviaciones
respecto a su media. Esta metodologa permite cuantificar el poder explicativo o la participacin de cada una de las
variables independientes en la explicacin de la variacin de la variable dependiente, por lo que en la prctica resulta
extremadamente til en el anlisis de los determinantes de la variable dependiente y la toma de decisiones en cualquier
campo donde se use un modelo lineal. Se presentan dos aplicaciones, una relativa a los determinantes de la decisin de
distribuir dividendos en un conjunto de empresas, y otra relacionada con los determinantes del ingreso laboral en las
zonas urbanas de Bolivia. Se pone especial nfasis en evaluar la nueva metodologa respecto a la descomposicin
propuesta por G. Fields, como representante de metodologas de descomposicin que admiten participaciones negativas
por variable independiente, la cual se ha popularizado en los ltimos aos rpidamente aplicndose en diversos estudios
a lo largo de todo el mundo. La nueva metodologa de descomposicin garantiza la no negatividad del poder explicativo
directo de una variable, por una parte, y reconoce y cuantifica el efecto que genera la correlacin entre variables
independientes, por otra.
Palabras Clave: Regresin lineal, base ortogonal, vectores singulares, metodologas de descomposicin.
1. INTRODUCCIN
Si bien existe una amplia literatura sobre mtodos de descomposicin en diversos contextos de modelizacin,
curiosamente an es tema de investigacin el mtodo de descomposicin para el indicador ms importante, R2, del
modelo ms utilizado, el modelo de regresin lineal. Aparentemente, ya se ha estudiado todo respecto a este ya
tradicional modelo y su aplicacin ahora se facilita totalmente con el apoyo de una computadora y el software
apropiado. La descomposicin del poder explicativo del modelo, R2, en trminos de aportes por variable independiente
es, sin embargo, un tema pendiente, tericamente no resuelto y en la prctica muy requerido.
Como es sabido, en el contexto de los modelos lineales y bajo presencia de la constante entre los regresores, el poder
explicativo del modelo se mide a travs del indicador R2. En un extremo, si este indicador es igual a la unidad, el
conjunto de las variables independientes explica completamente a la variable dependiente; en el otro extremo, si el
indicador es cero, el conjunto de variables independientes no explica nada de la variable dependiente. En la prctica de
los modelos lineales, el primer indicador que se evala luego de una estimacin del modelo es precisamente R2; una vez
que se ha obtenido un R2 satisfactorio, la historia del R2 habitualmente termina ah.
La utilidad prctica de R2, se incrementa notoriamente si puede descomponerse en trminos de todas las variables
independientes, cada una con su propia participacin en la descomposicin. As, no solamente se sabra qu tan bien
explica el modelo a la variable dependiente, sino qu tanto de dicha explicacin se debe a cada una de las variables
independientes, generando un ordenamiento de las variables independientes segn su poder explicativo individual,
ordenamiento puede ser aprovechado ya no para evaluar impactos ni para pronsticos, sino para la toma decisiones y la
definicin de polticas. Por ejemplo, a la hora de tomar decisiones, para un inversionista podra ser un factor decisivo
saber que entre los determinantes de la distribucin de dividendos en las empresas de su medio, la liquidez es el ms
importante.
Actualmente, se ha popularizado el uso de la metodologa de descomposicin propuesta por G. Fields, de la Cornell
University, al punto que se la ha aplicado en diversos estudios a lo largo de todo el mundo. La descomposicin de Fields
es simple y directa; sin embargo, tiene algunos problemas metodolgicos, como todas las propuestas previas de
soluciones extremadamente simples a un problema no tan simple. En el presente estudio se sealan algunas limitaciones
UPB - INVESTIGACIN & DESARROLLO, No. 7: 5 24 (2007)
E. CUP
de metodologas que, como la de Fields, admiten la posibilidad que una variable independiente tenga poder explicativo
negativo; luego, se propone una nueva metodologa libre de dichas limitaciones. Las caractersticas de la nueva
metodologa se muestran empricamente a travs de dos aplicaciones, una a la distribucin de dividendos empresariales
y otra a los determinantes del ingreso laboral en las zonas urbanas de Bolivia.
El documento est organizado de la siguiente manera. En la siguiente seccin se hace una revisin del indicador R2, en
la Seccin 3 se presenta la metodologa de descomposicin propuesta por G. Fields; en la Seccin 4 se presenta
preliminarmente la idea subyacente a la nueva metodologa; en la Seccin 5 se desarrolla la nueva metodologa. En la
Seccin 6 se presentan dos aplicaciones con datos reales y, finalmente, en la Seccin 7 se presentan las conclusiones.
2. R2 EN LA REGRESIN LINEAL
La linealidad del modelo
Y X e
(2.1)
y
i
xi
(2.2)
Si los cambios en algunas o todas las variables independientes xi, componentes del vector x, se dan simultneamente, el
efecto sobre la variable independiente es una transformacin lineal definida por
y
(2.3)
x
donde es la transpuesta del vector de coeficientes . As, si hi es el cambio en la i-sima variable independiente, el
efecto simultneo sobre la variable dependiente est dado por
k
y
(h) h i hi
i 0
x
(2.4)
Entonces, la linealidad del modelo permite descomponer el efecto de cambios simultneos en dichas variables como
suma de efectos por cambios aislados en cada variable independiente. Es importante notar que no existen efectos
combinados generados por la interaccin entre las variables independientes.
Genricamente, la regresin lineal es un tema de la estadstica aplicada debido a la presencia de un trmino estocstico
no observado en el modelo lineal de regresin, lo que deriva en el inters por las propiedades estadsticas de los
parmetros estimados y el cumplimiento de los supuestos estocsticos del modelo. Sin embargo, una de las propiedades
principales de la regresin lineal es no estocstica: proporciona la mejor aproximacin lineal de la variable dependiente
en funcin de las variables independientes del modelo.
Dadas las variables dependiente e independientes y una vez establecida dicha aproximacin lineal ptima, el inters se
orienta al grado de aproximacin o la calidad del ajuste; es decir, en qu tan bien la variable dependiente estimada, Y ,
se aproxima a la variable independiente observada, Y. La forma tradicional de hacerlo es a travs del indicador R2 que,
en presencia de una constante entre los regresores, toma valores en el intervalo [0, 1]. Cuanto ms prximo a la unidad
es el valor de R2 mejor es el ajuste del modelo y cuanto ms prximo a cero la calidad del ajuste empeora. Siguiendo la
idea expresada en [2.4], resulta natural requerir por una descomposicin similar para R2.
Y 0 X e
(2.6)
es un vector Tx1 de unos, 0 , y e son estimaciones de los respectivos parmetros y vectores aleatorio. Con
la matriz simtrica e idempotente
1
M 0 I .
(2.7)
T
donde I es la matriz identidad, [2.6] se puede escribir como,
donde
Y X e
(2.8)
donde Y M 0Y y X M 0 X . Salvo una constante, la varianza de la variable dependiente puede expresarse como,
Y Y X Y ee
(2.9)
X Y
Y Y
ee
Y Y
(2.10)
de donde se sigue que el indicador R2, que expresa la varianza explicada por el modelo en trminos de la varianza de la
variable dependiente, est dado por
X Y
R2
(2.11)
Y Y
Adems de la interpretacin estadstica en trminos de varianza que tiene, el indicador R2 admite tambin otras
interpretaciones. Por ejemplo, en sentido geomtrico es una medida del ngulo entre el vector de observaciones de la
variable dependiente y el hiperplano generado por los regresores, todos medidos en trminos de desviaciones respecto a
su correspondiente media; de hecho, es igual al cuadrado del coseno de dicho ngulo. En sentido grfico, R2 es
directamente proporcional al rea entre la lnea asociada a las observaciones de la variable dependiente y la lnea de la
variable dependiente estimada por el modelo.
Bajo cualquier interpretacin, R2 mide la bondad de ajuste entre la variable dependiente observada y su mejor
aproximacin lineal en trminos de las variables independientes o regresores; la optimalidad de la aproximacin est
garantizada por el conocido Teorema de la Proyeccin, vlido en espacios tan generales como los Espacios de Hilbert;
por eso, ahora la pregunta es cunto contribuye cada regresor en el logro de dicha aproximacin.
3. LA DESCOMPOSICIN DE FIELDS
Gary Fields de la Cornell University, propone una sencilla y directa descomposicin de R2, caractersticas que han
popularizado al mtodo1 y extendido su uso en diversas reas y aplicaciones 2, particularmente en estudios sobre
determinantes de la desigualdad en el ingreso3.
Una exposicin de su propuesta se encuentra en Fields [4] y un programa para aplicarlo en Fiorio y Jenkins [6], tambin existe una
rutina implementada en Stata.
2
En [4], G. Fields hace referencia a una amplia serie de pases para los que se han realizado estudios aplicando su metodologa de
descomposicin.
3
Ver por ejemplo Fields and Yoo [5].
E. CUP
La descomposicin de Fields expresa R2 como
X iY
Y Y
(3.1)
X Y
s( X i ) i i
Y Y
(3.2)
R 2 i
i 1
As,
p( X i )
s( X i )
R2
(3.3)
Esta descomposicin equivale a expresar la variacin de la variable dependiente en trminos no de las variaciones de las
variables independientes, sino de las componentes de la variacin de la misma variable independiente respecto a cada
una de las variables independientes expresadas en trminos de variaciones.
Si bien el mtodo de descomposicin propuesto por G. Fields es simple y directo, presenta dos serias limitaciones de
alta importancia prctica. Una de ellas, cuando se manifiesta, dificulta la interpretacin y la otra, curiosa y
aparentemente, la facilita.
La primera limitacin se refiere a que nada garantiza la no negatividad de las participaciones s( X i ) y, dado que se trata
de explicar una varianza, una participacin negativa no tiene sentido. La participacin s( X i ) toma un valor negativo si
el parmetro y la correlacin entre la variable independiente Xi y la variable dependiente Y tienen signos diferentes.
i
Por otro lado, esta limitacin del mtodo da lugar a la posibilidad de la existencia de variables que individualmente
expliquen ms del 100% del R2.
La segunda limitacin se refiere a que la descomposicin de Fields ignora el efecto combinado que tienen los regresores
en la explicacin de la varianza de la variable dependiente. El pasar por alto dicho efecto combinado se traduce en un
sesgo de sobrestimacin, generalmente en presencia de slo participaciones no negativas, o subestimacin,
generalmente bajo presencia de alguna participacin negativa, del poder explicativo de varianza atribuido a una o
varias variables.
4. UNA PROPUESTA PRELIMINAR DE DESCOMPOSICIN ORTOGONAL
Es claro que la idea de una descomposicin de R2 es expresar la variacin de Y solamente en trminos de participaciones
individuales de las Xi. Desafortunadamente, ello no es posible en general; con datos reales, dicha imposibilidad se
origina en la presencia de algn grado de correlacin entre las Xi.
Ante la naturaleza de la causa que genera esta limitacin, de manera natural surge la idea de descomponer la variacin
de Y en trminos de la variacin de las Xi respecto a un conjunto de variables auxiliares, digamos Zi, no correlacionadas
u ortogonales entre s. A fin de capturar las direcciones de mayor variacin de las Xi, cada Zj se puede determinar de
modo que capture la direccin de mayor variacin en el subespacio ortogonal al generado por los vectores Zi
previamente seleccionados. Esto nos lleva a elegir
Z1 X 1
donde 1 es un eigenvector unitario de la matriz
4
(4.1)
cov [ X i i ,Y ]
.
var [Y ]
Z2 X 2
donde 2 es un eigenvector unitario de la matriz
manera se obtienen k variables ortogonales,
(4.2)
i 1,
,k
(4.3)
donde los eigenvectores i son ortogonales entre s y estn asociados a eigenvalores i ordenados en forma descendente.
La existencia de las i unitarias y ortogonales est garantizada por la simetra de la matriz
estn no correlacionadas, pues
Zi Z j i X X j
i j j
(4.4)
j i j
0
para i j
Con Z la matriz cuyas columnas son los vectores Zi y la matriz conformada por los vectores como columnas, a
continuacin se muestra que las variables auxiliares Zi capturan toda la variacin de las Xi ,
k
Z Z
i
traza( Z Z )
traza( X X )
traza( X X )
traza( X X I )
(4.5)
traza( X X )
k
X i X i
i 1
2
donde ( )i es el cuadrado del i-simo elemento del vector . As, tomando en cuenta que la media de cada Zi es
X X D
Z Z D
(4.6)
donde D es la matriz diagonal con las i en la diagonal principal, es posible descomponer la variacin de Y en trminos
de las Zi :
Y Y X X ee
D ee
Z Z ee
(4.7)
( )i2 Z iZ i ee
i 1
E. CUP
Z Z
(4.8)
Cada uno de los trminos de la descomposicin [4.8] es no negativo y su suma reproduce R2. Lamentablemente, esta
descomposicin slo es posible en trminos de las variables auxiliares y no de las variables originales; ms an, los
vectores i, de dimensin k y que desempean un rol central en la descomposicin, no tienen relacin directa con las
variables originales Xi. La propuesta que se presenta en la siguiente seccin salva esta limitacin.
5. UN NUEVO MTODO DE DESCOMPOSICIN
El aspecto novedoso en la propuesta de descomposicin ortogonal de la seccin anterior empieza cuando se trabaja con
la matriz X X en lugar de la matriz X X . Si bien el recurrir a variables ortogonales asociadas a la matriz X X
resuelve el problema de descomposicin de R2 como suma de trminos no negativos asociados a variables individuales,
sin embargo no permite expresar la descomposicin en trminos de las variables originales o relacionarlas directamente
con las variables originales. A fin de salvar esta limitacin, es necesario trabajar con las matrices X y X por
separado.
k
*k
. Entre
*T
en
,
*T
; a su
, en el
*k
X X I k X IT X
(5.1)
, de
*T
, de
k
*T
en
*k
, resultado de la
y de
*k
En ese contexto, se puede mostrar que existen matrices U TxT , Vkxk y DTxk tales que
T
i)
r rango( X ) ); dichos elementos tienen los valores dii positivos y se consideran ordenados en forma
descendente.
iii) Con Ui y Vi las columnas i-simas de las matrices U y V, respectivamente, se tiene
X Vi diiU i
X U i diiVi
X U i 0
iv)
v)
5
para i 1,
para i k 1,
,k
,T
(5.2)
(5.2b)
Las columnas de U capturan ortogonalmente las direcciones de mayor variacin de las variables originales y
columnas de X . Las columnas de V capturan ortogonalmente las direcciones de mayor variacin de las filas de
X.
X U DV
(5.2c)
Este resultado es conocido como el Teorema de Descomposicin de Valor Singular de Matrices y es vlida para cualquier matriz.
Ver Datta [3].
10
La expresin [5.2c] es la Descomposicin de Valor Singular de la matriz X , los vectores Ui y Vi son los
vectores singulares de X , asociados a los valores singulares dii.
( X U i )2
para i 1,
Y Y
La expresin [5.3] descompone R2 como suma de cantidades no negativas
si
,k
[5.4]
R 2 si
[5.5]
i 1
Cada participacin si
k 1 k k ( i X iU l )( j X jU l )
Y Y
i 1 j i 1 l 1
(5.6)
se tiene que la participacin directa de la variable X i en la explicacin de la varianza de la variable dependiente est
dada por
k
qi i 2
j 1
el trmino i 2
( X iU j )2
Y Y
(5.7)
( X iU j ) 2
11
E. CUP
qi j 2i j
( X iU l )( X jU l )
Y Y
l 1
donde 2i j
i j, i 1,
, k 1, j 2,
,k
[5.8]
( X iU l )( X jU l )
i k 1, j k
i 1
i j
R 2 qi
[5.9]
qi j
( X U
j 1
) 2 ( X iU j )(U j X i )
j 1
X i( U j U j )X i
(5.10)
j 1
X i(UU ) X i
X i X i
por lo que la participacin directa de la variable X i se puede expresar simplemente como
XX
qi i 2 i i
Y Y
(5.11)
Similarmente, se obtiene que la participacin combinada de las variables X i y X j se expresa tambin como,
qi j 2i j
X i X j
Y Y
i j, i 1,
, k 1, j 2,
,k
(5.12)
As, (5.11) y (5.12) permiten descomponer R2 de una manera simple a partir directamente de los parmetros estimados y
las variables independientes.
12
Rentabilidad y Eficiencia
Liquidez
Ratio de Dividendos
Variable
RE1
RE2
RE3
RE4
RE5
RE6
ENFP1
ENFP2
ENFP3
ENFP4
EFGFD1
EFGFD2
EFGFD3
EFGFD4
EFGFD5
L1
L2
L3
L4
DIV
Descripcin
Valor agregado/Ventas
Valor agregado/Inmovilizado Neto
Utilidad antes de intereses e impuestos/Activo Total
Utilidad antes de intereses e impuestos/Ventas
Ventas/Activo Total
Utilidad despus de intereses e impuestos/Fondos Propios
Tasa de variacin del activo total
Tasa de variacin del inmovilizado neto
Tasa de variacin de los fondos propios
Tasa de variacin de las ventas
Deudas totales/Recursos propios
Deudas a corto plazo/Deudas a largo plazo
Utilidad antes de intereses e impuestos/Gastos financieros
Gastos financieros/Capacidad autofinanciacin
Activo total/capacidad autofinanciacin
Activo circulante/Deudas a corto plazo
(Activo circulante-Existencias)/Deudas a corto plazo
Capacidad autofinanciacin/Deudas a corto plazo
Deudas a corto plazo/Ventas
Dividendos/Utilidad despus de intereses e impuestos
Luego del anlisis economtrico usual, se concluye que la distribucin de dividendos, DIV, se explica por la tasa de
variacin de fondos propios, ENFP3, endeudamiento en trminos de recursos propios, EFGFD1, capacidad de cobertura
de gastos financieros, EFGFD3, y liquidez en trminos de obligaciones por deudas a corto plazo, L2.
Los parmetros estimados tienen los signos esperados. Un incremento en la tasa de variacin de los fondos propios se
refleja en menor disponibilidad para dividendos, coeficiente negativo de ENFP3; una disminucin de solvencia frente a
deudas (incremento del ratio de deudas sobre recursos propios) se refleja en menores dividendos, coeficiente negativo
de EFGFD1; aumentos de la capacidad de cobertura de gastos financieros se traducen en mayores dividendos,
coeficiente positivo de EFGFD3; e incremento de la liquidez en trminos de obligaciones de corto plazo por deudas,
coeficiente L2 positivo.
La variable de mayor impacto individual sobre la distribucin de dividendos es la liquidez, medida por L2, seguida por
endeudamiento, medido por EFGFD1, capacidad de cobertura de gastos financieros, medido por EFGFD3, y
variaciones en fondos propios, medido por ENFP3, en ese orden. Salvo en el caso del coeficiente de endeudamiento, la
hiptesis nula de coeficiente nulo se rechaza a un nivel de significancia menor al 5%, incluyendo la constante.
La base de datos y el enfoque en la elaboracin de indicadores de esta aplicacin se han tomado de Gonzles [9] y Carrascal [2],
respectivamente.
13
E. CUP
TABLA 6.2 - ESTIMACIN DEL MODELO DE DETERMINANTES DE DIVIDENDOS EMPRESARIALES
Dependent Variable: DIV
Method: Least Squares
Sample: 1 56
Included observations: 56
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
ENFP3
EFGFD1
EFGFD3
L2
0.238354
-5.97E-05
-0.073515
0.006368
0.259618
0.111044
2.38E-05
0.041894
0.003074
0.034094
2.146477
-2.503850
-1.754794
2.071525
7.614771
0.0366
0.0155
0.0853
0.0434
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.589202
0.556982
0.440347
9.889202
-30.91113
2.110723
0.461071
0.661584
1.282540
1.463375
18.28713
0.000000
En conjunto, las variables independientes explican el R 2 = 58.9% de la variacin de los dividendos. A fin de realizar
una evaluacin comparativa de la descomposicin propuesta por G. Fields y la nueva metodologa en la determinacin
del poder explicativo de cada variable, se presentan a continuacin los resultados de ambas descomposiciones.
Por simplicidad y en correspondencia con la notacin empleada en el desarrollo general de este artculo, se adopta la
siguiente notacin:
X1 = ENFP3, X2 = EFGFD1, X3 = EFGFD3, X4 = L2
De acuerdo a la descomposicin de Fields, Tabla 6.3, la liquidez es con mucho la variable con mayor poder explicativo
relativo, 82%. Cada una de las dems variables tiene un poder explicativo relativo menor al 10% y en orden de
importancia son endeudamiento, 8%, capacidad de cobertura de gastos financieros, 6%, y variacin de fondos propios,
4%.
TABLA 6.3 - DETERMINANTES DE DIVIDENDOS EMPRESARIALES
Descomposicin de Fields
Regresores
Participacin
X1
X2
X3
X4
Total
s(Xi)
p(Xi)
0.023
4%
0.049
8%
0.035
6%
0.482
82%
0.589
100%
Por otra parte, la descomposicin ortogonal identifica cuatro variables ortogonales ordenadas segn las direcciones de
mayor variacin de las variables independientes. De acuerdo al Tabla 6.4, en este caso cada variable ortogonal est
asociada a una variable independiente; U1 con la variacin de fondos propios, U2 con la capacidad de cobertura de
gastos financieros, U3 con liquidez y U4 con endeudamiento.
TABLA 6.4 - DETERMINANTES DE DIVIDENDOS EMPRESARIALES
Matriz de Correlacin Variables Independientes vs. Variables Ortogonales
U1
U2
U3
U4
14
X1
X2
X3
X4
-1.000
0.000
0.000
0.000
0.116
-0.196
-0.424
0.876
0.062
0.998
0.000
0.001
-0.173
-0.062
0.947
0.265
Regresores ortogonales
Participacin
U1
U2
U3
U4
Total
s'(Ui)
p(Ui)
0.010
2%
0.032
5%
0.545
93%
0.002
0%
0.589
100%
Considerando la correspondencia uno a uno que se da en este caso entre variables independientes y ortogonales, se
observa que ambas descomposiciones describen una concentracin del poder explicativo relativo en una sola variable, la
liquidez. Sin embargo, parecen existir diferencias en el orden por poder explicativo relativo en las siguientes variables
independientes. A diferencia de lo que establece la descomposicin de Fields, donde endeudamiento tiene el segundo
mayor poder explicativo, la descomposicin ortogonal seala que la variable endeudamiento podra ser menos
importante de lo que parece, de hecho podra ser la menos importante. Para ver esto con mayor detalle, pasamos a
considerar la descomposicin ortogonal en trminos de las variables independientes.
En los Tablas 6.6 y 6.7 se presentan las participaciones directas y combinadas, respectivamente, en trminos de las
variables independientes. El total de las participaciones combinadas tiene signo negativo y junto al total de las
participaciones directas reproduce R2, las magnitudes de las participaciones combinadas son relativamente pequeas,
reflejo de baja colinealidad entre las variables independientes; ms an, prcticamente la totalidad de las participaciones
directas de cada variable independiente son capturadas por slo una variable ortogonal.
TABLA 6.6 - DESCOMPOSICIN ORTOGONAL Y DIVIDENDOS EMPRESARIALES
Participaciones Directas de Variables Independientes
Participaciones Directas
X1
X2
X3
X4
Total
U1
U2
U3
U4
0.053
0.000
0.000
0.000
0.000
0.001
0.005
0.021
0.000
0.036
0.000
0.000
0.015
0.002
0.447
0.035
0.068
0.039
0.452
0.056
Total
0.053
0.027
0.036
0.499
0.615
La variable de liquidez es la que mayor efecto combinado muestra, particularmente con la variable de fondos propios,
produciendo un efecto negativo de 0.056 puntos. Esta variable, fondos propios, tambin tiene efecto combinado con
cada una de las dems variables, aunque el ms significativo se da con liquidez.
15
E. CUP
TABLA 6.7 - DESCOMPOSICIN ORTOGONAL Y DIVIDENDOS EMPRESARIALES
Participaciones Combinadas de Variables Independientes
Participaciones Combinadas
X1 X2
X1 X3
X1 X4
X2 X3
X2 X4
X3 X4
Total
U1
U2
U3
U4
-0.009
0.000
0.000
0.000
0.005
0.000
0.000
0.000
-0.056
0.000
0.000
0.000
0.000
0.012
0.000
0.000
0.005
-0.003
0.093
-0.054
-0.003
-0.017
0.000
0.000
-0.058
-0.007
0.093
-0.054
Total
-0.009
0.005
-0.056
0.012
0.041
-0.020
-0.023
En una presentacin de resultados que omite la referencia a las variables ortogonales, Tabla 6.8 y Tabla 6.9, a los que se
pueden llegar tambin por descomposicin directa, se confirma la predominancia de la variable de liquidez en la
explicacin de la variacin de la distribucin de dividendos empresariales; sin embargo, tambin se confirma la
importancia de la variable de fondos propios que resulta ser la segunda en importancia de poder explicativo relativo en
trminos de su participacin directa, 9%. Las variables de capacidad de cobertura de gastos financieros y
endeudamiento tienen similar poder explicativo de manera directa, aunque la de endeudamiento es levemente inferior.
TABLA 6.8 - DESCOMPOSICIN DIRECTA Y DIVIDENDOS EMPRESARIALES
Participaciones Directas de Variables Independientes
Participaciones Directas
Participacin
X1
X2
X3
X4
Total
Q(Xi)
0.053
0.027
0.036
0.499
0.615
P(Xi)
9%
5%
6%
85%
104%
Las participaciones combinadas ms importantes, se dan entre la variable de liquidez y las variables de fondos propios
(signo negativo) y endeudamiento (signo positivo), reflejando la forma en que afectan conjuntamente, una vez
descontada la participacin directa, dichas variables en la explicacin de la variacin de los dividendos.
TABLA 6.9 - DESCOMPOSICIN DIRECTA Y DIVIDENDOS EMPRESARIALES
Participaciones Combinadas de Variables Independientes
Participaciones Combinadas
Participacin
X1 X2
X1 X3
X1 X4
X2 X3
X2 X4
X3 X4
Total
Q(Xi)
-0.009
0.005
-0.056
0.012
0.041
-0.020
-0.026
P(Xi)
-1%
1%
-10%
2%
7%
-3%
-4%
R2
0.589
100%
Los resultados del anlisis por descomposicin apoyan la idea de que las empresas quiebran por caja, no por utilidad;
ello se refleja en la importancia predominante de la variable de liquidez entre los determinantes de la distribucin de
dividendos.
6.2 DETERMINANTES DEL INGRESO LABORAL (I)
El anlisis por descomposicin es particularmente til en el estudio de los determinantes de desigualdad en el ingreso8.
En esta seccin se aplica el anlisis por descomposicin al estudio de los determinantes del ingreso laboral en el rea
8
Ver por ejemplo Arayama et Al. [1], Fields y Yoo [5], Morduch y Sicular [8], Salardi [10], Taiwo [11], Wan y Zhou, Zhangyue
[13].
16
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPERCIA
EXPERCIA2
AESCOLA
JEFE
ASALRDO
2.113064
0.109993
-0.001323
0.098683
1.520367
1.480297
0.106135
0.005573
9.20E-05
0.006838
0.059048
0.059168
19.90920
19.73524
-14.38130
14.43180
25.74791
25.01868
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.403215
0.402433
1.728011
11394.66
-7510.704
1.735586
6.039002
2.235389
3.933388
3.943197
515.6519
0.000000
En conjunto, las variables independientes explican el R2 = 40.3% de la variacin del (logaritmo del) ingreso laboral. A
fin de realizar una evaluacin comparativa con la descomposicin propuesta por G. Fields, se presentan a continuacin
los resultados de ambas descomposiciones. En correspondencia con la notacin empleada en el desarrollo general de
este artculo, se adopta la siguiente notacin:
X1 = EXPERCIA,
X2 = EXPERCIA2,
X3 = AESCOLA,
X4 = JEFE,
X5 = ASALRDO
De acuerdo a la descomposicin de Fields, Tabla 6.11, la condicin de jefe de hogar es la variable con mayor poder
explicativo relativo, 38%, seguida por la condicin de asalariado, 29%, y la experiencia, 23%. Los aos de escolaridad
tienen un poder explicativo menor, 12%, y la experiencia al cuadrado tiene una participacin negativa, -2%, en la
descomposicin de R2.
Encuesta de Hogares realizado por el Instituto Nacional de Estadstica bajo el programa de Mejoramiento de Condiciones de Vida,
MECOVI, correspondiente al ao 2005.
10
Los indicadores han sido elaborados por Carlos Foronda R., investigador del Centro de Investigaciones Econmicas y
Empresariales (CIEE) de la Universidad Privada Boliviana (UPB).
11
Por ejemplo, en Wan y Zhangyue [13] se incluyen las variables Education y Education Squared, Age y Age Squared, en el marco
de un modelo Mincer estndar.
12
Debido al propsito ilustrativo de esta aplicacin, no se discute el conocido problema de sesgo de seleccin en la estimacin de
este tipo de modelos.
13
Ver, por ejemplo, Wan y Zhou [13].
17
E. CUP
TABLA 6.11 - DETERMINANTES DEL INGRESO LABORAL (I)
Descomposicin de Fields
Regresores
Participacin
X1
X2
X3
X4
X5
Total
s(Xi)
p(Xi)
0.091
23%
-0.009
-2%
0.048
12%
0.154
38%
0.119
29%
0.403
100%
Por otra parte, Tabla 6.12, la descomposicin ortogonal muestra que solamente tres variables ortogonales de las cinco,
son las que explican la variacin del ingreso laboral. En particular, la variable ortogonal U4 tiene un poder explicativo
de 55%.
TABLA 6.12 - DETERMINANTES DEL INGRESO LABORAL (I) Y DESCOMPOSICIN ORTOGONAL
Regresores ortogonales
Participacin
U1
U2
U3
U4
U5
Total
s'(Ui)
p(Ui)
0.000
0%
0.075
19%
0.105
26%
0.222
55%
0.0000
0%
0.403
100%
La matriz de correlacin entre las variables independientes y las variables ortogonales, Tabla 6.13, muestra que la
variable ortogonal U1, que captura la direccin de mayor variacin de las variables independientes, est altamente
correlacionada con las variables independientes experiencia y experiencia al cuadrado, igual a la unidad con signo
negativo con esta ltima; as, la variable ortogonal U1 es una variable de experiencia que prcticamente captura la
participacin de dos variables independientes en la descomposicin de R2 y seala la posible redundancia en este
sentido de una de las dos variables independientes. A su vez, la variable U3, aunque en menor grado, est altamente
correlacionada con la variable de aos de escolaridad. La correlacin de las dems variables ortogonales se da con
varias variables independientes.
TABLA 6.13 - DETERMINANTES DEL INGRESO LABORAL (I)
Matriz de Correlacin Variables Independientes vs. Variables Ortogonales
X1
X2
X3
X4
X5
U1
U2
U3
U4
U5
-0.947
0.320
-0.036
0.000
0.001
-1.000
0.000
0.000
0.000
0.000
0.522
-0.148
-0.840
0.003
0.000
-0.103
0.223
-0.172
-0.713
-0.634
0.256
-0.071
-0.166
-0.698
0.644
La posibilidad de redundancia entre las variables experiencia y experiencia al cuadrado se incrementa si se toma en
cuenta que la correlacin entre ellas es 0.95. En este punto, ya es necesario expresar la descomposicin ortogonal en
trminos de las variables independientes, cuyos resultados se muestran en el Cuadro 6.14.
A diferencia de lo que ocurre en la descomposicin propuesta por G. Fields, en la que la descomposicin de R2 no
genera seales de alarma sobre la existencia de alta multicolinealidad (salvo por la existencia de una sin sentido
participacin negativa de la variable experiencia al cuadrado) que afecta a la descomposicin, la descomposicin
ortogonal expresada en trminos de las variables independientes muestra claramente la gravedad de la situacin 14.
14
Que no es detectada por el estadstico t de los respectivos coeficientes, pues an con una correlacin de 0.95 los coeficientes de
ambas variables son altamente significativos.
18
Participaciones Directas
Participacin
X1
X2
X3
X4
X5
Total
Q(Xi)
0.632
0.328
0.047
0.115
0.110
1.232
P(Xi)
157%
81%
12%
28%
27%
305%
Una primera revisin de los resultados muestra que el poder explicativo directo de la variable de experiencia supera
ampliamente el 100% y, a su vez, el poder explicativo directo de la variable experiencia al cuadrado es superior al 80%.
Las participaciones directas de las otras variables en la descomposicin se mantienen en rangos razonables,
confirmando que la multicolinealidad se focaliza en las variables experiencia y experiencia al cuadrado.
TABLA 6.15 - DESCOMPOSICIN DIRECTA Y DETERMINANTES DEL INGRESO LABORAL (I)
Participaciones Combinadas de Variables Independientes
Participaciones Combinadas
Participacin
X1 X2
X1 X3
X1 X4
X1 X5
X2 X3
X2 X4
X2 X5
X3 X4
X3 X5
X4 X5
Total
Q(Xi)
-0.862
-0.177
0.094
-0.136
0.130
-0.040
0.097
0.008
0.041
0.017
-0.828
P(Xi)
-214%
-44%
23%
-34%
32%
-10%
24%
2%
10%
4%
-205%
R2
0.403
100%
El reporte de las participaciones combinadas, Cuadro 6.15, muestra que la alta multicolinealidad entre las variables de
experiencia se manifiesta en extremadamente desproporcionadas participaciones combinadas en las relaciones que
intervienen. En particular, la participacin combinada entre experiencia y experiencia al cuadrado es negativa y supera
el 200%.
As, aunque en trminos de la participacin directa las variables de mayor poder explicativo del (logaritmo del) ingreso
laboral son experiencia y experiencia al cuadrado, su alta participacin combinada negativa relativiza dicho resultado
inicial y seala la necesidad de repensar en la especificacin del modelo.
6.3 DETERMINANTES DEL INGRESO LABORAL (II)
Debido a las seales de alarma puestas de manifiesto por la nueva metodologa de descomposicin, se ha excluido la
variable experiencia al cuadrado de la especificacin del modelo de ingreso laboral en las zonas urbanas de Bolivia. Los
resultados de la estimacin del modelo re-especificado, Tabla 6.16, muestran que los coeficientes estimados continan
siendo significativos y que R2 se reduce levemente a 0.371.
En correspondencia con la notacin empleada en el desarrollo general de este artculo, esta vez se adopta la siguiente
notacin:
X1 = EXPERCIA, X2 = AESCOLA, X3 = JEFE, X4 = ASALRDO
De acuerdo a la descomposicin de Fields, Tabla 6.17, la condicin de asalariado es la variable con mayor poder
explicativo, 46%, seguida por la condicin de jefe de hogar, 32%, aos de escolaridad, 14% y experiencia, 8%. No se
tienen participaciones negativas.
TABLA 6.16 - ESTIMACIN DEL MODELO DE DETERMINANTES DE INGRESO LABORAL (II)
Dependent Variable: LNW
Method: Least Squares
Sample: 1 3822
Included observations: 3822
UPB - INVESTIGACIN & DESARROLLO, No. 7: 5 24 (2007)
19
E. CUP
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
EXPERCIA
AESCOLA
JEFE
ASALRDO
2.594182
0.035739
0.109146
1.670789
1.473719
0.103405
0.002154
0.006980
0.059661
0.060740
25.08767
16.58863
15.63692
28.00486
24.26269
0.0000
0.0000
0.0000
0.0000
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.370870
0.370210
1.773989
12012.23
-7611.568
1.704430
6.039002
2.235389
3.985645
3.993820
562.5266
0.000000
Regresores
Participacin
X1
X2
X3
X4
Total
s(Xi)
p(Xi)
0.030
8%
0.053
14%
0.118
32%
0.170
46%
0.371
100%
Por otra parte, la descomposicin ortogonal, Tabla 6.18, muestra que la participacin se concentra en dos de las cuatro
variables ortogonales; en particular, la variable ortogonal U4 tiene un poder explicativo de 67%.
TABLA 6.18 - DETERMINANTES DEL INGRESO LABORAL (II) Y DESCOMPOSICIN ORTOGONAL
Regresores ortogonales
Participacin
U1
U2
U3
U4
Total
s'(Ui)
p(Ui)
0.010
3%
0.111
30%
0.250
67%
0.000
0%
0.371
100%
La matriz de correlacin entre las variables ortogonales y las variables independientes, Tabla 6.19, muestra que cada
una de las dos primeras variables est altamente correlacionada a una variable explicativa diferente, la variable
ortogonal U1 con la variable experiencia y la variable ortogonal U2 con la variable de aos de escolaridad.
TABLA 6.19 - DETERMINANTES DEL INGRESO LABORAL (II)
Matriz de Correlacin Variables Independientes vs. Variables Ortogonales
X1
X2
X3
X4
U1
U2
U3
U4
-0.999
-0.043
0.000
0.000
0.547
-0.837
0.003
0.000
0.267
-0.165
-0.644
-0.698
-0.167
-0.179
-0.774
0.584
Como consecuencia de las relaciones de correlacin, la participacin de cada una de las dos primeras variables
independientes es capturada por la respectiva variable ortogonal correlacionada, Tabla 6.20; las participaciones de las
variables dicotmicas de jefe de hogar y asalariado son capturadas por todas las variables ortogonales. El valor del total
de participaciones directas es prcticamente igual al valor de R2.
20
X1
X2
X3
X4
Total
U1
U2
U3
U4
0.067
0.000
0.000
0.000
0.017
0.040
0.000
0.000
0.008
0.003
0.045
0.053
0.004
0.004
0.083
0.047
0.095
0.048
0.128
0.100
Total
0.067
0.058
0.109
0.139
0.372
A diferencia de lo que ocurra con las participaciones combinadas en el modelo que inclua la variable experiencia al
cuadrado, las participaciones combinadas en el modelo re-especificado no presenta valores desproporcionados; en
particular, la participacin combinada total no alcanza a 1% de R2.
TABLA 6.21- DESCOMPOSICIN DIRECTA Y DETERMINANTES DEL INGRESO LABORAL (II)
Participaciones Combinadas de Variables Independientes
Participaciones Combinadas
Participacin
X1 X2
X1 X3
X1 X4
X2 X3
X2 X4
X3 X4
Total
U1
U2
U3
U4
-0.068
0.004
0.000
0.000
-0.045
0.001
0.000
0.000
0.032
0.001
0.000
0.000
0.023
0.022
0.000
0.000
-0.016
0.027
0.000
0.000
-0.011
0.007
0.122
-0.100
-0.085
0.063
0.122
-0.100
Total
-0.063
-0.044
0.034
0.045
0.010
0.018
-0.001
Expresando en forma resumida los resultados de la descomposicin ortogonal en trminos de las variables
independientes, se verifica que la descomposicin de R2 se reduce prcticamente a las participaciones directas; si bien
existen participaciones combinadas positivas y negativas de alguna magnitud, stas se compensan representando en el
total menos del 1% de R2 15.
TABLA 6.22 - DESCOMPOSICIN DIRECTA Y DETERMINANTES DEL INGRESO LABORAL (II)
Participaciones Directas de Variables Independientes
Participaciones Directas
Participacin
X1
X2
X3
X4
Total
Q(Xi)
0.067
0.058
0.109
0.139
0.372
P(Xi)
18%
16%
29%
37%
100%
La participacin combinada negativa generada entre las variables de experiencia y jefe de hogar se compensa con la
positiva generada por la participacin positiva generada entre las variables jefe de hogar y aos de escolaridad; la
participacin combinada negativa generada entre las variables experiencia y aos de escolaridad se compensan
parcialmente con la participacin combinada positiva generada por la interaccin de la variable aos de escolaridad con
las variables jefe de hogar y condicin de asalariado.
Por tanto, de acuerdo a la descomposicin propuesta en el presente artculo, la variable independiente de mayor poder
explicativo es la condicin de asalariado, 37%, seguida de la variable de condicin de jefe de hogar, 29%, la variable de
experiencia, 18%, y la variable de aos de escolaridad, 16%.
15
Las participaciones porcentuales que se reportan en los cuadros 6.22 y 6.23 se han redondeado a unidades enteras.
21
E. CUP
TABLA 6.23 - DESCOMPOSICIN DIRECTA Y DETERMINANTES DEL INGRESO LABORAL (II)
Participaciones Combinadas de Variables Independientes
Participaciones Combinadas
Participacin
X1 X2
X1 X3
X1 X4
X2 X3
X2 X4
X3 X4
Total
Q(Xi)
-0.063
-0.044
0.034
0.045
0.010
0.018
-0.001
P(Xi)
-17%
-12%
9%
12%
3%
5%
0%
R2
0.371
100%
Finalmente, an en una situacin como la presente, con participaciones combinadas no significativas, las participaciones
directas que se obtienen son diferentes segn se aplique la metodologa propuesta por G. Fields o la nueva metodologa.
En ambos casos, la condicin de asalariado es la variable con mayor poder explicativo, pero en diferentes magnitudes;
la descomposicin de Fields le asigna una participacin de 46% y la propuesta nueva le asigna una participacin
bastante menor, 37%.
En las dems variables, la diferencia no solamente implica cambios en magnitudes sino tambin cambios en el orden de
importancia, Tabla 6.2416. En particular, segn la descomposicin de Fields existe una diferencia notoria entre el poder
explicativo de la variable experiencia y el poder explicativo de la variable aos de escolaridad, y se da a favor de aos
de escolaridad; segn la nueva metodologa, la diferencia es leve y a favor de la variable experiencia. Segn la
metodologa de G. Fields, la condicin de asalariado tiene un poder explicativo casi seis veces ms que la variable de
experiencia; en cambio, dicha relacin es de dos veces segn la nueva metodologa.
TABLA 6.24 - DESCOMPOSICIN DIRECTA Y DETERMINANTES DEL INGRESO LABORAL (II)
Participaciones Combinadas de Variables Independientes
Mtodo de
Descomposicin
Experiencia
Aos de
Escolaridad
Jefe de Hogar
Mtodologa de G.
Fields
8%
14%
32%
46%
100%
Metodologa
Nueva
18%
16%
29%
37%
100%
Asalariado
Total
7. CONCLUSIONES
El anlisis por descomposicin de R2 es extremadamente til en la prctica, no solamente porque ampla
considerablemente las posibilidades de anlisis en el contexto de los modelos lineales, sino tambin porque posibilita la
toma de mejores decisiones de accin al respaldarlas tcnicamente.
Actualmente, se ha popularizado el uso de la metodologa de descomposicin propuesta por G. Fields y se la ha
aplicado en diversos estudios a lo largo de todo el mundo. Un atractivo de la descomposicin de Fields es que se obtiene
de una manera simple y directa; sin embargo, este mtodo de descomposicin no garantiza la no negatividad de los
componentes de la descomposicin, por una parte, y no reconoce la existencia del efecto generado en la interaccin
entre regresores, por otra. La presencia de participaciones negativas de una variable en la descomposicin de R2, que
mide varianza en trminos relativos, carece de sentido; el efecto combinado que la descomposicin de Fields ignora
puede ser significativo, particularmente bajo presencia de alta multicolinealidad entre las variables independientes del
16
Debido a que el total de las participaciones combinadas es prcticamente cero en este caso, el total de las participaciones directas
es prcticamente 100%.
22
8. BIBLIOGRAFA
[1] Arayama, Yuko; Moo Kim, Jong; Kimhi, Ayal. Determinants of Income Inequality among Korean Farm
Households. Economic Research Center. Discussion Paper No.161 November 2006.
[2] Carrascal, U.; Gonzles, Y.; Rodrguez, B. Anlisis Economtrico con EViews. Alfaomega-RaMa. Mxico 2001.
[3] Datta, Biswa Nath. Numerical Linear Algebra and Applications. International Thomson Publishing Company. 1994.
[4] Fields, Gary S., Regression-Based Decompositios: A New Tool for Managerial Decision-Making, Departamente of
Labor Economics, Cornell University. March 2004.
[5] Fields, Gary; Yoo, Gyeongjoon. Falling Labor Income Inequality in Korea's Economic Growth: Patterns and
Underlying Causes. Review of Income and Wealth. Series 46, Number 2, June 2000
[6] Fiorio, Carlo V.; Jenkins, Stephen P. ineqrbd: Regression-based inequality decomposition, following Fields (2003).
UKSUG. September 2007
[7] Lebart, Ludovic; Morineau, Alain; Piron, Marie. Statistique Exploratoire Multidimensionalle. Dunod. Paris, 1995.
[8] Morduch, J.; Sicular, T. Rethinking Inequality Decomposition, with Evidence from Rural China. The Economic
Journal 112:93-106. 2002.
UPB - INVESTIGACIN & DESARROLLO, No. 7: 5 24 (2007)
23
E. CUP
[9] Pedraz Gonzles, R. Determinantes de la decisin de Repartir Dividendos. Revista CEFGESTION. N 14, Espaa
1999.
[10] Salardi, Paola, How much of Brazilian Inequality can we explain? An attempt of income differentials
decomposition using the PNAD 2002. Quaderni del Dipartamento di Economia Pubblica e Territoriale n. 1/2005.
[11] Taiwo, Awoyemi. Explaining Income Inequality in Nigeria: A Regressio-Based Decomposition Using Household
Data. Department of Agricultural Economics. University of Ibadan, Nigeria.
[10] The World Bank. Spatial Inequality in Vietnam: A Regression-based Decomposition. 2003.
[12] Wan, Guang Hua. Regression-based Inequality Decomposition: Pitfalls and a Solution Procedure. World Institute
for Development Economic Research. Discussion Paper No. 2002/101. 2002.
[13] Wan, Guanghua; Zhou, Zhangyue. Income Inequality in Rural China Regression-Based Decomposition Using
Household Data. Review of Development Economics, 9(1), 107120, 2005.
24