You are on page 1of 10

Universidad Tecnolgica de El Salvador

Facultad de Maestras y Estudios de Postgrado


Maestra en Administracin Financiera

Nota tcnica
Contabilidad gerencial
Medicin del comportamiento de los costos
Anlisis de regresin

Profesor: Miguel ngel Prez Orellana.

Nombre junio de 2017

Regresin lineal
Introduccin a la regresin lineal

El objeto de un anlisis de regresin es investigar la relacin


estadstica que existe entre una variable dependiente (Y) y una o
ms variables independientes , ... ). Para poder realizar
esta investigacin, se debe postular una relacin funcional entre las
variables. Debido a su simplicidad analtica, la forma funcional que
ms se utiliza en la prctica es la relacin lineal. Cuando solo existe
una variable independiente, esto se reduce a una lnea recta:

donde los coeficientes b0 y b1 son parmetros que definen la


posicin e inclinacin de la recta. (Ntese que hemos usado el
smbolo especial para representar el valor de Y calculado por la
recta. Como veremos, el valor real de Y rara vez coincide
exactamente con el valor calculado, por lo que es importante hacer
esta distincin.)

El parmetro b0, conocido como la ordenada en el origen, nos


indica cunto es Y cuando X = 0. El parmetro b1, conocido como la
pendiente, nos indica cunto aumenta Y por cada aumento de una
unidad en X. Nuestro problema consiste en obtener estimaciones de
estos coeficientes a partir de una muestra de observaciones sobre
las variables Y y X. En el anlisis de regresin, estas estimaciones se
obtienen por medio del mtodo de mnimos cuadrados.
Como ejemplo, consideremos las cifras del Cuadro 1, que muestra
datos mensuales de produccin y costos de operacin para una
empresa britnica de transporte de pasajeros por carretera durante
los aos 1949-52 (la produccin se mide en trminos de miles de
millas-vehculo recorridas por mes, y los costos se miden en
trminos de miles de libras por mes). Para poder visualizar el grado
de relacin que existe entre las variables, como primer paso en el
anlisis es conveniente elaborar un diagrama de dispersin, que es
una representacin en un sistema de coordenadas cartesianas de los
datos numricos observados.

En el diagrama resultante, en el eje X se miden las millas-vehculo


recorridas, y en el eje Y se mide el costo de operacin mensual.
Cada punto en el diagrama muestra la pareja de datos (millas-
vehculo y costos de operacin) que corresponde a un mes
determinado. Como era de esperarse, existe una relacin
positiva entre estas variables: una mayor cantidad de millas-
vehculo recorridas corresponde un mayor nivel de costos de
operacin.

Por otro lado, tambin se aprecia por qu este grfico se denomina


un diagrama de dispersin: no existe una relacin
matemticamente exacta entre las variables, ya que no toda la
variacin en el costo de operacin puede ser explicada por la
variacin en las millas-vehculo. Si entre estas variables existiera
una relacin lineal perfecta, entonces todos los puntos caeran a lo
largo de la recta de regresin, que tambin ha sido trazada y que
muestra la relacin promedio que existe entre las dos variables.
En la prctica, se observa que la mayora de los puntos no caen
directamente sobre la recta, sino que estn dispersos en torno a
ella. Esta dispersin representa la variacin en Yque no puede
atribuirse a la variacin en X.
Diagrama de dispersin
Cuadro 1.
Operaciones Mensuales en
una Empresa de Transporte de Pasajeros.
Costos Millas
Totales Vehculo
(miles) (miles)
Mes N Y X

1 213.9 3147
2 212.6 3160
3 215.3 3197
4 215.3 3173
5 215.4 3292
6 228.2 3561
7 245.6 4013
8 259.9 4244
9 250.9 4159
10 234.5 3776
11 205.9 3232
12 202.7 3141
13 198.5 2928
14 195.6 3063
15 200.4 3096
16 200.1 3096
17 201.5 3158
18 213.2 3338
19 219.5 3492
20
21
243.7
262.3
4019
4394
Estimacin de la recta de regresin
22 252.3 4251 y del coeficiente de determinacin
23 224.4 3844
24 215.3 3276
25 202.5 3184 En la prctica, los clculos relacionados
26 200.7 3037
27 201.8 3142 con un anlisis de regresin se efectan
28
29
202.1
200.4
3159
3139
por medio de programas de
30 209.3 3203 computadora, por lo que los clculos
31
32
213.9
227.0
3307
3585
detallados en esta seccin se incluyen
33 246.4 4073 nicamente a ttulo de ilustracin.
Fuente: J. Johnston,
Anlisis Estadstico de los Costes Para estimar los coeficientes por medio
(Barcelona: Sagitario, S. A., 1966), p. 118.
de mnimos cuadrados, se utilizan las
siguientes frmulas:

En nuestro ejemplo, aplicando estas frmulas tenemos:


25,216,020.3 219.1242(113,879)
b1 = = 0.044674
398,855,769 3,450.879(113,879)
b0 = 219.1242 0.044674(3,450.879) = 64.96

Expresando los resultados en trminos de la recta de regresin,


tenemos:

= 64.96 + 0.044674 X

Podemos concluir que por cada milla adicional recorrida, los costos
de operacin aumentan en aproximadamente 4.5 centavosesto
podra interpretarse como el costo marginal para la empresa de
recorrer una milla adicionalmientras que el coeficiente b0 nos
estara indicando la parte del costo mensual que no vara
directamente con la cantidad de millas recorridas (aproximadamente
64,960 libras mensuales).

Diagrama de dispersin

Coeficiente de Determinacin (R2).

Una pregunta importante que se plantea en el anlisis de regresin


es la siguiente: Qu porcentaje de la variacin total en Y se debe a
la variacin en X? En otras palabras, cul es la proporcin de la
variacin total en Y que puede ser explicada por la variacin en X?
El estadstico que mide esta proporcin o porcentaje se denomina
coeficiente de determinacin:
En este caso, al hacer los clculos respectivos, se obtiene un valor
de 0.946. Esto significa que la variacin en las millas recorridas
explica 94.6 % de la variacin en el gasto de operacin mensual.

Regresin mltiple

Hasta ahora hemos considerado nicamente el caso de la regresin


simple. En el caso ms general de la regresin mltiple, existen dos
o ms variables independientes:

= b0 + b1X1 + b2X2 + ...

La estimacin de los coeficientes de una regresin mltiple es un


clculo bastante complicado y laborioso, por lo que se requiere del
empleo de programas de computacin especializados. Sin embargo,
la interpretacin de los coeficientes es similar al caso de la regresin
simple: el coeficiente de cada variable independiente mide el efecto
separado que esta variable tiene sobre la variable dependiente. El
coeficiente de determinacin, por otro lado, mide el porcentaje de la
variacin total en Y que es explicado por la variacin conjunta de las
variables independientes.

El ejemplo numrico que se desarrolla a continuacin est basado


en un estudio estadstico de los costos administrativos en los bancos
comerciales en Guatemala. (Los datos bsicos se muestran en el
Cuadro 2.) La variable dependiente para el anlisis ser el nivel
anual de los Gastos Generales y de Administracin en los
diferentes bancos del sistema. Si se examina el Cuadro 2, se podr
apreciar que estos costos (que en lo sucesivo llamaremos
simplemente costos administrativos) varan enormemente de un
banco a otro. Nuestro problema consistir, por tanto, en encontrar
una lista de variables que nos permitan explicar esta variacin
observada.

Cuadro 2
A un nivel muy elemental, por Bancos Comerciales Privados en Guatemala (1991).
Gastos Total Agencias
supuesto, dicha variacin no tiene Generales Activo

realmente ningn misterio, ya que


y de Promedio
Admin.

los bancos varan mucho en cuanto


G&T 48.8 831.5 30
a su tamao, y es ms bien de
INDUSTRIAL 43.2 1204.0 18
esperarse que los bancos ms OCCIDENTE 39.4 1153.5 20
grandes tengan tambin costos del CAFE 29.8 499.6 25
administrativos ms altos por el del AGRO 26.2 466.6 30
slo hecho de ser ms grandes. AGRICOLA MERC. 24.8 522.3 12
Nuestra tarea ser traducir esta INTERNACIONAL 24.0 376.6 12
nocin intuitiva en un concepto INMOBILIARIO 21.5 431.3 20
operativo, y para esto debemos CONSTRUBANCO 18.3 282.2 10
tratar de expresar el tamao de del EJERCITO 15.6 311.8 13
un banco en trminos de alguna LLOYDS 14.3 284.5 7

variable numrica. La variable METROPOLITANO 12.9 339.0 8

escogida para este propsito fue el BANEX 12.5 462.8 3

Total de Activos del banco. Con del QUETZAL 8.8 205.0 12

esto, y como una primera PROMOTOR 6.0 162.4 3

aproximacin para el anlisis, la CITIBANK 5.9 45.8 1

recta de regresin sera la CONTINENTAL 3.6 113.7 4

siguiente: REFORMADOR 1.7 237.3 7

UNO 1.0 170.8 5

Fuente: Superintendencia de Bancos, Boletn de Estadsticas


= b0 + b1X Bancarias (Guatemala, 4 Trimestre, 1992).

donde Y = Costos Administrativos del banco, y X = Activos Totales


del banco.

Los Activos Totales de un banco son una buena medida de su


tamao, aunque no es la nica medida posible, por lo que la
decisin de adoptar esta medida especfica es en cierto modo
arbitraria. Por otro lado, el empleo de los Activos Totales como
variable independiente en la regresin facilita en cierto modo la
interpretacin econmica de los coeficientes:

a) El coeficiente b1 nos indica en cunto incrementa el costo


administrativo anual por cada quetzal adicional de activos que
maneja el banco. En otras palabras, este coeficiente nos mide el
costo marginal de administrar un quetzal adicional de activos.
Obviamente, este es un dato sumamente interesante para los
tomadores de decisiones en el sector bancario. Esperamos
naturalmente que este coeficiente sea positivo.

b) Por otro lado, el coeficiente b0 nos estara indicando la parte del


costo administrativo que no vara directamente con el nivel de los
activos del banco. En otras palabras, esta sera la parte del costo
administrativo que podra interpretarse como un costo fijo.
Esperamos tambin que este coeficiente sea positivo.

Un posible defecto de esta ecuacin es la suposicin de que todos


los bancos tienen los mismos costos fijos. Por otro lado, se puede
apreciar en el Cuadro 2 que los bancos comerciales varan mucho
en cuanto al nmero de sucursales o agencias que operan, y este
es un factor que seguramente debe afectar el nivel de los costos
administrativos. Por esto, para una mejor aproximacin se
estimar ms bien la siguiente regresin mltiple:

= b0 + b1X1 + b2X2

donde X1 = Activos Totales del banco, y X2 = Nmero de Agencias


del banco.

En esta segunda regresin, el coeficiente b2 nos est midiendo el


incremento en el costo administrativo anual que resulta de manejar
una agencia adicional. Esperamos, por tanto, que este coeficiente
sea positivo. Naturalmente que este coeficiente tendra que
interpretarse como un costo promedio por agencia, ya que
ninguna agencia es exactamente igual que otra, por lo que
difcilmente pueden tener todas el mismo costo. Los otros
coeficientes tienen la misma interpretacin que en la ecuacin
anterior. Los resultados estimados fueron los siguientes:

= -1.22 + 0.0275X1 + 0.661X2


R2 = 0.9018

Se puede apreciar en primer lugar que esta regresin tiene un alto


grado de poder explicativo: la variacin conjunta de estas dos
variables explica poco ms de 90 por ciento de la variacin en los
Costos Administrativos.
Por otro lado, se aprecia que el valor estimado para b0 es negativo,
lo cual en principio carece de sentido econmico. En vista de esto,
conviene en este caso volver a estimar la regresin por el origen,
es decir, sin esta constante. Los resultados son los siguientes:

= 0.0266X1 + 0.621X2
R2 = 0.8995

Aqu se aprecia que el poder explicativo es bsicamente igual que en


la regresin anterior, aunque al haber eliminado un coeficiente
posiblemente redundante, esta segunda regresin nos proporciona
en principio estimaciones ms eficientes de los otros coeficientes:

a) El coeficiente b1, se recordar, nos mide el costo marginal de


administrar un quetzal adicional de activos. Segn estas
estimaciones, por tanto, se podra concluir que en nmeros
redondos el costo administrativo de un banco tpico aumentar
entre 2 y 3 centavos por ao por cada quetzal adicional de activos
que administre.

b) El coeficiente b2, se recordar, nos mide el incremento en el costo


administrativo anual que resulta de manejar una agencia
adicional. Segn estas estimaciones, por tanto, se podra concluir
en nmeros redondos, y tomando en cuenta que los datos se
expresan en trminos de millones de quetzales, que el costo
administrativo de un banco tpico aumentar alrededor de
620,000 quetzales por ao por cada agencia adicional.

Los resultados de este anlisis pueden proporcionar una buena


indicacin sobre el comportamiento de los costos para el banco
tpico en Guatemala, aunque la naturaleza misma de un estudio de
este tipo no puede arrojar resultados estrictamente aplicables a
cada uno de los bancos considerados individualmente. No obstante,
a pesar de esto, un estudio de este tipo de todas maneras puede ser
muy til, porque los resultados pueden proporcionar una norma o
estndar contra el cual se pueden comparar los costos
administrativos en un banco particular.

En ausencia de un estudio de este tipo, un banco no tiene realmente


un criterio para determinar si sus costos son muy elevados,
aceptables, o normales, ya que los bancos difieren enormemente
en cuanto a cantidad de activos, nmero de sucursales, etc., de
modo que el nico criterio objetivo sera el de compararse con un
banco de similar tamao y caractersticas. Sin embargo, si se
pudiera obtener una frmula emprica que permita calcular un valor
normal o promedio para los costos administrativos en funcin de
unas pocas variables que permitan una medicin numrica,
entonces se podra fcilmente determinar si el banco en cuestin
est mejor o peor que el banco tpico a ese respecto.

Regresin no lineal

La regresin lineal no siempre da buenos resultados, porque a veces


la relacin entre Y y X no es lineal sino que exhibe algn grado de
curvatura. La estimacin directa de los parmetros de funciones no-
lineales es un proceso bastante complicado. No obstante, a veces se
pueden aplicar las tcnicas de regresin lineal por medio de
transformaciones de las variables originales.

Una funcin no-lineal que tiene muchas aplicaciones es la funcin


exponencial:

Y = AXb

donde A y b son constantes desconocidas. Si aplicamos logaritmos,


esta funcin tambin puede ser expresada como:

log(Y) = log(A) + b.log(X)

Consideremos ahora la siguiente regresin lineal:

log(Y) = b0 + b1log(X)

En esta regresin (denominada regresin doble-log), en lugar de


calcular la regresin de Y contra X, calculamos la regresin del
logaritmo de Y contra el logaritmo de X. Comparando estas dos
ecuaciones, podemos apreciar que el coeficiente es un estimador
de log(A), mientras que es un estimador de b (el exponente de la
funcin exponencial). Este modelo es particularmente interesante
en aplicaciones economtricas, porque el exponente b en una
funcin exponencial mide la elasticidad de Y respecto de X.

Como ejemplo, en el Cuadro 3 se Cuadro 3


Demanda de Automviles Nuevos
muestran los datos bsicos de un estudio y Variables Relacionadas,
de la demanda de carros nuevos en los 1932-56.
X1 X2 X3 Y
Estados Unidos, publicado en 1958 por el
1932 126.5 83.4 18.7 1.10
Profesor D. B. Suits (ntese que Suits 1933 128.5 82.6 17.9 1.53
excluy de su anlisis los datos 1934 128.5 90.9 18.9 1.93
correspondientes al perodo 1942-48, por 1935 120.5 99.3 19.4 2.87
considerarlos poco representativos). Las 1936 117.0 111.6 20.1 3.51
variables consideradas para el anlisis 1937 121.0 115.6 21.5 3.51
fueron las siguientes: 1938 133.8 109.0 22.3 1.96
1939 131.0 118.5 22.7 2.72
X1 = ndice del Precio Real de Automviles Nuevos 1940 134.3 127.0 23.2 3.46
X2 = Ingreso Disponible Real (en miles de millones de 1941 144.9 147.9 24.5 3.76
dlares) .. .. .. .. ..
X3 = Automviles en Circulacin al principio de cada
1949 186.6 184.9 30.6 4.87
ao (millones de unidades)
1950 186.6 200.5 33.1 6.37
Y = Ventas de Automviles Nuevos (millones de
unidades). 1951 181.5 203.7 35.7 5.09
1952 195.7 209.2 37.6 4.19
Con estos datos, podemos estimar la 1953 188.2 218.7 39.3 5.78
1954 190.2 221.6 41.6 5.47
siguiente regresin doble-log:
1955 196.6 236.3 43.0 7.20
1956 193.4 247.2 47.0 5.90
log(Y) = b0 + b1log(X1) + b2log(X2) + b3log(X3) Fuente: The Demand for New
Automobiles in the United States,
Review of Economics and Statistics,
40 (August 1958): 279.

Puesto que todas las variables se expresan en trminos de


logaritmos, los coeficientes de regresin son estimaciones de las
elasticidades de Y respecto de las variables independientes. La
regresin estimada fue la siguiente:

log(Y) = - 1.5803 - 1.422 log(X1) + 3.216 log(X2) - 1.479 log(X3)


R2 = 0.942

En base a estos resultados, podemos concluir que la elasticidad-


precio de la demanda de automviles nuevos en este perodo era
cercana a 1.4, con una elasticidad-ingreso de aproximadamente
3.2. (Cul sera la interpretacin del coeficiente de la variable X3?)

You might also like