You are on page 1of 12

INTRODUCCIN

Como la Estadstica Inferencial nos permite trabajar con una variable a nivel de
intervalo o razn, as tambin se puede comprender la relacin de dos o ms
variables y nos permitir relacionar mediante ecuaciones, una variable en relacin
de la otra variable llamndose Regresin Lineal y una variable en relacin a otras
variables llamndose Regresin mltiple.
Casi constantemente en la prctica de la investigacin estadstica, se encuentran
variables que de alguna manera estn relacionados entre si, por lo que es posible
que una de las variables puedan relacionarse matemticamente en funcin de otra
u otras variables.

OBJETIVOS

Describir la relacin entre dos o ms variables independientes y una


variable dependiente utilizando la ecuacin de regresin mltiple.

Calcular e interpretar el error estndar mltiple de estimacin y el


coeficiente de determinacin.

PROCEDIMIENTO
o
o
o
o

Seleccionar una muestra a partir de una poblacin.


Listar pares de datos para cada observacin.
Dibujar un diagrama de puntos para dar una imagen visual de la relacin.
Determinar la ecuacin de regresin.

CONCEPTOS BSICOS

Anlisis de Regresin
Es un procedimiento estadstico que estudia la relacin funcional entre
variables. Con el objeto de predecir una en funcin de la(s) otra(s).
Regresin Mltiple
Intervienen dos o ms variables independientes.
Variable Dependiente
(Respuesta, predicha, endgena) es la variable que se desea predecir o
estimar.
Variable Independiente
(Predictoras, explicativas, exgenas), son las variables que proveen las
bases para estimar.

ANLISIS DE REGRESIN MLTIPLE


El anlisis de regresin mltiple es el estudio de la forma en que una variable
dependiente, y , se relaciona con dos o ms variables independientes. En el
caso general emplearemos k para representar la cantidad de variables
independientes.
Los conceptos de un modelo de regresin y una ecuacin de regresin que
presentamos en el tema anterior se pueden aplicar al caso de la regresin
mltiple. La ecuacin que describe la forma en que la variable dependiente, y
se relaciona con las variables independientes

x 1 , x 2 , x k y un trmino de error

se llama modelo de regresin. El modelo de regresin mltiple tiene la forma


siguiente:

Ejemplos:
VARIABLE DEPENDIENTE (Y)
Volumen de ventas, en unidades
Peso de los estudiantes
Consumo de bienes industriales por
ao
Unidades consumidas de un bien por
familia
Precio de una vivienda

VARIABLES INDEPENDIENTES
(X1,X2,......)
Precio unitario
Gasto de Propaganda
Estatura
Edad
Ingreso disponible
Importacin de bienes de consumo
Precio unitario del bien
Ingreso
Nmero de integrantes por familia
N de habitaciones
N de pisos
rea construida
rea techada , etc.

La tcnica de regresin mltiple se usa frecuentemente en investigacin, se aplica


al caso en que la variable respuesta es de tipo numrico. Cuando la respuesta es
de tipo dicotmico (muere/vive; enferma/no enferma), usamos otra tcnica
denominada regresin logstica.

ANLISIS DE REGRESIN MLTIPLE PARA 2 VARIABLES INDEPENDIENTES


Para dos variables independientes, la frmula general de la ecuacin de regresin
mltiple es:

Y ' a b1 X 1 b2 X 2

X1 y X2 son las variables independientes.

a es la intercepcin en Y.

b1 es el cambio neto en Y para cada cambio unitario en X1, manteniendo X2


constante. Se denomina coeficiente de regresin parcial, coeficiente de
regresin neta o bien coeficiente de regresin.

b2 es el cambio neto en Y para cada cambio unitario en X2, manteniendo X1


constante. Se denomina coeficiente de regresin parcial o bien coeficiente
de regresin.

El clculo de estos valores es por dems laborioso a mano, por ejemplo para el
caso de las dos variables independientes, para poder resolver y obtener y en una
ecuacin de regresin mltiple el clculo se presenta muy tediosa porque se tiene
atender 3 ecuaciones que se generan por el mtodo de mnimo de cuadrados:

ANLISIS DE REGRESIN MLTIPLE CON K VARIABLES INDEPENDIENTES


La ecuacin general de regresin mltiple con k variables independientes es:

El criterio de mnimos cuadrados se usa para el desarrollo de esta ecuacin.


Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cmputo
que pueden utilizarse para estimarlos.

ERROR ESTNDAR MLTIPLE DE LA ESTIMACIN


El error estndar mltiple de la estimacin es la medida de la eficiencia de la
ecuacin de regresin.
Est medida en las mismas unidades que la variable dependiente, es difcil
determinar cul es un valor grande y cul es uno pequeo para el error estndar.
La frmula es:
SY 12k

(Y Y ' )
n (k 1)

SSE
n (k 1)

Donde:

Y es la observacin.

Y es el valor estimado en la ecuacin de regresin.

n es el nmero de observaciones y k es el nmero de variables


independientes.

ENFOQUE MATRICIAL PARA ENCONTRAR LOS PARAMETROS DE LA


ECUACION DE REGRESION
Al ajustar un modelo de regresin mltiple es mucho ms conveniente expresar
las operaciones matemticas en forma matricial. Supongamos que existen k
variables independientes y n observaciones (Xi1 ,Xi2 ,Xi3,.,Xik ,Yi ), i=1,2,3,4,
,n, y que el modelo que relaciona las variables independientes y la variable
dependiente es:

y i b0 b1 xi1 b2 xi 2 ... bk xik


Este modelo es un sistema de n ecuaciones que puede expresarse en notacin
matricial como:
y X

o ENFOQUE MATRICIAL
Donde:

y .
.

.
y
n

b2

1x31 x32 x33 .......x3k

y3

b0
b
1

1x11 x12 x13 .......x1k


1x x x .......x
2k
21 22 23

y1
y
2

nx 1

X ........................
........................

........................
1x x x .......x
nk
i1 i 2 i 3

nx p


.
.

.
b
k

px 1

Dnde: p = k+1, nmero de parmetros


COEFICIENTE DE DETERMINACIN MLTIPLE R2
Mide la tasa porcentual de los cambios de y que pueden ser explicados por: X1,
X2, X3, simultneamente.
Una vez estimado el modelo es conveniente obtener una medida acerca de la
bondad del ajuste realizado. Un estadstico que facilita esta medida es el
coeficiente de determinacin (R2), que se define:

ANLISIS DE VARIANZA

Ecuacin Bsica para anlisis de Varianza

PRUEBA GLOBAL
Ayuda a determinar si es posible que todas las Variables Independientes tengan
coeficientes de regresin neta iguales a 0. En otras palabras podra la cantidad
de variacin explicada R2, ocurrir al azar?
La prueba global se usa para investigar si todas las variables independientes
tienen coeficientes significativos. Las hiptesis son:

H 0 : 1 2 3 ... k 0

El estadstico de prueba es la distribucin F con k (nmero de variables


independientes) y n - (k + 1) grados de libertad, donde n es el tamao de la
muestra.
El estadstico de prueba se calcula con:

F = [(SCR) /(k)] /[(SCE) /(n-k+1)].

TABLA ANOVA
La tabla ANOVA proporciona la variacin de la variable dependiente (tanto de la
que est explicada por la ecuacin de regresin como de la que no lo est).

http://dm.udc.es/asignaturas/estadistica2/secprac_5_2.html

1. El propietario de La cadena de cines CINE PLANET desea estimar el


ingreso semanal neto en funcin de los gastos de publicidad. Los datos
histricos de una muestra de 8 semanas son los siguientes:

Ingresos Brutos
semanales
(en
miles
de
dlares)

Anuncios en TV
(en
miles
de
dlares)

Anuncios
peridicos
(en
miles
dlares)

en
de

96

5.0

1.5

90

2.0

2.0

95

4.0

1.5

92

2.5

2.5

95

3.0

3.3

94

3.5

2.3

94

2.5

4.2

94

3.0

2.5

96
90

95

92

1
1
1
1
1
1
1
1

95

94
94

94 8 x1

5.0
2.0
4.0
2.5
3.0
3.5
2.5
3.0

1.5
2.0
1.5
2.5
3.3
2.3
4.2
2.5

Planteando matricialmente los datos

b

b
0

3 x1

8x3

Determinando la ecuacin de regresin


El modelo es:

y b0 b1 x1 b2 x2
Entonces primero resolvemos las matrices para encontrar los parmetros:

( X X ) 1 X y

5,9989

-1,0389 -1,0353

-1,0389

0,2239 0,1313

-1,0353

0,1313
0,2491
1

( X X )

750 83.2301 b0
2401 2.2902 b
1


1856
X y 1.3010 b2

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
Anuncios en TV (en
miles de dlares)
Anuncios en peridicos
(en miles de dlares)

B
83.230

Error tp.
1.574

2.290

.304

1.301

.321

a. Variable dependiente: Ingresos Brutos semanales

Coeficientes
es tandarizad
os
Beta

Intervalo de confianza para


B al 95%
Lmite
Lmite inferior
superior
79.184
87.276

t
52.882

Sig.
.000

1.153

7.532

.001

1.509

3.072

.621

4.057

.010

.477

2.125

(en miles de dlares)

Finalmente la ecuacin es:

y 83.2301 2.2902 X 1 1.3010 X 2


Interpretemos los parmetros estimados de las variables independientes:

Para b1: Cuando los gastos de anunciar en televisin varan una unidad y
los gastos de anunciar en peridicos se mantienen constantes, los ingresos
brutos semanales se incrementarn en 2.2902 miles de dlares.
Para b2: Cuando los gastos de anunciar en televisin se mantienen
constantes y los gastos de anunciar en peridicos varan una unidad, los
ingresos brutos semanales se incrementarn en 1.3010 miles de dlares.

Hallando el error estndar de estimacin


Para lo cual usaremos la frmula abreviada para dos variables independientes la
cual se deriva de la forma general presentada en las frmulas a utilizar. La frmula
es la siguiente:
S y. X1 X 2

b0 y b1 X 1 y b2 X 2 y
n 3

S y . X1 X 2 0.64
o Interpretacin: La distancia promedio de los valores observados alrededor
de la ecuacin de regresin es de 0.64. Es decir la dispersin de los valores
observados es 0.64.
Hallando el Coeficiente de Determinacin
Resumen del modelo
Modelo
1

R
R cuadrado
a
.959
.919

R cuadrado
corregida
.887

Error tp. de la
estimacin
.64259

r 0.959
r 2 0.919

a. Variables predictoras: (Constante), Anuncios en peridicos


(en miles de dlares), Anuncios en TV (en miles de dlares)

o Interpretacin: Aproximadamente el 91.9% de los cambios producidos en


los ingresos brutos semanales son explicados por los cambios producidos
en los gastos de publicidad (en televisin y peridicos).

2. Una desea estimar los gastos en alimentacin de una familia (Y) en base a
la informacin que proporcionan las variables regresoras X1 =ingresos
mensuales y X2 =nmero de miembros de la familia. Para ello se recoge
una muestra aleatoria simple de 15 familias cuyos resultados son los de la
tabla adjunta (El gasto e ingreso est dado en cientos de miles de pesetas)
GASTO
043
031
032
046
125
044
052
029
129
035
035
078
043

INGRESO
21
11
09
16
62
23
18
10
89
24
12
47
35

TAMAO
3
4
5
4
4
3
6
5
3
2
4
3
2

047
038

29
14

Solucin

Con estos datos se obtiene:

n=15,

x 1 i=42

x2 i

3
4

Gasto=0' 160+0' . Ingreso +0' .Tamao+ error


A partir de esta ecuacin se obtienen las predicciones y los residuos
asociados a las observaciones muestrales. Para la primera observacin
'

'

x 1=2 1; x 2=3 ; y=0 43 se obtiene:


^
y 1=0' 160+0 ' . 2' 1+0' .3=0' 3839
'

'

'

e 1= y 1 ^y 1=0 430 3839=0 0461


PREDICCIONES
038
031
036
039
107

041
057
037
139
035

033
077
051
050
036

You might also like