You are on page 1of 24

Tema 2.

Mtodos de
Regresin Estadstica

Parte II: Regresin lineal mltiple

Mtodos Estadsticos en Ordenador


Grado en Relaciones Laborales y Recursos Humanos

Supuesto prctico
Una empresa fabricante de cereales para el desayuno desea
conocer la ecuacin que permita predecir las ventas (en miles de
euros) en funcin de la inversin en publicidad infantil en televisin
(en miles de euros), en publicidad en radio (en miles de euros) y la
inversin en publicidad en los peridicos (en miles de euros). Se
realiza un estudio en el que se renen los datos mensuales
correspondientes a los ltimos 20 meses. Estos datos aparecen en
la tabla adjunta. Se pide:
1.

Ajustar un modelo de regresin lineal mltiple. Estimar los


parmetros del modelo e interpretarlos.

2.

Verificar que el modelo ajustado es adecuado, es decir, las


variables estn asociadas linealmente (contraste de regresin)
y estudiar la bondad del ajuste.

3.

Realizar el contraste de significacin de las constante y


concluir si es adecuado incluirla en el modelo.

4.

Comparar los efectos de los gastos en publicidad en tv, radio y


peridicos y concluir qu tipo de publicidad es la ms rentable
y cul e la menos rentable.

5.

Ajustar de nuevo el modelo de regresin de forma que slo se


incluyan las variables independientes significativas. Utilizar
para ello un mtodo de seleccin automtica.

ejregmult_1.sav

Regresin lineal mltiple


-Modelo tericoModelo lineal

Y = 0 + 1 X1+ 2 X2 ++ k Xk +

(1)

Parmetros
j magnitud del efecto que Xj tienen sobre Y (incremento en la media de
Y cuando Xj aumenta una unidad, y el resto de variables
independientes permanecen constantes)
0 trmino constante (promedio de Y cuando las v. explicativas valen 0)
residuos (perturbaciones aleatorias, error del modelo)

Datos (observaciones, muestra) { (Yi, X1i,,Xki) : i = 1,,n }


PROBLEMA

Suponiendo que la relacin entre las variables es como


en (1), estimar los coeficientes ( j ) utilizando la
informacin proporcionada por la muestra

Paso 1. Ajustar el modelo de


regresin lineal mltiple
Identificar el modelo (variable dependiente y
variables independientes).
Estimar los parmetros del modelo (efectos
de las variables independientes).
Interpretar los parmetros estimados.

Supuesto prctico

(ejregmult_1.sav)

Objetivo: Ajustar un modelo lineal que permita predecir las ventas


en funcin de la inversin en publicidad en televisin, la inversin
en publicidad en radio y la inversin en publicidad en peridicos.
Variable dependiente o de respuesta (Y):
ventas
ventas mensuales en miles de euros
Variables independientes o explicativas (X1 , X2 , X3):
publ_tv inversin publicidad tv (miles de euros)
publ_rad inversin publicidad radio (miles de euros)
publ_per inversin publicidad peridicos (miles de euros)

ventas = 0 + 1*publ_tv + 2*publ_rad + 3*publ_per +

Estimacin del modelo


^

Problema de mnimos cuadrados

Solucin
( n > k+1 )

Yi valor predicho

Suma residual de cuadrados

Estimacin de los coeficientes

Analizar
Regresin
Lineal

Estimacin de los parmetros


del modelo
(efectos de las variables)

ventas = 2.108 + 3.432*publ_tv + 0.001*publ_rad + 11.347*publ_per

Interpretacin de los parmetros del modelo


(efectos de las variables independientes)
ventas = 2.108 + 3.432*publ_tv + 0.001*publ_rad + 11.347*publ_per
constante (2.108) si no es invierte en ningn tipo de publicidad (tv, radio
y peridicos), las ventas medias son de 2.108 miles de euros.
publ-tv (3.432) por cada unidad (miles de euros) que se incrementa la
inversin en publicidad en tv las ventas se incrementan en 3.432 unidades
(miles de euros).
publ-rad (0.001) por cada unidad (miles de euros) que se incrementa la
inversin en publicidad en radio las ventas se incrementan en 0.001
unidades (miles de euros).
publ-per (11.347) .. interpretacin?.

Paso 2. Bondad del ajuste


Verificar que el modelo ajustado es
adecuado, es decir, las variables
estn asociadas linealmente
(contraste de regresin).
Estudiar la bondad del ajuste.

Contraste de regresin
Utilidad: Verificar que el modelo lineal es adecuado para
describir la relacin entre las variables
Contraste: H : = = = = 0
0
1
2
k
H1 : Algn j 0

H0 : R = 0
H1 : R 0

Interpretacin:
Aceptar H0 significa que las variables independientes no
estn asociadas linealmente con la variable dependiente,
esto es, el modelo lineal no es adecuado

Contraste de regresin

Al 5% se rechaza H0 (el
modelo lineal es adecuado
para describir la relacin entre
las variables)

TABLA ANOVA
FUENTE

SUMA DE
CUADRADOS

G.D.L.

MEDIA
CUADRTICA

MODELO

VE

VE/k

VNE

N-k-1

VNE/(N-k-1)

VT

N-1

RESIDUAL
TOTAL

Fexp

p-valor

Bondad del ajuste


Descomposicin de la variabilidad

Coeficiente de determinacin:

Inconveniente: sobrevalora la bondad del ajuste

Coeficiente de determinacin corregido:

Bondad del ajuste

R2 = 0.832
R2 corregido = 0.801 (es siempre algo menor que R2)
Interpretacin: la variable ventas queda explicada en un 80.1%
por las variables inversin en publicidad en tv, radio y peridicos a
travs del modelo lineal ajustado

Paso 3. Significacin de la
constante
Verificar que es conveniente incluir la
constante en el modelo.

Significacin de la constante
Utilidad: verficar si es conveniente ajustar un modelo lineal
con un trmino constante
Contraste de hiptesis

H0 : 0 = 0
H1 : 0 0

Interpretacin:
Aceptar H0 significa que no es conveniente incluir un
trmino constante en la ecuacin del modelo lineal

Significacin de la constante

H0 : 0 = 0
H1 : 0 0

Dado que el p-valor es 0.320>0.05, entonces se


acepta la hiptesis nula y la constante podra ser
eliminada del modelo

Paso 4. Comparar los


efectos de las variables
independientes
Identificar qu variables son las que ms
influyen en la variable dependiente.
Ver si alguna de las variables no aporta
informacin significativa y podra ser
eliminada del modelo de regresin

Comparacin de los efectos


Coeficientes tipificados

Interpretacin: la variable que ms influye en las ventas es la


inversin en publicidad en peridicos (coeficiente tipificado
0.711) y la que menos influye es la publicidad en radio (0.006).

Comparacin de los efectos


Significacin individual
de las variables
H0 : j = 0
H1 : j 0

Para cada variable independiente, aceptar H0


significa que la variable no aporta informacin
significativa en el modelo
Interpretacin: la variable inversin en publicidad en radio no
aporta informacin significativa en la explicacin de las ventas (pvalor=0.961>0.05). El modelo por tanto se puede simplificar.

Paso 5. Seleccin
automtica de variables en el
modelo de regresin lineal
Ajustar un modelo ms sencillo donde
slo las variables que aportan
informacin significativa se incluyan.

Seleccin de un subconjunto ptimo


de variables independientes
Objetivo: Seleccionar las variables que
sin ser redundantes proporcionen la mejor
explicacin de la variable dependiente.
Mtodos secuenciales en SPSS:

Hacia atrs, Hacia delante, Pasos sucesivos

En trminos muy muy generales


Evalan contrastes de hiptesis
para controlar la entrada y salida
de variables en el modelo

Seleccin de un subconjunto ptimo


de variables independientes

Elegimos ajustar el modelo segn el mtodo Pasos


sucesivos y eliminamos la constante (botn Opciones)

Seleccin de un subconjunto ptimo


de variables independientes

Modelo final:
ventas = 12.082*publ_per + 4.599*publ_tv

R2 corregido = 0.984 la variable ventas queda explicada en un


98.4% por las variables inversin en publicidad en tv y peridicos a
travs del modelo lineal ajustado

Ejercicio propuesto
Se pretende estudiar la posible
relacin lineal entre el precio de pisos
en miles de euros, en una conocida
ciudad espaola y variables como la
superficie en m2 y la antigedad del
inmueble en aos. Para ello, se realiza
un estudio, en el que se selecciona de
forma
aleatoria
una
muestra
representativa de los distintos barrios
de la ciudad. Los datos aparecen en la
tabla adjunta.
Realizar un anlisis de regresin que
permita describir el precio de los pisos
en funcin de la superficie y la
antigedad.

You might also like