You are on page 1of 36

Modelos de Regresin

Lineal-Variables ficticias
Paola T. Mendoza Bello.
Objetivo de la Regresin Lineal Simple
Regresin Lineal Simple

Modelo de Regresin Lineal Simple:

Estimacin de parmetros por MCO: Recta Estimada:


Coeficiente de Regresin Lineal
Anlisis de la Varianza
Anlisis de Varianza
Coeficiente de Determinacin
El contraste de Regresin

Ntese que el valor p < al nivel de significacin (alpha)


Rechaza la hiptesis nula de no linealidad del modelo.
Regresin Lineal Mltiple

Para n observaciones podemos escribir:


Regresin Lineal Mltiple

Notacin Matricial:

donde
Regresin Lineal Mltiple

Vector de coeficientes de Beta:

Ecuacin Ajustada de regresin:


REGRESIN LINEAL MLTIPLE

Pensando en el ejemplo con 2 variables explicativas (que usted puede generalizar


a k) que se representar por:

Y X

Y1 1 X11 X 21 1
Y 1 X
2 X 22 0

12
2
Y
.
1
X . . . .
. .
. . .

. . . . 2
.
Yn 1 X1n X 2n n
REGRESIN LINEAL MLTIPLE

Para la estimacin de los parmetros, se toma la funcin de mnimos


cuadrados expresada por L, la que es igual a la suma de los errores elevados
al cuadrado:
n
L i2
i1

Si multiplicamos la transpuesta del vector


por el mismo vector
obtendremos la suma de los errores elevados al cuadrado:
n
i2
i1

La funcin de mnimos cuadrados quedar como:

L
REGRESIN LINEAL MLTIPLE

Ahora bien, si de la ecuacin vectorial del modelo de regresin anterior


despejamos el error:
Y X
sustituyndolo en L:

L Y X Y X
Al realizar las operaciones anteriores y simplificando se llega a lo siguiente:

L Y Y 2X Y X X 2
Derivando la funcin anterior con respecto de
, evaluando para

e igualando a cero:

L XY XX 0

REGRESIN LINEAL MLTIPLE

despejando

X X XY
1

donde:

n n

0 n X X 2i n
Yi
1i

n i1 i1

1
n n
n i1
X X X1i 1i
X 2
X1i X 2i
i1 X Y X1i Yi
n
i1 i1
i1
2
n n
X 2i n
i1
X
i1
1i X 2i i1
X 2i
2

X 2i Yi
i1
REGRESIN LINEAL MLTIPLE

despejando

XX XY
1
REGRESIN LINEAL MLTIPLE

De esta manera, el modelo de regresin lineal mltiple ajustado


queda definido por:

Y 0 1 X 1 2 X 2
REGRESIN LINEAL MLTIPLE
PRUEBA DE SIGNIFICANCIA

La prueba de significancia del modelo nos permite determinar


estadsticamente si las variables independientes (en conjunto) tienen efecto
o no sobre la variable dependiente.

Para realizar esta prueba se requiere descomponer la suma total de


cuadrados, representada por SCT, en dos componentes: SCRg y SCE

SCT= SCRg + SCE


Donde:

SCT es la suma total de cuadrados


SCRg es la suma de cuadrados de la regresin
SCE es la suma de cuadrados del error
A modo de ejemplo asumiendo un modelo Y 0 1 X 1 2 X 2
La figura siguiente muestra la relacin entre las variables independientes e Y.

Y 0 1 X 1 2 X 2

X2

X1
Anlisis de Varianza
Coeficiente de Correlacin Mltiple
Coeficiente de determinacin Mltiple corregido

SCRg
Ra 2 1 n k 1
SCT
n 1

2
Un nmero reducido de grados de libertad puede generar un elevado R ,
sin que la relacin entre las variables sea estrecha. Este coeficiente tiene la
ventaja de que no aumenta su valor al aumentar el nmero de variables
explicativas.
Contraste de Regresin

Nte que un valor p < al nivel de significacin (alpha)


Rechazar la hiptesis nula.
Prueba sobre coeficientes individuales

En la prueba de significancia determinamos si existe o no relacin entre la


variable dependiente y las variables independientes en conjunto, es decir, no
se puede determinar la relacin entre Y y cada una de las variables
independientes.
Se pueden realizar pruebas individuales para analizar la relacin entre la
variable dependiente y cada una de las variables independientes.

Partimos de las hiptesis siguientes:

H0 : j 0
H1 : j 0 para j = 1, 2, ..., k
El dueo de una empresa de venta de Salmones en la ciudad de Puerto Montt
desea determinar la interrelacin entre la introduccin del producto Trozos de
salmn en aderezos (importados y nacional) y las utilidades.

Utilidades 70 40 100 80 30 100


Demanda del producto con aderezo 2 1 3 2 1 3
nacional
Demanda del producto con aderezo 50 65 75 30 45 35
importada

Con esta informacin determine lo siguiente:

1.- La ecuacin de regresin lineal mltiple.


2.- Complete la Tabla ANOVA
3.- Calcule el coeficiente de determinacin mltiple y concluya respecto del
modelo de regresin lineal mltiple.
XX XY
1
donde:

n n

0 n X X 2i n
Yi
1i

n i1 i1

1
n n
n i1
X X X1i 1i
X 2
X1i X 2i
i1 X Y X1i Yi
n
i1 i1
i1
2
n n
X 2i n
i1
X
i1
1i X 2i i1
X 2i
2

X 2i Yi
i1
1
6 12 300 420
12 28 600 970
300 600 16500 20850
2.833333 0.5 0.033333 420
0.5 0.25 0 970

0.033333 0 .0006666 20850
10
32.5
0.1
10
32,5
0,1

Y 10 32,5 X 1 0,1X 2
SCRg XY
Y 2

n
420

SCRg 10 32,5 0,1 970
420
2

20850
6
SCT Y 2
Y
2

SCRg 4240 n

SCT 33800
420
2

6
SCT 4400
SCE SCT SCRg
SCE 4400 4240
SCE 160
SSR
R2
Esto indica que el 96,36 % de la variabilidad de la utilidad de las ventas de Syy
del producto Trozos de salmn en aderezos se explica mediante el
modelo de regresin lineal mltiple: 4240
R
2

4400
R 2 0,9636
Y 10 32,5 X 1 0,1X 2
En educacin existe polmica acerca de las notas de los colegios, se creen que estas estn
infladas.
Si no estuvieran infladas esperaramos que las pruebas de ingreso a la Universidad estn
altamente correlacionadas con las notas de enseanza media (NEM). Revisemos, con datos de
la Prueba de Aptitud Acadmica (PAA, variables predictoras PHyG, Pmat, PVerbal) del ao
2001 en la regin del Maule, si podemos explicar
las notas de enseanza media con la PAA.

Resumen del modelo

R cuadrado Error tp. de la


Modelo R R cuadrado corregida estimacin
1 .578a .334 .334 81.25283
a. Variables predictoras: (Constante), Prueba Historia y
Geografa, Prueba Aptitud Matemtica, Prueba Aptitud Verbal
ANOVAb

Suma de Media
Modelo cuadrados gl cuadrtica F Sig.
1 Regresin 16400316 3 5466772.0 828.045 .000a
Residual 32660205 4947 6602.023
Total 49060521 4950
a. Variables predictoras: (Constante), Prueba His toria y Geografa, Prueba Aptitud
Matemtica, Prueba Aptitud Verbal
b. Variable dependiente: NEM Notas Ens Media

Coeficientesa

Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Lmite
Modelo B Error tp. Beta t Sig. Lmite inferior superior
1 (Constante) 312.088 5.656 55.179 .000 301.000 323.176
Prueba Aptitud Verbal .153 .019 .176 7.993 .000 .115 .190
Prueba Aptitud
.275 .015 .349 18.133 .000 .245 .304
Matemtica
Prueba Historia y
.096 .019 .098 5.049 .000 .059 .133
Geografa
a. Variable dependiente: NEM Notas Ens Media
Correlacionesa

Prueba Prueba
NEM Notas Prueba Aptitud Historia y
Ens Media Aptitud Verbal Matemtica Geografa
NEM Notas Ens Media Correlacin de Pearson 1 .526** .556** .485**
Sig. (bilateral) . .000 .000 .000
Prueba Aptitud Verbal Correlacin de Pearson .526** 1 .783** .789**
Sig. (bilateral) .000 . .000 .000
Prueba Aptitud Correlacin de Pearson .556** .783** 1 .711**
Matemtica Sig. (bilateral) .000 .000 . .000
Prueba Historia y Correlacin de Pearson .485** .789** .711** 1
Geografa Sig. (bilateral) .000 .000 .000 .
**. La correlacin es significativa al nivel 0,01 (bilateral).
a. N por lista = 4951

Resumen del modelob

R cuadrado Error tp. de la


Modelo R R cuadrado corregida estimacin
1 .575a .331 .331 81.439
a. Variables predictoras: (Constante), Prueba Aptitud
Matemtica, Prueba Aptitud Verbal
b. Variable dependiente: NEM Notas Ens Media