Professional Documents
Culture Documents
Como la Estadstica Inferencial nos permite trabajar con una variable a nivel de
intervalo o razn, as tambin se puede comprender la relacin de dos o ms
variables y nos permitir relacionar mediante ecuaciones, una variable en relacin
de la otra variable llamndose Regresin Lineal y una variable en relacin a otras
variables llamndose Regresin mltiple.
Casi constantemente en la prctica de la investigacin estadstica, se encuentran
variables que de alguna manera estn relacionados entre si, por lo que es posible
que una de las variables puedan relacionarse matemticamente en funcin de otra
u otras variables.
OBJETIVOS
PROCEDIMIENTO
o
o
o
o
CONCEPTOS BSICOS
Anlisis de Regresin
Es un procedimiento estadstico que estudia la relacin funcional entre
variables. Con el objeto de predecir una en funcin de la(s) otra(s).
Regresin Mltiple
Intervienen dos o ms variables independientes.
Variable Dependiente
(Respuesta, predicha, endgena) es la variable que se desea predecir o
estimar.
Variable Independiente
(Predictoras, explicativas, exgenas), son las variables que proveen las
bases para estimar.
x 1 , x 2 , x k y un trmino de error
Ejemplos:
VARIABLE DEPENDIENTE (Y)
Volumen de ventas, en unidades
Peso de los estudiantes
Consumo de bienes industriales por
ao
Unidades consumidas de un bien por
familia
Precio de una vivienda
VARIABLES INDEPENDIENTES
(X1,X2,......)
Precio unitario
Gasto de Propaganda
Estatura
Edad
Ingreso disponible
Importacin de bienes de consumo
Precio unitario del bien
Ingreso
Nmero de integrantes por familia
N de habitaciones
N de pisos
rea construida
rea techada , etc.
Y ' a b1 X 1 b2 X 2
a es la intercepcin en Y.
El clculo de estos valores es por dems laborioso a mano, por ejemplo para el
caso de las dos variables independientes, para poder resolver y obtener y en una
ecuacin de regresin mltiple el clculo se presenta muy tediosa porque se tiene
atender 3 ecuaciones que se generan por el mtodo de mnimo de cuadrados:
(Y Y ' )
n (k 1)
SSE
n (k 1)
Donde:
Y es la observacin.
o ENFOQUE MATRICIAL
Donde:
y .
.
.
y
n
b2
y3
b0
b
1
y1
y
2
nx 1
X ........................
........................
........................
1x x x .......x
nk
i1 i 2 i 3
nx p
.
.
.
b
k
px 1
ANLISIS DE VARIANZA
PRUEBA GLOBAL
Ayuda a determinar si es posible que todas las Variables Independientes tengan
coeficientes de regresin neta iguales a 0. En otras palabras podra la cantidad
de variacin explicada R2, ocurrir al azar?
La prueba global se usa para investigar si todas las variables independientes
tienen coeficientes significativos. Las hiptesis son:
H 0 : 1 2 3 ... k 0
TABLA ANOVA
La tabla ANOVA proporciona la variacin de la variable dependiente (tanto de la
que est explicada por la ecuacin de regresin como de la que no lo est).
http://dm.udc.es/asignaturas/estadistica2/secprac_5_2.html
Ingresos Brutos
semanales
(en
miles
de
dlares)
Anuncios en TV
(en
miles
de
dlares)
Anuncios
peridicos
(en
miles
dlares)
en
de
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
96
90
95
92
1
1
1
1
1
1
1
1
95
94
94
94 8 x1
5.0
2.0
4.0
2.5
3.0
3.5
2.5
3.0
1.5
2.0
1.5
2.5
3.3
2.3
4.2
2.5
b
b
0
3 x1
8x3
y b0 b1 x1 b2 x2
Entonces primero resolvemos las matrices para encontrar los parmetros:
( X X ) 1 X y
5,9989
-1,0389 -1,0353
-1,0389
0,2239 0,1313
-1,0353
0,1313
0,2491
1
( X X )
750 83.2301 b0
2401 2.2902 b
1
1856
X y 1.3010 b2
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
Anuncios en TV (en
miles de dlares)
Anuncios en peridicos
(en miles de dlares)
B
83.230
Error tp.
1.574
2.290
.304
1.301
.321
Coeficientes
es tandarizad
os
Beta
t
52.882
Sig.
.000
1.153
7.532
.001
1.509
3.072
.621
4.057
.010
.477
2.125
Para b1: Cuando los gastos de anunciar en televisin varan una unidad y
los gastos de anunciar en peridicos se mantienen constantes, los ingresos
brutos semanales se incrementarn en 2.2902 miles de dlares.
Para b2: Cuando los gastos de anunciar en televisin se mantienen
constantes y los gastos de anunciar en peridicos varan una unidad, los
ingresos brutos semanales se incrementarn en 1.3010 miles de dlares.
b0 y b1 X 1 y b2 X 2 y
n 3
S y . X1 X 2 0.64
o Interpretacin: La distancia promedio de los valores observados alrededor
de la ecuacin de regresin es de 0.64. Es decir la dispersin de los valores
observados es 0.64.
Hallando el Coeficiente de Determinacin
Resumen del modelo
Modelo
1
R
R cuadrado
a
.959
.919
R cuadrado
corregida
.887
Error tp. de la
estimacin
.64259
r 0.959
r 2 0.919
2. Una desea estimar los gastos en alimentacin de una familia (Y) en base a
la informacin que proporcionan las variables regresoras X1 =ingresos
mensuales y X2 =nmero de miembros de la familia. Para ello se recoge
una muestra aleatoria simple de 15 familias cuyos resultados son los de la
tabla adjunta (El gasto e ingreso est dado en cientos de miles de pesetas)
GASTO
043
031
032
046
125
044
052
029
129
035
035
078
043
INGRESO
21
11
09
16
62
23
18
10
89
24
12
47
35
TAMAO
3
4
5
4
4
3
6
5
3
2
4
3
2
047
038
29
14
Solucin
n=15,
x 1 i=42
x2 i
3
4
'
'
'
041
057
037
139
035
033
077
051
050
036