You are on page 1of 18

Regression Analysis

r 0.910 n 15
r 0.954 k 1
Std. Error 3.135 Dep. Var. Prueba 2 (y)
ANOVA table
Source SS df MS F p-value
Regression 1,291.5820 1 1,291.5820 131.43 3.61E-08
Residual 127.7513 13 9.8270
Total 1,419.3333 14
Regression output confidence interval
variables coefficients std. error t (df=13) p-value 95% lower 95% upper
Intercept -11.6653 5.2957 -2.203 .0463 -23.1060 -0.2246
Prueba1(X) 0.7550 0.0659 11.464 3.61E-08 0.6127 0.8973
Regression Analysis
r 0.910 n 15
r 0.954 k 1
Std. Error 3.135 Dep. Var. Prueba 2 (y)
ANOVA table
Source SS df MS F p-value
Regression 1,291.5820 1 1,291.5820 131.43 3.61E-08
Residual 127.7513 13 9.8270
Total 1,419.3333 14
Regression output confidence interval
variables coefficients std. error t (df=13) p-value 95% lower 95% upper
Intercept -11.6653 5.2957 -2.203 .0463 -23.1060 -0.2246
Prueba1(X) 0.7550 0.0659 11.464 3.61E-08 0.6127 0.8973
Regression Analysis
r 0.910 n 15
r 0.954 k 1
Std. Error 3.135 Dep. Var. Prueba 2 (y)
ANOVA table
Source SS df MS F p-value
Regression 1,291.5820 1 1,291.5820 131.43 3.61E-08
Residual 127.7513 13 9.8270
Total 1,419.3333 14
Regression output confidence interval
variables coefficients std. error t (df=13) p-value 95% lower 95% upper
Intercept -11.6653 5.2957 -2.203 .0463 -23.1060 -0.2246
Prueba1(X) 0.7550 0.0659 11.464 3.61E-08 0.6127 0.8973
Predicted values for: Prueba 2 (y)
95% Confidence Interval 95% Prediction Interval
Prueba1(X) Predicted lower upper lower upper Leverage
85 52.511 50.593 54.429 45.472 59.550 0.080
Regression Analysis
r 0.910 n 15
r 0.954 k 1
Std. Error 3.135 Dep. Var. Prueba 2 (y)
ANOVA table
Source SS df MS F p-value
Regression 1,291.5820 1 1,291.5820 131.43 3.61E-08
Residual 127.7513 13 9.8270
Total 1,419.3333 14
Regression output confidence interval
variables coefficients std. error t (df=13) p-value 95% lower 95% upper
Intercept -11.6653 5.2957 -2.203 .0463 -23.1060 -0.2246
Prueba1(X) 0.7550 0.0659 11.464 3.61E-08 0.6127 0.8973
Predicted values for: Prueba 2 (y)
95% Confidence Interval 95% Prediction Interval
Prueba1(X) Predicted lower upper lower upper Leverage
85 52.511 50.593 54.429 45.472 59.550 0.080
Solicitante Prueba1(X) Prueba 2 (y)
1 75 38
2 89 56
3 60 35
4 71 45
5 92 59
6 105 70
7 55 31
8 87 52
9 73 48
10 77 41
11 84 51
12 91 58
13 75 45
14 82 49
15 76 47
c. Use la recta de regresin para predecir la puntuacin en la segunda prueba para un solicitante que obtuvo 85 puntos en la prueba 1.
Entrevistas de prueba De dos tcnicas existentes para evaluacin de personal, la primera requiere una entrevista de prueba de dos horas mientras
que la segunda se puede completar en menos de una hora. Las puntuaciones para cada una de las 15 personas que tomaron ambas pruebas se dan en
la tabla siguiente.
a. Construya una grfica de dispersin para los datos. Le parece razonable la suposicin de linealidad?
b. Encuentre la recta de mnimos cuadrados para los datos.
Si observamos la posicin de los puntos de este diagrama, se evidencia que hay una
dependencia lineal entre las puntuaciones de la prueba1(X) y la prueba 2(y), pues a medida
que aumenta la puntuacin en la prueba 1 tambien aumenta la puntuacin en la prueba 2.
y = 0.755x
R = 0.91
0
10
20
30
40
50
60
70
80
0 20 40 60 80
P
r
u
e
b
a

2
(
Y
)

Prueba1 (X)
Diagrama de Dispersin entre las puntuaciones de las Prueba1
Prueba 2.
Solicitante Prueba1(X) Prueba 2 (y) X*Y
1 75 38 2850
2 89 56 4984
3 60 35 2100
4 71 45 3195
5 92 59 5428
6 105 70 7350
7 55 31 1705
8 87 52 4524
9 73 48 3504
10 77 41 3157
11 84 51 4284
12 91 58 5278
13 75 45 3375
14 82 49 4018
15 76 47 3572
Total 1192 725 59324
Datos
Sum X = 1192 Sum Y =
n = 15 n =
Prom X = 79.46666667 Prom Y =
Sum X^2= 96990 Sum Y^2=
Covarianza (Sxy) = 1710.66667
Covarianza entre X e Y
Este valor indica una dependencia positiva directa, debido a que la covarianza nos da tambin el
signo de la relacin.
Coeficiente de Correlacin
Si observamos la posicin de los puntos de este diagrama, se evidencia que hay una
dependencia lineal entre las puntuaciones de la prueba1(X) y la prueba 2(y), pues a medida
que aumenta la puntuacin en la prueba 1 tambien aumenta la puntuacin en la prueba 2.
Prueba 1 (X) Prueba 2 (Y)
Covarianza (Sxy)= 1710.66667
Varianza X = Sxx= 2265.73333 Des. Est. X = Sx= 47.5997199
Varianza Y = Syy= 1419.33333 Des. Est.Y = Sy= 37.6740406
0.953935025
Ecuacin De Regresin
Pendiente = b 0.75501677
Intersecto = a -11.6653328
El coeficiente de interseccin estimado , a=-11.665333, represental la puntuacin
promedio de la Prueba1 cuando la puntuacin es 0 en la prueba 2.
El coeficiente de regresin estimado, b= 0.7550, indica que la puntuacin
promedio en la prueba 2 aumenta en 0.7550 cuando se incrementa en un punto la
prueba 1.
Coeficiente de correlacin de Pearson = r
Existe una alta correlacin positiva entre las puntuaciones de las pruebas 1 y 2.
La recta de mnimos cuadrados
X Y 75501677 . 0 665333 . 11


3.134808415
1.- Formulacin de hiptesis
Hiptesis Nula (H
0
): = 0
Hiptesis Alternativa (H
1
): > 0
2.- Nivel de significancia = 0.05
3.- Estadstico de Prueba (Fc)=
4.- Regin Crtica (Ft)
=DISTR.F.INV(,1,n-2)
=DISTR.F.INV(0.05,1,13)
4.667192732
4.667192
5.- Valor del estadstico
Desviacin estndar de la Regresin
Desviacin Est. De la Regresin = Sy.x=
La desviacin estndar de la regresin Sy.x es una medida de dispersin de los
datos alrededor de la lnea de regresin.
Prueba de Hiptesis
) 2 , 1 (
2
1

n c
F
MSE
MSR
n
SCE
SCR
F
Fuente
grados de
libertad
Suma de
cuadrados
Promedio de
cuadrados
Valor de F
Regresin 1 1291.5820 1291.5820 131.431657
Error 13 127.7513 9.8270
Total 14 1419.3333
Suma de Cuadrados
Suma de Cuadrados de la
Regresin (SSR)= 1291.58202
Suma de cuadrados
del Error (SSE)= 127.751309
Covarianza (X,Y)= S
xy
1710.66667 Varianza Y = S
yy
1419.33333
Varianza X = S
xx
2265.73333
Promedio de Cuadradros
Promedio de cuadrados de la Regresin Promedio de cuadrados del Error
Promedio de cuadrados de
la regresin (MSR)= 1291.58202
Promedio de
cuadrados del error
(MSE)= 9.8270238
Suma de Cuadrados de la
Regresin (SSR)= 1291.58202
Suma de cuadrados
del Error (SSE)= 127.751309
Suma de Cuadrados de la Regresin Suma de Cuadrados del Error

XX
XY
S
S
SSR
2


SSR S
S
S
S SSE
yy
XX
XY
yy

2
SSR
SSR
MSR
1
2

n
SSE
MSE
Grados de libertad de la
Regresin (1)= 1
Grados de libertad
del error (n-2)= 13
Valor de F
Fc= 131.431657
6.- Decisin
Fc = 131.43 pertenece a la Regin Crtica
Por lo tanto se Rechaza H
0
.
7.- Conclusin
Valor p
=DISTR.F.CD(X,grados de libertad1,grados de libertadad2)
=DISTR.F.CD(X,1,n-2)
=DISTR.F.CD(131.431657,1,13)
3.60668E-08
Coeficiente de Determinacin
r^2= 0.90999203
(1-r^2) 0.09000797
Intersecto = a -11.6653328
Pendiente = b 0.75501677
Indica que el 0.09% de la variacin de la prueba 2 no es explicada por la
regresin.
c. Use la recta de regresin para predecir la puntuacin en la segunda prueba
para un solicitante que obtuvo 85 puntos en la prueba 1.
A un 95% de confianza se estima que existe una relacin lineal entre las
puntuaciones de las Pruebas 1 y 2.
Indica que el 90.99% de la variacin de la prueba 2 es explicada por la regresin.
MSE
MSR
F
c

X Y 75501677 . 0 665333 . 11


Prueba 1 = 85
Y estimado=
52.5110928
Megastat
Regression Analysis
r 0.910 n 15
r 0.954 k 1
Std. Error 3.135 Dep. Var. Prueba 2 (y)
ANOVA table
Source SS df MS F
Regression 1,291.5820 1 1,291.5820 131.43
Residual 127.7513 13 9.8270
Total 1,419.3333 14
Regression output confidence interval
variables coefficients std. error t (df=13) p-value
Intercept -11.6653 5.2957 -2.203 .0463
Prueba1(X) 0.7550 0.0659 11.464 3.61E-08
Predicted values for: Prueba 2 (y)
95% Confidence Interval 95% Prediction Interval
Prueba1(X) Predicted lower upper lower
85 52.511 50.593 54.429 45.472
) 85 ( 75501677 . 0 665333 . 11

Y
c. Use la recta de regresin para predecir la puntuacin en la segunda prueba para un solicitante que obtuvo 85 puntos en la prueba 1.
Entrevistas de prueba De dos tcnicas existentes para evaluacin de personal, la primera requiere una entrevista de prueba de dos horas mientras
que la segunda se puede completar en menos de una hora. Las puntuaciones para cada una de las 15 personas que tomaron ambas pruebas se dan en
la tabla siguiente.
a. Construya una grfica de dispersin para los datos. Le parece razonable la suposicin de linealidad?
b. Encuentre la recta de mnimos cuadrados para los datos.
Si observamos la posicin de los puntos de este diagrama, se evidencia que hay una
dependencia lineal entre las puntuaciones de la prueba1(X) y la prueba 2(y), pues a medida
que aumenta la puntuacin en la prueba 1 tambien aumenta la puntuacin en la prueba 2.
y = 0.755x - 11.665
R = 0.91
80 100 120
Diagrama de Dispersin entre las puntuaciones de las Prueba1 -
X^2 Y^2 (Xi-X) (Yi-Y) (Xi-X)*(Yi-Y)
5625 1444 -4.466666667 -10.3333333 46.1555556
7921 3136 9.533333333 7.66666667 73.0888889
3600 1225 -19.46666667 -13.3333333 259.555556
5041 2025 -8.466666667 -3.33333333 28.2222222
8464 3481 12.53333333 10.6666667 133.688889
11025 4900 25.53333333 21.6666667 553.222222
3025 961 -24.46666667 -17.3333333 424.088889
7569 2704 7.533333333 3.66666667 27.6222222
5329 2304 -6.466666667 -0.33333333 2.15555556
5929 1681 -2.466666667 -7.33333333 18.0888889
7056 2601 4.533333333 2.66666667 12.0888889
8281 3364 11.53333333 9.66666667 111.488889
5625 2025 -4.466666667 -3.33333333 14.8888889
6724 2401 2.533333333 0.66666667 1.68888889
5776 2209 -3.466666667 -1.33333333 4.62222222
96990 36461 1710.66667
725 Sum X*Y= 59324
15
Sum (Xi-X)*(Yi-Y) 1710.66667
48.3333333
36461
Si observamos la posicin de los puntos de este diagrama, se evidencia que hay una
dependencia lineal entre las puntuaciones de la prueba1(X) y la prueba 2(y), pues a medida
que aumenta la puntuacin en la prueba 1 tambien aumenta la puntuacin en la prueba 2.
Prueba 2 (Y)
Suma de Cuadrados
del Total (SST)= 1419.33333
Suma de Cuadrados del Total

SSR S
S
S
S SSE
yy
XX
XY
yy

2
yy
S SST
p-value
3.61E-08
confidence interval
95% lower 95% upper
-23.1060 -0.2246
0.6127 0.8973
95% Prediction Interval
upper Leverage
59.550 0.080
X 56 42 72 36 63 47 55 49 38 42
Y 147 125 160 118 149 128 150 145 115 140
X Y
56 147
42 125
72 160
36 118
63 149
47 128
55 150
49 145
38 115
42 140
68 152
60 155
En un centro de salud se han tomado los datos de las edades y la Presin Sistlica de 12 pacientes, bajo
la sospecha de que la edad y la presin estaban relacionadas de alguna manera. Los datos que se
tomaron son los siguientes
a)Obtenga el diagrama de dispersin y comente los resultados
b)Calcule la ecuacin de regresin estimada e interprete el valor de cada uno de los coeficientes de la
recta anterior
c)Calcule e interprete el valor del coeficiente de determinacin
d) Puede UD. Afirmar que la pendiente e la recta es significativamente distinta de cero, con = 0.05?
68 60
152 155
En un centro de salud se han tomado los datos de las edades y la Presin Sistlica de 12 pacientes, bajo
la sospecha de que la edad y la presin estaban relacionadas de alguna manera. Los datos que se
tomaron son los siguientes
a)Obtenga el diagrama de dispersin y comente los resultados
b)Calcule la ecuacin de regresin estimada e interprete el valor de cada uno de los coeficientes de la
recta anterior
c)Calcule e interprete el valor del coeficiente de determinacin
d) Puede UD. Afirmar que la pendiente e la recta es significativamente distinta de cero, con = 0.05?

You might also like