You are on page 1of 21

1.Cuestionario de regresin simple.

1. Qu es el anlisis de regresin?

2. Cmo se hace un anlisis de regresin?

3. Cuntos tipos de anlisis de regresin existe?

4. Qu es el coeficiente de correlacin y como se interpreta?


Es el grado de dependencia que tiene una variable con respecto a la
otra, puede tomar valore de -1 a 1, indicando un valor cercano a -1 una
correlacin inversa, es decir, conforme el valor de una variable aumenta
el de la otra disminuye, valores cercanos a 1 indica correccin directa, es
decir, las variables aumentan al mismo tiempo, y si toma valor cercano
a cero indica que no existe una relacin o dependencia lineal entre las
variables, no excluyendo otro tipo de relacin.
5. Qu es el coeficiente de determinacin y como se interpreta?
Es el porcentaje de los datos de la variable dependiente que puede
explicar la variable independiente utilizando la ecuacin de regresin
lineal, de ah que puede tomar valores de 0 a 1,
6. Es ms importante el coeficiente de correlacin que el de
determinacin? Por qu?
Matemticamente el coeficiente de determinacin es el cuadrado del
coeficiente de correlacin, bsicamente es lo mismo, se tiene que
calcular y entender el significado de uno para entender y calcular al
otro.
7. Por qu es necesario realizar la prueba de hiptesis para el
anlisis de regresin?
Para determinar que coeficiente de la ecuacin de regresin es cero, es
decir, cual variable independiente aporta la menor variabilidad de la
variable independiente que estadsticamente sea despreciable y se
pueda omitir en la ecuacin y reformular otra sin dicha variable.

8. Por qu es necesario calcular un intervalo de confianza para el


anlisis de regresin?
Es una medida de control de calidad, dado que se estima la ecuacin de
recta, se define estadsticamente las tolerancias admitidas para saber si
algn dato en especfico puede ser descrito por dicha ecuacin.
9. Qu aspectos involucra el ANOVA en el anlisis de regresin?
Comprobar que al menos uno de los coeficientes de la ecuacin es
diferente de cero.
10.
Por qu es necesario realizar un ANOVA en el anlisis de
regresin?
Para comprobar si al menos uno de los coeficientes de la ecuacin de
regresin lineal es diferente de cero.

2.Problema de regresin lineal 1.


2.1.

Planteamiento

Uno de los problemas ms desafiantes para el control de contaminacin


del agua lo presenta la industria del curtido de pieles. Los desechos de
esta industria son qumicamente complejos. Se caracteriza por valores
elevados en la demanda de oxigeno bioqumico, los slidos voltiles y
otras mediciones de contaminacin. Consideremos los datos de la
siguiente tabla, los cuales se obtuvieron de 33 muestras de desperdicios
que se tratan qumicamente en el estudio "Chemical Treatent on Speant
Vegetable Tan Liquior" realizado por el Virginia Polytechnic Institute and
State University en 1970. Se registraron las lecturas de la reduccin
porcentual de slidos y la reduccin porcentual de demanda de oxigeno
bioqumico para las 33 muestras.
Se utilizara el Software de Microsoft Excel para determinar la ecuacin
de regresin lineal que exista entre la reduccin porcentual de slidos,
como variable independiente x, y reduccin porcentual de demanda
de oxigeno bioqumico, como variable dependiente y.

2.2.

Desarrollo

1. Como primer paso se elabora el grafico de dispersin


correspondiente a cada punto representado por las respectivas
muestras de x y y.

Grafico de dispersin

Se puede observar claramente la relacin que tiene ambas variables, de estas se puede decir que
mientras se reduce el porcentaje de solidos el porcentaje de oxigeno bioqumico lo har tambin, es
decir, tiene una correlacin positiva.
2. Se procede a aplicar la opcin de Regresin, del Complemento Anlisis de Datos de Excel.
Estadsticas de la regresin
Coeficiente de correlacin
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0.955479
357
0.912940
801
0.910132
44
3.229537
63
33

El coeficiente de correlacin indica una relacin directa entre ambas variables, si una aumenta de valor la
otra lo hora tambin.
El coeficiente de determinacin indica que con la actual ecuacin, el 91.29 % de la variacin de la
reduccin de la demanda de oxigeno es explica con la reduccin de residuos slidos utilizando la ecuacin
obtenida.
El error tpico nos indica la variacin promedio entre los valores obtenidos de la ecuacin y los reales, que
es de 3.22 %.

3. Se escribe la ecuacin de recta que describe el comportamiento de los datos.


Coeficientes

Intercepcin

Interpretacin

3.829633198 Valor donde intercepta la recta cuando el porcentaje de

Reduccin de slidos, x(%)

residuos slidos es cero.


Ritmo de cambio del porcentaje de demanda de
0.903643211 oxigeno cuando se varia un 1 % los residuos slidos.

Ecuacin de la recta.y = 0.9036x + 3.8296

Grafica de la ecuacin de la recta

2.3.

Anlisis de varianza
Suma de
cuadrados

Grados de libertad
Regresi
n
Residuos
Total

1
31
32

3390.55148
323.327312
3713.87879

Promedio de los
cuadrados

F
325.079
3390.55148
54
10.4299133

Se establece la hiptesis de trabajo para el ANOVA, utilizando una

P
5.4754E18

= 5%:

Ho: B1 = 0
H1: B1 0
Utilizando el resultado de F calculada < F = 5, del ANOVA, se puede responder que se rechaza la hiptesis
nula, y se concluye, que el coeficiente de la variable de entrada es diferente de cero, y por lo tanto es un
buen estimador de la variable de salida, utilizando la ecuacin de la recta obtenida.

3.Problema de regresin lineal 2.


3.1.

Planteamiento

Una compaa administra a sus vendedores una prueba en


adiestramiento de ventas antes de permitir salir a trabajar. La
administracin est interesada en determinar la relacin entre las
calificaciones de la prueba y las ventas hechas por los vendedores al
final de un ao de trabajo. Los siguientes datos se recolectaron de 10
agentes de ventas que han estado en el campo durante un ao. (Rubin,
1996).

Num. De vendedor

Calif. De la
prueba (T)

Num. De
unidades
vendidas (S)

1
2
3
4
5
6
7
8
9
10

2.6
3.7
2.4
4.5
2.6
5
2.8
3
4
3.4

95
140
85
180
100
195
115
136
175
150

Se utilizara el Software de Microsoft Excel para determinar la ecuacin


de regresin lineal que exista entre las calificaciones de la prueba, como
variable independiente x, y las ventas hechas por los vendedores al
final de un ao de trabajo, como variable dependiente y.

3.2.

Desarrollo

Como primer paso se elabora el grafico de dispersin correspondiente a


cada punto representado por las respectivas muestras de x y y.

Grafico de dispersin

Se puede observar claramente la relacin que tiene ambas variables, de estas se puede decir que
mientras se obtiene una mejor calificacin se realizan un mayor nmero de ventas, es decir, tiene una
correlacin positiva.
4. Se procede a aplicar la opcin de Regresin, del Complemento Anlisis de Datos de Excel.
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0.96278
4254
0.92695
3519
0.91782
2709
10.9605
2714
10

El coeficiente de correlacin indica una relacin directa entre ambas variables, si una aumenta de valor la
otra lo hora tambin.
El coeficiente de determinacin indica que con la actual ecuacin, el 92.69 % de la variacin de las ventas
se explica con las calificaciones obtenidas en la prueba utilizando el modelo matemtico encontrado.
El error tpico nos indica la variacin promedio entre los valores obtenidos de la ecuacin y los reales, que
es de 10.96.

5. Se escribe la ecuacin de recta que describe el comportamiento de los datos.


Intercepcin

Coeficientes
-4.615099715

Interpretacin
Punto donde se intersecta la recta cuando se obtuvo una
calificacin de cero, no tiene un significado relevante puesto

Calif. De la prueba (T)

Ecuacin de
-4.615099715

la

41.68091168

que no se pueden tener ventas negativas. .


Nmero de ventas realizadas por cada punto obtenido en la
prueba.

recta.y

41.68091168x

Grafica de la ecuacin de la recta

f(x) = 41.68x - 4.62


R = 0.93

3.3.

Anlisis de varianza

ANLISIS DE VARIANZA
Grados de
libertad

Suma de
cuadrados

Promedio de los
cuadrados

Regresin

12195.83476

12195.83476

Residuos
Total

8
9

961.0652422
13156.9

120.1331553

Se establece la hiptesis de trabajo para el ANOVA, utilizando una

Valor crtico
de F
101.51930 8.02336E77
06
F

= 5%::

Ho: B1 = 0
H1: B1 0
Utilizando el resultado de F calculada < F = 5, del ANOVA, se puede responder que se rechaza la hiptesis
nula, y se concluye, que el coeficiente de la variable de entrada es diferente de cero, y por lo tanto es un
buen estimador de la variable de salida, utilizando la ecuacin de la recta obtenida.

4.Problema de regresin mltiple propuesto.


4.1.

Planteamiento

Un Ingeniero fue contratado como gerente en entrenamiento por una


importante empresa financiera. Como primer proyecto, se le pidi que
estudiara la utilidad bruta en la industria qumica. Qu factores afectan
las utilidades en esa industria? El ingeniero selecciona al azar una
muestra de 16 compaas y obtiene datos respecto a la cantidad de
empleados, el nmero de dividendos consecutivos pagados de acciones
comunes, el valor total de inventario al inicio del presente ao y la
ganancia bruta de cada empresa. Sus descubrimientos son:

Compa
a

Ganancia
Bruta mdd
Y

Nmero de
empleados
X1

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

2800
1300
1230
1600
4500
5700
3150
640
3400
6700
3700
6440
1280
4160
3870
9800

140
65
130
115
390
670
205
40
480
810
120
590
440
280
650
150

Dividendos
consecutiv
os
X2
12
21
42
80
120
64
43
14
88
98
44
110
38
24
60
24

4.2.

Desarrollo

a) Determine la ecuacin de regresin e interprtela.


Se

encuentra

los

coeficientes

utilizando

la

formula

matricial

Se procede a obtener cada una de las matrices:


VECTOR
RESULTADO
1
1Y
1
14
65
130
2800
0

12
18
00

16
527
5
882
584
89

MATRIZ
TRANSPUESTA

MATRIZ DE VALORES

1
1
1
1
X3 1
115
67
40
12180
59
2
44
65
15
0
0
0
0
8
0
0
0
0
0
21
42
80
43
88 21 98
44320
11
2
1300
1120 64
65 14
38
60
24
0
4
1230
1
130
42
820
320
820
76
360
84
500
870
7500
98
65
91
8
12
13
00
8
9
1600
10
115
80 75 00 7630 12
00
00
00
0
4500
1
390
120
360
MATRIZ TRANSPUESTA POR MATRIZ DE VALORES
0
5275
882 1
5700
670
6458489 840
266457 374600
27999230 0
3150
1
205
43
500
5
374600
66870
4354174 8
640
1
40
14
870
279992 435417
398112165
3400
1
480
88
750
30
4
0
INVERSA DE MAT TRANS POR MAT VLORES
6700
1
810
98
987
0.240563096
5
2.81181E-06
3700
1
120 0.000159
44 0.002460
650
899
319
0
-0.000159899
2.31608E6440
1
590
110
913
06
6.21402E
-7.14351E-08
0
-06
1280
1
440
38
120
-0.002460319
0.000104
0
997
-3.49866E-07
4160
1
280 6.21402E24
890
06
3870 2.81181E-06
1
650
120
- 60
0
7.14351E- 3.49866E
1.09493E-08
9800
1
150
24
130
08
-07
0

VECTOR
RESULTA
DO *
MAT
TRANSP
UESTA

B01
1390

1
X1
205
140

X2 1
480 12 81

60270
240818
50
373265
0
284130
300

PARAMETROS RESULTADO
2263.
B1
481
B2
2.647
B3
5.419
B4
0.254

Ecuacin.y = 2263.481 + 2.647*X1 5.419*X2 + 0.254*X3

b) Si el Ingeniero emplea 220 personas, ha pagado 64 dividendos


consecutivos de acciones y tiene un inventario en $1500 (dls) al
principio de ao. Cul es la ganancia bruta calculada?
Utilizando la ecuacin obtenida se puede estimar una ganancia de
2,880.36 dlares.
c) Realice una prueba global de hiptesis para determinar si alguno
de los coeficientes de regresin neta es diferente de cero
ANLISIS DE
VARIANZA
Grados de
libertad
Regresin

Residuos

12

Total

15

Suma de
cuadrados
25148926.
01
66071017.
74
91219943.
75

Promedio
de los
cuadrados
8382975.33
6
5505918.14
5

Valor
crtico de
F

1.52

0.25

Se establece la hiptesis de trabajo para el ANOVA, utilizando una


5%:

Ho: B1, B2, B3 = 0


H1: Al menos un coeficiente B1, B2, B3 0

Utilizando el resultado de F calculada > F = 5, del ANOVA, se puede


responder que se acepta la hiptesis nula, y se concluye, que los
coeficientes de las respectivas variables de entrada son cero, y por lo
tanto no son buenos estimadores de la variable de salida, utilizando la
ecuacin obtenida, no excluyendo una relacin de otro tipo.

Grafica de residuos

d)
Determine los residuos y grafquelos.

Observacin

1
2
3
4
5
6
7
8
9
10

Pronstico
Ganancia
Bruta (mdd)
Y
3026.69130
9
2403.08827
9
2588.46565
5
2153.6641
3560.82406
3
5825.89118
6
3846.45893
3
2514.70458
7
4964.11135
8
6387.24572

Residuos

-226.6913093
-1103.088279
-1358.465655
-553.6640997
939.1759371
-125.8911863
-696.4589332
-1874.704587
-1564.111358
312.7542803

11
12
13
14
15
16

3995.44856
5550.50420
4
3527.24988
9
3100.81392
4
3963.84490
1
2860.99333
2

-295.4485605
889.4957962
-2247.249889
1059.186076
-93.84490123
6939.006668

Se observa un patrn en los puntos, dado que concluyo que la ecuacin


de regresin no presenta un buen ajuste, se observa que existe otro tipo
de relacin.
e) Obtenga la Tabla ANOVA y realice sus conclusiones.
Es la misma respuesta del inciso c), el ANOVA se utiliza para responder
la hiptesis global para determinar si alguno de los coeficientes de
regresin neta es diferente de cero.

5.Bibliografa
Ronald E. Walpole, R. H. (2003). Probabilidad y estadistica (cuarta edicion).
Mexico: McGRAW-HILL.
Rubin, R. I. (1996). Estadistica para adminsitradores. Cd. Mexico: PEARSON.

You might also like