Professional Documents
Culture Documents
DE MONTERREY
Tarea B
oma de decisiones”
Matricula: A01684020
a: 3 de Octubre de 2017
Capítulo 11
Problema 1
Cierta empresa piensa que el tipo de campaña influye en la zona del país, ya que la empresa indica
otras. Para probar lo anterior se obtuvo la preferencia según la zona, lo anterior se muestra a contin
Tipo de campañas
Zona del país
Tipo A Tipo B Tipo C
Norte 158 156 146
Sur 147 167 166
Este 149 165 146
Oeste 160 146 154
Centro 167 148 165
Usando un nivel de significancia del 2.5%, se le pide que sustente sus respuestas en forma estadísti
contener lo siguiente:
a. Hipotesis
H0: No parece haber una relación entre el Tipo de campaña seleccionado y la zona
H1: Hay una relación entre el tipo de campaña seleccionado y la zona del país.
a (alfa) = 2.50%
Filas : 5
Columnas: 3
Para la prueba de significación ji cuadrada donde los rasgos se clasifican en una tabla de con
libertad se obtienen por medio de:
Tipo de campañas
Zona del país Tipo A Tipo B
Fo Fe Fo Fe
Norte 158 153.5299145 156 153.7264957
Sur 147 160.2051282 167 160.4102564
Este 149 153.5299145 165 153.7264957
Oeste 160 153.5299145 146 153.7264957
Centro 167 160.2051282 148 160.4102564
Total 781 781 782 782
Calculo de ji cuadrada es :
x2= 5.4708659694
c. Valor crítico
17.5345461395 =INV.CHICUAD.CD(0.025,8)
gl = 8
Pobabilidad .
Región de rechazo
0.025
No se rechaza
Ho 2
Escala de X
17.535
Valor crítico
d. Decisión que se tomo
5.470865969 ≥ 17.53454614
0
El valor calculado de ji cuadrada de aprox. 5.471 y es menor que el valor crítico de la tabla, por lo tanto no se rechaz
campaña seleccionado y la zona del país.
a que la empresa indica que unas son más agresivas que
rior se muestra a continuación:
Tipo de campañas
Zona del país Total
Tipo A Tipo B Tipo C
Norte 158 156 146 460
Sur 147 167 166 480
Este 149 165 146 460
Oeste 160 146 154 460
Centro 167 148 165 480
Total 781 782 777 2340
GMAT Study
1-day program
10-week course
a. Las Hipotesis
H0: µ1 = µ2 = µ3
H1: Al menos una µi es ≠ a los demás
K=3 nt = 18 a (alfa) =
Distribución F
Grados de libertad en el numerador = k - 1 =
Grados de libertad en el denominador = n - k =
Business Engineering
-15 25
65 -55
-55 45
25 105
45 85
85 65
Business Engineering
225 625
4225 3025
3025 2025
625 11025
2025 7225
7225 4225
Total 17350 28150
SSE
Business Engineering
-40 -20
40 -100
-80 0
0 60
20 40
60 20
Business Engineering
1600 400
1600 10000
6400 0
0 3600
400 1600
3600 400
Total 13600 16000
Por último se determina SST, la suma de los cuadrados debida a los tratamientos con resta
Tratamientos 45300
Error 37150
Total 82450.00
Valor-p : 0.002530819580565950000
Como el valor-p es inferior a alpha se rechaza Ho (Esto implicaría que no existe una relación de sign
Como el valor estadistico de prueba F es mayor al valor crítico de F por lo tanto se rechaza H0
1%
3-1 = 2
18 - 3 = 15
decisión es : 3.68
lado de F es mayor que 3.68.
Arts and
Sciences
-35
-115
-95
-35
-35
-105
Arts and
Sciences Total
1225
13225
9025
1225
1225
11025
36950 82450 Valor de SS
Arts and
Sciences
35
-45
-25
35
35
-35
Arts and
Sciences Total
1225
2025
625
1225
1225
1225
7550 37150 Valor de SSE
37150.00
VA:
Grados de Média
F
libertad cuadrática
2 22650.00 9.15
15 2476.67
17
no existe una relación de significancia entre la variable dependiente y las dos variables independientes)
chaza. La conclusión es que no todas las medias poblacionales son iguales. Al menos una de las
a de la carrera que estudian.
Anova: Single Factor
er si el puntaje
SUMMARY
Groups Count
Arts and
Engineering Total
Sciences Business 6
540 480 Engineering 6
460 400 Arts and Sciences 6
560 420
620 480
600 480 ANOVA
580 410 Source of Variation SS
3360 2670 9270 Between Groups 45300
6 6 18 Within Groups 37150
560 445 515
Total 82450
independientes)
menos una de las
Sum Average Variance
df MS F P-value F crit
2 22650 9.145356662 0.00253082 3.682320344
15 2476.666667
17
Capítulo 13 y 14
Problema 3
La base de datos siguiente, muestra un estudio realizado durante 10 años por la Asociación Estadounidense de Cardi
guardan la edad (Age), la presión sanguínea (Pressure) y el hábito de fumar sobre el riesgo de sufrir un infarto; el rie
(multiplicada por 100) de que el paciente sufra un infarto en los próximos 10 años. Para la variable fumador (Smoker
valores 1 si el individuo es fumador y 0 si no lo es, es decir si la variable Fumador tiene el valor de YES, se le asigna u
valor de 0; esto se muestra en la siguiente tabla:
Se piensa que el Riesgo (probabilidad de que la persona sufra un infarto) aumenta si la edad, la pre
necesita un nivel de confianza utilice el 95%.
Note que en la redacción no dice cuál es la variable X y cuál es la variable Y, pero la redacción dice q
la presión arterial y si es fumador”, lo anterior indica que la variable dependientes (Y) es el riesgo y
efecto en Y, estás son denominadas variables independientes (X) que sería la edad, o la presión arte
la tabla anterior, usando un nivel de significancia del 5%; se le pide que conteste lo siguiente:
a. Presente un diagrama de dispersión (Scatter en inglés), E indique el tipo de relación que se tiene
edad (X), ¿qué indica la gráfica?
Grafica de dispersión
60
50
20
10
0
50 55 60 65 70 75 80 85 90
Age
b. Realice una regresión simple por medio del Excel y muestre sus resultados relacionado a la vari
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.650239601
R Square 0.422811538
Adjusted R Square 0.390745512
Standard Error 11.59254546
Observations 20
ANOVA
df SS MS F
Regression 1 1771.982015709 1771.982015709 13.1856545808
Residual 18 2418.967984291 134.3871102384
Total 19 4190.95
c. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto
Yˆ= a + b1X1
Yˆ= -42.796465 + 1.00426876(69.45) = 26.950000382
d. Realice la prueba de hipótesis (por medio de la prueba t) para mostrar que, a mayor edad, mayor
H0: B1 = 0
H1: B1 <> 0
𝑡=(𝑏_1−0)/𝑆_(𝑏_1 ) = (1.00426876−0)/0.276566202=
3.631205
Con el nivel de significancia de 5% y las tablas B.2, la regla de decisión es rechazar H0 si el valor calc
t ≥ valor crítico
3.631205 ≥ 2.100922
1
Como el valor de "t" es mayor que el valor crítico, por lo tanto indica que a mayor edad hay mayor r
e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indique si us
lo que indican sobre el riesgo y la edad, para poder determinar si la variable edad, hace se incremen
e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indique si us
lo que indican sobre el riesgo y la edad, para poder determinar si la variable edad, hace se incremen
R cuadrada = 0.4228115381
Error estándar del estimado= 0.2765662025
f. Ahora realice una regresión múltiple y muestre sus resultados, usando todas las variables indepen
Fuma) y la variable Riesgo (Y). Note que la variable cualitativa también entraría en esta regresión ya
ficticia (con 1 y 0) puede ser usada en la regresión.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.934605168
R Square 0.87348682
Adjusted R Square 0.849765599
Standard Error 5.756574565
Observations 20
ANOVA
df SS MS F
Regression 3 3660.739588378 1220.246529459 36.8230122294
Residual 16 530.2104116223 33.1381507264
Total 19 4190.95
g. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto.
g. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto.
Yˆ= a + b1X1+b2X2+b3X3
Yˆ= -91.759498 + 1.07674106(69.45)+ 0.25181347(157.1) + 8.73987106(0.5)
Yˆ= 26.95
No existe multicolinealidad debido a que las correlaciones no son mayores a 0.70 o menores a -0.70
i. Realice las pruebas de hipótesis (prueba t) necesarias para indicar que variables deberían de est
deberían de estar en la ecuación.
H0: b1= 0 ; b2 = 0; b3 = 0
H1: b1 ≠ 0; b2 = 0; b3 ≠ 0
𝑡=(𝑏_1−0)/𝑆_(𝑏_1
Age ) = (1.07674106−0)/0.165963611=
6.4878141197
𝑡=(𝑏_2−0)/𝑆_(𝑏_2 ) = (0.25181347−0)/0.045225519=
Pressure 5.5679510234
𝑡=(𝑏_3−0)/𝑆_(𝑏_3 ) = (8.73987106−0)/3.000815432=
Smoker 2.9124987036
Con el nivel de significancia de 5% y las tablas B.2, la regla de decisión es rechazar H0 si el valor calc
j. Midiendo la calidad de ajuste de esta nueva regresión, ¿se explica de mejor manera el riesgo?
�_𝑎𝑑𝑗^2=1−(1−�^2 ) (𝑛−1)/(𝑛−𝑝−1)= 1−(1−0.87348682)((20−1)/(20−1−1))=
0.8497655988
El 84.97% indica la explicación del riesgo dependiendo de 3 variables (edad, presión y fumador).
k. Compare ambas regresiones por la calidad de ajuste (aquí solo podrá comparar la Rcuadrada ajus
dos sería la mejor regresión?
Comparando infromaciòn utilizando los datos muestreados de Rcuadrada ajustada y el error estànd
error de 15.22 es mejor utilizando mas variables para obtener un resultado más completo
stadounidense de Cardiología proporcionó datos sobre la relación que
sufrir un infarto; el riesgo (Risk) se interpreta como la probabilidad
iable fumador (Smoker), defina una variable ficticia que tome los
or de YES, se le asigna un 1 y si toma el valor de NO, se le asigna un
Significance F
0.0019098794
(grados de libertad)
Significance F
2.06403869E-07
70 o menores a -0.70
(grados de libertad)
manera el riesgo?
84.977%
sión y fumador).
Mean 69.45
Standard Error 2.1502447841
Median 68.5
Mode 59
Standard Deviation 9.6161870111
Sample Variance 92.4710526316
Kurtosis -1.4318301246
Skewness 0.0887364599
Range 30
Minimum 56
Maximum 86
Sum 1389
Count 20
Pressure
Mean 157.1
Standard Error 7.2963220728
Median 155
Mode 155
Standard Deviation 32.6301442809
Sample Variance 1064.7263157895
Kurtosis -0.9636008019
Skewness 0.0160262273
Range 111
Minimum 98
Maximum 209
Sum 3142
Count 20
Risk
Mean 26.95
Standard Error 3.3209660928
Median 26
Mode 15
Standard Devia 14.8518118689
Sample Varian 220.5763157895
Kurtosis -0.7275412035
Skewness 0.3409858374
Range 53
Minimum 3
Maximum 56
Sum 539
Count 20
Smoker
Mean 0.5
Standard Error 0.1147078669
Median 0.5
Mode 1
Standard Devia 0.512989176
Sample Varian 0.2631578947
Kurtosis -2.2352941176
Skewness 0
Range 1
Minimum 0
Maximum 1
Sum 10
Count 20