You are on page 1of 36

INSTITUTO TECNOLÓGICO DE ESTUDIOS SUP

DE MONTERREY

“Métodos cuantitativos para la toma de deci

Tarea B

Autor(a): Cesar Adrian Osorio Zuñiga Matricula: A0168


Correo(s): A01684020@itesm.mx ,
osorio_cesar10@hotmail.com

Monterrey, Nuevo León Fecha: 3 de Octubre de 20


TUDIOS SUPERIORES
EY

oma de decisiones”

Matricula: A01684020

a: 3 de Octubre de 2017
Capítulo 11
Problema 1
Cierta empresa piensa que el tipo de campaña influye en la zona del país, ya que la empresa indica
otras. Para probar lo anterior se obtuvo la preferencia según la zona, lo anterior se muestra a contin

Tipo de campañas
Zona del país
Tipo A Tipo B Tipo C
Norte 158 156 146
Sur 147 167 166
Este 149 165 146
Oeste 160 146 154
Centro 167 148 165

Usando un nivel de significancia del 2.5%, se le pide que sustente sus respuestas en forma estadísti
contener lo siguiente:

a. Hipotesis

H0: No parece haber una relación entre el Tipo de campaña seleccionado y la zona
H1: Hay una relación entre el tipo de campaña seleccionado y la zona del país.

a (alfa) = 2.50%
Filas : 5
Columnas: 3

Para la prueba de significación ji cuadrada donde los rasgos se clasifican en una tabla de con
libertad se obtienen por medio de:

gl = (número de filas - 1) (número de columnas - 1) = ( r - 1 ) ( c - 1 ) = ( 5 - 1 ) ( 3 - 1

b. El valor estadístico de prueba


𝐹�=((𝑇𝑜𝑡𝑎𝑙 𝑑� 𝑓𝑖𝑙𝑎𝑠)(𝑇𝑜𝑡𝑎𝑙 𝑑� 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠))/(𝐺𝑟𝑎𝑛 𝑇𝑜𝑡𝑎𝑙)

Tipo de campañas
Zona del país Tipo A Tipo B
Fo Fe Fo Fe
Norte 158 153.5299145 156 153.7264957
Sur 147 160.2051282 167 160.4102564
Este 149 153.5299145 165 153.7264957
Oeste 160 153.5299145 146 153.7264957
Centro 167 160.2051282 148 160.4102564
Total 781 781 782 782

Calculo de ji cuadrada es :

Tipo A Tipo B Tipo C


Norte 0.1301483439 0.033623493 0.297727733
Sur 1.0884508684 0.270710374 0.274576775
Este 0.1336555531 0.826740361 0.297727733
Oeste 0.2726635139 0.388343831 0.010334749
Centro 0.2881947864 0.960128533 0.197839323

x2= 5.4708659694

c. Valor crítico

17.5345461395 =INV.CHICUAD.CD(0.025,8)

gl = 8
Pobabilidad .

Región de rechazo
0.025
No se rechaza
Ho 2
Escala de X
17.535
Valor crítico
d. Decisión que se tomo

Para rechazar H0 ji ≥ Valor crítico

5.470865969 ≥ 17.53454614
0

Por lo tanto no se rechaza H0

e. Conclusión a la cual se llego

El valor calculado de ji cuadrada de aprox. 5.471 y es menor que el valor crítico de la tabla, por lo tanto no se rechaz
campaña seleccionado y la zona del país.
a que la empresa indica que unas son más agresivas que
rior se muestra a continuación:

Tipo de campañas
Zona del país Total
Tipo A Tipo B Tipo C
Norte 158 156 146 460
Sur 147 167 166 480
Este 149 165 146 460
Oeste 160 146 154 460
Centro 167 148 165 480
Total 781 782 777 2340

estas en forma estadística para lo cual deberá de

eleccionado y la zona del país.


na del país.

n en una tabla de contingencia, los grados de

c-1) = (5-1)(3-1) = 4*2 = 8


Total
Tipo C
Fo Fe Fo Fe
146 152.7435897 460 460
166 159.3846154 480 480
146 152.7435897 460 460
154 152.7435897 460 460
165 159.3846154 480 480
777 777 2340 2340
a, por lo tanto no se rechaza H0 y hay una relación entre el tipo de
Capítulo 12
Problema 2
La siguiente tabla muestra el puntaje que alumnos de diferentes ramas de las carreras que estudian
promedio es el mismo en las diferentes ramas de la carrera:

GMAT Study

horas dedicadas 3-hour review

1-day program

10-week course

Usando un nivel de significancia del 1%, se le pide lo siguiente:

a. Las Hipotesis

H0: µ1 = µ2 = µ3
H1: Al menos una µi es ≠ a los demás

K=3 nt = 18 a (alfa) =

b. El valor estadístico de prueba

Distribución F
Grados de libertad en el numerador = k - 1 =
Grados de libertad en el denominador = n - k =

Al checar la tabla del apéndice B4, se determina que la regla de decisión es :


por lo tanto, la regla de decisión es rechazar Ho si el valor calculado de F es mayor que 3.6
SS

Business Engineering

-15 25
65 -55
-55 45
25 105
45 85
85 65

Business Engineering

225 625
4225 3025
3025 2025
625 11025
2025 7225
7225 4225
Total 17350 28150

SSE

Business Engineering

-40 -20
40 -100
-80 0
0 60
20 40
60 20

Business Engineering

1600 400
1600 10000
6400 0
0 3600
400 1600
3600 400
Total 13600 16000

Por lo tanto el valor SSE es 93700. Es decir, ∑ ( X - X c ) =

Por último se determina SST, la suma de los cuadrados debida a los tratamientos con resta

SST = SS total - SSE

SST = 82450 - 37150 = 45300

Para determinar el valor calculado de F, se elabora la tabla ANOVA:

Fuente de variación Suma de Cuadrados

Tratamientos 45300
Error 37150
Total 82450.00

c. Valor crítico , d. Decisión que se tomó

Valor-p : 0.002530819580565950000

Para rechazar la hipotesis H0 Valor-p ≤ alfa


0.00253081958056595 ≤ 0.01
1

Como el valor-p es inferior a alpha se rechaza Ho (Esto implicaría que no existe una relación de sign

Al checar la tabla del apéndice B4, se determina que la regla de decisión es :


por lo tanto, la regla de decisión es rechazar Ho si el valor calculado de F es mayor que 3.68.

Para rechazar la hipotesis H0 F ≥ Valor crítico de F


9.15 ≥ 3.68
1

Como el valor estadistico de prueba F es mayor al valor crítico de F por lo tanto se rechaza H0

e. Conclusión a la cual llegó


El valor calculado de F es 9.15, por tanto la hipótesis nula se rechaza. La conclusión es qu
horas dedicadas no son iguales para los diferentes tipos de rama de la carrera que estudia
s de las carreras que estudian obtuvieron según las horas que dedicaron; se desea saber si el puntaje

Rama de la carrera que estudian


Arts and
Business Engineering GMAT Study Business
Sciences
500 540 480 500
3-hour review
580 460 400 580

460 560 420 460


1-day program
540 620 480 540
560 600 480 560
10-week course
600 580 410 600
Total de la columna 3240
n 6
media 540

1%

3-1 = 2
18 - 3 = 15

decisión es : 3.68
lado de F es mayor que 3.68.

Arts and
Sciences
-35
-115
-95
-35
-35
-105

Arts and
Sciences Total

1225
13225
9025
1225
1225
11025
36950 82450 Valor de SS

Arts and
Sciences
35
-45
-25
35
35
-35

Arts and
Sciences Total

1225
2025
625
1225
1225
1225
7550 37150 Valor de SSE

37150.00

a los tratamientos con resta:

VA:

Grados de Média
F
libertad cuadrática

2 22650.00 9.15
15 2476.67
17

no existe una relación de significancia entre la variable dependiente y las dos variables independientes)

a regla de decisión es : 3.68


e F es mayor que 3.68.
r lo tanto se rechaza H0

chaza. La conclusión es que no todas las medias poblacionales son iguales. Al menos una de las
a de la carrera que estudian.
Anova: Single Factor
er si el puntaje

SUMMARY
Groups Count
Arts and
Engineering Total
Sciences Business 6
540 480 Engineering 6
460 400 Arts and Sciences 6
560 420
620 480
600 480 ANOVA
580 410 Source of Variation SS
3360 2670 9270 Between Groups 45300
6 6 18 Within Groups 37150
560 445 515
Total 82450
independientes)
menos una de las
Sum Average Variance

3240 540 2720

3360 560 3200

2670 445 1510

df MS F P-value F crit
2 22650 9.145356662 0.00253082 3.682320344
15 2476.666667

17
Capítulo 13 y 14
Problema 3

La base de datos siguiente, muestra un estudio realizado durante 10 años por la Asociación Estadounidense de Cardi
guardan la edad (Age), la presión sanguínea (Pressure) y el hábito de fumar sobre el riesgo de sufrir un infarto; el rie
(multiplicada por 100) de que el paciente sufra un infarto en los próximos 10 años. Para la variable fumador (Smoker
valores 1 si el individuo es fumador y 0 si no lo es, es decir si la variable Fumador tiene el valor de YES, se le asigna u
valor de 0; esto se muestra en la siguiente tabla:

Riesgo Edad Presión Fumador


Risk Age Pressure Smoker
12 57 152 No
24 67 163 No
13 58 155 No
56 86 177 Yes
28 59 196 No
51 76 189 Yes
18 56 155 Yes
31 78 120 No
37 80 135 Yes
15 78 98 No
22 71 152 No
36 70 173 Yes
15 67 135 Yes
48 77 209 Yes
15 60 199 No
36 82 119 Yes
8 66 166 No
34 80 125 Yes
3 62 117 No
37 59 207 Yes

Se piensa que el Riesgo (probabilidad de que la persona sufra un infarto) aumenta si la edad, la pre
necesita un nivel de confianza utilice el 95%.
Note que en la redacción no dice cuál es la variable X y cuál es la variable Y, pero la redacción dice q
la presión arterial y si es fumador”, lo anterior indica que la variable dependientes (Y) es el riesgo y
efecto en Y, estás son denominadas variables independientes (X) que sería la edad, o la presión arte
la tabla anterior, usando un nivel de significancia del 5%; se le pide que conteste lo siguiente:

a. Presente un diagrama de dispersión (Scatter en inglés), E indique el tipo de relación que se tiene
edad (X), ¿qué indica la gráfica?

Grafica de dispersión
60

50

40 f(x) = 1.0042687612x - 42.7964654657


R² = 0.4228115381
30
RIsk

20

10

0
50 55 60 65 70 75 80 85 90
Age

b. Realice una regresión simple por medio del Excel y muestre sus resultados relacionado a la vari

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.650239601
R Square 0.422811538
Adjusted R Square 0.390745512
Standard Error 11.59254546
Observations 20

ANOVA
df SS MS F
Regression 1 1771.982015709 1771.982015709 13.1856545808
Residual 18 2418.967984291 134.3871102384
Total 19 4190.95

Coefficients Standard Error t Stat P-value


Intercept -42.7964655 19.3816481808 -2.2080921636 0.0404505696
Age 1.004268761 0.2765662025 3.6312056649 0.0019098794

c. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto

Yˆ= a + b1X1
Yˆ= -42.796465 + 1.00426876(69.45) = 26.950000382

d. Realice la prueba de hipótesis (por medio de la prueba t) para mostrar que, a mayor edad, mayor

H0: B1 = 0
H1: B1 <> 0

𝑡=(𝑏_1−0)/𝑆_(𝑏_1 ) = (1.00426876−0)/0.276566202=
3.631205

El estadístico de prueba es la distribución t con n-(k+1) = 20 - (2+1)= 17

Con el nivel de significancia de 5% y las tablas B.2, la regla de decisión es rechazar H0 si el valor calc

Tablas B.2 con 17 g.l. y significancia de 5% (valor crítico) = 2.1009220402

t ≥ valor crítico
3.631205 ≥ 2.100922
1

Como el valor de "t" es mayor que el valor crítico, por lo tanto indica que a mayor edad hay mayor r

e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indique si us
lo que indican sobre el riesgo y la edad, para poder determinar si la variable edad, hace se incremen
e. Indique la calidad de ajuste (muestre R cuadrada y el error estándar del estimado) e indique si us
lo que indican sobre el riesgo y la edad, para poder determinar si la variable edad, hace se incremen

R cuadrada = 0.4228115381
Error estándar del estimado= 0.2765662025

�_𝑎𝑑𝑗^2=1−(1−�^2 ) (𝑛−1)/(𝑛−𝑝−1)= 1−(1−0.422811538)((20−1)/(20−1−1))=

f. Ahora realice una regresión múltiple y muestre sus resultados, usando todas las variables indepen
Fuma) y la variable Riesgo (Y). Note que la variable cualitativa también entraría en esta regresión ya
ficticia (con 1 y 0) puede ser usada en la regresión.

SUMMARY OUTPUT

Regression Statistics
Multiple R 0.934605168
R Square 0.87348682
Adjusted R Square 0.849765599
Standard Error 5.756574565
Observations 20

ANOVA
df SS MS F
Regression 3 3660.739588378 1220.246529459 36.8230122294
Residual 16 530.2104116223 33.1381507264
Total 19 4190.95

Coefficients Standard Error t Stat P-value


Intercept -91.7594984 15.2227600869 -6.0277832611 1.75755473E-05
Age 1.076741057 0.1659636107 6.4878141197 7.48730187E-06
Pressure 0.251813473 0.0452255186 5.5679510234 4.24366457E-05
Smoker 8.739871056 3.000815432 2.9124987036 0.010173553

g. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto.
g. De los resultados que se obtuvieron del Excel, muestre en qué lugar se encuentra la ecuación de
riesgo de sufrir un infarto.

Yˆ= a + b1X1+b2X2+b3X3
Yˆ= -91.759498 + 1.07674106(69.45)+ 0.25181347(157.1) + 8.73987106(0.5)
Yˆ= 26.95

h. Existe la multicolinealidad, si es así, ¿entre que variables?

Risk Age Pressure Smoker


Risk 1
Age 0.650239601 1
Pressure 0.388163473 -0.3089516736 1
Smoker 0.680448073 0.410767454 0.1666460687 1

No existe multicolinealidad debido a que las correlaciones no son mayores a 0.70 o menores a -0.70

i. Realice las pruebas de hipótesis (prueba t) necesarias para indicar que variables deberían de est
deberían de estar en la ecuación.

H0: b1= 0 ; b2 = 0; b3 = 0
H1: b1 ≠ 0; b2 = 0; b3 ≠ 0

𝑡=(𝑏_1−0)/𝑆_(𝑏_1
Age ) = (1.07674106−0)/0.165963611=
6.4878141197
𝑡=(𝑏_2−0)/𝑆_(𝑏_2 ) = (0.25181347−0)/0.045225519=
Pressure 5.5679510234

𝑡=(𝑏_3−0)/𝑆_(𝑏_3 ) = (8.73987106−0)/3.000815432=
Smoker 2.9124987036

El estadístico de prueba es la distribución t con n-(k+1) = 20 - (2+1)= 17

Con el nivel de significancia de 5% y las tablas B.2, la regla de decisión es rechazar H0 si el valor calc

valor crítico = 2.1199052992


t ≥ valor crítico
Age 6.4878141197 ≥ 2.1199052992
Pressure 5.5679510234 ≥ 2.1199052992
Smoker 2.9124987036 ≥ 2.1199052992

j. Midiendo la calidad de ajuste de esta nueva regresión, ¿se explica de mejor manera el riesgo?
�_𝑎𝑑𝑗^2=1−(1−�^2 ) (𝑛−1)/(𝑛−𝑝−1)= 1−(1−0.87348682)((20−1)/(20−1−1))=
0.8497655988

El 84.97% indica la explicación del riesgo dependiendo de 3 variables (edad, presión y fumador).

k. Compare ambas regresiones por la calidad de ajuste (aquí solo podrá comparar la Rcuadrada ajus
dos sería la mejor regresión?

Comparando infromaciòn utilizando los datos muestreados de Rcuadrada ajustada y el error estànd
error de 15.22 es mejor utilizando mas variables para obtener un resultado más completo
stadounidense de Cardiología proporcionó datos sobre la relación que
sufrir un infarto; el riesgo (Risk) se interpreta como la probabilidad
iable fumador (Smoker), defina una variable ficticia que tome los
or de YES, se le asigna un 1 y si toma el valor de NO, se le asigna un

Riesgo Edad Presión Fumador Total


Risk Age Pressure Smoker Risk - Age
18 56 155 1
12 57 152 0
13 58 155 0
28 59 196 0
37 59 207 1
15 60 199 0
3 62 117 0
8 66 166 0
24 67 163 0
15 67 135 1
36 70 173 1
22 71 152 0
51 76 189 1
48 77 209 1
31 78 120 0
15 78 98 0
37 80 135 1
34 80 125 1
36 82 119 1
56 86 177 1
Total 539 1389 3142 10 1928
n 20 20 20 20 40
media 26.95 69.45 157.1 0.5 96.4

nta si la edad, la presión arterial aumenta y si es fumador. Si


o la redacción dice que “el riesgo se ve afectado por la edad,
tes (Y) es el riesgo y las otras variables son las que causan un
ad, o la presión arterial o si es fumador o no. Basándose en
e lo siguiente:

lación que se tiene entre la dependiente (Y) y la variable

elacionado a la variable riesgo y edad.

Significance F
0.0019098794

Lower 95% Upper 95% Lower 95.0% Upper 95.0%


-83.515797305 -2.07713363 -83.5157973 -2.07713363
0.4232247308 1.585312792 0.423224731 1.585312792

ntra la ecuación de regresión estimada para predecir el

mayor edad, mayor sería el riesgo de contraer un infarto

(grados de libertad)

ar H0 si el valor calculado de t es mayor al valor crítico

or edad hay mayor riesgo.

mado) e indique si usaría esta ecuación para saber si es cierto


ad, hace se incremente el riesgo.
0.3907455125 39.075%

as variables independientes (X´s que son: Edad, Presión,


en esta regresión ya que al convertirse en una variable

Significance F
2.06403869E-07

Lower 95% Upper 95% Lower 95.0% Upper 95.0%


-124.030308216 -59.4886887 -124.030308 -59.4886887
0.7249139189 1.428568194 0.724913919 1.428568194
0.155939656 0.347687289 0.155939656 0.347687289
2.3784265193 15.10131559 2.378426519 15.10131559

ntra la ecuación de regresión estimada para predecir el


7106(0.5)

70 o menores a -0.70

bles deberían de estar en la ecuación o que variables no

(grados de libertad)

ar H0 si el valor calculado de t es mayor al valor crítico


1
1
1

manera el riesgo?

84.977%

sión y fumador).

ar la Rcuadrada ajustada y el error estándar); ¿Cuál de las

ada y el error estàndar podemos observar el 84.977% y un


s completo
Age

Mean 69.45
Standard Error 2.1502447841
Median 68.5
Mode 59
Standard Deviation 9.6161870111
Sample Variance 92.4710526316
Kurtosis -1.4318301246
Skewness 0.0887364599
Range 30
Minimum 56
Maximum 86
Sum 1389
Count 20

Pressure

Mean 157.1
Standard Error 7.2963220728
Median 155
Mode 155
Standard Deviation 32.6301442809
Sample Variance 1064.7263157895
Kurtosis -0.9636008019
Skewness 0.0160262273
Range 111

Minimum 98

Maximum 209
Sum 3142
Count 20
Risk

Mean 26.95
Standard Error 3.3209660928
Median 26
Mode 15
Standard Devia 14.8518118689
Sample Varian 220.5763157895
Kurtosis -0.7275412035
Skewness 0.3409858374
Range 53
Minimum 3
Maximum 56
Sum 539
Count 20

Smoker

Mean 0.5
Standard Error 0.1147078669
Median 0.5
Mode 1
Standard Devia 0.512989176
Sample Varian 0.2631578947
Kurtosis -2.2352941176
Skewness 0
Range 1

Minimum 0

Maximum 1
Sum 10
Count 20