You are on page 1of 14

Taller teoría de la probabilidad

Regresión lineal

Integrantes: Wilmar Alberto Romero, Cesar Camilo Vargas Callejas

45). Un consultor está interesado en el grado de precisión con que un nuevo índice de
desempeño laboral mide lo que es importante para una corporación. Una forma de
verificarlo es analizar la relación entre el índice de evaluación del trabajo y el salario de un
empleado. Se tomó una muestra de ocho empleados y se recabó información del salario
(en miles de dólares) y el índice de evaluación del trabajo (1 a 10, donde 10 es la mejor
calificación).

Índice de evaluación del trabajo (X) 9 7 8 4 7 5 5 6


Salario (Y) 36 25 33 15 28 19 20 22

SOLUCION

a) 𝑦 =4.2138x - 2.1132
b) 1.32860797883559
c) 𝑅 2= 0.970863288

Salario(y)
40
35 36
33
30
28
25 25
22
20 20
19 Salario(y)
15 15
10
5
0
0 2 4 6 8 10

46). La Stork Foundation desea mostrar con estadísticas que, contrariamente a la


creencia popular, las cigüeñas sí traen a los bebés. Para esto ha recolectado datos sobre
el número de cigüeñas y el número de bebés (ambos en miles) en varias ciudades
grandes de Europa central.
Cigüeñas 27 38 13 24 6 19 15
Bebés 35 46 19 32 15 31 20
a) Calcule el coeficiente de determinación de la muestra y el coeficiente de correlación de
la muestra para estos datos.
b) ¿Contradijo la ciencia estadística la creencia popular?

SOLUCION
a) El coeficiente de determinacion de la muestra es de 0.24369817 y el coeficiente
de correlación es de 0.493657948
b) La stork foundation desea mostrar con estadística que, contrariamente a la
creencia popular, las cigüeñas si traen a los bebes. Para esto ha recolectado
datos sobre el número de cigüeñas y el número de bebes en varias ciudades
grandes de Europa Central.
Lo cierto es que tanto las cigüeñas como los bebes dependen de la causa común,
Z, que es el tamaño del pueblo o ciudad. En las poblaciones más grandes
siempre hay más cigüeñas y más niños. Tanto cigüeñas como niños es tan
correlacionados con el tamaño de la población pero no entre ellos mismos. Esto
significa que el 98% de los datos se relacionan entre sí. La relación entre las dos
variables es negativa y la pendiente es positiva por tanto, el signo de r es positivo.

bebes
50
45 46
40
35 35
31 32
30
25
bebes
20 19 20
15 15
10
5
0
0 10 20 30 40

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,97882033
Coeficiente de determinación R^2 0,95808925
R^2 ajustado 0,9497071
Error típico 2,44198722
Observaciones 7

47). Los análisis de regresión y correlación tratan la relación entre variables. El análisis de
regresión, mediante ecuaciones de estimación nos permite determinar una variable
desconocida a partir de un conjunto de variables conocidas. La variable desconocida se
llama Dependiente; las variables conocidas se llaman variables Independientes. La
correlación entre dos variables indican el grado de la relación lineal entre ellas y por tanto
da una idea de qué tan bien el análisis de regresión describe la relación entre las
variables.
48). Calcule el coeficiente de determinación de la muestra y el coeficiente de correlación
de la muestra para el ejercicio 12-14.

Business Week y U.S. News & World Report publican clasificaciones de las mejores 20
escuelas de administración.
La clasificación global del Business Week se basa en clasificaciones obtenidas de
estudiantes y compañías que reclutan maestros en administración. Junto con las
clasificaciones, las publicaciones reportan información sobre el costo de obtener una
maestría y los salarios iniciales promedio de los graduados.
Utilice los datos de la tabla MR12-1 para responder los ejercicios 12-49 a 12-52.

49). Trace un diagrama de dispersión de la clasificación USN&WR contra el costo del


grado de la maestría. ¿Parece que las escuelas más caras obtienen mejores
clasificaciones? Calcule el coeficiente de correlación de muestra entre estas dos
variables.

Costo
45

40
38.48 37.637.639 38.5 38
37.1 37.2 37 37.5 37 37.2
36.1
35 35
33.5
30
28.5
25 24.6
22.5
Costo
20
17.36
15 15.4

10

0
0 5 10 15 20 25

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,49365795
Coeficiente de determinación R^2 0,24369817
R^2 ajustado 0,2016814
Error típico 5,28593898
Observaciones 20
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los
libertad cuadrados cuadrados F Valor crítico de F
Regresión 1 162,059283 162,059283 5,80002174 0,02696204
Residuos 18 502,940717 27,941151
Total 19 665

Coeficien Error Estadísti Probabili Inferior Superior Inferior Superior


tes típico co t dad 95% 95% 95,0% 95,0%
Intercepc 23,65404 5,588336 4,232752 0,000500 11,91338 35,39470 11,91338 35,39470
ión 19 11 18 46 34 04 34 04
- - - - - -
Variable 0,395527 0,164233 2,408323 0,026962 0,740568 0,050485 0,740568 0,050485
X1 01 35 43 04 47 56 47 56

50). ¿Existe una retribución por gastar más en una maestría? Grafique un diagrama de
dispersión del salario inicial contra el costo. Ajuste una ecuación de regresión a los datos
y pruebe las hipótesis apropiadas respecto a su pendiente.

Solución

SALARIO COSTO
INICIAL
70,2 37,6
68,6 38,5
84,96 37,1
72,2 37,6
58,11 37,2
74,26 37,5
82,86 38,48
49,07 24,6
66,62 38
55,5 17,36
65,28 28,5
59,87 37
73 39
59,94 37
56,73 36,1
64,54 22,5
56,98 37,2
65,5 15,4
47,32 35
48,2 33,5

SALARIO INICIAL CONTRA EL GASTO


45
40
35
30
25
20
15
10
y = 0.2196x + 19.206
5 R² = 0.0983
0
0 10 20 30 40 50 60 70 80 90

y = 19,206+ 0,2196x Y=A+BX


R² = 0,0983

51). ¿Los graduados de escuelas con clasificación más alta obtienen salarios iniciales
más altos? Trace un diagrama de dispersión de salario inicial contra la clasificación global
de Business Week. Ajuste una ecuación de regresión a los datos y pruebe las hipótesis
apropiadas respecto a su pendiente.

SALARIO
INICIAL CLASIFICACION GLOBAL BUSINESS WEEK
70,2 3
68,6 10
84,96 12
72,2 15
58,11 9
74,26 1
82,86 5
49,07 6
66,62 18
55,5 8
65,28 2
59,87 7
73 14
59,94 4
56,73 16
64,54 11
56,98 23
65,5 13
47,32 19
48,2 24

SALARIO INICIA CONTRA CLASIFICACION GLOBAL


30

25

20

15

10
y = -0.2281x + 25.597
R² = 0.127
5

0
0 10 20 30 40 50 60 70 80 90

y = 25,597+(-
0,2281x) Y=A+BX
R² = 0,127

52). ¿Qué tan fuerte es la relación entre los salarios iniciales y las clasificaciones? Calcule
los coeficientes de determinación de la muestra entre los salarios iniciales y las tres
clasificaciones de Business Week (globales, por estudiantes y por compañías). ¿Cuáles
de estas clasificaciones explican la mayor parte de la variación en salarios iniciales?

SALARIO INICIAL CONTRA CLASIFICACION BW DE


1992
SALARIO INICIAL CLASIFICACION BW
70,2 1
68,6 2
84,96 3
72,2 4
58,11 5
74,26 6
82,86 7
49,07 8
66,62 9
55,5 10
65,28 11
59,87 12
73 13
59,94 14
56,73 15
64,54 16
56,98 17
65,5 18
47,32 19
48,2 20

SALARIO INICIA CONTRA CLASIFICACION 1992


25

20

15

10
y = -0.3332x + 31.821
R² = 0.3527
5

0
0 10 20 30 40 50 60 70 80 90

R² = 0,3527

SALARIO INICIAL CONTRA CLASIFICACION BW DE


ESTUDIANTES
CLASIFICACION
SALARIO INICIAL ESTUDIANTES
70,2 3
68,6 10
84,96 12
72,2 15
58,11 9
74,26 1
82,86 5
49,07 6
66,62 18
55,5 8
65,28 2
59,87 7
73 14
59,94 4
56,73 16
64,54 11
56,98 23
65,5 13
47,32 19
48,2 24

Chart Title
30

25

20

15

10
y = -0.2281x + 25.597
5 R² = 0.127

0
0 10 20 30 40 50 60 70 80 90

R² = 0,127

SALARIO INICIAL CONTRA CLASIFICACION BW POR COMPAÑIAS


SALARIO INICIAL COMPAÑIAS
70,2 1
68,6 4
84,96 3
72,2 2
58,11 6
74,26 12
82,86 7
49,07 8
66,62 5
55,5 11
65,28 15
59,87 14
73 10
59,94 17
56,73 13
64,54 16
56,98 9
65,5 19
47,32 20
48,2 18

Chart Title
25

20

15

10

y = -0.298x + 29.571
R² = 0.2822
5

0
0 10 20 30 40 50 60 70 80 90

R² = 0,2822

53). “Nada triunfa como el éxito” es un antiguo adagio en el negocio de la publicidad. El


presidente de una distribuidora de varias líneas de automóviles ha observado que los
agentes de ventas que gana los bonos más altos al final de año son los que tienen mayor
probabilidad de exceder su cuota de ventas el año siguiente (y ganar otro bono alto).

Bono el año pasado (miles de dólares) 7.8 6.9 6.7 6.0 6.9 5.2
Ventas arriba de cuota este año 64 73 42 49 71 46
Bono el año pasado (miles de dólares) 6.3 8.4 7.2 10.1 10.8 7.7
Ventas arriba de cuota este año 32 88 53 84 85 93

a) Desarrolle la recta que mejor se ajuste para describir estos datos.


b) Calcule el error estándar de la estimación para la relación.

VENTAS ARRIBA DE
BONO EL AÑO PASADO CUOTA
(MILES DE DOLARES) ESTE AÑO
7,8 64
6,9 73
6,7 42
6 49
6,9 71
5,2 46

Estadísticas de la regresión
Coeficiente de correlación múltiple
Coeficiente de determinación R^2
R^2 ajustado
Error típico estandar
Observaciones

Coeficie Error Estadísti Probabili Inferior Superio Inferior Superior


ntes típico co t dad 95% r 95% 90,0% 90,0%
- - - -
Intercep 2,77543 40,1457 0,06913 0,94820 114,23 108,687 88,3601 82,8092
ción 27 987 3826 119 804 174 2467 5932
- -
Variable 9,15576 6,05232 1,51276 0,20488 7,6481 25,9597 3,74686 22,0583
X1 192 15 8599 593 765 003 0224 8407

AÑO PASADO BONO CONTRA ENTAS ESTE AÑO


80

70

60

50

40

30

20 y = 9.1558x - 2.7754
R² = 0.3639
10

0
0 1 2 3 4 5 6 7 8 9

BONO EL AÑO VENTAS ARRIBA DE


PASADO CUOTA
(MILES DE ESTE AÑO
DOLARES)
6,3 32
8,4 88
7,2 53
10,1 84
10,8 85
7,7 93

Coeficie Error Estadísti Probabili Inferior Superio Inferior Superior


ntes típico co t dad 95% r 95% 90,0% 90,0%
- - - -
Intercep 8,16635 44,1399 0,18501 0,86222 130,71 114,385 102,265 85,9331
ción 1607 09 0613 272 839 683 8748 7156
- -
Variable 9,58412 5,15425 1,85945 0,13648 4,7263 23,8946 1,40396 20,5722
X1 0983 517 7994 607 856 275 1345 0331

AÑO PASADO BONO CONTRA ENTAS ESTE AÑO


120

100

80

60

40
y = 9.5841x - 8.1664
R² = 0.4636
20

0
0 2 4 6 8 10 12

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,680906208
Coeficiente de determinación
R^2 0,463633265
R^2 ajustado 0,329541581
Error típico estandar 19,95457981
Observaciones 6
60. Suponga que desea saber si los negocios son mejores en comunidades con más
gente mayor. Utilice una edad promedio para representar el número de personas mayores
en cada área metropolitana, ajuste una ecuación de regresión para explicar VENTAS en
términos de EDAD. ¿La pendiente de su regresión es significativamente mayor que cero?
Con base en este análisis, ¿debe concluir que “los negocios no son mejores en
comunidades con más personas mayores”? Explique su respuesta.

No se encuentra en el cd no tiene solución

61). Los economistas con frecuencia están interesados en estimar funciones de consumo,
que se obtienen mediante la regresión del consumo Y sobre el ingreso X (para esta
regresión, los economistas llaman a la pendiente la propensión marginal al consumo).
Para una muestra de 25 familias, se calculó una pendiente de 0.87 y un error estándar del
coeficiente de la pendiente de regresión de 0.035. Para esta muestra, ¿la propensión
marginal a consumir disminuyó a menos que el estándar de 0.94? Utilice ∝ = 0.05.
Establezca las hipótesis explícitas y una conclusión.

Solución

Pendiente = 0.87
Error estándar= 0.035

∝ = 0.05.

62). A diferencia del coeficiente de determinación, el coeficiente de correlación (escoja la


respuesta correcta):
a) Indica si la pendiente de la recta de regresión es positiva o negativa.
b) Mide la fuerza de asociación entre las dos variables de manera más exacta.
c) Nunca puede tener un valor absoluto mayor que 1.
d) Mide el porcentaje de varianza explicado por la recta de regresión.

63). ¿Son importantes las calificaciones en la universidad para ganar un buen sueldo? Un
estudiante de estadística para la administración tomó una muestra aleatoria de sueldos
iniciales y promedios de calificaciones en la universidad de algunos de sus amigos recién
graduados. Los datos son los siguientes:

Sueldo inicial (miles de dólares): 36 30 30 24 27 33 21 27


Promedio de calificaciones: 4.0 3.0 3.5 2.0 3.0 3.5 2.5 2.5

a) Grafique estos datos.


b) Desarrolle la ecuación de estimación que mejor describa los datos.
c) Grafique la ecuación de estimación en el diagrama de dispersión del inciso a).

Solución

A),
40
35
30
25 Sueldo inicial (miles
20 de dólares)
15 Promedio de
10 calificaciones
5
0
1 2 3 4 5 6 7 8

B). Estimación lineal = -0,61764706

C).

Promedio de calificaciones
5

4 4
3.5 3.5
3 3 3
2.5 2.5
2 Promedio de calificaciones
2

0
0 5 10 15 20 25 30 35 40

64). Un arrendador está interesado en ver si las rentas de sus departamentos son las
comunes. Para esto tomó una muestra aleatoria de 11 rentas y tamaños de
departamentos en complejos de departamentos similares.
Los datos son los siguientes:

Renta: 230 190 450 310 218 185 340 245 125 350 280
Número de recámaras: 2 1 3 2 2 2 2 1 1 2 2

a) Desarrolle la ecuación de estimación que mejor describa estos datos.


b) Calcule el coeficiente de determinación.
c) Pronostique la renta para un departamento de dos recámaras.
Solución

A). Estimación lineal = -1,858272163


B).Coeficiente de determinación R^2= 0,576169255
C).

Renta 2
Renta Número de recámaras
recamaras
230 2 116
190 1
450 3
310 2 156
218 2 110
185 2 93,5
340 2 171
245 1
125 1
350 2 176
280 2 141

You might also like