You are on page 1of 10

Gua Unidad I:

DISTRIBUCIONES BIDIMENSIONALES

1. Dado el siguiente cuadro que resume una investigacin sobre montos de venta y aos de
experiencia en el trabajo.

Aos de Montos de venta anuales (en miles de dlares)


Experiencia.
[20 , 17 [17 , 14 [14 , 11 [11 , 8
0 1 1
1 2 6 5
2 4 2 16
4 8 3 7 2
8 10 2 4 2

Determinar el Coeficiente de Correlacin de Pearson y La Recta de Regresin Mnimo Cuadrtico


que permita estimar el monto de venta de un trabajador con 12 aos y medio de experiencia.
Comente los resultados.

Solucin:

yj 18.5 15.5 12.5 9.5 ni xi ni x2i ni


xi
0.5 0 0 0 1 1 0.5 0.25
1.5 0 0 6 5 11 16.5 24.75
3.0 0 2 16 0 18 54.0 162.00
6.0 0 3 7 2 12 72.0 432.00
9.0 2 4 2 0 8 72.0 648.00
nj 2 9 31 8 50 215.0 1267.00
vj 2 1 0 -1
vj nj 4 9 0 -8 5
2
v nj
j 8 9 0 8 25

215 1267
M(X) = = 4.3 ; V(X) = - 4.32 = 6.85
50 50

y j 12.5
vj = yj = 3 vj + 12.5
3

5
M(Y) = 3 + 12.5 = 12.8
50
25
0.1
2
V(Y) = 32 = 4.41
50
( x i , y j) nij xiyjnij 2915.5
Cov(X,Y) = - 12.8
50
4.3 ( 0.5 , 9.5 ) 1 4.75
= 3.27
( 1.5 , 12.5 ) 6 112.50
( 1.5 , 9.5 ) 5 71.25 3.27
r = = 0.59
( 3.0 , 15.5 ) 2 93.00 4.41 6.85
( 3.0 , 12.5 ) 16 600.00
3.27
b = ( 6.0 , 15.5 ) 3 279.00 = 0.4777
6.85
( 6.0 , 12.5 ) 7 525.00
a = 12.8 - 0.4777 ( 4.3 )
( 6.0 , 9.5 ) 2 114.00
= 10.74589
( 9.0 , 18.5 ) 2 333.00
(9.0 , 15.5 ) 4 556.00
(9.0 , 12.5 ) 2 225.00
2915.50

As, la recta de Regresin Mnimo Cuadrtica, resulta:

= 10.74589 + 0.4777 x
y

= 10.74589 + 0.4777 (12.5) = 16.717


y

De los resultados se sigue que existe algn grado de correlacin entre aos de experiencia y
capacidad de venta (r = 0.59), que para la toma de una decisin final deber ser sometido a una
Prueba de Hiptesis.
En base a la Recta de Regresin Mnimo Cuadrtica obtenida podemos afirmar que un trabajador
con 12 aos y medio de experiencia podr vender un monto aproximado de 16.717 dlares
anuales. Afirmacin que se debe tomar con serias reservas desde que el Coeficiente de
Determinacin (r2 = 0.3481) es bastante pobre; igualmente se debe someter a una Prueba de
Hiptesis o construir zonas de confianza con la ayuda de la Estadstica Inferencial.

2. En la produccin de herramientas, la deformacin de acero a cierta temperatura puede


afectar su dureza. En la investigacin de esta relacin se obtuvieron los siguientes
resultados experimentales.

Deformacin 6 9 11 13 22 26 28 33 35
(en mm2)
Dureza 68 67 65 53 44 40 37 34 32
(en Kg/mm2)

a) Ajustar una Recta Mnimo Cuadrtica para determinar la dureza (Y) dada la deformacin
(X) y estimar la dureza del acero cuando su deformacin alcanza 36.5 mm 2.
b) Ajustar una Recta mnimo Cuadrtica para determinar la deformacin (X) dada la dureza
(Y) y estimar la deformacin de acero cuando su dureza registra 70 Kg/mm 2.
c) Determinar la bondad de ajuste y compare con el Coeficiente de Correlacin Lneal entre
las variables X,Y.

Solucin:

a) Recta de Regrein de Y dado X.


De los datos obtenemos:

9 9 9 9

xi 183 ; xi yi = 440 ; y
2 2
= 4665 ; i = 23232
i 1 i 1 i 1 i 1

x y
i 1
i i = 7701

Por se n pequea (n = 9) , utilizaremos las varianzas y covarianzas de Cochran:

183 440
X = = 20.33 ; Y = = 48.99
9 9

2 1 1 2
S x = 8 4665 9 (183) = 118

2 1 1
S = 23232 ( 440) 2 = 215.11
y
8 9

1 1
S xy = 7701 (183)(440) = -155.71
8 9

155.71
b= = -1.32 ; a = 48.89 - (-1.32) (20.33) = 75.73.
118

Y = 75.73 1.32 x

Para X = 36.5 :

Y = 75.73 1.32 (36.5) = 27.55

Cuando se deforma en 63.5 mm2 la dureza del acero se estima en 27.55 Kg/mm 2.

b) Recta de Regresin de X dado Y.

155.71
b= = -0.72386 ; a = 20.33 -(-0.72386) 48.89 = 55.7195
215.11

X = 55.7195 0.72386 y
Para y = 70:
X = 55.7195 - 0.72386 (70) = 5.0493
La deformacin del acero se estima en 5.0493 mm 2 cuando su dureza registra 70 Kg/mm2.

c) Clculo del Coeficiente de Determinacin.

xi yi ( yi - 48.89 )2 (Y

- 48.89 )2
Y i i

6 68 67.81 365.1921 357.9664


9 67 63.85 327.9721 223.8016
11 65 61.21 259.5321 151.7824
13 53 58.57 16.8121 93.7024
22 44 46.69 23.9121 4.8400
26 40 41.41 79.0321 55.9504
28 37 38.77 141.3721 102.4144
33 34 32.17 221.7121 279.5584
35 32 29.53 285.2721 374.8096

1720.8889 1644.8256

1644.8256
r2 = = 0.95579999
1720.8889

Nos indica una bondad de ajuste excelente.


Clculo de r:

9(7701) (183)(440)
r = = - 0.97732595
[9(4665) 183 2 ][9(23232) 440 2 ]

r2 = 0.955166

Observamos que el Coeficiente de Determinacin es el cuadrado del Coeficiente de Correlacin,


salvo discrepancias en las diez mil milsimas por problemas de redondeo.

3. El efecto de la temperatura (X) en la absorcin (Y) del anhdrido carbnico en agua est
dada en la siguiente Tabla:

Temperatura 10 15 20 30 35 40 50
( en C )
Coeficiente de 5 8 7.5 12 13 22 46
absorc. Relativa.

a) Mostrar el Diagrama de Dispersin y observar su tendencia.


b) Ajustar la exponencial y = a bx a los datos.
c) Estimar y cuando x = 25.
Solucin:

50 x

40

30
x
20
x x x
10 x x

0 10 20 30 40 50

b) Tomando logaritmos vulgares (o naturales) a ambos miembros de la funcin exponencial,


se obtiene:
Log y = log a + x log b (1)
Haciendo log y = z ; log a = A ; log b = B (1) se transforma en z = A + B x, que es la
ecuacin de una recta; entonces, podemos calcular A,B usando el Mtodo de Mnimos Cuadrados.

xi yi zi xizi xi2

10 5 0.69897 6.98970 100


15 8 0.90309 13.54635 225
20 7.5 0.87506 17.50120 400
30 12 1.07918 32.37540 900
35 13 1.11394 38.98790 1225
40 22 1.34242 53.69680 1600
50 46 1.66276 83.13800 2500
200 7.67542 246.23535 6950

7(246.23535) 200(7.67542)
B = = 0.02178
7(6950) 200 2

7.67542 200
A = Z - B X = - 0.02178 = 0.47391
7 7
Luego:
z = 047391 + 0.02178 x
Para x = 25 : z = 0.47391 + 0.02178 (25) = 1.101866
Log y = 1.01866 y = 101.01866 = 10.439

Se estima un Coeficiente de Absorcin Relativa de 10.439 cuando la temperatura es de 25C.


O bien:
Log b = B b = 10B = 100.02178 = 1.051429
Log a = A a = 10A = 100.47391 = 2.977899
Luego:

x
Y = 2.977899 ( 1.051429 )

Para x = 25 : Y = 2.977899 (1.051429)25 = 10.433
Las discrepancias en las milsimas se debe a problemas de redondeo.

4. Una encuesta sobre los vendedores de autos usados para determinar la relacin entre la
cantidad de anuncios clasificados y la venta de autos usados, se resume en la siguiente
tabla:

Vendedores N de avisos N de autos usados


clasificados vendidos

A 74 139
B 45 108
C 48 98
D 36 76
E 27 62
F 16 57

a) Determinar la Recta de Regresin, seleccionando la variable independiente apropiada,


para estimar el nmero de autos usados que se venderan si el nmero de avisos
clasificados fuese 50.
b) Calcular la Correlacin Lineal entre el nmero de avisos publicitados y el nmero de autos
usados vendidos.
c) Determinar la Bondad de Ajuste.
Solucin:

Seleccionando el nmero de avisos clasificados como la variable independiente (X), se tiene:

6 6 6 6 6

xi = 246 ;
x 1
xi2 = 12086 ;
x 1
yi = 540 ;
x 1
y i2 = 53458 ;
x 1
x y
x 1
i i = 25172

X = 41 ; Y = 90 ; S x = 400 ; S y = 971.6
2 2

1 1
S xy = 25172 ( 246)(540) = 606.4
5 6

606.4
a) b = = 1.516 ; a = 90 1.516 (41) = 27.844
400

= 27.844 + 1.516 x
y

Para x = 80 : = 27.844 + 1.516 (80) =


y 149.124

Si el nmero de avisos clasificados fuese 80 se venderan 149 autos usados.


606.4
b) r = = 0.972714621
400 971.6

Existe una correlacin alta (97.27%) entre el nmero de avisos clasificados y el nmero de autos
usados vendidos.

c)
r2 = (0.972714621)2 = 0.946173734

Una Bondad de Ajuste del 94.62% Un Ajuste Excelente.

5. Se realiza un experimento para calibrar un instrumento electrnico que mide la cantidad de


humedad de un producto alimenticio. Los investigadores toman lecturas del instrumento
para valores seleccionados de humedad conocidos.

X 1 1 1 2 2 3 3 4 4 5 5 5

y 4.25 4.31 4.33 4.61 4.58 4.86 4.97 5.19 5.21 5.59 5.49 5.52

X: Niveles de Humedad (codificado)


Y: Lectura del instrumento.
a) Observar la tendencia a traves de un Diagrama de Dispersin y calcular la Correlacin
Lineal entre Niveles de Humedad y la Lectura del Instrumento.
b) Determinar la Recta de Regresin Mnimo Cuadrtico que permite estimar la Lectura
impresa en el Instrumento si el nivel de humedad (codificado) es de 5.5.
Respuesta:
a) El diagrama de dispersin sugiere una tendencia lineal y r = 0.9969.
b) y = 3.98 + 0.31 x ; y = 4.91 , para x = 5.5.

6. Se seleccionan pedacitos de cierto tipo de mineral y se observa su Densidad (en


gr./cm.3) y su contenido de Hierro (en porcentajes). Los resultados obtenidos
fueron:

Densidad 2 2.5 3 3.5 4 2.5 3.5 3 4 5

Porcentaje 20 20 26 32 38 20 30 26 38 40

a) Calcule el grado de Correlacin Lineal entre Densidad y Porcentaje de Hierro de los


pedacitos de mineral bajo estudio. Comente los resultados obtenidos.
b) Considerando a la variable Densidad (X) como variable independiente. Obtenga la Recta
de Regresin Mnimo Cuadrtica que permita estimar el porcentaje de hierro en un pedazo
de mineral con una densidad de 5.5 gr/cm3.
c) Considerando a la variable Porcentaje de Hierro (Y) como variable independiente. Obtenga
la Recta de Regresin que permita estimar la posible densidad de un pedazo de mineral
que contiene un 50% de hierro.

Respuesta:
a) r = 0.95668. existe una alta correlacin lineal entre Densidad y Porcentaje de Hierro, en
los 10 pedazos del mineral bajo estudio.
b) y = 1.115 + 8.45 x ; y = 47.59 , para x = 5.5

x = 5.5743 , para y = 50.
= 0.1593 + 0.1083 y ; x

7. De cierta Empresa que se dedica a la fabricacin de estabilizadores de diferentes potencias se


ha obtenido el Costo de Fabricacin (Y) y Precio de Venta (X) en nuevos soles, durante un
mes:

Y 70 - 79 80 - 94 95 - 129 130 -159 160 - 198


X
150 4
170 7 8
190 5 6
210 3 5 2
230 4 3
250 3
a) Calcule el Coeficiente de Correlacin.
b) Estime el precio de venta del estabilizador si su costo de fabricacin es de 210 nuevos
soles.

Respuesta:
a) r = 0.85 7957.
b) 255.31

8. Se tiene la siguiente distribucin del nmero de hijos (X) y el nmero de


dormitorios por habitacin (Y) en una muestra aleatoria de 20 familias
seleccionadas en un centro urbano.
N de N de Dormitorios.
Hijos
1 2 3

0 1 2 1

1 2 3 2

2 1 3 1

3 0 1 2

4 0 0 1

a) Calcular la media, mediana, moda, media geomtrica, y media armonica en cada una de
las marginales y dar sus significados.
b) Calcular la correlacin entre las variables X, Y.
c) Calcular el valor de D, tal que:

D = ( x , y ) S ( x , y )'

Donde, ( x, y ) es la transpuesta del Vector de Medias y S es la Matriz de Covarianzas.

Respuesta:
a) x = 1.5 : El nmero de hijos promedio es de 1 a 2.
Md. = 1.357 : El 50% de las familias tiene menos de 2 hijos.
Mo. = 1 : El mayor nmero de familias tiene un hijo.
No es posible determinar la media geomtrica y la media armonica de la variable nmero de hijos.
y = 2.15 : El nmero promedio de dormitorios es 2.
Md. = 2.17 : El 50% de las familias tienen menores o iguales a 2 dormitorios.
Mo. = 2 : El mayor nmero de familias tienen 2 dormitorios.
G = 2.006577 ; H = 1.846.

b) r = 0.33866. Correlacin pobre.


c) D = 2.65

9. Los siguientes datos corresponden al sexo, edad y peso de atletas.

Sexo Edad Peso

H 18 65
H 20 70
M 20 50
H 24 68
H 21 69
M 18 52
H 23 75
H 24 74
H 25 69
M 20 49
a) Construir una Tabla de frecuencias Relativas Tridimensionales, clasificando las variables
Edad y Peso con tres intervalos de Clase c/u.
b) Construir una Tabla de Frecuencias Absolutas Bidimensionales 3x3 de Edad vs Peso.
c) Con referencia a b) . Dar el valor y significado de f12 ; 100 h33%.

Respuesta:
a)

Peso H M
Edad
[49.58> [58,67> [67,76> [49,58> [58,67> [67,76>
[17,20> 0.1 0.1

[20,23> 0.1 0.2

[23,26> 0.5

b)

Edad [48,58> [58,67> [67,76>

[17,20> 1 1

[20,23> 2 1

[23,26> 5
c) f12 = 1 : Existe un atleta con [17,20> aos de edad y [58,67> Kg. de peso.
100 h33% = 50% : Hay un 50 % de atletas con [23,26> aos de edad y [67,76>Kg. de peso.

You might also like