Professional Documents
Culture Documents
Resuelve
Pgina 337
Relacin funcional y relacin estadstica
En cada uno de los siguientes casos debes decir si, entre las dos variables que se citan, hay relacin
funcional o relacin estadstica (correlacin) y, en este ltimo caso, indicar si es positiva o negativa:
a) En un conjunto de familias:
Estatura media de los padres - Estatura media de los hijos
b) Entre los pases del mundo respecto a Espaa:
Volumen de exportacin - Volumen de importacin
c) En los pases del mundo:
Tasa de mortalidad infantil - Mdicos por cada 1000 habitantes
d) En las viviendas de una ciudad:
kWh consumidos durante enero - Coste del recibo de la luz
Nmero de personas en cada casa - Coste del recibo de la luz
e) En los equipos de ftbol:
Posicin al finalizar la liga - Nmero de partidos perdidos
Posicin al finalizar la liga - Nmero de partidos ganados
a) Estadstica, porque la estatura media de los padres no nos permite saber exactamente la estatura media
de los hijos. Hay correlacin positiva. Normalmente, los hijos de padres altos son altos.
b) Estadstica, porque el volumen de exportacin no nos permite saber exactamente el volumen de impor-
tacin. Hay correlacin negativa. Normalmente, los pases que exportan mucho, importan poco.
c) Estadstica, porque la tasa de mortalidad infantil no nos permite saber exactamente el nmero de mdi-
cos por cada 1000 habitantes. Hay correlacin negativa. Normalmente, los pases que tienen una tasa
de mortalidad infantil grande, tienen pocos mdicos por cada 1000 habitantes.
d) kWh consumidos durante enero - Coste del recibo de la luz 8 Funcional; si conocemos los kWh consumi-
dos durante enero, podemos calcular el coste del recibo de la luz.
Nmero de personas en cada casa - Coste del recibo de la luz 8 Estadstica, porque el nmero de personas
en cada casa no nos permite saber exactamente el coste del recibo de la luz. Hay correlacin positiva.
Normalmente, cuantas ms personas hay en una casa, ms luz se consume.
e) Posicin al finalizar la liga - Nmero de partidos perdidos 8 Estadstica, porque la posicin al finalizar la
liga no nos permite saber exactamente el nmero de partidos perdidos. Hay correlacin negativa. Nor-
malmente, cuanto ms alta es la posicin en la liga, menos partidos se han perdido.
Posicin al finalizar la liga - Nmero de partidos ganados 8 Estadstica, porque la posicin al finalizar la
liga no nos permite saber exactamente el nmero de partidos ganados. Hay correlacin positiva. Nor-
malmente, cuanto ms alta es la posicin en la liga, ms partidos se han ganado.
1
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
180
170
160 ESTATURA
PADRES
160 170 180 190
a) Guillermo y Gabriel estn representados mediante los puntos (160, 175) y (160; 177,5).
2
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
1 Verdadero o falso?
a) En una distribucin bidimensional, para cada valor de x solo puede haber un valor de y.
b) Cuantos ms puntos tenga una distribucin bidimensional, ms fuerte es su correlacin.
c) Las series temporales son distribuciones estadsticas en las que una de las variables es el tiempo.
Aunque no sean distribuciones bidimensionales propiamente dichas, pueden tratarse del mis-
mo modo que estas.
a) Falso, se pueden mirar las nubes de puntos de esta misma pgina.
b) Falso, la correlacin depende de la relacin entre las caractersticas que se estudian en una poblacin,
no del nmero de elementos de la poblacin.
c) Verdadero.
3
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
2 Correlacin lineal
Pgina 341
1 Verdadero o falso?
a) Cuanto ms prximos estn a una recta los puntos de una distribucin bidimensional, ms
fuerte es su correlacin lineal.
b) Si la recta de regresin tiene pendiente negativa, la correlacin lineal es negativa.
c) Si los puntos de la nube no se aproximan a ninguna recta, entonces las variables estn incorre-
ladas.
a) Verdadero. Porque la correlacin estudia las distancias de los puntos a la recta de regresin. Cuanto
ms pequea es la distancia a la recta, mayor es la correlacin.
b) Verdadero. Una recta de pendiente negativa indica, como el signo del coeficiente de correlacin, que
al aumentar una variable, la otra disminuye.
c) Verdadero.
2 La siguiente tabla muestra cmo se ordenan entre s diez pases, A, B, C, segn dos variables,
R.P.C. (renta per cpita) e I.N. (ndice de natalidad). Representa los resultados en una nube de
puntos, traza la recta de regresin y di cmo te parece la correlacin.
pases A B C D E F G H I J
r.p.c. 1 2 3 4 5 6 7 8 9 10
i.n. 10 6 9 5 7 4 1 3 8 2
I.N.
10
R.P.C.
2 4 6 8 10 12
4
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
1 Verdadero o falso?
a) El signo de la correlacin (r) coincide con el de la covarianza (qxy).
b) Si cambiamos las unidades en que se expresa la variable x, entonces se modifican los valores de
x, qx , qxy y r.
c) Aunque cambiemos las unidades en que se da la variable x (o la y, o ambas) el valor de la co-
rrelacin, r, no se modifica.
q xy
a) Verdadero, r = ; como qx y qy son positivas, el signo de r es el de qxy.
qx q y
b) Falso. Varan todos los parmetros menos r, porque r es el nico que no tiene dimensiones.
c) Verdadero.
2 Obtn mediante clculos manuales los coeficientes de correlacin de las distribuciones con las que
hemos trabajado en el epgrafe anterior:
Salto de altura - Salto con prtiga
Salto de altura - 1500 m lisos
Salto de altura - Lanzamiento de peso
Hazlo tambin con una calculadora con modo lr.
a) x: salto de altura
y: salto con prtiga
Elaboramos la tabla como en el ejercicio resuelto:
b) x: salto de altura
y: 1500 m lisos
5
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
c) x: salto de altura
y: lanzamiento de peso
6
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
4 Recta de regresin
Pgina 345
1 Verdadero o falso?
a) Cuanto ms fuerte sea la correlacin, ms puntos habr de la nube que se encuentren exacta-
mente sobre la recta de regresin.
b) Cuanto ms fuerte sea la correlacin, ms cerca de la recta de regresin estarn los puntos de la
nube.
c) Cuanto ms fuerte sea la correlacin, ms fiables sern las estimaciones hechas a partir de la
recta de regresin.
a) Verdadero. Como r es muy grande, la distancia de los puntos a la recta es muy pequea o nula.
b) Falso. Habr muchos puntos cerca de la recta, pero puede haber puntos aislados lejos de la recta.
c) Verdadero. Los valores de una de las variables son ms predecibles, puesto que estn muy prximos a
la recta de regresin.
7
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
1 Verdadero o falso?
a) En una distribucin bidimensional en la que se estudien conjuntamente las estaturas (x) y los
pesos (y) de un grupo de jvenes en la cual x = 170 cm e y = 65 kg, es imposible que las rectas
de regresin sean y = 0,8x 67 e y= 1,1x 121.
b) Si en una distribucin bidimensional es x = 3 e y=5, entonces es posible que las rectas de
regresin sean y=2x 1 e y = x + 8, pues ambas se cortan en (3,5).
El punto de corte de las rectas de regresin debe ser (x, y) = (170, 65), luego es verdadera la afirma-
cin.
b) Verdadero, por el razonamiento anterior.
c) Verdadero. Se puede observar en las grficas de esta pgina.
8
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
6 Tablas de contingencia
Pgina 347
1 Calcula la media y la desviacin tpica de la distribucin marginal de la x. Para ello, asigna a cada
intervalo de edades su marca de clase (punto medio) y al ltimo intervalo asgnale el valor 75.
xi fi xi fi xi2 xi2 fi
21,5 50 1075,0 462,25 23112,50
30,5 85 2592,5 930,25 79071,25
43,0 140 6020,0 1849,00 258860,00
58,0 100 5800,0 3364,00 336400,00
75,0 125 9375,0 5625,00 703125,00
500 24862,5 1400568,75
24 862, 5
x = = 49,725
500
1 400 568, 75
qx = 49, 725 2 = 18,126
500
2 La distribucin marginal de la y corresponde a una variable cualitativa. Por tanto, no tiene media
ni desviacin tpica. El nico parmetro que podemos asignarle es la moda. Cul es?
Moda = Deportes.
Pgina 348
xi fi xi fi xi2 xi2 fi
21,5 9 193,5 462,25 4160,25
30,5 21 640,5 930,25 19535,25
43,0 36 1548,0 1849,00 66564,00
58,0 26 1508,0 3364,00 87464,00
75,0 46 3450,0 5625,00 258750,00
138 7340,0 436473,50
9
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
yi fi
inf 10
doc 20
ent 20
dep 54
pel 26
otr 5
5 Comprueba, calculando las frecuencias relativas, que el suceso pel no es independiente de la edad.
xi 21,5 30,5 43 58 75
pel 11 15 20 16 11 73
0,15068493 0,20547945 0,2739726 0,21917808 0,15068493
6 Haz la distribucin de x condicionada a no deporte y compara sus frecuencias relativas con las
de la distribucin marginal de la x.
xi 21,5 30,5 43 58 75
no dep 61 105 166 119 138 589
xi fi xi fi xi2 xi2 fi
21,5 61 1311,5 462,25 28197,25
30,5 105 3202,5 930,25 97676,25
43,0 166 7138,0 1849,00 306934,00
58,0 119 6902,0 3364,00 400316,00
75,0 138 10350,0 5625,00 776250,00
589 28904,0 1609373,50
1 609 373, 5
qx = 40, 073 2 = 28,471
500
La media es similar; sin embargo, la desviacin tpica es mayor si consideramos los datos de las personas
que no ven deportes.
10
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
Pgina 350
xi
yi 0 1 2 3 4
7 Otro grupo de 154 personas han realizado los mismos tests, con los resul-
tados que se dan en la tabla de la derecha. Halla el coeficiente de correla- 0 17 22 6 4 1
cin. 1 15 14 8 2 0
2 13 6 10 5 1
De los datos obtenemos las siguientes tablas: 3 5 4 2 6 2
xi 4 3 1 0 3 4
yi 0 1 2 3 4
0 17 22 6 4 1 50
1 15 14 8 2 0 39
2 13 6 10 5 1 35
3 5 4 2 6 2 19
4 3 1 0 3 4 11
53 47 26 20 8 154
Distribucin marginal de la x:
xi fi xi fi xi2 xi2 fi
0 53 0 0 0
1 47 47 1 47
2 26 52 4 104
3 20 60 9 180
4 8 32 16 128
154 191 459
x = 194 = 1, 26
154
Distribucin marginal de la y:
yi fi yi fi yi2 yi2 fi
0 50 0 0 0
1 39 39 1 39
2 35 70 4 140
3 19 57 9 171
4 11 44 16 176
154 210 526
y = 210 = 15 = 1, 36
154 11
0, 99
r= = 0, 67
1, 25 1, 18
11
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
E F Mr Ab My Jn Jl Ag S O N D
horas de sol 216 251 271 300 335 329 377 321 244 225 159 194
temperatura media 12,2 10,8 14,5 15,6 20,4 24,1 25,8 26,7 23,7 19,3 16,4 13,5
a) Es una distribucin bidimensional en la que se relacionan las variables x: horas de sol e y: temperatura
media en Almera, correspondientes a un ao.
b) TEMPERATURA MEDIA
35
30
25
20
15
10
5
HORAS DE SOL
nota 3 4 5 6 6 7 7 8 8 9
nota del ao pasado 4 2 6 6 8 5 6 9 7 10
cociente intelectual 120 102 118 105 95 110 103 107 115 125
a) x: Nota
y: Nota del ao pasado
NOTA DEL AO PASADO
11
10
9
8
7
6
5
4
3
2
1
NOTA
1 2 3 4 5 6 7 8 9 10
Hay una correlacin positiva bastante fuerte.
12
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
b) x: Nota
y: Cociente intelectual
COCIENTE INTELECTUAL
225
200
175
150
125
100
75
50
25
NOTA
1 2 3 4 5 6 7 8 9 10
Hay una correlacin positiva bastante fuerte.
13
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
b) ^
y(5,5) = 7,1(5,5 3,5) + 28,5 = 42,7
c) ^
x(20) 8 20 28,5 = 7,47(x 3,5) 8 y = 2,36
20, 75
r= = 0,97
1, 71 12, 45
14
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
yi fi yi fi yi2 yi2 fi
20 4 80 400 1600
35 5 175 1225 6125
60 6 360 3600 21600
15 615 29325
y = 615 = 41
15
qy = 29 325 41 2 = 16,55
15
Sx y f = 6825
qxy = 6 825 9,5 41 = 65,5
15
65, 5
r= = 0,81
4, 85 16, 55
65, 5
c) myx = = 2,78
4, 85 2
Recta de regresin de Y sobre X
y 41 = 2,78(x 9,5)
d) ^
y(18) = 2,78(18 9,5) = 64,63
15
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
Para practicar
Sin frmulas
1 Para cada uno de los siguientes casos, indica:
Cules son las variables que se relacionan.
Si se trata de una relacin funcional o de una relacin estadstica y, en este ltimo caso, deter-
mina el signo de la correlacin.
a) Renta mensual de una familia - Gasto mensual en electricidad
b) Radio de una esfera - Volumen de esta
c) Litros de lluvia recogidos en una ciudad - Tiempo dedicado a ver la televisin por sus habitantes
d) Longitud del trayecto recorrido en una lnea de cercanas - Precio del billete
e) Peso de los alumnos de 1. de Bachillerato - Nmero de calzado que usan
f ) Toneladas de tomate recogidas en una cosecha - Precio del kilo de tomate en el mercado
g) Superficie de una vivienda - Valor de la misma
a) Renta (), gasto ().
Correlacin positiva.
b) Relacin funcional.
c) Relacin estadstica. Seguramente muy dbil. Positiva (cabe pensar que cuanto ms llueva ms tiem-
po pasarn en casa y, por tanto, ms vern la televisin?).
d) Aunque lo parezca a priori, seguramente la relacin no es funcional. Es una correlacin positiva fuerte.
e) Correlacin positiva.
f ) Correlacin negativa (cuanto mayor sea la cosecha, ms baratos estarn los tomates).
g) Correlacin positiva.
2 a) Copia en tu cuaderno y traza a ojo una recta de regresin para cada una de estas distribuciones
bidimensionales:
A B C D
10 10 10 10
5 5 5 5
5 10 5 10 5 10 5 10
b) Cules de ellas tienen correlacin positiva y cules tienen correlacin negativa?
c) Sin hacer clculos, elige, de entre los siguientes valores, la correlacin de cada una de las dis-
tribuciones:
0 0,64 1 0,98 0,95 1 0,76
d) Una de ellas presenta relacin funcional, cul? Da la expresin analtica de la funcin que
relaciona las dos variables.
16
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
a) A 10 B 10
5 5
5 10 5 10
C 10 D 10
5 5
5 10 5 10
b) B y C tienen correlacin positiva; A y D, negativa.
c) A 8 1; B 8 0,95; C 8 0,64; D 8 0,76
d) La A es relacin funcional: y = 12 2x.
3 Cada una de estas seis distribuciones bidimensionales est representada por sus dos rectas de
regresin:
I II III
IV V VI
17
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
4 Representa la nube de puntos de esta distribucin y estima cul de estos tres puede ser el coefi-
ciente de correlacin:
a) r = 0,98 b) r = 0,87 c) r = 0,58
x 0 1 2 3 3 4 5 6 7 8 9
y 1 4 6 2 4 8 6 5 3 6 9
Y
9
2 4 6 8 9 X
c) r = 0,58
2 4 6 8 X
5 5 5
5 10 5 10 5 10
18
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
xi 158 162 164 165 168 169 172 172 174 178
yi 163 155 160 161 164 158 175 169 166 172
180
170
160
150
Pgina 355
Con frmulas
x 0 1 2 3 4 4 5 6 7 8 9 10
y 0 2 2 4 3 6 4 5 7 7 9 10
Halla:
a) x, y, x, y, xy.
b) El coeficiente de correlacin, r. Interprtalo.
c) Las ecuaciones de las dos rectas de regresin.
n = 12, Sx = 59, Sy = 59
a) x = 4,92 y = 4,92
19
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
x 0 1 2 3 3 4 5 6 7 8 9
y 1 4 6 2 4 8 6 5 3 6 9
a) Representada en el ejercicio 4.
b) Se comprueba.
Y X sobre Y
9
Y sobre X
5 9 X
10 Una distribucin bidimensional en la que los valores de x son 12, 15, 17, 21, 22 y 25, tiene una
correlacin r = 0,99 y su recta de regresin es y = 10,5 + 3,2x.
a) Calcula ^
y (13), ^
y (20), ^
y (30), ^
y (100).
b) Cules de las estimaciones anteriores son fiables, cul poco fiable y cul no se debe hacer?
c) Expresa los resultados en trminos adecuados.
Por ejemplo:
^
y (13) = 52,1. Para x = 13 es muy probable que el valor correspondiente de y sea prximo
a 52.
a) ^
y(13) = 52,1; ^
y(20) = 74,5; ^
y(30) = 106,5; ^
y(100) = 330,5
b) ^
y(13) e ^
y(20) son estimaciones fiables, ^
y(30) es poco fiable e ^
y(100) es una estimacin nada fiable.
c) Son fiables ^y(13) e ^y(20), porque 13 y 20 estn en el intervalo de valores utilizados para obtener
la recta de regresin.
^
y(30) es menos fiable, pues 30 est fuera del intervalo, aunque cerca de l.
^
y(100) es una estimacin nada fiable, pues 100 est muy lejos del intervalo [12,25].
20
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
a)
x 1 2 3 4 4 5 6 7 8 9
y 5 8 7 6 9 4 5 2 3 1
b) n = 10 Sx = 49 x = 49 = 4,9
19
Sy = 50 y = 50 = 5
10
Y
10
5 10 X
d) ^
y(4,5) = 5,56
^
y(11) = 3,04
^
y(20) = 14,95
Como r = 0,76, la estimacin para 4,5 la podemos considerar fiable, pero las de 11 y 20, que no
estn en el intervalo de datos, no se pueden considerar muy fiables.
21
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
12 Calcula las correlaciones correspondientes a las nubes de puntos que inventaste en el ejercicio 6.
Comprueba si las correlaciones obtenidas se parecen a las que pretendas alcanzar.
a) r = 0,97
b) r = 0,64
c) r = 0,25
Para resolver
13 La siguiente tabla recoge los datos econmicos de algunas de las pelculas ms rentables de un
ao (las cantidades estn dadas en millones de euros):
x: gastos 18 15 20 11 10 6 6 14 16 12
y: recaudacin 93 83 80 47 46 44 36 34 33 26
Halla el coeficiente de correlacin y la recta de regresin para la distribucin x-y y para la dis-
tribucin x-z y analiza los resultados.
x: altura del lugar (en m)
y: presin atmosfrica (en mm Hg)
r = 0,99
Recta de regresin: y = 0,08x + 759
Hay casi una relacin funcional entre la altura de un lugar y su presin atmosfrica. Adems, cuan-
do aumenta la altura, disminuye la presin.
x: altura del lugar (en m)
z: nmero de pulsaciones en reposo
r = 0,85
Recta de regresin: y = 6,87x + 74,8
Hay una correlacin fuerte entre la altura de un lugar y el nmero de pulsaciones, en reposo, de una
persona. Adems, cuando aumenta la altura, aumentan las pulsaciones en reposo.
22
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
15 En la siguiente tabla se consignan los goles a favor (x) y los goles en contra (y) al final del
campeonato de liga de 1. divisin de ftbol de 10 equipos:
x 95 102 64 54 62 60 62 46 45 35 54 41
y 21 33 44 44 61 55 53 55 46 42 68 56
Halla el coeficiente de correlacin entre las dos variables y analiza lo que has obtenido.
x: goles a favor
y: goles en contra
r = 0,61
r es negativo, luego cuantos ms goles a favor tiene un equipo, menos goles en contra tiene. La co-
rrelacin no es muy fuerte, por lo que no es demasiado fiable estimar los goles en contra sabiendo los
goles a favor.
elemento K Ca Ti V Mn Fe Co Ni
n. atmico 19 20 22 23 25 26 27 28
densidad 0,86 1,54 4,50 5,60 7,11 7,88 8,70 8,80
a) DENSIDAD
9
8
7
6
5
4
3
2
1
N. ATMICO
19 21 23 25 27
r = 0,98
y = 16,5 + 0,93x
b) ^
y(24) = 5,86
La densidad del cromo se estima en, aproximadamente, 5,86. Su valor real es 7,1.
c) ^
y(21) = 3,06
La densidad del escandio se estima en, aproximadamente, 3,01. Su valor real es 2,9.
23
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
Pgina 356
18 La siguiente tabla recoge datos de ocho alumnos de secundaria de un centro escolar, relativos al
nmero de horas por da que ven la televisin y la nota media obtenida en la ltima evaluacin:
x: n. de horas de tv 0 2 1 3 4 2 1 3
y: nota media 8 6 8 6 1 4 7 3
a) Representa grficamente los datos. Permite el anlisis grfico deducir el signo del coeficiente
de correlacin de Y sobre X? Y el de X sobre Y?
b) Halla el coeficiente de correlacin de las dos variables.
c) Calcula la ecuacin de la recta de regresin de Y sobre X.
d) Qu nota media puede esperar quien ve la televisin tres horas y media diarias? Y quien la
ve cinco horas?
a)
Y Los dos signos son negativos; es decir, si aumentan las horas por da
8 que ven la televisin, disminuye la nota media obtenida en la ltima
7 evaluacin.
6
5
4
3
2
1
1 2 3 4 X
b) r = 0,87 8 correlacin fuerte
c) Recta de regresin de Y sobre X: y = 1,67x + 8,70
d) ^
y(3,5) = 1,67 3,5 + 8,70 = 2,86
^
y(5) = 1,67 5 + 8,70 = 0,35
Si ve la televisin tres horas y media diarias, cabe esperar que saque un 2,86.
Si ve la televisin cinco horas, cabe esperar que saque un 0,35.
24
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
19 Elegimos seis automviles al azar. Su antigedad, en aos, y el nmero de kilmetros que han
rodado, en miles de kilmetros, estn relacionados por la siguiente tabla:
antigedad 1 2 4 4 5 6 7
kilmetros recorridos 15 45 32 61 60 132 93
Cuestiones tericas
20 El coeficiente de correlacin de una distribucin bidimensional es 0,87.
Si los valores de las variables se multiplican por 10, cul ser el coeficiente de correlacin de
esta nueva distribucin?
El mismo, puesto que r no depende de las unidades; es adimensional.
23 Qu condicin debe cumplir r para que las estimaciones hechas con la recta de regresin sean
fiables?
|r| debe estar prximo a 1.
24 Prueba que el producto de los coeficientes de regresin es igual al cuadrado del coeficiente de
correlacin.
2
=f p = r2
q xy q xy q xy
q 2x q 2y qx q y
25 Explica cmo se calculan x e y a partir de las dos rectas de regresin de una distribucin bidi-
mensional. Aplcalo a este caso:
La recta de regresin de Y sobre X es: y = 8,7 0,76x
La recta de regresin de X sobre Y es: y = 11,36 1,3x
(x, y) son las coordenadas del punto de interseccin de las dos rectas de regresin.
* 4 8 x = 4,9259; y = 4,9563
y = 8, 7 0, 76x x = 4, 9259
y = 11, 36 1, 3x y = 4, 9563
26 Explica cmo se halla el coeficiente de correlacin a partir de las dos rectas de regresin de una
distribucin bidimensional. Aplcalo al caso del ejercicio anterior.
q xy
r=
qx q y
q xy q xy q 2xy
myx 1 = 2 2 = 2 2 = r2
m xy qx qy qx q y
Luego r = m yx 1
m xy
En el ejercicio anterior:
myx = 0,76; mxy = 1,3
r = 0, 76 1 = 0,7646
1, 3
27 La estatura media de 100 escolares es de 155 cm con una desviacin tpica de 15,5 cm.
La recta de regresin de la estatura respecto al peso es y=80 + 1,5x (x: peso; y: estatura)
a) Cul es el peso medio de esos escolares?
b) Cul es el signo del coeficiente de correlacin entre peso y estatura?
a) La recta de regresin pasa por (x, y), luego el peso medio ser la solucin de la ecuacin:
y = 80 + 1,5x 8 155 = 80 + 1,5x 8 x = 50 kg
b) El signo del coeficiente de correlacin entre peso y estatura es el mismo que el de la pendiente de la
recta de regresin, luego es positivo.
26
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
28 Verdadero o falso?
a) Si la pendiente de la recta de regresin de Y sobre X es 1, la correlacin entre las dos varia-
bles es muy fuerte.
b) Si la pendiente de la recta de regresin de Y sobre X es negativa, la pendiente de la recta de
regresin de X sobre Y tambin es negativa.
c) En una relacin funcional lineal las dos rectas de regresin coinciden.
d) Cuanto ms fuerte sea la correlacin entre las variables x e y, mayor es r2.
a) Falso. Si la pendiente de la recta de regresin de Y sobre X es 1, sabemos que la covarianza es igual
a la varianza de x, pero no que r est prximo a 1.
b) Verdadero, porque myx 1 = r2 > 0
m xy
El producto es un nmero positivo, luego las dos pendientes tienen que tener el mismo signo.
Pgina 357
Para profundizar
29 En una autoescuela, cada alumno realiza un total de 80 tests repartidos en 4 tandas de 20. La
siguiente tabla relaciona las variables nmero de la tanda (x) y nmero de fallos (y):
y
x 0-3 4-7 8 - 11 12 - 15
1 0 4 11 5
2 1 10 7 2
3 12 7 1 0
4 16 4 0 0
2 1 10 7 2 20
3 12 7 1 0 20
4 16 4 0 0 20
29 25 19 7 80
27
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
xi fi xi fi xi2 xi2 fi
1 20 20 1 20
2 20 40 4 80
3 20 60 9 180
4 20 80 16 320
80 200 600
x = 200 = 5 = 2, 5
80 2
qx = 600 2, 5 2 = 1,12
80
yi fi yi fi yi2 yi2 fi
1,5 29 43,5 2,25 65,25
5,5 25 137,5 30,25 756,25
9,5 19 180,5 90,25 1714,75
13,5 7 94,5 182,25 1275,75
80 456,5 3812,50
y = 456 = 57 = 5,7
80 10
qy = 3 812 5, 7 2 = 3,89
80
Sx y f = 876
28
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
30 En un estudio realizado a los trabajadores de una cadena de fabricacin de piezas de coches sobre
su productividad quincenal, se relacionan las horas trabajadas (x) con las unidades producidas
(y).
Sabemos que:
La recta de regresin de Y sobre X es:
y = 3,47x + 32,01
La recta de regresin de X sobre Y es:
y = 3,81x + 5,36
El intervalo de horas empleadas por los trabajadores es [60, 85].
a) Halla x, y y el coeficiente de correlacin.
b) Si un operario trabaja 70 horas en una quincena, cuntas unidades se estima que produzca?
Cmo de fiable es esta estimacin? Y si trabaja en total 40 horas? Y si fueran 120horas?
c) Si un empleado esta quincena ha llegado a producir 300piezas, cuntas horas se estima que
ha trabajado?
a) (x, y) es el punto de corte de las dos rectas de regresin:
* 4 8 x = 78,38; y = 304
y = 3, 47x + 32, 01
y = 3, 81x + 5, 36
m yx 3, 47
r2 = = = 0,91 8 r = 0, 91 = 0,95394
m xy 3, 81
b) ^
y(70) = 3,47 70 + 32,01 = 274,91
Se estima que el operario produzca unas 275 unidades trabajando 70 horas.
Como r es muy prximo a 1 y, adems, 70 est en el intervalo de horas empleadas, la estimacin
es muy fiable.
^
y(40) = 3,47 40 + 32,01 = 170,81
Se estima que el operario produzca casi 171 unidades trabajando 40 horas. Esta estimacin no es
tan fiable como la anterior porque 40 [60, 85].
^
y(120) = 3,47 120 + 32,01 = 448,41
Se estima que el operario produzca alrededor de 448 unidades trabajando 120 horas. Esta estima-
cin no es muy fiable porque 120 [60, 85].
c) 300 = 3,81x + 5,36 8 x = 77,33
Se estima que ha trabajado entre 77 y 78 horas.
29
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
Autoevaluacin
Pgina 357
x 1 2 2 3 4 6 7 8 8 9
y 2 4 3 4 6 5 8 9 10 9
10
5 10
a) x = 5, y = 6
qx = 2,8; qy = 2,7; qxy = 7,1
b) r = 0,95
c) y = 0,91x + 1,45
d) ^
y(5) = 6; ^
y(10) = 10,55
Las estimaciones son muy fiables porque r = 0,95 es un valor muy alto. Si se tratase de "notas" (de
0 a 10), la segunda estimacin habra que "hacerla real" y darle el valor 10.
30
Unidad 13. Distribuciones bidimensionales BACHILLERATO
Matemticas I
4 El consumo mensual de energa per cpita, y, en miles de kWh, y la renta per cpita, x, en miles
de euros, de seis pases son:
A B C D E F
x 11,1 8,5 11,3 4,5 9,9 6,5
y 5,7 5,0 5,1 2,7 4,6 3,1
31