Professional Documents
Culture Documents
MEDIDAS
DE
CORRELACION
I I
l
INTRODUCCION
II l',tc
I 'J
.111Lcs
El COEFICIENTE DE CORRELACION
PRODUCTO-MOMENTO
DE PEARSON
109
Ml.101)0$
110
ES1Al)ISIICOS
Af'Ll(Al)m
' 111
N( IM1 ,;QCIAI IS
promedio de empleo de los profesores en una escuela con el sahn io promedio que
reciben? Evidentemente, para responder a taJes preguntas debemos observar cada
variable dentro de un grupo de unidades (tpicamente, personas, aunque puede
tambin tratarse de clases, escuelas, condados, etc.). Para responder a esta clase
de preguntas, podran obtenerse datos como los siguientes:
Estudiante
nmero
C/ en el
Stanford-Binet (X)
120
112
110
120
103
126
2
3
Puntuacin bruta en
una prueba de rendimiento
en Qumica ( Y)
31
2S
19
24
17
28
18
20
16
IS
27
19
113
114
8
9
10
11
12
106
108
128
109
Las variables observadas sobre doce estudiantes eran, en este caso, los CI,
determinados por la escala de inteligencia de Stanford-Binet, aplicada en quinto
de elementaJ y el rendimiento en qumica de primero de secundaria, medido por
una prueba de 35 tems construida por el profesor. En un diagrama de dispersin
30
20
~lbo
105
do
111
I ACION
clc describirse grficamente la relacin entre estas dos variables, tal como se
11111r.,1 rn en la Fig, 7. l.
t-n el diagrama de dispersin, cada unidad se representa por un punto. Por
1 ,hh
individuo. se coloca una marca o punto en el lugar de interseccin de las
11111" trazadas a partir de la puntuacin del CI, perpendicular aJ eje de las X, y
II pu 11 ir de la puntuacin en qumica, perpendicular aJ eje de las Y. El diagrama
,h 1li-.pcrsin de la Fig. 7.1 muestra una relacin moderadamente positiva entre
\ y I'. Sin embargo, por el momento, carecemos de una medida precisa para estas
h1l rones.
H problema generaJ de relacin debe tener un significado algo ms preciso.
1,11 ejemplo, tiene que ver la puntuacin obtenida por alguien en X, con su puntu,1116n en Y, o no existe un apareamiento sistemtico entre puntuaciones aJtas
" h11J:tS'!
1-11 trminos de las medidas de ambas distribuciones de puntuaciones tanto
,11 1 como en X, la posicin de un individuo respecto de la de los dems, se refleja
t>H l'I tamao y en los signos aJgebraicos de las puntuaciones de desviacin (X1 - X.)
t ( 11 - Y.). Si un sujeto obtiene puntuaciones altas en ambas variables, como
,1 ,. tudiante nmero 11 del ejemplo citado, el producto (X1 - X.) y (Y, - Y.)
1111\ alto y positivo. Pero tambin debe estudiarse el caso de que alguien obtenga
e1111111aciones bajas, tanto en X como en Y. Entonces, la relacin tambin ser
ll,1 y positiva (puesto que el producto de dos nmeros negativos es positivo). Si X y
1 .e relacionan sustancialmente de modo directo (es decir, que las puntuaciones
1111,,, estn apareadas con las altas y las bajas con tas bajas), la mayora de los pro1l1111os (X1 - X.)(Y1 - Y.) sern positivos; en consecuencia, la suma de tales
11111
111,1ductos
111111 y positiva.
i-i
Si X y Y muestran entre s una relacin inversa (una puntuacin alta en X, apa1111da con una baja en Y o viceversa), muchos sujetos con puntuaciones positivas
1 \1
X.) obtendrn puntuaciones negativas ( Y1 - f.) y, a su vez, puntuaciones
11q111ivas (X1 - X.) tendern a aparearse con puntuaciones positivas ( Y1 - Y.).
111 este caso, los productos (X1 - X.)(Y1 - Y.) generalmente sern negativos y,
"' consecuencia,
(X1 - X.)(Y1 - Y.)
Si X y Y mantienen entre si una relacin sistemtica (es decir, que las puntua-
mi.. mo para puntuaciones bajas en X), tendremos entonces, que de los individuos
- X.), algunos tendrn puntat111ncs positivas ( Y1 - f.) y otros puntuaciones negativas ( Y1 - f.). Cuando se
1111 man los productos (X1 - X.)( Y1 - f.), algunos sern positivos y otros negaItvos. La suma de los productos,
115
'~
ser
1-1
<.'ORRI
I"
25
MI 1111 lA~ UI
125
FIG. 7.1
Diagrama de dispersin que muestra la relacin entre el CI (X)
con el rcudirnieruo en qumica ( Y) de 12 estudiantes.
I"
1-1
(X1 - X.)( Y1 -
Y.),
112
Ml101>0S
h:.IAl)ISI
1{'0
Al'LI
..
negativos y
113
hunente se necesita dividir sx, por Sx y s,. y el resultado ser la relacin entre X y Y.
"1 conoce como coeficiente de correlacin producto-momento de Pearson y se de1111111 por
'x,:
,-1
X y Y se relacionan estrechamente, que es prxima a O cuando X y Y no se relacionan y que es alta y negativa cuando X y Y se relacionan inversamente. Sin em-
s;
I" (X, -
,-1
La cantidad
I" (X, -
Y.) por n - 1.
X.)(Y, -
X.)(Y, -
1-1
"
I(X,
- X.XY, ,-1
s.,,=
n-1
(7.2)
La designacin r viene de la palabra regresin. Sus primeras aplicaciones hechas
Francis Galton y Karl Pearson (1857-1936) mostraron el importante papel
,,1,c desempea este coeficiente en el estudio de la asociacin de caractersticas
11~1ctts humanas, estudio que por primera vez mostr la naturaleza regresiva de
111 medidas fisicas entre una generacin y la siguiente. Aunque Pearson desem111 M el papel ms importante al establecer las propiedades matemticas de '" ,
111 nocin de un coeficiente iguaJ a s,,,f(s,,s,) puede encontrarse ya en los escritts
,1, Galton, as como en un artculo publicado en 1846 por el francs Bravais.
1111
l,3
FORMULA PARA
CALCULO DE rxy
1 ,1 lc. (7.2) se basa en una definicin y no es conveniente para calcular el '"Y' A con1111111,cio derivaremos una frmula ms adecuada para cmputos mecnicos, dis1'1111cndo de los totales directos de X y Y. Principiemos con
Y)
(7.1)
s.,s,,
I" (X,
EL
Ji
.f.)1/(n -
(X, -
1-1
l)JI (Y, -
(7.3)
Y.)8/(n - 1)
1-1
X)(X, - X)
_
n-1
La covarianza constituye una excelente medida para muchos problemas de
ciencias fisicas y de ingeniera (de hecho, los fisicos llaman aJ respetable coeficiente
de correlacin de las ciencias de la conducta. covarianza adimensional) y es
tambin una medida adecuada, siempre y cuando la escala (media y varianza)
de las variables no sea arbitraria y tenga algn significado, puesto que muchas
de las variables que tratamos estn medidas en e calas arbitrarias: la media y la
varianza pueden asumir cualquier valor puesto que, generalmente, solamente nos
interesa las posiciones relativas en un grupo y esto es particularmente cierto para
los datos de pruebas psicolgicas y educacionales.
Al desviar las puntuaciones X y Y respecto de sus media . se independiza
de los promedio de las puntuaciones. Para que la medida de relacin deseada
sea independiente de la desviacin tpica de ambos grupo de puntuaciones. so-
s,.,
I" ex, -
1-1
x.xr1 - Y.>
(7.4)
l (X,
,-1
"
.f.XY, - Y.)=
IX1Y, - x.I,-1
,-1
"
"
Y, - Y.
ne.
I, . . 1 x, + n.f.Y..
n
(7.5)
MHOl)OS
114
LS1
DISTl('OS
ft
nX.Y..
(7.6)
115
MI IIIIMS DE CORRPLACION
=1
Si se remplaza
IUIA 7.1
Tanto la Ec, (7.6) como la (7.7) constituyen una sencilla frmula para expresar
el numerador de rx,, cuyo denominador puede computarse por un mtodo ya conocido
L (X; -
X.)'I. =
L x: - ( X,)2.
(7.8)
(7.9)
Si se combinan las Ecs. (7.7), (7.8) y (7.9) se obtiene la siguiente frmula para rx,,
})2/n)
(7.10)
X
y
Razonamiento
Razonamiento
abstracto
l 1111dw11e
I inda J.
19
32
33
l'cggy Y.
l>canc L.
Constan.ce L.
WllliamP.
ltoger D.
Curoline E.
frudy R.
44
28
35
39
39
Peter A.
44
44
l)avid E.
( hcryl G.
Oeorgia S.
I rma J.
24
37
29
Ronald L.
40
l'nmcla J.
I dward B.
Rosa L.
Knrcn M.
ltogcr W.
Richard T.
42
32
48
43
33
47
terbal
17
7
17
28
27
31
20
17
35
43
10
28
13
43
45
24
45
26
16
26
Razonamiento Razonamiento
Estudiante
abstracto
verbal
Martn T.
Sharon L.
Julie E.
Natalie J.
Maryjcan K.
Larry N.
Mchael B.
Carleen M.
Scott C.
Sigrid K.
Jan W.
Roger B.
Richard H.
Bonita G.
RexN.
Richard S.
MauriceD.
Warren W.
Jack G.
Stanley L.
38
25
35
22
30
18
26
17
17
26
16
37
26
21
16
37
37
14
41
19
18
39
37
47
40
42
41
41
37
30
31
41
42
24
43
36
39
39
39
48
' llt"-carnos expresar nuestra gratitud al Dr. J. Thomas Hastiugs, director del lllinois Statcwidc Tcsting Program,
I"'' 11,,t~r permltldo la reproduccin de estos datos.
La Ec. (7.1 t) resulta ms conveniente que la (7.10) para hallar el r,.1 con calculadora en la cual sea posible efectuar multiplicaciones negativas. Entonces serai
posible calcular el numerador de la Ec. (7 .11) sin divisiones y sin escribir nmeros.
Esto tambin vale para los trminos entre parntesis del denominador de la Ec. (7 .11 ).
7.4
ILUSTRACION DEL
CALCULO DE r,,,
Part ilustrar los clculos de las Ecs. (7.10) y (7.11), se utilizarn algunos datos de
pruebas de aptitud. Supongamos que se investiga la relacin entre dos tipos de
aptitud de razonamiento entre estudiantes de primaria: razonamiento abstracto
y razonamiento verbal. Se construyen dos pruebas que miden razonamiento abs-
Fn la Tabla 7.2 aparecen los clculos intermedios y finales para hallar r,.y con
1 lrmulas (7.10) y (7.11), clculos que fueron realizados en calculadora. (En
"1'nciu de artefactos mecnicos, el clculo del coeficiente de correlacin producto11111111c11to generalmente es tedioso.) Probablemente la nica cantidad de la Tabla 7.2
111yo origen no queda del todo claro es
. 1-1
es la suma de todos
111 pruductos de las puntuaciones de X y Y de cada persona. En la Tabla 7.1, te11111111, que para el primer individuo, Linda J., X1 = 19 y Y1 = 17. Para la segun1111 nlumna, Peggy Y .. X2 = 32 y Y2 = 7. La cantidad
40
,_,LX, Y
MI
renos
1-!,IAl)ISIIC()S
P!!
-;;
:;
>
e.,
e..
..
e
o
N
a:
'l:.1, 1
1 1 1
20
I b
MARGEN
TABLA 7.3
DE VALORES
DE
rxy
Valor de
r~,
+l,00
1 1 1 1 1 1 1
Razonamiento
117
CORIU.l,ll{'ION
vunquc es dificil de probar, rx, no puede tomar nunca un valor menor de -1 ni mayor
ti, 1 1 . (Si la aparente dificultad de esta demostracin desmoraliza aJ estudiante, al
30
l)li
11111y fuerte y directa entre la aptitud de razonamiento verbal y abstracto, tal como
111 miden estas pruebas .
~11 llllMS
Descripcin de la
relacin lineal
Diagrama de
dispersin
40
abstracto
Aprox. +0.50
.
...
.
. . , .....
....
TABLA 7.2
ILUSTRACION OE LOS CALCULOS PARA OBTENER ,., A PARTIR OE LOS DATOS DE LA TABLA 7.1
La Ec. (7.10):
40.798 - (1465)(1057)/40
40
X,=
,.,=-:-:============================
v l55.72S - (1465) /401
1-1
'
xl-
55.725
i-l
40
X1 Y, =
,-1
: :
Aprox. -0.50
... ...
..
,I Y= 32.551
40.798
{32.SSI - (1057)1/40)
== 2085,375 = O 67.
3091,932
'
La Ec. (7.11):
40(40.798) - (1465)(1057)
-1.00
' - -::=====================
v'[40(55.72S) - (1465)'1
X {40(32.551) - (1057)11
83.415
123.761,128
1465
Relacin nula
(es decir. covarianza de X y Y
nula)
Clculos [lnales
Clculos intermedios
n =40
0.00
...
= O 67.
'
Los ltimos clculos de la derecha de la Tabla 7.2 muestran que r">' es 0,67 y,
a C'>IC resultado .... e llega bien sea por la Ec. (7.1 O) o (7.11 ). Sin lugar a error. ambas
16nnulas producirn siempre el mi ... 1110 valor. Asl, pues. parece existir una relacin
"""' z;
1
:_ z:
,, - 1
)'
L" (z. -
z,)', que
Iz~z.
r~,.,----.
(11 - 1)
1. 1rnhnj111 con
L (z. -l
z,)'.
MI 101)0\ l \l.'\l>l\11(.0\
111
''"
,11\ 11\11"
...
e ORIU I AC:..ION
Descripcin de cariabtes
y
Naturaleza de
los sujetos
Valor tpico
de r,,.,
Ms de 600 universitarios
0,58
CI en el Stanford-Binet
La misma prueba
administrada una
semana despus
Alumnos de escuelas
elementales
0.90
Aptitud en razonamiento
verbal. segn el DAT
Aptitud en razonamiento
no verbal
Alumnos de secundaria
0,65
Estatura
Rendimiento en sica de
universidad
Universitarios de semestres
terminales
0,00
7,8
Con un poco de experiencia en manejo de datos reales, se desarrolla una especie
de intuicin para detectar el grado de relacin indicado por un valor detenninado de r. Probablemente, el estudiante aprender a asociar un diagrama de dispersin de puntos con el correspondiente valor aproximado de r. No somos partidarios de aplicar adjetivos descriptivos a los valores que puede tomar r, como
llamar un r de 0,80 alto o un r de 0,20 bajo. El que un r determinado sea alto,
bajo o moderado, depende de cmo se han asociado en el pasado ambas variables al relacionarse, as como del empleo que se pretenda hacer de la relacin
entre las variables, etc. Adems, por qu usar un epteto tan ambiguo para una
relacin de r cuando es tan sencillo informar simplemente de su valor?
Erlenmeyer-Kimliog y Jarvik (1963) presentaron datos que constituyen ilustraciones muy explicativas sobre el uso de r. Encontraron valores tpicos de r en
estudios muy extensos, en los cuales se correlacionaron puntuaciones de pruebas
de inteligencia de nios con los de sus hermanos, parientes y nios no relacionados
con ellos. Por ejemplo, en un grupo numeroso de gemelos idnticos el valor tipico del coeficiente de correlacin entre el CI (X) de un nio y el de su gemelo idn-
Naturaleza de la relacin
0,88
0,75
0,53
0,53
0,49
0,46
0,52
0,19
0,16
EFECTO DE PUNTUACIONES
TRANSFORMADAS SOBRE EL rxy
frecuencia, la media y la varianza de las puntuaciones de X y Y son arbitraParece como si se pudieran cambiar a voluntad y sin consecuencias. Pero
1111onces, cabe preguntarse si el valor de r.,y depende de la media y varianza de X
t r La respuesta es no, y ya estaba implcita en nuestro desarrollo de la frmula
,.,. pero ahora deseamos hacerla ms clara y explcita.
La media y la varianza de X (o de Y) puede cambiarse a cualquier valor que
dr,ccmos, multiplicando X por una constante b diferente de cero y aadiendo
111111 constante al producto, es decir, formando la ecuacin bX + a. Este proceso
conoce como transformacin lineal de X. Supongamos ahora que tomamos
1111,1 (o la misma transformacin lineal de Y), dY + e, donde a -+ O. Seria el coelk tente de correlacin entre X y Y, en este caso, el mismo que entre el bX + a y
1111
111,~
,lt
t e?
Lu correlacin entre bX + a y dY + e es la varianza de ambos dividida por el
lbl
ldl
El tipo de relacin que mide '~, se discutir en el Cap. 8. Si se desea ampliar este punto. consullar la Sec. 7.7, sobre relaciones curvilnea entre X y Y del mismo capitulo.
SbX+o
= lbl S,.,
SdY+c
ldl s.,.
(7.12)
120
La covarianza de bX
+a
.2 [bX, + a n
S1&X+ellt1Y+c)
+e
y dY
I I
es
+ a)J[dY, + e -
(bX.
1-1
(dY.
n-1
..
1
bdsrv.
(7. 13)
'bX+e,dY+
bd
(7.14)
32
---r
aX+5,tY+3 -
lbl ldl
bX
b
b
b
b
es
es
es
es
Y Y SOBRE EL
VALOR OE r117 (CASOS ESPECIAUS OE LA EC. (7.14))
+a
positivo
negativo
positivo
negativo
dY
d
d
d
d
es
es
es
es
+e
positivo
positivo
negativo
negativo
.a.,l'l
TABLA 7.1
Causacin y correlacin
X.Xl - Y.)
n -
n-1
INTERPRETACION
DE LOS
COEFICIENTES
DE CORRELACION
bd .2 (X, -
bX)(dY, - d Y.)
121
+ e)]
.2 (bX, -
Valor de ru
,.,
-rq
_,Ji,
,,,,
.4Y+c
11
1
111 universidad.
1101 otro lado, se ha encontrado que el porcentaje de desertores en toda eswrlu secundaria correlaciona negativamente con el nmero de libros por alumno
111 111~ bibliotecas de dichas escuelas. Sin embargo, el sentido comn nos indica
111w umontonar libros en la biblioteca no tendr ms influencia sobre el porcenlllJr111 deserciones que, digamos, el emplear un astuto bibliotecario para que aumenllh 1111\1,t,cnmente las pertenencias de la biblioteca escolar. Es una lstima que el
111,111 comn no siempre nos sea tan til.
S bren una sola conclusin falaz no arredra a algunos investigadores, muchos
,.11,11111c11 con sus razonamientos falaces, como, por ejemplo, cuando piensan que
.. 11111cl11c1n
es una evidencia de causacin prima facie y, adems, que la relacin
122
123
U.
,j'
o,
.!:
..
e
se
e
..
'o
e
G
G
G G
BG /G G
B
B G G
BGG
B BBa B G G
Be
B B B
a:
Ansiedad
124
Ml,lOIJOS t,SIAl)llll
medios desiguales en ambas variables. De tal agrupamiento pueden resultar relaciones positivas o negativas. Seria conveniente dibujar el diagrama de dispersin
de dos conjuntos en los cuales X y Y no correlacionen y en los cuales el grupo A
tuviera un promedio alto en X y bajo en Y, y el grupo B, un promedio bajo en X y
alto en Y. Podra saberse si este diagrama corresponde a una correlacin entre
X y Y positiva, negativa o nula?
X y Y pueden correlacionarse, aun si existen subgrupos con medias diferentes.
Sin embargo, podemos encontrar en este hecho una explicacin plausible de la
diferencia sustancial observada entre
y cero.
'x,
C.
Curvilinearidad y formas
de distribuciones marginales
r"' mide solamente uno de los posibles tipos de mediciones que pueden relacionar
dos variables entre si. El valor de '"' es una medida del grado de relacin lineal
entre X y Y. Si X y Y se relacionan linealmente de forma perfecta, los puntos del
diagrama de dispersin caern todos sobre una recta, tal como se ilustra en la
Tabla 7.3. Pueden obtenerse tambin diversos grados de relaciones lineales entre
X y Y, dispersando los puntos al azar, por encima y por debajo de la recta de regresin, aproximadamente a la misma distancia en cada direccin. Si los puntos
de un diagrama de dispersin se distribuyen al azar en torno de una curva, la relacin entre X y Y puede ser bsicamente curvilinea. Si no se hace referencia al
diagrama de dispersin, puede pensarse que '"' no mide sino relaciones lineales
entre X y Y y, en este caso, si se encuentran valores de rx, prximos a cero, puede
pasarse por alto el hecho de que la relacin entre las dos variables sea curvilnea,
125
nlta que sta sea, pueden encontrarse valores de '"' muy prximos de cero.
Fig. 7.4 muestra dos diagramas de dispersin diferentes, ambos con coeficientes
111 rorrclacin
muy bajos.
Sin embargo, a pesar de que los diagramas de dispersin A y B de la Fig. 7.4
lh11cn coeficientes de correlacin de cero, existe una relacin considerable en el
II mientras que en A no hay relacin sistemtica entre X y Y. La sola ilustracin
1li la Fig, 7.4 debera ser una advertencia ms que suficiente para no concluir nunca
ljlll' dos variables no se relacionan solamente por el hecho de que '"Y sea ce~o.
C 1111 alguna frecuencia se encuentran diversas medidas de relacin curvilnea entre
\111 rubes. Las puntuaciones de pruebas psicolgicas y educacionales en grupos
1tlp1cos, a menudo muestran efectos de techo o piso, como, por ejemplo,
, 1h111do se administran pruebas demasiado fciles o demasiado dificiles, con el
11 eultado de que muchas personas obtienen la puntuacin ms alta o la ms baja.
11 diagrama de dispersin de las puntuaciones de la prueba A, que muestra un
11kcto de techo y el de la prueba B, que muestra un efecto de piso, podra ser
11111ilur al de la Fig. 7.5.
11111
,1
Prueba B
o
o
tki 0..30. Sin embargo, dentro del limite de dificultad establecido para cada prueba
o o
'1 =O
X
Relacin al azar
FIG.
7.4
X
Alta relacin curvlllnea
prximos a cero.
IZI
7.8
MI IOl>U\ 1
OTRAS ANOTACIONES
INTERPRETACION
DE
1'11<
IAl>l\11(0\
SOBRE
<\IIU\
1 \
1 11 r.l l \\ \O( 1 \I IS
LA
rs,
mu
x,
21
O 1
O O
l
12
14
14
4
13
5 6 7 8 9
10 7 4 2
10
1
2 3 4 5 6 7 8 9 10
1 1 2 2 4 5 6 7 71
11 IIIIM\
127
,1,, 11 esto? ,Puede tratarse de una relacin moderada entre dos variables cuya
,11 tubucin de frecuencias conjunta toma la forma de una superficie normal bi, ,11 u1da o podr tratarse acaso de una mxima relacin posible entre un X des, 1.1110 po itivamcnte y un Y desviado negativamente? Anteriormente vimos cmo
11111tlcn surgir dudas similares respecto de un valor cero para r:r,. Entonces, es
11111 \ y Y realmente no se relacionan, o es que su relacin no es lineal? Estas dudas
1uwtlcn resolverse muy satisfactoriamente estudiando el diagrama de dispersin
,lt 111, puntuaciones X y Y, donde puede verse inmediatamente si X y Y tienen una
1du1:1n pronunciada curvilnea o si la relacin es muy baja. Desgraciadamente,
1,111 demasiada frecuencia los investigadores se muestran reacios a construir dia11,111111c; de dispersin. Podra pensarse que una de las mayores ventajas del pro" unucnto electrnico de datos se traducira en un aumento de los diagramas
,lt 111\pcrsin para problemas de correlacin, pero esto no ha sucedido. La opinin
de 1 uutor es que vale la pena el pequeo esfuerzo de construir e inspeccionar dia11,1mn, de dispersin para poder interpretar ms inteligentemente el ':rr
, 1,,~ ionaba
s!+11
= ""'1
[X,+ Y, - (.f.+
'x,
':r,
,:r,
s!,
" -
Y.)]'
_
(7.15)
..
s! .. " = I
_1
[(X, -
X.) -f (Y, -
Y.))1
_
(7.16)
" - J
\1 -.e de arrolla la expresin entre corchetes del numerador de la Ec. (7 .16)
121
MI IC)l)()', 1\1;\l)ll,ll(O~Al'II(
\1111\
\ l,\'I
"
s!+w -
(X; - X.)2
n-1
2 I (X, - X_XY, - Y)
n
n-1
"
(IINIIA<;
SO(t/\1111
al
(Y - V.)2
""'1
,o llll>A<;
l>H CORRELACION
129
s~-,.
n-1
s; s;.
s; s;;
s;.
t
s:io+,
- s"'t - s,1 = s,.'+ s,,'+2 r'"s"'s" - s"'2 - s.ll = 2r....,s,.s .
s! = s! + s; + 2s.,.w.
-e- ,
r,.., con el trmino s,..,f(s,.s.,). Evidentemente, tenemos entonces que s,.., = r"'s,.s,. As, pues, si se remplaza s,.., por la expresin equSe puede tambin denotar
valente, tenemos,
2
sx+,
= s; + s, +
2
s!+, - s! - s! = r .. ,.
2s,.sw
2 r~x5w
Las Ecs. (7.18) y (7.19) relacionan la varianza de la suma de dos series de puntuaciones con la varianza de cada serie y con su covarianza.
Un caso especial de la Ec. (7.19) que ofrece gran inters es aquel en el cuaJ X y
Y no se correlacionan, por ejemplo, cuando r,.1 = O. Si esto es cierto, entonces
s!.+, = s!
+ s;.
,,m se obtenga
la suma de X1
s!+..+
""1
[(X, +
Y1
n- 1
Yf-
21" ex - xJcr, I
Y.>
t
Sio+i,-ta
I"
....,,1
[(X, -
- 2S;n,
= Sirt+ s;2 -
+ (Z, -
2.))_1
n- 1
(7.23)
fl numerador de la Ec. (7.23) es un trimonio cuadrado. Por lgebra de bachi+ b + c)2 = a2 + b2 + c2 + 2ab + 2ac + 2bc. As, pues,
2 rz.,S11:S,.
s!_, = s! + s;.
No sera sorprendente que se encontraran dificultades
(7.22)
n- 1
= s;t + s,!
21?
"
rcx,
- xf + I" cr, -
s!+..+ = I
(X, -
n-1
+I
..f)' + I
n-1
Y.)'
n-1
(Y, -
..f.Xl' -
Y.>
n-1
O - Y.xz, - 2.) .
n-1
130
MI l()l)OS I Sl/\l)l~IIC'O'>
1'111 Al>tt\
s!+~+ = s!
anterior son
,o
11111
y por ende. la correlacin entre las dos variables enunciadas a continuacin ser
fl0'1tiva o negativa:
11111w1,
11
7.10
131
Inclrcnr, si. en la poblacin de todas las escuelas primarias de los Estados Unidos, la cova-
11
\',
estatura en pulgadas;
Y. peso en libras,
X. edad en meses entre los 6 y los 16 aos; Y, tiempo en segundos para correr 50 yardas.
lc111mr
s., /
l II correlacin
111c111c X con
Persona
1
2
3
4
5
6
7
8
PROBLEMAS Y EJERCICIOS
l.
+ 1 cuando :" =
z,h/(11
z,.
10
11
12
13
14
15
entonces que
" z;/(n -
2.
100
28
25
19
24
23
21
27
90
126
112
80
115
105
J 10
99
97
87
76
100
80
120
25
26
25
23
18
29
20
18
<'11h:11Jur el r para los duros del grupo a y b a continuacin. ,Por qu difieren en magnitud
In~ coeficientes de correlacin?
lJZ
O~ /\1'1 li
MI IOI)():, 1.!ll/\1)11111<
/1
IQ
a. Nmero de la
persono Prueba A Prueba B
1
2
3
4
80
105
121
93
99
107
119
103
102
115
87
96
5
6
7
8
9
10
11
12
9.
IO.
b. Nmero de lo
persona
83
101
117
100
96
112
123
99
110
110
81
98
1111111m 11l11
C:11 rocobula-
1
2
3
4
rlo genorat
96
111
89
107
102
115
98
83
104
100
117
94
5
6
7
8
9
10
11
12
aritmttro
104
121
84
91
114
96
109
94
116
86
101
99
PREDICCION Y
ESTIMACION
Se sabe que las mujeres tienden a obtener puntuaciones muy superiores a las de los homb
en el Minnesotta Teacher Attitude Inventory. Un investigador correlacion las pu
tuaciones en el MTAI obtenidos por un grupo de 100 profesores expertos, con el nme
de alumnos suspendidos por ellos durante un ao. Obtuvo un r de -0,39. Concluy q
los profesores tienden a suspender a los estudiantes porque carecen de actitudes de a
racin hacia sus alumnos. Comente los mtodos de este investigador asi como sus co
clusiones.
I..
t-1
(X, - .f,)(Y, -
.
= I
f> = I"
[X,(Y, -
t-1
X,(Y, -
t-1
f) -
X,(Y, -
"
PRELIMINARES
f)]
.f,(O).
1-1
Ra:011ami1111,,
Es verdad que
I"
X1(Y1
1-1
..
P) = I Y,(X, - X)?
,-1
I"
1-1
[X,( Y, -
f> -
"' unas pocas nociones de geometra analtica, pueden ilustrarse de modo ca111111 los conceptos y procedimientos implcitos en las formas ms sencillas de
ltn:in estadstica. A continuacin se expondr en detalle la idea del sistema
Inucnsional de coordenadas as como la de la ecuacin de una recta.
l II In Fig. 8.1 se ilustra un sistema de coordenadas canesianas", Los ejes de
111 ~ xtcma -las rectas perpendiculares X y Y- dividen el plano en cuatro cua(la superficie plana, bidimensional con longitud y anchura, pero sin pro111lidnd ). Son los cuadrantes 1, 11, m y IV.
1 ,1c sistema garantiza la posibilidad de demarcar el plano en forma tal que,
uuuc un par de nmeros ordenados (X, Y), pueda identificarse cualquier punto
t1ur I pertenezca. El punto (O, O) se denomina origen del sistema y se encuentra
l,1 interseccin de X y Y. El primer nmero de cualquier par representa la dis11111 u1 que debe seguirse en sentido horizontal, desde el origen (distancia X) hasta
ll 9,111110, y el segundo nmero, la distancia del origen a la cual se halla dicho punto
lh """' ido vertical. El punto A de la Fig. 8.1 corresponde al par (2, 2) en el cual
II I" uncr nmero se conoce como coordenada X y el segundo como coordenada Y.
111mto B corresponde al par ( - 2, l) y se halla a dos unidades hacia la izquierda
., origen, en direccin del eje de las X, y a una unidad sobre el origen, en direccin
.. , l'IC de las Y. Los puntos del cuadrante I corresponden a pares de nmeros en
111c,