You are on page 1of 38

Estad stica Descriptiva y Probabilidad

(Teor y problemas) a 3a Edicin o Autores I. Espejo Miranda F. Fernndez Palac a n M. A. Lpez Snchez o a M. Muoz Mrquez n a A. M. Rodr guez Ch a A. Snchez Navas a C. Valero Franco

Copyright c 2006 Universidad de Cdiz. Se concede permiso para copiar, distribuir y/o a modicar este documento bajo los trminos de la Licencia de Documentacin Libre de e o GNU, Versin 1.2 o cualquier otra versin posterior publicada por la Free Software Founo o dation. Una traduccin de la licencia est incluida en la seccin titulada Licencia de o a o Documentacin Libre de GNU. o

Copyright c 2006 Universidad de Cdiz. Permission is granted to copy, distribute and/or a modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation. A copy of the license is included in the section entitled GNU Free Documentation License.

Edita: Servicio de Publicaciones de la Universidad de Cdiz a C/ Dr. Mara n, 3 no 11002 Cdiz a http://www.uca.es/publicaciones

ISBN: 978-84-9828-058-6 Depsito legal: o

Estad stica Descriptiva y Probabilidad. Teor y Proa blemas (Revisin: Febrero 2006) o I. Espejo Miranda, F. Fernndez Palac M. A. Lpez Snchez, a n, o a M. Mu oz Mrquez, A. M. Rodr n a guez Ch A. Snchez Navas, a, a C Valero Franco c 2006 Servicio de Publicaciones de la Universidad de Cdiz. a Documento bajo Licencia de Documentacin Libre de GNU o (Versin 1.2 o posterior). o http://www.uca.es/teloydisren

Cap tulo 2 Anlisis conjunto de variables a

En el cap tulo anterior se ha considerado un unico carcter, sin a embargo, es frecuente estudiar conjuntamente varios caracteres y preguntarse si existe o no algn tipo de relacin entre ellos. Este cap u o tulo se dedica al estudio de la relacin entre dos caracteres, comenzando con o la organizacin y sintetizacin de la informacin, siguiendo un esquema o o o anlogo al establecido en el cap a tulo anterior, para concluir con el estudio de la relacin entre ambos. Cuando se analiza la relacin entre dos o o caracteres se pueden presentar dos casos extremos: el primero de ellos ser aquel en que conocido el valor de un carcter se pueda obtener el a a valor del otro, el segundo se presenta cuando la informacin sobre un o carcter no arroja ninguna informacin sobre el otro. Entre estas situaa o ciones extremas se dan una innidad de casos intermedios, por ello, el objetivo del cap tulo ser analizar el nivel de inuencia existente ena tre los caracteres. Hay que indicar, no obstante, que dicho anlisis no a establecer cul es la causa y cul el efecto entre ambos, sino slo la a a a o intensidad de la relacin. o 1. Distribucin conjunta de dos caracteres o

Cuando el investigador est interesado en el estudio de dos caractea res de una poblacin, se obtienen dos observaciones para cada individuo, o que se recogen en forma de pares de valores, que deben ser organizados

54 Cap tulo 2. Anlisis conjunto de variables a X, Y x1 . . . xi . . . xr y1 yj n11 n1j . . .. . . . . . ni1 nij . . .. . . . . . nr1 nrj n1 nj ys n1s n1 . . .. . . . . . nis ni . . .. . . . . . nrs nr ns n

Tabla 2.1: Distribuciones conjuntas y marginales de (X, Y )

en funcin de la naturaleza de dichos caracteres. o Al igual que en el caso unidimensional es interesante organizar los datos en forma de tabla de frecuencias, sin embargo, al tener que especicar los valores que toman ambos caracteres, la tabla debe ser de doble entrada o bidimensional, vase la tabla 2.1. Supongamos que e X toma r valores distintos x1 , x2 , . . . , xr , e Y toma s valores distintos y1 , y2 , . . . , ys . Se dene la frecuencia absoluta del par (xi , yj ), que se denota por nij , como el nmero de veces que se observa dicho par de u valores. Esta distribucin se denomina distribucin conjunta de (X, Y ). o o
r s

Se verica que
i=1 j=1

nij = n, valor que aparece recogido en la


r s

parte inferior derecha de la tabla. Conservando la notacin, fij , con fij = o


nij n ,

es la frecuencia relativa del par (xi , yj ) y por lo tanto


i=1 j=1

fij = 1.

Si la distribucin es de atributos, la tabla se llama de contingencia o y si es de variables se denomina de correlacin. Inicialmente, se centra o el estudio en el caso en el que los caracteres sean variables, para abordar el estudio de tablas de contingencia en posteriores apartados de este cap tulo. La situacin de los valores no nulos en la tabla de doble entrada o da una idea intuitiva de la posible relacin entre ambos caracteres, as o ,

2.2 Distribuciones marginales 55 el que las mayores frecuencias se den alrededor de una diagonal viene a indicar la existencia de relacin, mientras que el que no se d esta o e circunstancia va a suponer, generalmente, la ausencia de la misma. 2. Distribuciones marginales

En la tabla 2.1, se han sumado las frecuencias que aparecen en cada una de las las y columnas, colocndose los resultados en los mrgenes, a a donde:
r s

nj =
i=1

nij , n = n =

ni =
j=1 r s

nij nij ,

i=1 j=1

de tal forma que la primera y ultima columna de la tabla 2.1, constituyen la distribucin marginal de X, y la primera y ultima la la distribucin o o marginal de Y . Lgicamente se verica que: o
r s

fi = 1 ,
i=1 r s j=1

fj = 1 y

fij = 1,
i=1 j=1

lo que garantiza la condicin de ambas distribuciones. o Se interpreta fi como la proporcin de datos que toman el valor xi o de X, independientemente del valor que tome Y . Una notacin anloga o a se maneja para la variable Y . Obsrvese que considerar la distribucin marginal de una variable e o equivale a considerar la distribucin de sta independientemente de la o e otra. 3. Distribuciones condicionadas

Cuando se posee informacin previa de una de las variables en o estudio, sta puede modicar la informacin disponible de la otra. En e o

56 Cap tulo 2. Anlisis conjunto de variables a particular, cuando se considera la distribucin de una variable para un o valor jo de la otra se obtiene la distribucin condicionada. Ms concreo a tamente, las frecuencias condicionadas son: fi|j f|i j = =
nij nj nij ni

i = 1, 2, , r j = 1, 2, , s.

Que son, respectivamente, la condicionada de X para el valor yj de Y , para j = 1, 2, , s, y la condicionada de Y para el valor xi de X, para i = 1, 2, , r. Ejemplo 2.1 Un alumno de Estad stica est interesado en estua diar la estatura y el peso del grupo de 21 alumnos varones que pertenecen a su clase. A tal efecto y una vez provisto de los adecuados aparatos de medida, metro y balanza, se dispone a realizar las mediciones. Los resultados que obtuvo se ofrecen en la tabla 2.2. La estatura y el peso se dan con una precisin de 001 metros y 1 kilogramo, respectivao mente. Peso 80 68 87 85 78 84 82 Estatura 183 180 184 177 177 182 171 Peso 78 76 94 74 77 82 67 Estatura 173 166 180 175 169 171 168 Peso 70 66 77 70 72 77 66

Estatura 178 172 188 181 173 189 180

Tabla 2.2: Tabla de datos El alumno domina el anlisis descriptivo univariana te y no tiene dicultad en aplicarlo a cada una de las variables que ha considerado, obteniendo as in formacin sobre las medias, dispersiones, simetr o as, etc., de la estatura y el peso. Sin embargo, conside-

2.3 Distribuciones condicionadas 57 ra la posibilidad de que entre las dos variables exista algn tipo de relacin. A la vista de los datos, y u o pensando que en otra situacin parecida el nmero o u de individuos en estudio fuera mucho ms grande, a decide agrupar a stos en clases uniformes. Despus e e de analizar la situacin establece intervalos de amo plitud 005 metros y 5 kilogramos, para estatura y peso respectivamente, reorganizando la informacin obtenida en una tabla de doble entrada. El o resultado que obtuvo se recoge en la tabla 2.3. Estatura 176-180 1 3 2

Peso 65-69 70-74 75-79 80-84 85-89 90-94

165-170 2 1

171-175 2 2 2

181-185

186-190

1 1 1 1

1 1

Tabla 2.3: Distribucin conjunta o A la vista del resultado obtenido, el investigador observa que ha perdido precisin respecto a los dao tos originales. Efectivamente, utilizando la tabla de doble entrada lo unico que se puede decir, por ejem plo, es que hay dos individuos que midiendo entre 171 y 175 metros pesan entre 75 y 79 kilogramos, ignorndose las mediciones exactas de stos. a e No obstante, entiende que aunque el volumen de datos fuera muy grande la tabla de doble entrada seguir siendo vlida con la adicin, tal vez, de a a o algunas clases extremas y, adems, piensa que el a error que se cometer no ser muy grande si, llea a gado el caso, se viera en la necesidad de asignar a cada intervalo su marca de clase. Por otra parte, y en el haber de la abstraccin realizada, un meo

58 Cap tulo 2. Anlisis conjunto de variables a ro anlisis visual hace entender que entre las dos a variables existe cierta relacin, pues los valores no o nulos de la tabla se distribuyen alrededor de una diagonal, obtenindose un resultado que como era e de esperar, y a falta de algn tipo de cuanticacin u o que se realice ms adelante, hace corresponder, en a general, a los individuos de estatura baja los de poco peso y a los de estatura alta los de mayor peso. No se puede decir que conocida la estatura de un individuo quede determinado su peso pero s que se puede acotar ste e incluso hacer una previsin e o aproximada de su valor. Tampoco se puede decir cul de las dos variables determina los valores de a la otra. A continuacin, el alumno piensa que quizs ser o a a interesante ofrecer los valores de la tabla como proporciones del nmero total de observaciones, para u ello divide cada elemento de la tabla por el nmero u de individuos en estudio, obteniendo la tabla 2.4.

Peso 65-69 70-74 75-79 80-84 85-89 90-94

165-170 2/21 1/21 0 0 0 0

171-175 2/21 2/21 2/21 0 0 0

Estatura 176-180 0 1/21 3/21 2/21 0 0

181-185 0 0 1/21 1/21 1/21 1/21

186-190 0 0 0 1/21 1/21 0

Tabla 2.4: Distribucin relativa conjunta o Ahora su inters se centra en conocer la propore cin de sus compaeros que pertenecen a una de las o n clases de estatura independientemente del peso que tengan. Para ello, se da cuenta de que slo tiene que o sumar cada columna, obteniendo, por ejemplo, que

2.3 Distribuciones condicionadas 59 Estatura 165-170 171-175 176-180 181-185 186-190 2/21 2/21 0 0 0 1/21 2/21 1/21 0 0 0 2/21 3/21 1/21 0 0 0 2/21 1/21 1/21 0 0 0 1/21 1/21 0 0 0 1/21 0 3/21 6/21 6/21 4/21 2/21 Tabla 2.5: Distribuciones marginales

Peso 65-69 70-74 75-79 80-84 85-89 90-94 f (E)

f (P ) 4/21 4/21 6/21 4/21 2/21 1/21 1

hay tres individuos cuya estatura est comprendia da entre 165 y 170 metros, seis entre 171 y 175 metros, y as sucesivamente. Realizando la misma operacin con las las obtiene los resultados para o el peso. Al objeto de organizar esta informacin o decide aadir una la y una columna en la tabla n donde almacena los resultados, vase la tabla 2.5. e Siguiendo con los datos del ejemplo, nuestro investigador se pregunta por la proporcin de compao neros que poseen una cierta estatura dentro de los del grupo que pesan entre 75 y 79 Kilogramos, que 6 sabemos constituyen 21 del total. Le resulta fcil comprobar que de entre los que tiea 2 nen ese peso hay 6 que tienen una estatura entre 171 y 175 metros. Observe que podr haber llea 2 gado al mismo resultado de haber dividido 21 entre 6 o 21 , es decir, la proporcin de individuos con altura en la clase [1 71, 1 75] y peso en [75, 79] entre el correspondiente a la proporcin marginal de la o variable peso en la clase [75, 79].

60 Cap tulo 2. Anlisis conjunto de variables a 4. Independencia

La independencia-dependencia viene a medir la informacin que o arroja sobre una de las variables el conocimiento que se tiene de la otra variable. As una informacin total implica dependencia funcional, la , o nula informacin independencia, y una informacin parcial dependencia o o estad stica. Formalmente, se dice que X es independiente de Y si se verica que: fi|j = fi i = 1, , r j = 1, 2, , s. Es decir, si la frecuencia condicionada coincide con la marginal. De la misma forma se dene la independencia de Y respecto de X. La denicin de distribucin condicionada da una expresin altero o o nativa para la independencia, y as X e Y son independientes si: fij = fi fj i, j,

que adems pone de maniesto que la independencia se establece en un a doble sentido; es decir, X es independiente de Y si y slo si Y lo es de o X. Ejemplo 2.2 En el ejemplo que se arrastra, nuestro joven estad stico se pregunta por la posibilidad de que exista algn tipo de relacin entre las variables, en el u o sentido de que conocido el valor de una de las va riables se pueda decir algo sobre la otra. El observa que si el peso est comprendido entre los 65 a y los 70 kilos la estatura debe estar entre 165 y 175 metros, y que no hay individuos que en ese rango de pesos mida ms de 175 metros. Es ms, a a este ejemplo le hace ver que si uno de los cruces de las clases, por ejemplo (xi , yj ), tiene frecuencia nula, el conocimiento de que una de las variables toma valores en la clase xi imposibilita que la otra variable tome valores en la clase yj , y viceversa. Pensando en su problema, llega a la conclusin de o

2.5 Medidas de dependencia. Coecientes de relacin 61 o que existir una dependencia total o funcional si a el conocimiento del valor de una de las variables determina el valor que tomar la otra. Esto implia ca que si X depende funcionalmente de Y en cada la hay una sola frecuencia distinta de cero, y si Y depende funcionalmente de X ocurre lo mismo con las columnas. Por otra parte, le resulta evidente que las variables son independientes si jado cualquier valor de una de las variables la otra variable mantiene sus porcentajes iguales a los de su distribucin condicionao da. Entre estas dos situaciones extremas, descubre que existen muchas posibilidades intermedias. Por otra parte, se dice que X depende funcionalmente de Y , si conocido el valor que toma Y queda determinado el valor de X. Para acabar esta seccin se comprueba con un contraejemplo que o la dependencia funcional no se establece en doble sentido. Ejemplo 2.3 En la siguiente distribucin: o X/Y x1 x2 y1 y2 y3 12 0 4 0 7 0

X depende funcionalmente de Y , puesto que conocido el valor de Y queda determinado el de X, pero el rec proco no se da, puesto que si X toma el valor x1 , Y puede tomar el valor y1 o el y3 . 5. Medidas de dependencia. Coecientes de relacin o

Los trminos asociacin, correlacin, contingencia, concordancia e o o y otros similares, se suelen utilizar como equivalentes muy a menudo. No obstante, haciendo un uso ms correcto de la terminolog estad a a stica, an con signicado semejante, se puede considerar: u

62 Cap tulo 2. Anlisis conjunto de variables a correlacin de variables propiamente dichas, o sea, medidas en eso cala de intervalo. concordancia de ordenaciones, entendindose como tales las denoe minadas variables ordinales, y asociacin o contingencia de variables nominales o atributos. o

As para clasicar los coecientes que detectan y miden el grado , de relacin, o dependencia estad o stica, se ha tenido en cuenta el tipo y la naturaleza de las variables sometidas a estudio. 5.1. Variables continuas. Correlacin o

5.1.1. Covarianza Para facilitar el estudio y la notacin de la covarianza, se introduce o previamente el concepto de momentos bidimensionales. Se dene el momento de orden (h, k) respecto al origen como:
r s k xh yj fij . i i=1 j=1

ah,k =

Es fcil ver que a1,0 es la media de X y que a0,1 es la media de Y . a Por otro lado, el momento de orden (h, k) respecto a la media viene dado por:
r s

mh,k =
i=1 j=1

(xi x)h (yj y )k fij .

Constatndose que m1,0 es cero, al igual que m0,1 , que m2,0 y m0,2 son a las varianzas de X e Y , respectivamente, y que es posible expresar los momentos respecto a la media en funcin de los momentos respecto al o origen. En particular se da la relacin o m1,1 = a1,1 a1,0 a0,1 .

2.5 Medidas de dependencia. Coecientes de relacin 63 o A m1,1 se le denomina covarianza de la distribucin, denotndosele o a tambin por Sxy . Este coeciente juega un importante papel en el estue dio de la relacin lineal entre las variables. Para analizar esta cuestin, o o se consideran las representaciones grcas de la gura 2.1 que reejan a distintas situaciones, dichas representaciones reciben el nombre de nube de puntos o, tambin, diagrama de dispersin. e o
qqqq qq qq q qq qq q qq q qq qqqq q qq qq qq qq qq q q qq q q q q q q q q q q q q q q q q q qq q q qq qq q q q q qq q q qq

q qqq q q q

q q q q q

A C
q qq q q qq qq q

B D
qq qq q qqq q q qq

qq

q q q q

qq

qq

qq

Figura 2.1: Anlisis de la covarianza a El punto que viene determinado por la media de X y la media de Y constituye el centro de gravedad de las nubes de puntos en todos los casos. Como se sabe, la covarianza viene dada por la expresin o
r s

Sxy =
i=1 j=1

(xi x)(yj y )fij .

Sxy es una medida simtrica y se puede leer como la suma de los e productos de las desviaciones de X por las desviaciones de Y con respecto a sus medias respectivas; de tal forma, que si el signo de la desviacin o

64 Cap tulo 2. Anlisis conjunto de variables a de X coincide con la de Y , como ocurre en el primer y tercer cuadrante, se genera un sumando positivo; y cuando el signo es distinto -segundo y cuarto cuadrante- la aportacin a la covarianza es negativa. Por tano to, la concentracin de valores en los distintos cuadrantes determina el o signo y la cuant de Sxy . As en los casos A y B de la gura 2.1, Sxy a , se aproxima a cero, en el caso C va a ser alta y positiva, y en el D alta y negativa. Por tanto, se est en condiciones de armar que la covarianza a detecta la relacin lineal entre las variables y el sentido de sta, pero o e no distingue entre la no presencia de relacin, caso B, y la existencia o de alguna dependencia no lineal, caso A. De todas formas, an para el u estudio de relaciones lineales la covarianza adolece de ciertos problemas, como el de venir acompaada de las unidades de las variables y el de n depender del nmero de observaciones. u 5.1.2. Coeciente de correlacin de Pearson o Para obviar las carencias de la covarianza se introduce el coeciente de correlacin lineal o coeciente de correlacin de Pearson o o r= Sxy , Sx Sy

que es una medida adimensional, ordinal, toma valores en el intervalo [1, 1] y tiene el signo de Sxy , por lo que cuando la relacin lineal entre o X e Y es exacta y directa, es decir, todos los puntos se encuentran sobre una recta con pendiente positiva, vale 1, cuando es exacta e inversa, es decir, todos los puntos se encuentran sobre una recta con pendiente negativa, vale 1 y cuando no hay relacin lineal 0; con un anlisis o a lgico para las posiciones intermedias. Cuando r vale cero, se dice que o las variables estn incorreladas. a En el caso lineal, al cuadrado de r se le llama coeciente de determinacin y se le denota por R2 , representando una medida cardinal o o cuantitativa para medir la relacin lineal entre las variables. Se estudia o este coeciente con ms detalle en el cap a tulo siguiente. Se concluye este apartado indicando que la independencia implica incorrelacin, pero el rec o proco no siempre es cierto. Este resultado es

2.5 Medidas de dependencia. Coecientes de relacin 65 o consecuencia de que la independencia supone la descomposicin de los o momentos de orden (h, k) (respecto al origen o respecto a la media) en el producto de los momentos (h, 0) y (0, k); as a1,1 = a1,0 a0,1 y por tanto , Sxy = m1,1 = a1,0 a0,1 a1,0 a0,1 = 0, con lo que r = 0 y las variables estn incorreladas. En sentido contrario, la incorrelacin slo implica esa a o o descomposicin para el momento (1, 1). En cierta forma, se puede decir o que la incorrelacin es una independencia de primer orden o lineal. o Ejercicio 2.1 Demuestre que las variables X e Y de la siguiente distribucin: o X Y 2 8 1 5 0 4 1 5 2 8 estn incorreladas, pero no son independientes; a es ms, existe una relacin funcional entre ellas. a o Ind quela. Por tanto, el coeciente de correlacin de Pearson mide el grado o de relacin lineal entre dos variables cuantitativas indicando el sentido o directo o inverso de la relacin. Es el ms comn de todos los coecientes o a u porque es la base de otras muchas medidas de relacin entre variables de o distinta naturaleza, de hecho, a menudo se tiende a interpretar cualquier coeciente como si del de Pearson se tratase. 5.1.3. Coeciente de correlacin biserial o Se utiliza para establecer el grado de correlacin entre dos variables o cuantitativas cuando una de ellas ha sido dicotomizada previamente. Se trata de una modicacin del coeciente de correlacin de Pearson entre o o una variable continua X y otra Y que se ha dicotomizado y que en origen responde a una estructura de distribucin normal1 . o
1

La distribucin normal se estudiar en el cap o a tulo 5

66 Cap tulo 2. Anlisis conjunto de variables a El coeciente de correlacin biserial se denota por rb y se puede o calcular indistintamente por cualquiera de las siguientes expresiones: Xp Xq pq Xp X p rb = ( )= ( ), Sx y Sx y donde: X es la variable continua Y es la variable dicotomizada Xp es la media de X cuando Y vale 0 Xq es la media de X cuando Y vale 1 X es la media de la distribucin marginal de X o Sx es la desviacin t o pica de la marginal de X p es la proporcin de elementos con asignacin 0 en la variable Y o o q es la proporcin de elementos con asignacin 1 en la variable Y , o o (q = 1 p) y es el valor de la ordenada correspondiente a un valor de x que divide el rea de la distribucin normal tipicada en dos partes, una igual a o a p y otra igual a q. Se interpreta de forma anloga al coeciente de correlacin de a o Pearson en lo referente a la intensidad de la relacin, no a su sentido; o adems, cuando la correlacin es alta y el requisito de normalidad de a o Y no se cumple de forma estricta, el coeciente de correlacin biserial o puede valer ms de 1 o menos de -1. a Como variante, aunque con idntica interpretacin y similar noe o tacin y expresin, se debe tener presente el coeciente de correlacin o o o biserialpuntual, que se utiliza para medir la correlacin entre una vao riable continua y otra dicotmica por naturaleza, denido por: o Xp X p Xp Xq pq = . rbp = Sx Sx q

2.5 Medidas de dependencia. Coecientes de relacin 67 o Observacin 2.1 Desde el punto de vista prctico, el coeciente de o a correlacin biserial se usa sobre todo para hacer inferencias. Su clculo o a necesita conocer la distribucin normal, puesto que es necesario obtener o el valor y.

Ejemplo 2.4

Con la nalidad de buscar el mayor rendimiento de la tierra, un agricultor, preocupado por su cosecha de naranjas, est interesado en estudiar el grado a de relacin entre la cantidad de fruta recogida y o la lluvia ca en los ultimos 10 aos. Para ello da n parte de la siguiente informacin, obtenida por l o e mismo, en la que ha clasicado los aos en secos n (S) o lluviosos (L): Naranjas (Tm) Ao Naranjas (Tm) Ao n n 1001 L 957 L 82 L 59 S S 68 S 723 1145 L 68 S 850 L 79 L Para estudiar a partir de estos datos la relacin o entre las variables, se recurre al coeciente de correlacin biserial-puntual2 , realizando la divisin de o o la cosecha en dos series, la obtenida en temporada de sequ con valor asignado 1, y la obtenida en a, temporada de lluvia, con asignacin el valor 0. Se o denota por X la cantidad de naranjas y por Y si la temporada es de lluvia o de sequ a. rbp = 9 27167 6 6825 0 6 0 4 = 0 7457. 1 70077 Lo que indica una relacin de dependencia relatio vamente fuerte entre las variables.

Se ha utilizado el coeciente de correlacin biserial-puntual y no el coeciente de o correlacin biserial, debido a que aunque la variable lluvia ca o da es en principio continua y probablemente Normal, el uso del coeciente de correlacin biserial requiere o conocimientos hasta ahora no adquiridos, como se indica en la observacin 2.1. o

68 Cap tulo 2. Anlisis conjunto de variables a Dada la inseguridad ante las medidas de la concentracin de lluvia anual por metro cuadrado que obo tuvo el agricultor, ste decide prescindir por come pleto de sus datos y recurrir a la informacin que o sobre el tema proporciona anualmente el instituto meteorolgico, el cul le proporciona la cantidad de o a lluvia ca cada ao. Se denota por X la cantidad da n de naranjas y por Y los m3 de lluvia. De esta forma los datos han sido transformados en: Nar. (Tm) Lluvia (m3 ) Nar. (Tm) Lluvia (m3 ) 1001 13 957 14 82 09 59 067 723 087 68 056 1145 175 68 087 096 79 124 850 Con esta informacin se analiza la relacin de las o o variables con el coeciente de correlacin de Pearo son, ya que ambas son continuas. r = Sxxyy = 0 917511 S R2 = 0 841827. Con esto se concluye que existe una fuerte dependencia lineal y adems directa entre ambas variaa bles, es decir, la cosecha de naranjas es mayor cuando mayor es la cantidad de lluvia ca da. 5.2. Variables ordinales. Concordancia
S

5.2.1. Coeciente de correlacin por rangos de Spearman o Este coeciente se utiliza para medir la relacin entre dos sucesioo nes de valores ordinales. Es el coeciente de correlacin de Pearson para o las llamadas variables cuasicuantitativas, discretas, o bien, para aquellas cuantitativas que han sido transformadas en ordinales (n primeros

2.5 Medidas de dependencia. Coecientes de relacin 69 o nmeros naturales para cada variable) tiene la forma u
n

6 rs = 1 donde:
i=1 2

d2 i

n(n 1)

rs es el coeciente de correlacin por rangos de Spearman o di es la diferencia entre el valor ordinal de la variable X y el de la variable Y en el elemento i-simo e n es el tamao de la muestra n Se verica que 1 rs 1. Si hay un gran nmero de elementos con el mismo valor en alguna u de las dos variables, es decir, si hay muchos empates, es conveniente recurrir a las correcciones de este coeciente. Quedando el coeciente como
n

x +y rs = con: x2 = n3 3 12 n3 3 12
n i=1

di 2 , t3 i tx i x , 12 t3i tyi y , 12

2 Txi ,
i=1 n

x2 y 2 Txi

y2 donde:

Tyi ,
i=1

Tyi

txi es el nmero de empates en el rango i de la variable X u tyi es el nmero de empates en el rango i de la variable Y u

70 Cap tulo 2. Anlisis conjunto de variables a Sus caracter sticas e interpretacin son similares a las del coeo ciente de correlacin de Pearson. o 5.2.2. Coeciente de Kendall De forma anloga al coeciente de Spearman, el coeciente cona sidera el orden de los n objetos o elementos tanto de una variable como de la otra e intenta medir el grado de concordancia o correspondencia entre ellos. Dicho coeciente viene dado por = donde: es el coeciente de Kendall P el nmero de coincidencias o acuerdos u Q el nmero de no coincidencias o desacuerdos u Nuevamente, si hay gran nmero de empates, conviene aplicar una u correccin, quedando el coeciente como o = con: Tx = Ty = 1 2 1 2
n

P Q , P +Q

P Q
1 2 n(n

1) Tx

1 2 n(n

, 1) Ty

txi (txi 1) ,
i=1 n

tyi (tyi 1) ,
i=1

donde txi y tyi coinciden con los denidos para el coeciente de correlacin de Spearman. o Sus caracter sticas e interpretacin son similares a las del coeo ciente de correlacin de Pearson. o

2.5 Medidas de dependencia. Coecientes de relacin 71 o X rg(X) Y 5 1 1 6 2 3 7 3 2 8 4 1 9 5 1 10 6 0 11 7 2 12 8 2 13 9 3 14 10 2 rg(Y) di di 2 3 2 4 9 5 7 5 56 25 6 5 3 5 12 25 3 1 1 3 2 4 1 5 25 65 05 0 25 65 15 2 25 9 5 0 5 0 25 65 3 5 12 25 117 5

Tabla 2.6: Clculo del coeciente de correlacin de Spearman a o 5.2.3. Coeciente de GoodmanKruskal Se utiliza para medir el grado de concordancia entre dos variables ordinales, estando especialmente indicado cuando hay muchas observaciones y pocos valores posibles, es decir, muchos empates. Su expresin e interpretacin es muy similar a la del coeciente de o o Kendall, considerando la proporcin de pares semejantes y la proporcin o o de pares no semejantes entre los empatados, resultando = donde: es el coeciente de Goodman-Kruskal ns es el nmeros de pares semejantes o no invertidos u nd es el nmero de no semejantes o invertidos u Ejemplo 2.5 Se pretende estudiar la relacin existente entre la o edad (E) y el nmero de hermanos (H) de un grupo u de 10 chicos, para ello se cuenta con los siguientes ns nd ns + nd

72 Cap tulo 2. Anlisis conjunto de variables a datos: E 6 12 8 11 10 7 9 14 13 5 H 3 2 1 2 0 2 1 2 3 1 Se calcular el coeciente de correlacin por rangos a o de Spearman, dado que se estn tratando variables a cuantitativas. Obtendremos primero la versin orio ginal de dicho coeciente. A partir de los clculos recogidos en la tabla 2.6, a se obtiene
n

6 rs = 1

i=1 = 1 610117 5 99 n(n2 1) 705 = 1 0 7121 = 0 2879. = 1 990 No obstante, debido al elevado nmero de empau tes deber emplearse el coeciente modicado paa ra dicho caso, o incluso al coeciente de GoodmanKruskal. Se calcular el coeciente modicado de a Spearman.

d2 i

103 3 0 = 997 12 12 3 6 y 2 = 10 12 3 ( 24 + 62 + 12 ) = 905 . 12 12 12 Por tanto el coeciente modicado queda como x2 = 997 + 905 117 5 12 = 0 2589 rs = 997 905 2 122 que es ligeramente inferior al original. Del resultado obtenido se concluye la escasa concordancia entre la edad y el nmero de hermanos. u

2.5 Medidas de dependencia. Coecientes de relacin 73 o 5.3. Atributos. Contingencia

5.3.1. Coeciente 2 El coeciente 2 se utiliza para medir el grado de asociacin eno tre dos variables cualitativas con h y k categor respectivamente. Este as estad stico est basado en la comparacin de las frecuencias observadas a o con las esperadas bajo una cierta hiptesis, generalmente de indepeno dencia, respondiendo a la expresin o
h k

2 =
i=1 j=1

(oij eij )2 , eij

donde: oij son las frecuencias observadas o emp ricas eij son las frecuencias esperadas o tericas o Cuando h y k toman el valor 2, es decir, cuando se est trabajando a con una tabla de contingencia 2 2, se aplica la denominada correccin o de Yates, resultando el coeciente:
2 2

=
i=1 j=1

(|oij eij | 0 5)2 . eij

El coeciente siempre toma valores no negativos, pero al tratarse de una medida no acotada, es de dif interpretacin por s sola, si cil o bien, cuanto ms relacionadas estn las variables sometidas a estudio a e ms se alejar el coeciente del valor 0. Su valor depende del nmero a a u de observaciones y de las categor en que stas se dividen, por tanto as e el coeciente 2 y sus derivados no son comparables con cualquier otro coeciente obtenido con distinto nmero de categor u as. Este coeciente 2 es la base de otros obtenidos a partir de l y e que solucionan el problema de su falta de acotacin. o

74 Cap tulo 2. Anlisis conjunto de variables a 5.3.2. Coeciente de contingencia Es uno de los coecientes derivados del 2 , resultando util bajo las mismas condiciones que aquel pero con mayores posibilidades de interpretacin. Se denota por C y se dene como o

C=

2 2 + n

siendo n el tamao muestral. n Se cumple que 0 C 1 y mide la intensidad de la relacin sin o indicar su sentido. 5.3.3. Coeciente de Cramer Es otro de los coecientes derivados del 2 . Se caracteriza por V y su expresin es o V = 2 n(m 1)

siendo: n el tamao muestral n m el m nimo entre h y k h el nmero de categor de la variable X u as k el nmero de categor de la variable Y u as Se verica que 0 V 1 y se interpreta igual que el coeciente de contingencia, teniendo en cuenta que slo proporciona informacin o o sobre la relacin entre las variables y no sobre el sentido de la misma. o

2.5 Medidas de dependencia. Coecientes de relacin 75 o 5.3.4. Coeciente Se trata de un coeciente especialmente indicado para medir la asociacin entre dos variables dicotmicas. Su expresin es o o o n11 n22 n21 n12 = n1 n2 n1 n2 donde: n11 es el nmero de veces que se da el par (X = 0, Y = 0) u n12 es el nmero de veces que se da el par (X = 0, Y = 1) u n21 es el nmero de veces que se da el par (X = 1, Y = 0) u n22 es el nmero de veces que se da el par (X = 1, Y = 1) u En cuanto a su interpretacin, el coeciente toma valores en el o intervalo [1, 1], midiendo de forma similar al coeciente de Pearson la intensidad de la asociacin entre las dos variables; salvo que alguna de o las frecuencias nij sea nula, en cuyo caso el coeciente vale 1 -1. o En el caso en que se estudie el grado de correlacin entre dos vao riables cuantitativas dicotomizadas, X e Y , siempre y cuando stas rese pondan a variables continuas bajo una ley normal (que se estudiar ms a a adelante), el coeciente suele denominarse coeciente de correlacin o tetracrica. o Ejemplo 2.6 De cara a la planicacin del prximo curso ser o o a conveniente analizar la relacin entre el nivel de o estudios del padre y la orientacin del alumno hacia o las ciencias. Se cuenta para ello con la informacin o obtenida en el centro Estudios padre Orientacin Nulo Bsico Medio Superior o a Orientado 23 12 34 32 No orientado 18 42 16 27

76 Cap tulo 2. Anlisis conjunto de variables a Como se trata de una tabla de contingencia, se calcula el coeciente 2 y sus derivados para hacer posible la interpretacin. o Nulo Bsico Medio Superior a Orientado 23 12 34 32 101 No orientado 18 42 16 27 103 41 54 50 59 204 eij 1 2 eij 1 2 2 = 1
10141 204 10341 204

2
10154 204 10354 204

3
10150 204 10350 204

4
10159 204 10359 204

20 30 26 73 24 75 29 21 20 70 27 26 25 24 29 79

(23 20 30)2 (12 26 73)2 + 20 30 26 73 2 (34 24 75) (32 29 21)2 + + 24 75 29 21 (18 20 70)2 (42 27 26)2 + + 20 70 27 26 (16 25 24)2 (27 29 79)2 + + 25 24 29 79 = 0 36 + 8 12 + 3 46 + 0 26 +0 35 + 7 97 + 3 38 + 0 26 = 24 16 24 16 = 0, 3254 24 16 + 204 24 16 = 0, 3441. 204 1

C=

V =

2.5 Medidas de dependencia. Coecientes de relacin 77 o Luego podemos concluir que el grado de asociacin o entre las variables es pequea. n Ejemplo 2.7 En el conservatorio de msica de una ciudad se u pretende estudiar la relacin existente entre el sexo o del alumnado y su acin por los instrumentos de o viento. Para ello, controlados los 482 estudiantes se tiene: Acionado No acionado Hombre 150 123 Mujer 97 112

Dada la naturaleza dicotmica de las variables, se o recurre al coeciente 150 112 123 97 4869 = = 0 08. = 57548 8 247 235 273 209 Con esto se pone de maniesto la inexistencia de relacin entre el sexo y la preferencia por los inso trumentos de viento. Ejemplo 2.8 Volviendo al ejemplo planteado en el estudio de variables continuas, vase ejemplo 2.4, y considee rando un caso an ms general, se supone que la u a informacin que conserv el agricultor despus de o o e la cosecha de cada ao es tan slo el recuerdo de n o si fue buena o mala. As los datos con los que se cuenta para el estudio de las variables son: Seco Lluvioso Mala 0 5 Buena 4 1

Haciendo uso ahora, dado que las variables aparecen dicotomizadas, del coeciente de correlacin o tetracrica o 20 5401 = = 0 8165. rt = 24 4948 6455

78 Cap tulo 2. Anlisis conjunto de variables a Poniendo nuevamente de maniesto la relacin eno tre la cantidad de naranjas y la lluvia. Hay que tener en cuenta que el signo que acompaa al coen ciente depende de la asignacin de valores a la o hora de dicotomizar las variables, por consiguiente, es interpretable la intensidad de la relacin, no o el sentido de la misma. Son varios los coecientes de relacin que a lo largo de esta seccin o o se han ido enumerando, coincidiendo con los que por sus caracter sticas, naturaleza y facilidad de clculo son ms utilizados y, por consiguiente, a a conocidos en los distintos campos donde su aplicacin tiene cabida. o 6. 6.1. Ejercicios Ejercicio resuelto

2.1 Se ha clasicado el peso de los huevos, Y , de un cierto tipo de pez en funcin del peso de la madre, X, obtenindose los resultados o e de la tabla adjunta.

X\Y [500,550) [550,600) [600, 650)

[25,27) 15 12 0

[27,29) 11 14 3

[29,31) 18 0 7

[31,33) 0 12 18

Calcule: a) La distribucin del peso del huevo. o b) La distribucin del peso de la madre cuando el huevo o tiene su peso comprendido entre [25, 27). c) La media, la mediana y la moda del peso de los huevos. d) El nivel de representatividad de la media del peso de la madre cuando el huevo est comprendido entre [25, 27). a e) Estudiar si las variables son independientes. f ) El grado de dependencia lineal entre estas variables.

2.6 Ejercicios 79 Solucin: o a) En realidad el primer apartado lo que est pidiendo es a la distribucin marginal de la variable Y . Por tanto, o n[25,27) = n(y [25, 27)) = n(x [500, 550), y [25, 27)) + n(x [550, 600), y [25, 27)) + n(x [600, 650), y [25, 27)) = 15 + 12 + 0 = 27 procediendo de igual forma con el resto de intervalos donde Y toma valores, se obtiene que: Y [25,27) [27,29) [29,31) [31,33) ni 27 28 25 30

b) Se pide la distribucin de la variable X condicionada a o que la variable Y tome valores en el intervalo [25, 27), es decir, f|[25,27) [500,550) = f (x [500, 550)/y [25, 27)) = = f (x [500, 550), y [25, 27)) f (y [25, 27))
15 110 27 110

15 5 = 27 9

procediendo de igual forma, se tiene: X/Y [25, 27) fi [500, 550) [550, 600) [600, 650) 5 9 4 9 0

c) Se calcula la media de variable Y , y= 26 27 + 28 28 + 30 25 + 32 30 = 29 05. 110

80 Cap tulo 2. Anlisis conjunto de variables a Para calcular la mediana se tiene en cuenta el apartado a), donde se ve que el primer intervalo cuya frecuencia absoluta acumulada supera el 50 % de los datos, es decir, 55, es el intervalo [29,31). Por tanto la mediana viene dada por M e = 29 + 55 55 2 = 29. 25

Para calcular la moda, se observa que todos los intervalos tienen igual amplitud y que el intervalo con mayor frecuencia es el [31,33), por tanto la moda es 0 M o = 31 + 2 = 31. 25 + 0 d) Para calcular el nivel de representatividad de la media se utiliza el coeciente de variacin, para ello, se calcula previamente la o media y la desviacin t o pica de la variable requerida. La distribucin de o esta variable se ha calculado en el apartado b), por tanto 5 4 4925 x/y [25, 27) = 525 + 575 = 9 9 9 4 5 2 Sx/y[25,27) = 5252 + 5752 9 9 Con lo que el coeciente de variacin es o
50000 81 4925 9

y = 50000 81

4925 9

CV =

= 0 045.

lo que supone que la media es muy representativa debido a que es muy pequeo el coeciente de variacin. n o e) Para tratar la independencia se considera un par (x, y) [500, 550) [25, 27). Se sabe que f (x [500, 550), y [25, 27)) = adems, se tiene que a f (x [500, 550)) = 44 110 15 , 110

2.6 Ejercicios 81 y que f (y [25, 27)) = con lo cual, f (x [500, 550), y [25, 27)) = 15 1188 = = 110 12100 27 110

= f (x [500, 550))f (y [25, 27)). Por tanto, se tiene que las variables no son independientes. f ) Para cuanticar el grado de dependencia lineal entre dos variables se calcula el coeciente de determinacin o R2 =
2 SXY 2 2 . SX SY

2 2 Se necesita calcular SX , SY y SXY : 2 SX =

5252 44 + 5752 38 + 6252 28 110

62450 110

= 1583 47
2

2 SY =

262 27 + 282 28 + 302 25 + 322 30 110

3196 110

= 5 14

SXY

1 (26 525 15 + 26 575 12 + 26 625 0 + 28 525 11 110 +28 575 14 + 28 625 3 + 30 525 18 + 30 575 0 +30 625 7 + 32 525 0 + 32 575 12 + 32 625 18) 199590200 = 44 03. 12100

Con lo cual R2 =

44 032 = 0 24, 5 14 1583 47

de donde se deduce que el grado de dependencia lineal es bastante bajo.

82 Cap tulo 2. Anlisis conjunto de variables a 6.2. Ejercicios propuestos

2.1. Durante el ao 1993 se han observado la poblacin y el n o nmero de viviendas de renta libre unifamiliares en 32 municipios de la u provincia de Cdiz. Los datos obtenidos se han tabulado, obtenindose: a e Y X 0-10 3 3 1 2 10-30 30-70 70-150 150-250

[0-2) [2-5) [5-10) [10-30) [30-80) [80-180)

3 2 1

1 6 2 1

1 1 1 1

2 1

donde: X = Nmero de viviendas u Y = Poblacin en miles de personas o a) Obtenga las distribuciones marginales de X e Y . b) Indique qu distribucin es ms homognea. e o a e c) Obtenga la distribucin de las viviendas unifamiliares o para los municipios entre dos mil y treinta mil habitantes. d) Calcule los momentos: a01 , a02 , a10 , a11 , m02 , m20 , m21 . e) Entre las poblaciones de ms de 10.000 habitantes, india que cul es el nmero de viviendas libres construidas ms frecuente. a u a f ) Obtenga la covarianza y el coeciente de correlacin de o las variables X e Y e interprtelo. e 2.2. De la variable bidimensional (X, Y ) se conoce su coeciente 2 2 de correlacin, r = 0 83, y sus varianzas, Sx = 5 32 y Sy = 8 41. Si se o multiplican por 3 los valores de X y por 2 los valores de Y , que repercusin tienen estas transformaciones en la covarianza y en el coeciente o de correlacin? o 2.3. La tabla 2.7 muestra una serie histrica sobre el Olivar o Espaol que recoge la supercie, rendimiento y produccin, durante el n o periodo 1965-1979. donde:

2.6 Ejercicios 83 Ao n 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 X 736 981 998 1077 1077 122 127 1381 1521 1448 1607 1502 1521 1673 165 Y 698 625 985 1025 974 1138 118 1281 1458 1398 1529 1434 146 1621 1602 Z 85 6 87 6 37 89 79 101 68 5 111 98 95 108 10

Tabla 2.7: Datos ejercicio 2.3

X = Supercie en miles de Ha. Y = Rendimiento en Qm/Ha.. Z = Produccin en miles de Tm.. o Se pide: a) El diagrama de dispersin de las variables X e Y . o b) Las medidas ms representativas para cada una de las a variables, indicando su representatividad c) El estudio de la relacin entre las variables XY , XZ e o Y Z.

2.4. La siguiente tabla muestra la relacin existente entre la lluo via ca en l/m2 , en el periodo octubremayo y la produccin obtenida da, o

84 Cap tulo 2. Anlisis conjunto de variables a en kilogramos por olivo. X Y Y Y Y Y 300 13 24 17 11 20 400 26 21 17 26 30 500 40 31 38 34 27 600 57 45 51 58 44 700 64 69 57 76 74

donde X representa la lluvia ca e Y la produccin obtenida en kiloda o gramos por olivo. a) Represente el diagrama de dispersin. o b) Indique si existe alguna tendencia. c) Cuantique y comente la relacin existente entre las dos o variables. 2.5. Dada la siguiente tabla de doble entrada con valores porcentuales: Y X 2 3 4 0 0 22 0 13 0 04 1 0 16 0 11 0 05 2 0 08 0 16 0 05 a) Obtenga la distribucin marginal de X. Calcule su meo dia, moda y mediana. b) Calcule la media de Y cuando X toma el valor 3. c) Estudie la dependencia de las variables X e Y . 2.6. Estudiar la coherencia de los siguientes resultados correspondientes a una variable bidimensional:
2 2 Sxy = 179 5, Sx = 36 8, Sy = 525, Me (X) = 12 3, Y = 0

2.7. De los modelos de una determinada marca de automviles o se considera el consumo medio y el tiempo de aceleracin de 0 a 100 o

2.6 Ejercicios 85 Km./h., obtenindose los siguientes resultados: e Acel. (seg.) [7, 9) [9,11) [11,14) [14,18) [5, 6) Cons. (lit.) [6, 7) [7, 8) [8, 9) 1 3 1 2 4 5 1 3 2 1 [9,12) 2 4 3

1 3

a) Dibuje y comente el diagrama de dispersin. o b) Obtenga el consumo medio de carburante. c) Obtenga el tiempo de aceleracin medio. o d) Indique cul de las dos medias es ms representativa. a a e) Estudie la relacin existente entre las dos caracter o sticas. 2.8. A un grupo de estudiantes se les pregunt por el tiempo que o tardan en llegar desde su hogar hasta la Facultad, X (minutos), el tiempo que le dedican diariamente al estudio, Y (horas), y las calicaciones obtenidas en la asignatura de Estad stica, Z, obtenindose las siguientes e respuestas: (40, 4, 4), (45, 3, 3), (30, 4, 5), (40, 4, 5), (80, 2, 5), (20, 3, 5) (10, 15, 6), (10, 4, 6), (20, 4, 6), (45, 3, 3), (20, 4, 4), (30, 4, 7) (30, 3, 7), (20, 4, 6), (30, 1, 6), (10, 5, 5), (15, 5, 5), (20, 6, 5) (20, 3, 7), (20, 4, 5), (20, 5, 6), (60, 2, 3), (60, 5, 5) a) Obtenga el diagrama de dispersin correspondiente al o tiempo dedicado al estudio y las calicaciones obtenidas en Estad stica. b) Se aprecia alguna tendencia? c) Estudie las relaciones exitentes entre XY , XZ e Y Z. 2.9. Al mismo grupo del ejercicio anterior se le ha pedido que escriba un d gito al azar entre 0 y 9 as como el nmero de hermanos u que tiene, obtenindose los siguientes pares de valores: e (7, 4), (0, 1), (2, 1), (2, 0), (9, 4), (7, 4), (6, 3), (8, 5) (7, 3), (3, 2), (7, 3), (2, 1), (7, 4),(7, 3), (8, 4), (8, 5) (5, 3), (3, 1), (4, 2), (4, 2), (5, 3), (2, 0), (4, 2) Existe alguna relacin entre las variables?, de qu tipo? o e

86 Cap tulo 2. Anlisis conjunto de variables a 2.10. Sea la variable bidimensional (X, Y ) de la que se han obtenido 25 pares de valores, con los siguientes resultados:
25 25

r = 0 65,
i=1 25

xi = 238,
i=1 25

yi = 138

x2 = 12678, i
i=1 i=1

2 yi = 2732

a) Calcule medias, varianzas y covarianza de X e Y . b) Indique qu variable es ms homognea. e a e 2.11. En cada uno de los estanques, A y B, se tienen 100 ejemplares de una variedad de dorada todas ellas afectadas por un parsito. a La alimentacin es idntica en ambos estanques salvo en un producto o e encaminado a eliminar dichos parsitos, suministrado unicamente a los a del estanque A. Posteriormente, se encuentra que en 71 ejemplares del A y en 58 del B han desaparecido los parsitos. Halle el coeciente de a contingencia y el coeciente de Cramer e interprete los resultados. 2.12. Demuestre que el coeciente de Cramer est comprendido a entre 0 y 1. 2.13. Demuestre que el valor mximo del coeciente de contina gencia de una tabla k k es
(k1) k .

2.14. Antes de un campeonato de ftbol las apuestas indican que u las posiciones que ocuparn al nalizar ste cinco de los equipos partia e cipantes es A > B > C > D > E. Un jugador apuesta que el orden nal ser A > D > B > E > C. Mida el grado de similitud entre ambas a ordenaciones. 2.15. Se mide el tiempo que 10 estudiantes tardan en realizar dos experimentos en los que predominan el clculo mental y la capacidad a espacial, respectivamente. Si los valores obtenidos son:

2.6 Ejercicios 87 Estudiante Tarea 1 Tarea 2 1 32 41 2 37 33 3 45 46 4 50 47 5 48 40 6 56 71 7 78 70 8 69 65 9 77 75 10 79 83

Estudie la relacin entre los resultados obtenidos en ambas tareas. o 2.16. Dos grupos de estudiantes deciden clasicar a 11 profesores. Los resultados se muestran a continuacin: o Prf. Gr.I Gr.II Es. 7 8 Og. 4 2 Mt. 2 1 Ig. 8 5 Fs. 9 3 Ge. 10 11 C. a 11 9 FQ. 6 10 Oc. 1 7 Bi. 3 4 In. 5 6

Compare ambas clasicaciones. 2.17. En un grupo de 100 personas se estudian los atributos Color del Cabello (Moreno, Rubio, Castao) y Color de los Ojos (Negro, n Marrn, Azul y Verde), obtenindose la siguiente tabla de contigencia: o e

Ojos \ Cabello Negro Marrn o Azul Verde

Moreno 20 16 5 10

Rubio 8 2 8 5

Castao n 4 11 8 3

Estn relacionados dichos atributos? a

88

You might also like