You are on page 1of 8

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ UNIDAD TEMATICA 1: ORGANIZACIN Y PRESENTACIN DE DATOS

TOS EN TABLAS BIDIMENSIONALES INTRODUCCION En un estudio de investigacin, una vez que se han definido las variables de inters, recogido los datos y elaborado la base de datos entre otras cosas, el paso siguiente es tratar de organizar y presentar datos de una variable, de dos variables, o ms de dos variables teniendo en cuenta los objetivos del estudio. A menudo, es necesario estudiar en la poblacin dos o ms variables simultneamente, como por ejemplo: cuando se observa en determinada regin el rea de los predios agrcolas y su produccin de legumbres (o de papa, trigo, caf, etc.), la poblacin de algn departamento del Per segn el sexo y la edad en el ao 2007, los ingresos y gastos de un grupo de familias, el nmero de muertes por accidentes de trabajo, el peso y edad de un grupo de nios, la estatura de padres e hijos, las horas de estudio y las notas obtenidas en un examen. En casos como estos, es posible analizar si existe alguna relacin funcional entre ambas variables e incluso cuantificar esta relacin. Los datos bidimensionales son los valores de dos variables distintas obtenidos de cada unidad de anlisis, ya sea en la poblacin o en la muestra. Se les utiliza cuando se trata de saber si dos variables estn asociadas o relacionadas. Para analizar la relacin existente entre dos variables, debe efectuarse un anlisis de correlacin y de regresin. PRESENTACION DE DATOS BIVARIADOS O BIDIMENSIONALES: Tablas de distribucin de frecuencias bidimensionales o Tablas estadsticas bivariadas o tablas de doble entrada, tablas de contingencia. Grficos de tablas estadsticas bivariadas.

TABLAS ESTADISTICAS BIVARIADAS Consideremos las variables X e Y definidas en una poblacin o en una muestra. La informacin obtenida de las unidades de anlisis, respecto a la variable bidimensional (X,Y), se compone de n datos en forma de pares. La distribucin de los n datos bidimensionales se presenta en una tabla de doble entrada o tabla estadstica bivariada, como la que se muestra a continuacin. X i/ Yj i=1 c1 i=2 c2 . . i=i ci . . i=k ck Total (f . j)
j=1

c1

j=2

c2

f11 f21 fi1 fk1 f.1

f12 f22 fi2 fk2 f.2

. . . . . . . .

j=j

cj f1i f2j fij fki f.i

..

j=r

cr f1r f2r fir fkr f.r

Total (f i .) f1. f2. fi. f k. n

Donde f i j son las frecuencias absolutas conjuntas, i= 1, 2,.,k (filas) y j= 1,2,,r (columnas) f i .: Son las frecuencias absolutas marginales de X , f i . = , i = 1,2,..,k, .=n f . j: Son las frecuencias absolutas marginales de Y, f i. j = , j = 1,2,..,r, . =n n= , nmero total de pares observados _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO 1

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Las variables X e Y pueden ser: a) Ambas cualitativas. As por ejemplo, clase social y simpata poltica, ocupacin y profesin, b) Una cualitativa y la otra cuantitativa, como por ejemplo, ingreso y profesin, ocupacin y nmero de hijos, nivel educativo y nmero de hijos, c) Ambas cuantitativas, como por ejemplo, nmero de personas y nmero de habitaciones por vivienda, ingresos y nmero de hijos, ingresos y tiempo de servicios. Cualquiera que sea el tipo de variable, sus valores o modalidades se ubican en los encabezados de filas y columnas, y en el cuerpo de la tabla y en los mrgenes se ubican las frecuencias absolutas conjuntas y absolutas marginales respectivamente. fij es la frecuencia absoluta conjunta o bidimensional. Indica el nmero de veces que se presenta, al mismo tiempo, la clase o categora ci de X y la clase o categora cj de Y. fi. es la frecuencia absoluta marginal de X. Indica el nmero de veces que se presenta la clase ci de X. f.j es la frecuencia absoluta marginal de Y. Indica el nmero de veces que se presenta la clase cj de Y. Antes de realizar cualquier estudio de la variable bidimensional (X,Y), organizaremos los datos en tablas y grficos adecuados. CASO 1: AMBAS VARIABLES SON CUALITATIVAS O CATEGRICAS Ejemplo 1: Se tom una muestra de 200 habitantes de una comunidad de la provincia de Lima, ao 2010, con el objetivo de conocer su opinin sobre el control de la natalidad (X) de acuerdo a su nivel socioeconmico (Y) y se obtuvo los siguientes resultados:
Xi AP AP AP DE DE DE NO NO NO TOTAL Yi BA ME AL BA ME AL BA ME AL fi 40 30 20 35 15 10 30 15 5 200

X : opinin X: variable cualitativa o categrica, con 3 niveles Aprueba : AP Desaprueba: DE No opina: NO Y: nivel socioeconmico Y: variable cualitativa o categrica, con 3 niveles Bajo: BA Medio: ME Alto: AL

DISTRIBUCIN CONJUNTA A continuacin, los datos bidimensionales sern puestos en una tabla de doble entrada la cual nos mostrar la clasificacin de los habitantes de una comunidad de Lima de acuerdo a las dos variables de estudio. Tabla 1: Tabla de frecuencias absolutas conjuntas y absolutas marginales DISTRIBUCION CONJUNTA DE HABITANTES DE UNA COMUNIDAD DE LIMA SEGN OPINION SOBRE EL CONTROL DE LA NATALIDAD Y NIVEL SOCIOECONOMICO j= 2 ME j = 3 AL f. a. m. X: f i . Xi / Y j j= 1 BA i = 1 AP 40 30 20 90 i= 2 DE 35 15 10 60 i= 3 NO 30 15 5 50 f. a. m.Y: f . j 105 60 35 n = 200 _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO 2

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Notaciones: fij : frecuencia absoluta conjunta, i = 1, 2, 3 indica las filas de X (OPINION) j = 1,2,3 indica las columnas de Y(NIVEL SOCIOECONOMICO) f i . : frecuencia absoluta marginal de X i , i = 1, 2, 3 i = 1 = CO i = 2 = SI i = 3 = SE f1. = f2. = f3. = = 40+30+20 = 90 = 35+15+10 = 60 = 30+15+5 = 50

f . j : frecuencia absoluta marginal de Y j , j = 1, 2 ,3 j = 1 = PRI j = 2 = SEC j = 3 = SUP f.1= f.2= f.3= = 40+35+30 = 105 = 30+15+15 = 60 = 20+10+15 = 35

DISTRIBUCIONES MARGINALES A partir de la tabla bidimensional, podemos obtener las distribuciones marginales. En los mrgenes derecho e inferior de la tabla, se encuentran los totales de filas y columnas. Los totales de la derecha son las frecuencias de la variable X, y los totales de la parte inferior son las frecuencias de la variable Y. Si se desea, se puede obtener cada distribucin por separado, obtenindose as las distribuciones marginales. Tablas 2 y 3: Tablas de distribuciones marginales de la opinin y del nivel socioeconmico, respectivamente Tabla 2 Distribucin marginal de los habitantes de una comunidad de Lima segn opinin sobre control de la natalidad Xi fi.
CO SI SE TOTAL 90 60 50 200

Tabla 3 Distribucin marginal de los habitantes de una comunidad de Lima segn nivel socioeconmico Yj f.j
PRI SEC SUP TOTAL 105 60 35 200

A partir de la frecuencia absoluta conjunta se puede obtener la frecuencia relativa conjunta hij que indica la proporcin de veces que se presenta, al mismo tiempo, la clase ci de X y la clase cj de Y: hij = fij / n Se cumple que : =1 .=1 . =1 3

h i . : es la frecuencia relativa marginal de la categora ci de X; h i . = f i . / n , h . j : es la frecuencia relativa marginal de la categora cj de Y; h . j = f . j / n,

_____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Tabla 4: Distribucin de frecuencias relativas conjuntas (hij) y marginales ( h i . , h . j ) en porcentaje. Xi / Yj AP DE NO f. r. m.Y: h . j % BA 20.0 17.5 15.0 52.5 ME 15.0 7.5 7.5 30.0 AL 10.0 5.0 2.5 17.5 f. r. m.X: h i . % 45 30 25 100

Todas las frecuencias de esta tabla han sido obtenidas dividiendo las frecuencias conjuntas y marginales de la tabla 1 entre el nmero total de datos (n = 200) h ij : frecuencia relativa conjunta h 11 = f11 / n = 40 / 200 = 0.20 h 12 = f12 / n = 30 / 200 = 0.15, ., h33 = f33 / n = 0.025 Frecuencias relativas marginales de X: h i . h 1 . = 20 + 15+ 10 = 45 = 90/200 h 2 . = 17.5+7.5+5 = 30 = 60/200 h 3 . = 15+7.5+2.5 = 25 = 50/200 Frecuencias relativas marginales de Y: h . j h . 1 = 20+17.5+15 = 52.5 = 105/200 h . 2 = 15+ 7.5+7.5 = 30 = 60/200 h . 3 = 10+ 5 + 2.5 = 17.5 = 35/200

Tablas 5 y 6: Distribuciones marginales de la opinin y del nivel socioeconmico, respectivamente (frecuencias relativas marginales expresadas en porcentajes) Tabla 5 h i .%
45 30 25 100

Xi
AP DE NO TOTAL

Yj
BA ME AL TOTAL

Tabla 6 h . j%
52.5 30 17.5 100.0

Las tablas 1 y 4 tambin reciben el nombre de TABLAS DE CONTINGENCIA DISTRIBUCIONES CONDICIONALES Considerando las frecuencias relativas conjuntas o absolutas conjuntas se puede obtener diferentes tipos de tablas, cuando se tome en cuenta las proporciones respecto al total de datos, respecto al total de filas y respecto al total de columnas, se obtienen las distribuciones condicionales. En cada caso, las interpretaciones de las frecuencias son diferentes. Considerando la tabla N 4 (distribucin de frecuencias relativas conjuntas) se obtiene la siguiente tabla N 7 Tabla 7: Distribuciones de frecuencias relativas condicionales de X i / Y= y j : h i j (en %) Xi : Control de Xi / Y 1 = BA Xi / Y 2 = ME Xi / Y 3 = AL natalidad h i j=1 h i j=2 h i j=3 AP 38.1 50 57.1 DE 33.3 25 28.6 NO 28.6 25 14.3 TOTAL 100.0 100 100.0 _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Distribucin de la variable X condicionada a que la variable Y tome la modalidad Y1 = BA Para i = 1, AP / Y1 = BA = h 1 j = 1 = h 11 / h . 1 = 20 / 52.5 = 0.3809 Para i = 2, DE / Y1 = BA = h 2 j = 1 = h 21 / h.1 = 17.5/52.5 = 0.3333 Para i = 3, NO / Y1 = BA = h 3 j = 1 = h 31 / h.1 = 15/52.5 = 0.2857 Como puede observarse, esta tabla nos muestra tres distribuciones diferentes para X. Nos informa acerca de la distribucin de la opinin de aquellos habitantes que tienen solamente nivel socioeconmico bajo o medio o alto (se considera el total de cada columna como una submuestra) Esta tabla se denomina Tabla de Perfiles Columna Interpretacin de las frecuencias de la 2 columna de la tabla 7: Del total de habitantes de la comunidad de Lima que tienen nivel socioeconmico bajo, el 38.1% aprueba, el 33.3% desaprueba y el 28.6% no opina sobre el control de la natalidad. Tabla 8: Distribuciones de frecuencias relativas condicionales de Y j / X = x i : h j i (en %) Y j : Nivel socioeconmico Yj / X 1 = AP h j i=1 Yj / X 2 = DE h j i=2 Yj / X 3 = NO h j i=3 BA ME AL TOTAL 45.0 33 22.0 100 58.3 25 60.0 30 16.7 10.0 100 100

Distribucin de la variable Y condicionada a que la variable X tome la modalidad X1 = AP Para j = 1, BA / X 1 = AP = h 1 i = 1 = h 11 / h 1. = 20/45 = 0.45 j = 2 ME / X 1 = AP = h 2 i = 1 = h 12 / h 1. = 15/45 =0.33 j = 3 AL / X 1 = AP = h 3 i = 1 = h 13 / h 1. = 10/45 =0.22 Como puede observarse, esta tabla nos muestra tres distribuciones diferentes para Y. Nos informa acerca de la distribucin del nivel socioeconmico de aquellos habitantes cuya opinin es aprueba o desaprueba o no opina (se considera el total de cada fila como una submuestra) Esta tabla se denomina Tabla de Perfiles Fila o Lnea. Interpretacin de las frecuencias de la 2 fila de la tabla 8: Del total de habitantes de una comunidad de Lima que aprueban el control de la natalidad, el 45% provienen del nivel socioeconmico bajo, el 33% del nivel socioeconmico medio y el 22% del nivel socioeconmico alto. De manera similar se pueden obtener las otras distribuciones condicionales de la tabla 1. REPRESENTACIN GRFICA Cuando ambas variables son cualitativas o categricas, los grficos adecuados son los siguientes: Frecuencias conjuntas absolutas o relativas: Grfico de barras de partes componentes o segmentadas Grfico de barras agrupadas: dobles o triples. _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO 5

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Frecuencias Condicionales expresadas en %: Grfico de perfiles columna Grfico de perfiles fila o lnea Frecuencias marginales absolutas o relativas: Grfico de barras simples para cada clase o modalidad o categora de la variable X y para cada clase, modalidad o categora de la variable Y CASO 2: UNA VARIABLE ES CUALITATIVA Y LA OTRA ES CUANTITATIVA Ejemplo 2: La tabla 9 muestra la distribucin de las variables edad y sexo de los empleados de la empresa VIDA SOLAR . Tabla N 9 Y: Gnero X: Edad
20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 Masculino 3 6 13 9 10 7 3 4 2 Femenino 1 2 3 5 6 5 13 6 2 43

Total
f. a. m. Xi 3 7 15 12 15 13 8 17 8 2 100

Total f.a.m. Yj

57

A continuacin, mostramos las distribuciones marginales de las edades y del sexo de los empleados de la empresa Vida Solar. Tabla N 10 Edades
20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 50 - 54 55 - 59 60 - 64 65 - 69 Total 3 7 15 12 15 13 8 17 8 2

Tabla N 11 Sexo Masculino femenino Total frecuencia 57 43 100

Con estos datos, obtener en forma similar lo hallado en las tablas 4, 7 y 8 Tabla 4: Frecuencias relativas conjuntas h ij y relativas marginales h i . y h . j Tabla 7: Frecuencias condicionales h i j Tabla 8: Frecuencias condicionales h j i _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO 6

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Ejemplo 3: La tabla 10 muestra la distribucin de 538 personas de acuerdo a su ocupacin X y nmero de hijos Y Tabla N 12 0 1 2 3 4 f. a. m. Xi X / Y Obreros 10 20 35 50 73 188 Empleados 13 30 50 60 17 170 Profesionales 32 50 70 20 8 180 55 100 155 130 98 f. a. m. Yj 538 Con los datos obtener en forma similar lo hallado en las tablas 4, 7, 8. Tabla 4: Frecuencias relativas conjuntas h ij y relativas marginales h i . y h . j Tabla 7: Frecuencias condicionales h i j Tabla 8: Frecuencias condicionales h j i Graficar: Distribucin del nmero de hijos segn ocupacin (grfico de barras de partes componentes). Distribucin de la ocupacin de las personas segn nmero de hijos (grfico de lnea de partes componentes) CASO 3: AMBAS VARIABLES CUANTITATIVAS (DISCRETAS O CONTINUAS) Caso 3.1: (X,Y) ambas cuantitativas discretas Ejemplo 4: Sea X nmero de hijos ( 0, 1, 2) e Y nmero de dormitorios por vivienda (1, 2, 3) Xi / Yj 0 1 2 f.a.m.Y : f . j 1 10 20 15 45 Tabla N 13 2 15 8 5 28 3 20 17 10 47 f.a.m.X: f i . 45 45 30 120

Notaciones: fij : frecuencias absoluta conjunta f i . : frecuencia absoluta marginal de X f . j : frecuencia absoluta marginal de Y Fij : frec. absoluta acumulada conjunta h j i: frec. Condicional de Y/X en % Representacin Grfica: Frecuencias absolutas conjuntas:

h i j : frecuencia relativa conjunta h i . : frecuencia relativa marginal de X h . j : frecuencia relativa marginal de Y Hij : frec. relativa acumulada conjunta h i j: frec. condicional de X/Y en %

Grfico de bastones en R3 Grfico de dispersin o nube de puntos

Frecuencias marginales absolutas y relativas: Grfico de bastones en R2 Caso 3.2 : (X,Y) ambas variables cuantitativas continuas Ejemplo 5: A 148 parejas se les pregunt la edad del esposo (Y) y la edad de la esposa (X) _____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO 7

UNMSM FCM EAPE CURSO: ESTADISTICA II- SEMESTRE ACADEMICO 2011-2 ________________________________________________________________________________ Tabla N 14 Distribucin conjunta de 148 parejas de acuerdo a las edades de la esposa y del esposo hi. Xi / Yj [15 25) [25 35) [35 45) fi. [15 25) 20 13.5 30 20.0 2 1 52 34.5 20 13.5 50 34.0 52 35 [25 35) 12 8.0 50 34.0 6 4 68 46.0 32 22.0 112 76.0 120 81 [35 45) 4 3.0 20 13.5 4 3 28 19.5 36 24.0 136 92.0 148 100 f.j h.j 36 24.5 100 67.5 12 8 148 100.0 Frecuencias conjuntas: fij hij Fij Hij Frecuencias marginales absolutas y relativas fi. hi. f.j h.j

Frecuencias marginales de Xi y de Yj: Absolutas (f i .), relativas (h i .), acumuladas absolutas (Fi .) y acumuladas relativas (H i .). Xi [15 25) [25 35) [35 45) Total Tabla N 15 fi. h i . Fi. % 52 68 28 148 34.5 52 46.0 120 19.5 148 100.0 Hi . % 34.5 80.5 100.0 Yj [15 25) [25 35) [35 45) Total Tabla N 16 f.j h.j % F.j H.j %

Ejercicio: Completar la tabla de las frecuencias marginales de Yj e interpretarlas. Usar la tabla del lado derecho como gua. Frecuencias condicionales de X / Yj : h i j (en %) Tabla N 17 h i j=1 h i j=2 h i j=3 56 33 11 100 30 50 20 100 17 50 33 100 Yj h j i=1 h j i=2 h j i=3 [15 25) Tabla N 18 [25 35) [35 45) Total

Xi [15 25) [25 35) [35 45) Total Ejercicio :

1) De manera similar hallar las frecuencias condicionales de Y/ Xi : h j i (en %) e interpretarlas. Usar tabla del lado derecho como gua. 2) Averiguar los posibles grficos a realizar para los diferentes tipos de frecuencias cuando ambas variables son cuantitativas continuas.

_____________________________________________________________________________ PROFESORAS: ANA MARA CRDENAS / CARIDAD HUAROTO

You might also like