Professional Documents
Culture Documents
SEMANA 5
Estadstica bivariada
Todos los derechos de autor son de la exclusiva propiedad de IACC o de los otorgantes de sus licencias. No est
permitido copiar, reproducir, reeditar, descargar, publicar, emitir, difundir, poner a disposicin del pblico ni 1
ESTE
utilizarDOCUMENTO
los contenidos paraCONTIENE LAdeSEMANA
fines comerciales 5
ninguna clase.
2
ESTE DOCUMENTO CONTIENE LA SEMANA 5
NDICE
3
ESTE DOCUMENTO CONTIENE LA SEMANA 5
ESTADSTICA BIVARIADA
OBJETIVOS ESPECFICOS
Conocer y comprender el concepto de estadstica bivariada.
INTRODUCCIN
En las aplicaciones de la estadstica hay muchos problemas que requieren un anlisis combinado
de dos variables. En las siguientes reas: administracin, en educacin y en muchas otras materias,
a menudo es necesario contestar preguntas como: Estn relacionadas estas dos variables? Si es
as, de qu manera? Existe una correlacin entre las variables?. Considere los siguientes
ejemplos:
- Los mdicos prueban frmacos nuevos para combatir la fiebre amarilla, al prescribir dosis
diferentes y observar las respuestas de sus pacientes.
4
ESTE DOCUMENTO CONTIENE LA SEMANA 5
1. TABLAS DE FRECUENCIAS BIVARIADAS
Una tabla de frecuencias bivariada tambin es llamada tabla de frecuencias bidimensional y lo que
hace es resumir la distribucin de frecuencias de dos variables de manera simultnea.
En donde:
5
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Ejemplo 1:
Si se quiere calcular el promedio de edad de las personas que estudiaron 14 aos, se transforma
en un problema de una sola variable:
Como la variable es continua (se debe considerar la marca de clase de la variable edad), el tiempo
promedio es:
20 2 24 1 28 2
Tiempo
5
Cabe destacar que el total de individuos es 5, ya que son ellos los que cumplen la condicin de
estudiar 14 aos y que 2 tienen 20 aos, 1 tiene 24 y 2, 28 aos, entonces:
20 2 24 1 28 2 40 24 56 120
Tiempo 24
5 5 5
6
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Ejemplo 2:
Se desea estudiar el promedio de aos de estudio, pero solo de aquellas personas menores de
26 aos:
Luego, se tiene:
12 7 13 1 14 3 15 3 84 13 42 45 184
Aos 13,14
14 14 14
As, el promedio de aos de estudio para los menores de 26 aos es de aproximadamente 13 aos.
Ejemplo 3:
7
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Solucin:
El nmero de matrimonios que cumplen con la condicin de edad (entre 20 y 30) son:
Es decir:
35 + 7 + 3 + 14 = 59
b) A lo ms 35 aos significa que la edad de los maridos es menor o igual a dicho nmero.
Entonces, el grupo que se debe evaluar es:
As, se puede escribir la tabla de la siguiente manera. Recordar que la marca de clases es
calcular los extremos dividido por dos, es decir y tomando como ejemplo el primer intervalo, se
tiene (20 + 25)/2 = 45/2 = 22,5.
8
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Luego, si la cantidad total de matrimonios es 92:
2.500
YX 35 27,174
92
Por lo tanto, la media de la edad de las mujeres cuyos maridos tienen a lo ms 35 aos es de 27
aos aproximadamente.
c) Finalmente, para determinar cul rango de edad de los maridos es ms homogneo, hay que
calcular el coeficiente de variacin para las siguientes tablas:
Luego:
22.100
23,375 .
935 23,375 2 6,11 2,47
X 20Y 25
40 40
2,47
CV ( X 20Y 25 ) 0,1057 10,57%
23,375
9
ESTE DOCUMENTO CONTIENE LA SEMANA 5
- Para la segunda tabla se tiene:
Marca de
Clase X(aos) N matrimonios Mc*Nmatri Mc^2*Nmatrim
22,5 20 - 25 1 22,5 506,3
27,5 25 - 30 3 82,5 2.268,8
32,5 30 - 35 2 65 2.112,5
37,5 35 - 40 1 37,5 1.406,3
207,5 6.293,8
Luego:
207,5
X 35Y 40 29,642
7
6.293,8
29,642 2 20,46 4,523
7
4,523
CV ( X 35Y 40 ) 0,1526 15,26%
29,642
Por lo tanto el grupo ms homogneo son los matrimonios cuya edad de la mujer es menor a
25 aos, ya que su coeficiente de variacin es menor.
2.1. COVARIANZA
La covarianza entre dos variables es una medida estadstica para determinar el tipo de relacin
entre dichas variables. Se la identificar como: S xy
S xy XY X Y
10
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Observaciones:
Ejemplo:
Una empresa desea estudiar la relacin entre la edad de sus trabajadores y los das no trabajados.
Considerar:
X = edad.
Y = n de das no trabajados.
11
ESTE DOCUMENTO CONTIENE LA SEMANA 5
De este modo:
3 16 9 16 15 15 417
Dias 8,8723
47 47
0 810 337,5 990 1485 0 315 1260 3150 135 810 5400
Edad Das 312,61
47
Entonces, se puede concluir que la relacin es directa, pues, si la edad de los trabajadores
aumenta, los das no trabajados tambin.
Este coeficiente se aplica cuando la relacin que puede existir entre las variables es lineal (es decir,
si se representara en un grfico los pares de valores de las dos variables, la nube de puntos se
12
ESTE DOCUMENTO CONTIENE LA SEMANA 5
aproximara a una recta). No obstante, puede que exista una relacin que no sea lineal, sino
exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal no medira
correctamente la intensidad de la relacin de las variables, por lo que convendra utilizar otro tipo
de coeficiente ms apropiado.
S
xy
rxy
S S
x y
Observaciones:
Si r 1
xy
Si r 1
xy
13
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Si r 0
xy
Ejemplo:
X = n de trabajadores.
Y = utilidades (en millones de $).
N de Utilidades
trabajadores (en millones de $)
14 48 8 12 ni MCi
0 100 12 / 1.500 6 / 1.800 0/0 18 50
100 200 6 / 2.250 3 / 2.700 1 / 1.500 10 150
200 300 4 / 2.500 5 / 7.500 3 / 7.500 12 250
300 400 0/0 6 / 12.600 10 / 35.000 16 350
nj 22 20 14 N 56
MC j 2,5 6 10
2,5 22 6 20 10 14 315
Y 5,625
56 56
14
ESTE DOCUMENTO CONTIENE LA SEMANA 5
2,5 50 12 6 50 6 10 50 0 2,5 150 6 6 150 3 10 150 1 2,5 250 4
6 250 5 10 250 3 2,5 350 0 6 350 6 10 350 10
XY
56
74.850
1.336,607
56
Por lo tanto:
S XY X Y S 1.336 ,607 196 ,428 5,625
xy xy
S 231,6995
xy
Entonces la covarianza indica que existe relacin directa entre el nmero de trabajadores y las
utilidades de las empresas, es decir, a mayor nmero de trabajadores, mayor cantidad de
utilidades).
2.257 ,5 315 2
s 8,672 2,945
y 56 56
231,6995
rxy 0,65
120 ,955 2,945
El coeficiente de correlacin indica que existe relacin lineal entre el nmero de trabajadores y las
utilidades, con pendiente positiva.
2
S
2 xy
rxy
S x S y
15
ESTE DOCUMENTO CONTIENE LA SEMANA 5
231,6995
rxy 0,65
120 ,955 2,945
231,6995
rxy ( ) 2 0,42
120 ,955 2,945
Luego, el coeficiente de determinacin indica que el 42% de las utilidades son influenciadas por la
cantidad de trabajadores o que el 42% de los trabajadores tiene influencias sobre las utilidades.
Ejemplo 1:
Construir una tabla que cuente los datos clasificados por rango de estatura y nivel
socioeconmico.
a) Cuntas personas tienen una estatura sobre 161 cm y hasta 179 cm?
d) De las personas que tienen una estatura desde 152 cm y hasta 170 cm, qu porcentaje poseen
un nivel socioeconmico bajo?
Solucin:
Para desarrollar este ejercicio, se debe construir una tabla dinmica que presente las variables
descritas, esto es:
16
ESTE DOCUMENTO CONTIENE LA SEMANA 5
a) Cuntas personas tienen una estatura sobre 161 cm y hasta 179 cm?
Para resolver esto, se debe filtrar la variable Rango Estatura segn la o las filas que se deban
ocupar:
Entonces, hay 272 personas que tienen una estatura sobre 161 cm y hasta 179 cm.
b) Para saber cuntas personas tienen una estatura de a lo ms 170 cm y poseen un nivel
socioeconmico bajo o medio?
Hay 356 personas que miden a lo ms 170 cm y son de nivel socioeconmico bajo o medio.
Al realizar los filtros se ordenan los datos como porcentaje del total:
Cuenta de ID Nivel socioeconmico
Rango Estatura Bajo Medio Alto Total general
152 - 161 11,80% 24,40% 9,40% 45,60%
161 - 170 11,20% 23,80% 8,00% 43,00%
170 - 179 2,20% 5,00% 4,20% 11,40%
Total general 25,20% 53,20% 21,60% 100,00%
Por tanto, el 74,8% (53,2% + 21,6%) de las personas son de nivel socioeconmico medio o alto.
d) Y de las personas que tienen una estatura desde 152 cm y hasta 170 cm, qu porcentaje
poseen un nivel socioeconmico bajo?
Al realizar los filtros se ordenan los datos como porcentaje del total:
Entonces el resultado arroja que el 25,96% de los que miden desde 152 cm y hasta 170 cm,
tienen un nivel socioeconmico bajo.
17
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Ejemplo 2:
Construir una tabla que cuente con los datos clasificados por rango de peso y rango de estatura.
a) Cuntas personas pesan entre 51,3 y 59,9 kg y miden entre 170 y 179 cm?
b) De las personas que miden a lo ms 170 cm, qu porcentaje pesa ms de 68,5 kg?
Solucin:
a) La primera pregunta es cuntas personas pesan entre 51,3 y 59,9 kg y miden entre 170 y 179
cm?
Se obtiene que:
Entonces, no hay personas que pesan entre 51,3 y 59,9 kg, y que midan entre 170 y 179 cm.
Aproximadamente un 22,35% de los que miden a lo ms 170 cm, pesan ms de 68,5 kg.
18
ESTE DOCUMENTO CONTIENE LA SEMANA 5
c) Finalmente para responder qu variable presenta menos variabilidad:
Para calcular la covarianza y coeficiente de correlacin se debe digitar las siguientes frmulas:
Covarianza:
=COVAR(DATOS_DE_X ; DATOS_DE_Y)
Coeficiente de correlacin:
=COEF.DE.CORREL(DATOS_DE_X; DATOS_DE_Y)
19
ESTE DOCUMENTO CONTIENE LA SEMANA 5
COMENTARIO FINAL
En esta semana se aprendi como introduccin el estudio de la estadstica bivariada, ya que es el
comienzo de las aplicaciones ms comunes de esta rea en, por ejemplo, medicina, psicologa, y
especialmente en economa y econometra. Sin lugar a dudas, estas reas sern beneficiadas con
estos conocimientos y herramientas estadsticas aplicadas en la vida del futuro profesional, que no
solo las necesitar, sino que sacar mucho provecho en su diario quehacer al obtener valiosos
resultados inapelables.
20
ESTE DOCUMENTO CONTIENE LA SEMANA 5
REFERENCIAS
Anderson, D.; Sweeney, D. y Williams, T. (2008). Estadstica para administracin y economa, 10.
Thomson Editores.
Levin, R.; Rubin, D.; Balderas, M.; Del Valle, J. C. y Gmez, R. (2004). Estadstica para
21
ESTE DOCUMENTO CONTIENE LA SEMANA 5
22
ESTE DOCUMENTO CONTIENE LA SEMANA 5