Professional Documents
Culture Documents
Independencia y Homogeneidad
Grupo Pearson
06 de octubre de 2015
Enunciado
Buscar un ejemplo donde se aplique la prueba de independencia y otro ejemplo donde se aplique la prueba de
homogeneidad. Analice los residuales en cada caso.
1. Prueba de independencia
Descripcin del caso
Para el ejemplo tomamos informacin de la base de datos del Latinobarmetro correspondiente al ao 2013,
estudio de ciencias polticas en Amrica Latina. Se aplica la prueba de independencia debido a que la tabla
ha sido construida en base a solo una muestra, la correspondiente a Per.
Se consult a los encuestados su opinin sobre la imagen de progreso del Pas. Las alternativas dadas fueron
que el pas est progresando, que est estancado y que est en retroceso.
En la tabla se consideran dos variables: La opinin sobre la imagen de progreso del pas y el grupo de edad
del encuestado.
Opinin <- c("Est progresando", "Est estancado", "Est en retroceso")
GrupodeEdad <- c("16-25","26-40", "41-60", "61 y ms")
TablaOpinin <- expand.grid(Opinin = Opinin, GrupodeEdad = GrupodeEdad)
data <- c(138,109,34,184,180,55,111,158,56,53,61,36)
TablaOpinin <- cbind(TablaOpinin, Frecuencia = data)
TablaOpinin <- xtabs(Frecuencia ~ GrupodeEdad + Opinin, TablaOpinin)
TablaOpinin
##
Opinin
## GrupodeEdad Est progresando Est estancado Est en retroceso
##
16-25
138
109
34
##
26-40
184
180
55
##
41-60
111
158
56
##
61 y ms
53
61
36
Prueba de Hiptesis
H0: No existe relacin entre el grupo de edad del encuestado y su opinin sobre la imagen de progreso del
pas.
H1: S existe relacin entre el grupo de edad del encuestado y su opinin sobre la imagen de progreso del pas.
library(vcd)
## Warning: package 'vcd' was built under R version 3.1.3
## Loading required package: grid
assocstats(TablaOpinin)
##
##
##
##
##
##
##
X^2 df
P(> X^2)
Likelihood Ratio 24.339 6 0.00045234
Pearson
25.138 6 0.00032200
Phi-Coefficient
: 0.146
Contingency Coeff.: 0.145
Cramer's V
: 0.103
Dado que los residuales calculados no estn estandarizados de manera que se pueda identificar qu residuales
son grandes o no, se calcula a continuacin los residuales estadarizados de Pearson.
#Residuales estandarizados de Pearson
chisq.test(TablaOpinin)$stdres
##
Opinin
## GrupodeEdad Est progresando Est estancado Est en retroceso
##
16-25
3.0236931
-1.7239361
-1.7592562
##
26-40
1.3225751
-0.1414598
-1.6101973
##
41-60
-3.1021827
2.3024216
1.0724561
##
61 y ms
-1.6051387
-0.6795715
3.1224215
Como se aprecia, la magnitud de los residuales se distribuye ms o menos homogneamente en la tabla,
variando entre -1.75 y 1, a excepcin de dos celdas con residuales de -0.14 y -0.06.
Se aprecia que tres celdas son las que presentan residuales ms pronunciados y, por ende, contribuyen ms al
rechazo de la hiptesis nula: las celdas correspondientes a una imagen de que el pas est progresando por
parte de los grupos de edad 16-25 aos y 41-60 aos, as como la celda correspondiente a la opinin de que el
pas est en retroceso por parte del grupo de edad de 65 aos a ms. Estas tres celdas tienen residuales de
alrededor de -3 o 3, siendo los ms grandes valores de la tabla de residuales.
2. Prueba de homogeneidad
Descripcin del caso
Para el ejemplo tomamos informacin de la base de datos del Latinobarmetro correspondiente al ao 2013,
estudio de ciencias polticas en Amrica Latina. Se aplica la prueba de independencia debido a que la tabla
ha sido construida en base a ms de una muestra, una por cada pas de inters.
Se consult a los encuestados su grado de satisfaccin con el funcionamiento de la democracia.
En la tabla se consideran dos variables: El pas de procedencia del encuestado y el grado de satisfaccin con
el funcionamiento de la democracia.
Satisfaccin <- c("Muy satisfecho","Satisfecho", "Insatisfecho", "Muy insatisfecho")
Pas <- c("Bolivia", "Colombia", "Ecuador", "Per")
Tabla.Democracia <- expand.grid(Satisfaccin = Satisfaccin, Pas = Pas)
data <- c(89,366,549,135,49,291,592,218,142,569,373,77,31,266,656,154)
Tabla.Democracia <- cbind(Tabla.Democracia, Frecuencia = data)
Tabla.Democracia <- xtabs(Frecuencia ~ Pas + Satisfaccin, Tabla.Democracia)
Tabla.Democracia
##
Satisfaccin
## Pas
Muy satisfecho Satisfecho Insatisfecho Muy insatisfecho
##
Bolivia
89
366
549
135
##
Colombia
49
291
592
218
##
Ecuador
142
569
373
77
##
Per
31
266
656
154
Prueba de hiptesis
H0: El comportamiento de las proporciones del grado de satisfaccin con el funcionamiento de la democracia
es similar en los 4 pases estudiados.
H1: El comportamiento de las proporciones del grado de satisfaccin con el funcionamiento de la democracia
no es similar en los 4 pases estudiados.
assocstats(Tabla.Democracia)
##
##
##
##
##
##
##
Dado que los residuales calculados no estn estandarizados de manera que se pueda identificar qu residuales
son grandes o no, se calcula a continuacin los residuales estadarizados de Pearson.
#Residuales estandarizados de Pearson
chisq.test(Tabla.Democracia)$stdres
##
Satisfaccin
## Pas
Muy satisfecho
##
Bolivia
1.5286608
##
Colombia
-3.9874444
##
Ecuador
8.4619476
##
Per
-6.1024383
Como se aprecia, existen diferencias apreciables en la magnitud de los residuales estandarizados hallados. En
particular, los residuales asociados al caso boliviano son los menores, ubicndose entre -1.12 y 1.5, mientras
que los residuales asociados al caso ecuatoriano son los mayores de la tabla, llegando a valores como -12.2 y
13.7. Los casos colombiano y peruano tienen valores de residuales tambin altos (entre -6.1 y 8.9). Dado que
existen numerosos valores de residuales altos, podra considerarse fiable la conclusin de rechazar la hiptesis
nula respecto de toda la tabla, ya que en ella existen mltiples y fuertes discordancias entre las frecuencias
esperadas y las frecuencias observadas en la mayora de celdas.