You are on page 1of 4

Prueba de Kruskal – Wallis: Análisis de la varianza por rangos

El procedimiento del análisis de la varianza se relaciona con la igualdad de las medias


de varias poblaciones. Sus datos estaban en un nivel de intervalo o de razón. Asimismo,
se supuso que las poblaciones seguían la distribución normal de probabilidad y que sus
desviaciones estándar eran iguales. ¿Qué sucede si los datos están a escala ordinal y/o
las poblaciones no siguen una distribución normal?
En 1952, William Henry Kruskal y W. Allen Wallis reportaron una prueba no paramétrica
que sólo requería datos de nivel ordinal (clasificados). No se requieren suposiciones
acerca de la forma de las poblaciones. A la prueba se le conoce como análisis en una
dirección de la varianza por rangos de Kruskal - Wallis.
La prueba de Kruskal – Wallis es el método más adecuado para comparar poblaciones
cuyas distribuciones no son normales. Incluso cuando las poblaciones son normales,
este contraste funciona muy bien. También es adecuado cuando las desviaciones
típicas de los diferentes grupos no son iguales entre sí.
Para la aplicación de la prueba de Kruskal - Wallis, las muestras seleccionadas de la
población deben ser independientes. Por ejemplo, si selecciona y entrevista muestras
de tres grupos —ejecutivos, personal y supervisores—, las respuestas de un grupo
(ejecutivos) no deben por ningún motivo influir en las respuestas de los demás. Para
entenderlo mejor lo explicaremos mediante un ejemplo.
El Hospital System of the Carolinas opera tres hospitales en el área de Great Charlotte:
St. Luke’s Memorial, en el lado poniente de la ciudad, Swedish Medical Center, al Sur,
y el Piedmont Hospital en el lado Este. El director de administración está preocupado
acerca del tiempo de espera de los pacientes con lesiones de tipo deportivo, que no
ponen en peligro la vida, y que llegan durante las tardes entre semana a los tres
hospitales. Específicamente, ¿existe una diferencia en los tiempos de espera en los tres
hospitales?
Para averiguarlo, el director seleccionó una muestra aleatoria de pacientes en los tres
hospitales y determinó el tiempo, en minutos, en que se entra a un hospital y el momento
en que termina el tratamiento.
Tiempos de espera de los pacientes en la sala de urgencias en el Sistema Hospitalario
de las Carolinas

St. Luke´s Memorial Swedish Medical Center Piedmont Hospital


56 103 42
39 87 38
48 51 89
38 95 75
73 68 35
60 42 61
62 107
89

En la tabla observamos que el tiempo de espera más corto, 35 minutos, es del quinto
paciente muestreado en el Piedmont Hospital. El tiempo más largo, 107 minutos, le tocó
al séptimo paciente muestreado en el Swedish Medical Center.
En este caso, las muestras provienen de poblaciones independientes, que son los tres
hospitales. Pero suponga que no quiere asumir que hay una varianza igual en los
tiempos de espera en los tres hospitales o que estos tiempos de espera siguen una
distribución de probabilidad normal. La falta de estos dos criterios significa que no se
cubren los requisitos de ANOVA, así que no se puede utilizar esta técnica. En vez de
eso, recurrimos a la prueba de Kruskal-Wallis, donde no se requieren estas
suposiciones.
El primer paso en la prueba de hipótesis es formular las hipótesis nula y alternativa.

 𝐻0 = Las distribuciones de las poblaciones de los tiempos de espera son iguales


para los tres hospitales.
 𝐻1 = No todas las distribuciones de las poblaciones son iguales.
El director de administración seleccionó un nivel de significancia de 0.05. El estadístico
de prueba de la prueba de Kruskal-Wallis se designa como H, y su fórmula es:
Prueba de Kruskal - Wallis
12 (𝛴𝑅1 )2 (𝛴𝑅2 )2 (𝛴𝑅𝑘 )2
𝐻= [ + + ⋯+ ] − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛1 𝑛2 𝑛𝑘

Con k-1 grados de libertad (k es el número de poblaciones), donde:

 𝛴𝑅1 , 𝛴𝑅2 , … , 𝛴𝑅𝑘  Son las sumas de los rangos de las muestras 1, 2,…, k,
respectivamente.
 𝑛1 , 𝑛2 , … , 𝑛𝑘  Son los tamaños de las muestras 1, 2,…,k, respectivamente.
 𝑛  Es el número combinado de observaciones de todas las muestras.
La distribución del estadístico de prueba H es muy similar a la distribución ji cuadrada
con k - 1 grados de libertad. Es preferible que cada muestra incluya al menos 5
observaciones. Utilice ji cuadrada para formular la regla de decisión. En este ejemplo
hay tres poblaciones: una población de tiempos de espera de pacientes en St. Luke’s
Memorial, otra de pacientes del Swedish Medical Center, y una tercera de los pacientes
de Piedmont Hospital. Por lo tanto, hay k - 1, es decir, 3 - 1 = 2 grados de libertad. El
valor crítico de 2 grados de libertad y el nivel de significancia de 0.05 es 5.99. No rechace
H0 si el valor calculado del estadístico de prueba H es menor o igual a 5.99. Rechace
H0 si el valor calculado de H es mayor que 5.99 y acepte H1.
El paso siguiente es determinar el valor del estadístico de prueba. Remplazamos los
tiempos de espera en los tres hospitales por sus rangos correspondientes.
Considerando los tiempos de espera como una sola población, el paciente de Piedmont
con un tiempo de espera de 35 minutos aguardó el tiempo más corto y, por lo tanto, se
le otorga el rango más bajo, 1. Hay dos pacientes que esperaron 38 minutos, uno en St.
Luke’s y el otro en Piedmont. Para resolver este empate, se otorga a cada paciente un
rango de 2.5, calculado mediante (2 + 3)/2. El proceso continúa con todos los tiempos
de espera. El más largo es de 107 minutos, y ese paciente del Swedish Medical Center
recibe un rango de 21.
En la siguiente tabla se muestra las calificaciones, los rangos y la suma de los rangos
en cada uno de los tres hospitales.
St. Luke´s Memorial Swedish Medical Center Piedmont Hospital
Tiempo de Rango del Tiempo de Rango del Tiempo de Rango del
espera tiempo de espera tiempo de espera tiempo de
espera espera espera
56 9.0 103 20.0 42 5.5
39 4.0 87 16.0 38 2.5
48 7.0 51 8.0 89 17.5
38 2.5 95 19.0 75 5.0
73 14.0 68 13.0 35 1.0
60 10.0 42 5.5 61 11.0
62 12.0 107 21.0
89 17.5
𝛴𝑅1 = 58.5 𝛴𝑅2 = 120.0 𝛴𝑅2 = 52.5

Al despejar H. se obtiene

12 (𝛴𝑅1 )2 (𝛴𝑅2 )2 (𝛴𝑅3 )2


𝐻= [ + + ] − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛1 𝑛2 𝑛3

12 (58.5)2 (120)2 (52.5)2


= [ + + ] − 3(21 + 1) = 5.38
22(21 + 1) 7 8 6

Como el valor calculado de H (5.38) es menor que el valor crítico de 5.99, no se rechaza
la hipótesis nula. No hay evidencia suficiente para concluir que existe una diferencia
entre los tiempos de espera en los tres hospitales.
EJERCICIO PROPUESTO
1. El gerente del banco regional Statewide Financial Bank tiene interés en el índice
de movimientos de dinero de las cuentas de cheques personales en cuatro
sucursales. (El índice de movimientos es la velocidad a la que el dinero en una
cuenta se deposita y se retira; una cuenta extremadamente activa puede tener
un índice de 300; si sólo se emiten uno o dos cheques, el índice puede ser de
30, aproximadamente). Los índices de rotación de las muestras seleccionadas
de las cuatro sucursales bancarias aparecen en la siguiente tabla. Con un nivel
de significancia de 0.01 y la prueba de Kruskal-Wallis, determine si hay una
diferencia entre los índices de rotación de las cuentas de cheques personales de
las cuatro sucursales.

Sucursal Sucursal West Sucursal Great Sucursal Sylvania


Englewood Side Northern
208 91 302 99
307 62 103 116
199 86 319 189
142 91 340 103
91 80 180 100
296 131
Solución:
1. Planteamiento de la hipótesis
𝐻0 = Las distribuciones de las poblaciones son idénticas
𝐻1 = Las distribuciones de las poblaciones no son idénticas.
2. Cálculo del estadístico:
Sucursal Sucursal West Sucursal Great Sucursal Sylvania
Englewood Side Northern
208 17 91 5 302 19 99 7
307 20 62 1 103 9.5 116 11
199 16 86 3 319 21 189 15
142 13 91 5 340 22 103 9.5
91 5 80 2 180 14 100 8
296 18 131 12
𝛴𝑅1 = 89 𝛴𝑅2 = 16 𝛴𝑅3 = 85.5 𝛴𝑅4 = 62.5

12 (𝛴𝑅1 )2 (𝛴𝑅2 )2 (𝛴𝑅3 )2


𝐻= [ + + ] − 3(𝑛 + 1)
𝑛(𝑛 + 1) 𝑛1 𝑛2 𝑛3

12 (89)2 (16)2 (85.5)2 (62.5)2


𝐻= [ + + + ] − 3(22 + 1) = 13.635
22(22 + 1) 6 5 5 6

3. Regla de decisión:
 Si 𝑋𝑐2 ≥ 𝑋𝑡𝑎𝑏2
 Se rechaza 𝐻0 y se acepta la hipótesis alterna, de lo
contrario se acepta 𝐻0 .
El valor crítico de k - 1 = 4 – 1 = 3 grados de libertad es 11.35, se rechaza la hipótesis
nula.
4. Conclusión:
Los índices de movimientos no son iguales.

You might also like