Pruebas No Parametricas

PRUEBAS NO
PARAMETRICAS
ESTADSTICA
La estadstica
Es una serie ordenada de mtodos que se utilizan para la recoleccin, organizacin,
presentacin, anlisis e interpretacin de datos numricos.
La estadstica descriptiva
Se utiliza para describir la frecuencia y distribucin de las caractersticas (o
variables) del objeto en estudio.
La estadstica inferencial
Se ocupa del proceso metdico para obtener conclusiones vlidas de una muestra,
con respecto a la poblacin, de manera tal que se le pueda considerar
representativa de ella.
VARIABLES CUALITATIVAS
Variable cualitativa nominal
Es cuando la variable no tiene punto de comparacin como el color
de los ojos (caf, azul, verde, negro).
Variable cualitativa ordinal.

Es cuando la variable tiene un determinado orden como clase
social (alta, media, baja), duracin de una enfermedad (aguda,
subaguda, crnica), orden en la familia (primero, segundo, tercero,
etc.).
VARIABLE CUANTITATIVA
Variable cuantitativa discreta, discontinua o de intervalo
Es cuando slo se puede medir en valores enteros: como el nmero de
alumnos, el nmero de partos, el nmero de empleados.
Variables cuantitativas continuas o de razn

Es cuando la variable se puede expresar en fracciones, como peso al
nacimiento (3,460 g) o estatura (51.3 cm).
El procedimiento estadstico que se usar para el anlisis de las

variables depende de:
1) El tipo de medida de la variable a analizar;

2) La distribucin que caracteriza a las mediciones de las variables, la
homogeneidad de las varianzas en los grupos de ellas, el impacto
de los residuos y el tamao de la muestra;

3) El poder de la prueba que se usar, es decir, la capacidad de
aceptar o rechazar, correctamente, la hiptesis nula.
Cuando se pretende probar una hiptesis respecto a uno o ms parmetros

de una poblacin que tiende a una distribucin normal, las pruebas usadas
son las de la estadstica paramtrica, como la t de Student.
Si los procedimientos estadsticos no requieren plantear inferencias acerca

de los parmetros de la poblacin (su media y dispersin) se le conoce como
no paramtricos, o de distribucin libre (ya que no se hacen suposiciones
acerca de la distribucin de la poblacin de donde procede la muestra
Las pruebas paramtricas requieren supuestos acerca de la

naturaleza o forma de las poblaciones involucradas.
Las pruebas no paramtricas no requieren supuestos acerca
de las distribuciones poblacionales.
Las pruebas de hiptesis no paramtricas suelen llamarse
pruebas de distribucin libre
Los procedimientos no paramtricos se usan con mayor
frecuencia por los analistas de datos.
Hay aplicaciones en la ciencia y la ingeniera donde los datos

no son valores continuos sino ms bien estn en una escala
ordinal tal que es bastante natural asignar rangos a los datos.
Con las pruebas no paramtricas:

Se puede trabajar con muestras pequeas de datos categricos u ordinales,
independientemente de la distribucin de las muestras que se desea
contrastar.
Las pruebas no paramtricas:
Son ms fciles de aplicar

Son aplicables a los datos jerarquizados
Se pueden usar cuando dos series de observaciones provienen de distintas
poblaciones;
Son la nica alternativa cuando el tamao de muestra es pequeo
Son tiles a un nivel de significancia previamente especificado.
Ventajas de los mtodos no paramtricos

1.Se aplican a una variedad de situaciones, puesto que no tienen
los requisitos ms estrictos de los mtodos paramtricos
correspondientes. En particular, los mtodos no paramtricos no
requieren poblaciones distribuidas normalmente.
2.
A diferencia de los mtodos paramtricos, los mtodos no paramtricos
con frecuencia se aplican a datos categricos, como el gnero de quienes
responden una encuesta.
3.
Los mtodos no paramtricos por lo regular implican clculos ms
sencillos que los mtodos paramtricos correspondientes; por lo tanto,
son ms fciles de entender y aplicar
Desventajas:
1. Los mtodos no paramtricos tienden a desperdiciar informacin,
pues los datos numricos exactos suelen reducirse a una forma
cualitativa.
2. Las pruebas no paramtricas no son tan eficientes como las pruebas
paramtricas, por lo que para una prueba no paramtrica
generalmente necesitaremos evidencia ms fuerte (como una muestra
ms grande o diferencias mayores) para rechazar una hiptesis nula
Cuando usarlos:
1. Cuando la hiptesis a ser probada no se relaciona con ningn parmetro.

2. Cuando los datos han sido medidos en una escala ms dbil que la
requerida para el procedimiento paramtrico alternativo.
3. Cuando se han violado una o ms suposiciones necesarias para la

aplicacin del metodo paramtrico apropiado. Un procedimiento no
paramtrico es frecuentemente la nica alternativa.
4. Cuando los resultados se necesitan rpidamente y los clculos deben
hacerse a mano.
EJEMPLO
La correcta cuantificacin de la ocurrencia de un evento de inters es uno de los

pilares de la experimentacin. La cuantificacin de ciertas variables como
rendimiento, nmero de insectos, altura de plantas, etc. resulta sencillo,
mientras que otras como la cuantificacin del dao que una plaga produce
sobre una hoja, planta o cultivo, que produce efectos intermedios entre planta
sana y planta muerta, no resulta tan simple. Se podra discutir diversas formas
de cuantificar este tipo de efectos y todas daran algn tipo de informacin. El
secreto consiste en extraer toda la informacin posible de los datos, pero no
ms de lo que realmente estos pueden dar. As un grado de ataque clasificado 3
como nulo, leve, medio, alto y muy alto podra tambin ser denominado como
0, 1, 2, 3, 4 y 5 respectivamente. Si se lo expresa de esta segunda forma, podra
resultar tentador pensar que el grado de ataque 4 es el doble del grado de
ataque 2, o que el 3 es el triple del 1, etc. cuando en realidad no sabemos si esto
es realmente as. Se podra incurrir en el error de pretender analizar datos de
este tipo mediante los mtodos paramtricos creyendo que se est obteniendo
ms informacin. Para extraer de los datos la informacin que realmente estos
pueden dar, especialmente cuando son del tipo no numrico, es que viene en
auxilio la estadstica no paramtrica.
Se observa la proporcin, respecto al total de una hoja, que un insecto a destruido (o

consumido) en determinada variedad de planta. El dao se cuantifica a ojo segn la
escala arbitraria siguiente: nulo, escaso, regular, abundante, muy abundante y total. Se
registra la cantidad de hojas dentro de cada categora.
Se debe sealar que hay varias desventajas asociadas con las pruebas no
paramtricas. En primer lugar, no utilizan la informacin que proporciona la muestra,
y por ello una prueba no paramtrica ser menos eficiente que el procedimiento
paramtrico correspondiente, cuando se pueden aplicar ambos mtodos.
PRUEBAS NO PARAMETRICAS
Pruebas para una muestra: Chi-cuadrado (bondad de ajuste con variables
categricas), Binomial (proporciones y cuantiles), Rachas (aleatoriedad) y
Kolmogorov-Smirnov (bondad de ajuste con variables cuantitativas).
Pruebas para dos muestras independientes: U de Mann-Whitney,
Kolmogorov-Smirnov, Reacciones extremas de Moses y Rachas de WaldWolfowitz.

Pruebas para varias muestras independientes: H de Kruskal-Wallis y
Mediana.
Pruebas para dos muestras relacionadas: Wilcoxon, Signos y McNemar.
Pruebas para varias muestras relacionadas: Friedman, W de Kendall y Q de
Cochran
PRUEBA DE
NORMALIDAD
Prueba de Normalidad
Estos procedimientos tratan de averiguar si nuestros datos pueden proceder de una

variable con distribucin normal (Ho).
cul es el efecto de un modelo distinto al supuesto? El utilizar un modelo falso nos
puede llevar a conclusiones no vlidas o, aunque sean vlidas, dejan de ser ptimas. Por
ejemplo, los procedimientos que suponen normalidad llevan a estimaciones poco
precisas cuando esta hiptesis no es vlida, lo que se traduce en intervalos
innecesariamente grandes o contrastes poco potentes. Por tanto, deberemos utilizar
procedimientos alternativos que no requieran de suposiciones sobre la poblacin salvo,
en algunos casos, la de que sea continua.
CHI CUADRADA
Prueba de Bondad de Ajuste
Consiste en determinar si los datos de cierta muestra corresponden a
cierta distribucin poblacional. En este caso es necesario que los valores

de la variable en la muestra y sobre la cual queremos realizar la inferencia
est dividida en clases de ocurrencia, o equivalentemente, sea cual sea la
variable de estudio, deberemos categorizar los datos asignado sus valores
a diferentes clases o grupos.
Oi: frecuencia observada

Ei: frecuencia esperada
EJEMPLO:
En cierta mquina Expendedora de Refrescos existen 4 canales que expiden el mismo
tipo de bebida. Estamos interesados en averiguar si la eleccin de cualquiera de estos
canales se hace de forma aleatoria o por el contrario existe algn tipo de preferencia en
la seleccin de alguno de ellos por los consumidores. La siguiente tabla muestra el

nmero de bebidas vendidas en cada uno de los 4 canales durante una semana.
Contrastar la hiptesis de que los canales son seleccionados al azar a un nivel de
significacin del 5%.
SOLUCION
Calcular las frecuencias esperadas:
Si la seleccin del canal fuera aleatoria, todos los canales tendran la misma
probabilidad de seleccin y por lo tanto la frecuencia esperada de bebidas vendidas
en cada uno de ellos debera ser aproximadamente la misma. Como se han vendido
en total 70 refrescos, la frecuencia esperada en cada canal es
EJEMPLO:
Estamos interesados en comprobar la perfeccin de un dado cbico (un
dado normal de 6 caras). Para esto realizamos 100 lanzamientos del dado
anotando los puntos obtenidos en cada lanzamiento. A la vista de los
resultados obtenidos, podemos concluir que el dado no es perfecto?. Nivel
de significacin (5%)
PRUEBA DE
HOMOGENEIDAD
PRUEBA DE HOMOGENEIDAD
Prueba de Homogeneidad de varias muestras cualitativas, consiste en comprobar si
varias muestras de una carcter cualitativo proceden de la misma poblacin (por
ejemplo: estas tres muestras de alumnos provienen de poblaciones con igual
distribucin de aprobados?.
NOTA:
En este tipo de contraste se suele rechazar la hiptesis nula (los valores observados
son coherentes con los esperados) cuando el estadstico es mayor que un determinado
valor crtico.
EJEMPLO :
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con
relacin al distribuidor que nos lo suministra. Para realizar esto, tomamos una
muestra de 100 componentes (ni) de cada uno de los 3 distribuidores que nos sirven
el producto comprobando el nmero de defectuosos y correctos (nj) en cada lote. La
siguiente tabla muestra el nmero de defectuosos en para cada uno de los
distribuidores.
84
91
SOLUCIN:
Debemos realizar un contraste de homogeneidad para concluir si entre los
distribuidores existen diferencias de fiabilidad referente al mismo componente.
84
91
Frecuencia esperada defectuosos= (100) (49)/300

Frecuencia esperada correctos= 100(251)/300
84
De tablas:
91
8,24
PRUEBA DE
INDEPENDENCIA
Consistente en comprobar si dos caractersticas cualitativas estn relacionadas entre s

(por ejemplo: el color de ojos est relacionado con el color de los cabellos?). Aunque
conceptualmente difiere del anterior, operativamente proporciona los mismos resultados.

Este tipo de contrastes se aplica cuando deseamos comparar una variable en dos
situaciones o poblaciones diferentes, i.e., deseamos estudiar si existen diferencias en las
dos poblaciones respecto a la variable de estudio.
EJEMPLO:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se
seleccion una muestra aleatoria simple de 100 jvenes, con los siguientes resultados:
Determinar si existe independencia entre la actividad del sujeto y su estado de

nimo. Nivel de significacin (5%)
SOLUCIN:
Calcular las frecuencias esperadas bajo el supuesto de independencia. La tabla de
frecuencias esperadas sera:
EJEMPLO:
Un estudio que se realiz con 81 personas referente a la relacin entre la cantidad de
violencia vista en la televisin y la edad del televidente produjo los siguientes resultados.
Edad
Indican los datos que ver violencia en la televisin depende de la edad del televidente,
a un nivel de significacin del 5%?
gl=2
Valor crtico= 5.99
Por lo tanto a un nivel de significacin del 0.005 deberemos rechazar la

hiptesis nula de independencia, y por lo tanto concluir que existe diferencias
entre el tipo de televisin consumida y la edad del televidente.
Ejemplo Clsico de Chi Cuadrada: al comparar los resultados obtenidos

con una nueva tcnica quirrgica usada en 255 individuos intervenidos
en comparacin con la tcnica utilizada ordinariamente.
Planteamiento de hiptesis estadsticas
Ho: Fo = Fe. Las frecuencias observadas son iguales a las

frecuencias esperadas
Ha: Fo Fe. Las frecuencias observadas difieren de las
frecuencias esperadas
Disposicin de ambas distribuciones de frecuencias. Para obtener la

distribucin de frecuencias esperada (terica) se aplican los porcentajes de
los resultados de la tcnica quirrgica tradicional al total de pacientes.
Clculo del valor de 2 mediante la frmula:
En donde :
o = frecuencia observada en una modalidad

e = frecuencia esperada en la misma
modalidad
Comparacin de la 2 calculada con el valor crtico que aparece en el

cuadro de 2 y conclusin respecto a las hiptesis planteadas.
En vista de que el valor calculado de la ji cuadrada rebasa, en ambos casos,

los valores crticos de las tablas al nivel de 5 % y 1 %, se puede rechazar la
hiptesis nula ( Ho: Fo = Fe ) con una p < 0.01.
Conclusin. Existen diferencias en la frecuencia de pacientes ubicados en

las diversas modalidades de los resultados obtenidos con la tcnica
quirrgica nueva respecto a las frecuencias que se encontraran en las
mismas modalidades si se hubiera aplicado la tcnica quirrgica usual, al
menos en el caso de estos 255 pacientes intervenidos.
PRUEBA DE
PROBABILIDAD EXACTA
DE FISHER Y YATES
PRUEBA DE MCNEMAR
PARA MUESTRAS
DEPENDIENTES
PRUEBA Q DE COCHRAN
PARA 3 O MAS
MUESTRAS
DEPENDIENTES
ANALISIS
SECUENCIAL
PRUEBA DE
KOLMOGOROV
Y SMINORV
DECISION
PRUEBA DE U
MANN
WHITNEY
PRUEBA DE
WILCOXON
PRUEBA DE
FRIEDMAN
PRUEBA DE
KRUSKALL
WALLIS
PRUEBA DE
SIGNOS
PRUEBA DE SIGNOS
La idea bsica que est detrs de la prueba del signo es el anlisis de las frecuencias
de los signos positivos y negativos, para determinar si son significativamente
diferentes. Por ejemplo, suponga que probamos un tratamiento que se dise para
disminuir la presin sangunea. Si se trata a 100 sujetos y 51 de ellos experimentan

una presin sangunea ms baja, mientras que los otros 49 tienen una presin
sangunea incrementada, el sentido comn sugiere que no hay evidencia suficiente
para decir que el frmaco es eficaz, puesto que 51 disminuciones en 100 casos no
son significativas. Pero qu sucede con 52 disminuciones y 48 incrementos? O

con 90 disminuciones y 10 incrementos? La prueba del signo nos permite
determinar cundo son significativos este tipo de resultados.
PRUEBA DE SIGNOS
EJEMPLO
Un restaurante italiano cercano a un campus universitario esta considerando la
posibilidad de utilizar una nueva receta para hacer la salsa que echa a las pizzas. Se
elige una muestra aleatoria de ocho estudiantes y se pide a cada uno que valore en
una escala de 1 a 10 su opinin sobre la salsa original y sobre la salsa propuesta. La
Tabla muestra las valoraciones obtenidas en la comparacin; los nmeros mas altos
indican que gusta mas el producto.
Indican los datos una tendencia general a preferir la nueva salsa a la original?
Hiptesis
Ho: No hay una tendencia general a preferir uno de los productos al otro (P=0.5)
Ha: La mayora prefiere el nuevo producto (o menos del 50% prefiere
el producto original)
SOLUCION:
Encontrar la probabilidad de observar en la muestra un resultado tan extremo o ms
que el que se obtendra si la hiptesis nula fuera, en realidad, verdadera:
n=7
P(x)= 2 (probabilidad de xito)
Entonces:
P-valor = P(x 2) = P(x = 0) + P(x = 1) + P(x = 2)
= 0,0078 + 0,0547 + 0,1641 = 0,2266
Decisin: Se acepta la Ho
Conclusin: los datos no son suficientes para sugerir que los estudiantes prefieren la
nueva salsa
Si se desear conocer la existencia de preferencia por alguno de los dos productos:
P(x): 2
P(x): 5
p-valor = P(x 2) + P(x 5) = P(0) + P(1) + P(2) + P(5) + P(6) + P(7) = 0,4532
Decisin: Se acepta la Ho.

Conclusin: los datos no son suficientes para pensar que los estudiantes
prefieren una de las salsas a la otra.
EJEMPLO
Medicin de inteligencia en nios Las mediciones mentales de nios pequeos se
hacen dndoles cubos y pidindoles que construyan una torre tan alta como sea
posible. Un experimento de construccin con cubos se repiti un mes despus, con
los tiempos (en segundos) listados en la tabla 12-2 (datos tomados de Tower
Building, de Johnson y Courtney, Child Development, vol. 3). Utilice un nivel de
significancia de 0.05 y pruebe la aseveracin de que no hay diferencia entre los
tiempos de la primera y segunda pruebas.
HIPOTESIS:
Ho: No existe diferencia (la mediana de las diferencias es igual a 0).
Ha: Existe una diferencia (la mediana de las diferencias no es igual a 0).
El estadstico de prueba x es el nmero de veces que ocurre el signo menos frecuente.

La tabla 12-2 incluye diferencias con 12 signos positivos y dos signos negativos;
descartamos el nico caso con una diferencia de cero. Permitimos que x sea igual al
menor entre 12 y 2; por lo tanto, x = 2. Adems, n =14 (el nmero total de signos
positivos y negativos combinados). Nuestra prueba es de dos colas con =0.05.
PRUEBA DE SIGNOS CON APROXIMACION NORMAL
Si el numero n de observaciones muestrales no nulas es grande, el contraste de signos

se basa en la aproximacin normal de la binomial de media y desviacin tpica:
donde S* es el estadstico del contraste corregido para tener en cuenta la continuidad

y se define de la forma siguiente:
a) En un contraste de dos colas:
b) En un contraste de la cola superior
En un contraste de la cola inferior
EJEMPLO:
Se ha pedido a una muestra aleatoria de 100 nios que comparen dos nuevos
sabores de helado: mantequilla de cacahuete y chicle. Cincuenta y seis miembros de
la muestra prefieren el helado de mantequilla de cacahuete, 40 el de chicle y 4 no
manifiestan ninguna preferencia. Utilice la aproximacin normal para averiguar si
existe una preferencia general por cualquiera de los dos sabores
Hiptesis:
Ho:Los nios no tienen ninguna preferencia por ninguno de los dos sabores (P=0.5)
Ha: Los nios tienen preferencia par uno de los dos sabores (P0.5)
SOLUCION:
Sea P la proporcin de la poblacin que prefiere el helado de chicle, por lo que S =

40.
(Tambin podra haber sido la proporcin de la poblacin que prefiere el helado de
mantequilla de cacahuete; en ese caso S = 56).
DECISIN: Se acepta la Ho
CONCLUSION: No existe suficiente evidencia para argumentar preferencia

sobre algn sabor
Discriminacin por gnero La cadena de restaurantes Hatters recibi acusaciones de

discriminacin por gnero porque slo contrat a 30 hombres junto a 70 mujeres
solicitantes. Una representante de la compaa acept que los solicitantes calificados
son aproximadamente la mitad hombres y la mitad mujeres, pero adems asevera que
Hatters no discrimina y el hecho de que 30 de los ltimos 100 empleados nuevos sean
hombres es slo una casualidad.
Utilice la prueba del signo con un nivel de significancia de 0.05 y pruebe la hiptesis
nula de que esta compaa contrata a hombres y a mujeres por igual.
HIPOTESIS
Ho: la proporcin de hombres contratados es igual a 0.5 (P=0.5)
Ha: la proporcin de hombres contratados es diferente a 0.5 (P0.5)
Si denotamos a los hombres contratados con + y a las mujeres contratadas con -,

tenemos 30 signos positivos y 70 signos negativos. El estadstico
de prueba x=30.
Por lo que rechazamos la hiptesis nula de que la proporcin de hombres

contratados es igual a 0.5.
Hay suficiente evidencia para justificar el rechazo de la aseveracin de que las
prcticas de contratacin son justas, con proporciones de hombres contratados y
mujeres contratadas igual a 0.5. Parece que esta compaa discrimina por no
contratar proporciones iguales de hombres y de mujeres.
Aseveraciones acerca de la mediana de una sola poblacin

Procedimiento para utilizar la prueba del signo en la prueba de una aseveracin
acerca de la mediana de una sola poblacin.
EJEMPLO
Temperaturas corporales El conjunto de datos 4 incluye temperaturas corporales
medidas en adultos. Utilice las 106 temperaturas listadas para las 12:00 AM del da 2
con la prueba del signo, para probar la aseveracin de que la mediana es menor que
98.6F. El conjunto de datos tiene 106 sujetos: 68 sujetos con temperaturas por
debajo de 98.6F, 23 sujetos con temperaturas por encima de 98.6F y 15 sujetos con
temperaturas iguales a 98.6F.
HIPOTESIS:
Ho: La mediana es igual a 98.6F. (mediana = 98.6F)
Ha: La mediana es menor que 98.6F. (mediana < 98.6F)
SOLUCION
Descartamos los 15 ceros, utilizamos el signo negativo (-) para denotar cada
temperatura por debajo de 98.6F y utilizamos el signo positivo (+) para denotar cada
temperatura por encima de 98.6F. As, tenemos 68 signos negativos y 23 signos
positivos; entonces, n=91 y x=23 (el nmero del signo menos frecuente). Los datos
muestrales no contradicen la hiptesis alternativa, puesto que la mayora de las 91
temperaturas estn por debajo de 98.6F. Entonces:
Decisin: se rechaza Ho
Conclusin: La mediana de la temperatura corporal de adultos saludables es

menor que 98.6F.
NOTA:
En esta prueba del signo, para la aseveracin de que la mediana est por debajo de
98.6F, obtenemos un estadstico de prueba de z= -4.61, con un valor P de 0.00000202,
pero una prueba paramtrica de la aseveracin de que < 98.6F da como resultado un
estadstico de prueba de t = -6.611 con un valor P de 0.000000000813. Puesto que el
valor P de la prueba del signo no es tan bajo como el valor P de la prueba paramtrica,
vemos que la prueba del signo no es tan sensible como la prueba paramtrica. Ambas
pruebas nos llevan al rechazo de la hiptesis nula, pero la prueba del signo no considera
que los datos muestrales sean tan extremos, parcialmente porque la prueba del signo
utiliza slo informacin acerca de la direccin de los datos, ignorando las magnitudes de
los valores de los datos.
Un artculo informa cerca de un estudio en el que se modela el motor de un cohete

reuniendo el combustible y la mezcla de encendido dentro de un contenedor metlico.
Una caracterstica importante es la resistencia al esfuerzo cortante de la unin entre los
dos tipos de sustancias. En la siguiente tabla se muestran los resultados obtenidos al
probar 20 motores seleccionados al azar. Se desea probar la hiptesis de que la mediana
de la resistencia al esfuerzo cortante es 2000 psi, utilizando = 0.05.
HIPOTESIS:
Conclusin:
Como P=0.1153 no es menor que
=0.05, no es posible rechazar la
hiptesis nula de que la mediana de la
resistencia al esfuerzo constante es
2000 psi.
Prueba de rangos con signo de Wilcoxon para datos apareados

Mediante el uso de rangos, esta prueba toma en cuenta las magnitudes de las
diferencias. Puesto que la prueba de rangos con signo de Wilcoxon incorpora y utiliza
ms informacin que la prueba del signo, tiende a proporcionar conclusiones que

reflejan mejor la verdadera naturaleza de los datos.
Una prueba no paramtrica que utiliza rangos ordenados de datos muestrales

consistentes en datos apareados. Se usa para probar las diferencias en las
distribuciones poblacionales (diferencias entre 2 poblaciones)
EJEMPLO: Medicin de la inteligencia en nios Los datos en la tabla 12-3 son datos
apareados de tiempos (en segundos) que se obtuvieron a partir de una muestra
aleatoria de nios a quienes se les pidi que construyeran, usando cubos, una torre tan
alta como fuera posible (segn datos de Tower Building, de Johnson y Courtney, Child
Development, vol. 3). Este procedimiento se utiliza para medir la inteligencia de los
nios. Utilice la prueba
de rangos con signo de Wilcoxon con un nivel de significancia de 0.05 y pruebe la
aseveracin de que no hay diferencia entre los tiempos de la primera y de la segunda
pruebas.
HIPOTESIS:
SOLUCION
1.- En la tabla 12-3, el rengln de diferencias se obtiene calculando esta

diferencia para cada par de datos:
d = tiempo de la primera prueba - tiempo de la segunda prueba
2.- Ignorando sus signos, ordenamos los rangos de las diferencias absolutas
de la ms baja a la ms alta. Note que los empates en los rangos se manejan
asignando la media de los rangos implicados a cada uno de los valores empatados y las
diferencias de 0 se descartan.
3: El rengln inferior de la tabla 12-3 se crea insertando a cada rango el signo de la
diferencia correspondiente.
4.- Ahora calculamos la suma de los valores absolutos de los rangos negativos y tambin
calculamos la suma de los rangos positivos.
Suma de los valores absolutos de los rangos negativos: 5.5
Suma de los rangos positivos: 99.5
5.- Permitiendo que T sea la menor de las dos sumas calculadas en el paso 4,
encontramos que T = 5.5.
6.- Permitiendo que n sea el nmero de pares de datos para los que la
diferencia d no es 0, tenemos n = 14.
7.- Puesto que n = 14, tenemos que n 30, por lo cual utilizamos un estadstico
de prueba de T = 5.5 (y no calculamos un estadstico de prueba z). Adems, puesto que
n 30, utilizamos la tabla A-8 para encontrar el valor crtico de 21.
8.- El estadstico de prueba T = 5.5 es menor que o igual al valor crtico de 21, por lo que
rechazamos la hiptesis nula. Por lo que aparentemente hay una diferencia entre los
tiempos de la primera prueba y los tiempos de la segunda prueba.
EJEMPLO: Una compaa de taxis trata de decidir si el uso de llantas radiales en lugar de
llantas regulares con cinturn mejora la economa de combustible. Se equipan 16
automviles con llantas radiales y se manejan por un recorrido de prueba establecido.
Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con
cinturn y se manejan una vez ms por el recorrido de prueba. Se registra el consumo de
gasolina, en kilmetros por litro, de la siguiente manera:
HIPOTESIS:
Prueba de la suma de rangos de Wilcoxon para dos muestras

independientes (prueba U de Mann-Whitney)
Aqu se introduce la prueba de la suma de rangos de Wilcoxon, que es la prueba no

paramtrica de que dos conjuntos independientes de datos muestrales provienen
de poblaciones con la misma distribucin. Dos muestras son independientes, si los
valores muestrales seleccionados de una poblacin no se relacionan, asocian o se
aparean de ninguna forma con los valores muestrales de la otra poblacin.
EJEMPLO. Rowling y Tolstoi. La tabla 12- 4 incluye valores de calificaciones de facilidad

de lectura de 2 libros, utilice los dos conjuntos de datos muestrales independientes de
la tabla 12-4, con un nivel de significancia de 0.05, y pruebe la aseveracin de que las
puntuaciones de facilidad de lectura para pginas de los dos libros tienen la misma
distribucin.
Acomode en rangos las 25 calificaciones de lectura

que se combinaron, comenzando con un rango de 1
(que se asign al valor ms bajo de 51.9).
R denota la suma de los rangos para la muestra que
escogimos como muestra 1. Si elegimos las
calificaciones de Rowling, tenemos:
Calcular:
Prueba de dos colas ya que un valor

positivo grande de z indicara que los
rangos ms altos se encuentran
desproporcionadamente en la primera
muestra, en tanto que un valor negativo
grande de z indicara que la primera
muestra
tuvo
una
porcin
desproporcionada de los rangos ms
bajos.
Se rechaza la Ho, por lo que existe diferencia en la facilidad de lectura de los libros.
Anlisis de Varianza no paramtricos

Anova de Kruskal-Wallis
Anova de Friedman
Anova de Q de Cochran
Las tcnicas de anlisis de varianza no paramtricos son tiles cuando los supuestos
de: Normalidad, Homogeneidad de las varianzas, Independencia de los Errores y
Aditividad de los efectos no se cumplan.
KRUSKAL-WALLIS
Ahora bien, teniendo en cuenta que en muchas situaciones reales resulta demasiado
arriesgado suponer normalidad y homocedasticidad (especialmente si las muestras son
pequeas y/o los tamaos muestrales desiguales), y considerando adems que en otras
situaciones el nivel de medida de los datos puede no ir ms all del ordinal, la prueba de
Kruskal-Wallis representa una excelente alternativa al ANOVA de un factor
completamente aleatorizado.
En la aplicacin de la prueba de Kruskal-Wallis, calculamos el estadstico de prueba

H, el cual tiene una distribucin que puede aproximarse por la distribucin chi
cuadrada, siempre y cuando cada muestra tenga al menos cinco observaciones.
Cuando utilizamos la distribucin chi cuadrada en este contexto, el nmero de
grados de libertad es k- 1, donde k es el nmero de muestras.
Donde:
EJEMPLO Clancy, Rowling y Tolstoi El conjunto de datos 14 del Apndice B incluye datos
obtenidos de 12 pginas que se seleccionaron aleatoriamente de tres libros diferentes:
El oso y el dragn, de Tom Clancy; Harry Potter y la piedra filosofal, de J. K. Rowling; y La
guerra y la paz, de Len Tolstoi. Se obtuvo la puntuacin de facilidad de lectura de
Flesch para cada una de estas obras; los resultados se listan en la tabla 12-5. El sistema
de puntuacin de facilidad de lectura de Flesch da como resultado calificaciones ms
altas para el texto que es ms fcil de leer. Las calificaciones bajas resultan de trabajos
que son ms difciles de leer. Use la prueba de Kruskal-Wallis, con la hiptesis nula de
que tres muestras provienen de poblaciones con la misma distribucin.
HIPOTESIS:
SOLUCION
El nmero de muestras es k = 3; entonces, tenemos 3-1 grados de libertad. Remtase a

la tabla para encontrar el valor crtico de 5.991, que corresponde a 2 grados de libertad
y a un nivel de significancia de 0.05 (con un rea de 0.05 en la cola derecha).
El estadstico de prueba H = 16.949 est en la regin crtica acotada por 5.991; por lo
tanto, rechazamos la hiptesis nula de poblaciones idnticas.
Hay suficiente evidencia para sustentar la conclusin de que las poblaciones de

calificaciones de facilidad de lectura para las pginas de los tres libros no son
idnticas. Los libros parecen tener calificaciones de facilidad de lectura diferentes.
Examinando las sumas de rangos, vemos que Tolstoi tuvo la suma de rangos ms
baja, lo que sugiere que su libro es el ms difcil de leer. Rowling tiene la suma de
rangos ms alta, lo que sugiere que su libro es el ms fcil de leer de los tres.
Ejemplo: El gerente de produccin de una planta donde se empaca cereal en cajas de

368 gramos ha estado considerando la situacin de una mquina vieja que afecta
directamente los resultados de produccin, y ha efectuado un experimento para
determinar si existe alguna diferencia significativa entre los tipos de mquinas respecto
al tiempo (en segundos) que les lleva a los trabajadores de la fbrica efectuar
completamente el proceso de llenado con ellas. Quince obreros de experiencia,
habilidad y edad parecidas fueron asignadas aleatoriamente a fin de recibir

entrenamiento y prctica, el gerente midi el tiempo el tiempo que les que les lleva a
los trabajadores para cada tipo de mquina. Despus de un tiempo adecuado de
entrenamiento y prctica, el gerente midi el tiempo que les lleva a los trabajadores
entrenados terminar el proceso de llenado utilizando su equipo respectivo. Si el gerente
no desea hacer la suposicin de que las mediciones de tiempo se distribuyen
normalmente en las poblaciones subyacentes, se puede utilizar el procedimiento de
libre distribucin conocida como prueba de rangos de Kruskal-Wallis para las diferencias
en las tres medianas de poblacin. Los resultados de este experimento se presentan en
la siguiente tabla, incluyendo los rangos correspondientes.
I
25.40 (14)
26.31 (15)
24.10 (12)
23.74 (11)
25.10 (13)
T1 (65)
Mquina
II
23.40 (9)
21.80 (6)
23.50 (10)
22.75 (8)
21.60 (5)
T2 (38)
III
20.00 (2)
22.20 (7)
19.75 (1)
20.60 (4)
20.40 (3)
T3 (17)
Utilizando la tabla 2 del apndice, el valor crtico de X2 con (c-1) dos grados de libertad y
correspondiente a un nivel de significancia de 0.05 es 5.991. Puesto que el valor calculado del
estadstico de prueba H es mayor que el valor crtico, se puede rechazar la hiptesis nula y
concluir que no todas las mquinas se comportaron igual respecto a la mediana del tiempo
requerido para que un trabajador lleve a cabo el proceso de llenado.
Comparaciones Mltiples de Dunn
Como continuacin de la prueba de rangos de Kruskal-Wallis, se presenta un

procedimiento de comparaciones mltiples, desarrollado por O. J. Dunn.
El alcance crtico para el procedimiento de Dunn se obtiene de:
Alcance crtico
Zu
n( n 1) 1
1
'
12 n j n j
Donde n es el nmero total de observaciones de todos los grupos combinados, njy nj

son, respectivamente, el nmero de observaciones en los grupos j y j , y para un nivel
de significancia seleccionado (), Zu es el valor crtico de una distribucin normal
estandarizada que contiene un rea /*c (c-1)] en el extremo superior.
Ejemplo: Para aplicar el procedimiento de Dunn en el ejemplo anterior, primero se

obtienen los rangos promedio de los tres grupos, a partir de las correspondientes sumas
de rangos que se presentan en la tabla de datos.
_
65
_
38
_
17
R1= ------ =13.0
R2 = ------- =7.6 R3 = ------- =3.4
5
5
5
Existen (3)(3-1)/2 = 3 comparaciones por pares que se deben hacer, debido a que hay
tres mquinas. Las diferencias absolutas de los rangos promedio son:
_
_
|R1 R2| = |13.0 7.6| = 5.4
_ _
|R1 R3| = |13.0 3.4| = 9.6
_ _
|R2 R3| = | 7.6 3.4| = 4.2
Puesto que cada uno de los tres grupos tienen el mismo tamao de muestra, solamente
hay un alcance crtico que sera utilizado en todas las comparaciones posibles. Eligiendo
n nivel de significancia de 0.05 se determina el alcance crtico obteniendo primero Zu=
2.39, puesto que el rea del extremo superior bajo la curva es 0.05/6 = 0.0083, de modo
que:
Entonces: 0.5-0.0083=0.4917
Solamente la segunda comparacin es mayor que el alcance crtico de 6.76, as que

el gerente llega a la conclusin de que la mquina III es significativamente ms
rpida que la mquina I, pero no existe evidencia de una diferencia significativa
entre las mquinas I y II, as como entre las mquinas II y III.
|R1 R2| = |13.0 7.6| = 5.4<6.76
_ _
|R1 R3| = |13.0 3.4| = 9.6>6.76
_ _
|R2 R3| = | 7.6 3.4| = 4.2 <6.76
M1a
M2ab
M3b
ANLISIS DE LA VARIANZA DE FRIEDMAN

Cuando K muestras igualadas tienen sus observaciones medidas, por lo menos, en la
escala ordinal, el anlisis de la varianza de dos criterios de Friedman puede ser
utilizado para probar si las K muestras han sido obtenidas de poblaciones diferentes.
El arreglo en bloques consiste en colocar los datos en una tabla de doble entrada de
n filas y k columnas. Las filas (bloques) representan a los distintos sujetos, unidades,
animales, plantas, etc, etc., y las columnas a las diferentes condiciones (tratamientos,
grupos, muestras, etc.)
Ejemplo: Se disea un experimento de pruebas de degustacin de modo que cuatro

marcas de caf colombiano sean clasificados por 9 expertos. Para evitar cualquier efecto
acumulado, la sucesin de pruebas para las 4 infusiones se determina aleatoriamente
para cada uno de los 9 probadores expertos hasta que se d una clasificacin en una
escala de 7 puntos (1=en extremo desagradable, 7= en extremo agradable para cada una
de las siguientes 4 categoras: sabor, aroma, cuerpo y acidez) la suma de los puntajes de
las 4 caracterstica.
Puesto que es mayor que el valor tabulado (7.81) por tanto se rechaza Ho. Se puede
concluir que hay diferencias importantes (percibidas por los expertos) con respecto a la
calidad de las 4 marcas de caf.
Una vez rechazado Ho la hiptesis nula se pueden usar tcnicas de comparaciones
mltiples a posteriori para determinar qu grupo o grupos, difieren significativamente
de los dems. Dada la magnitud de las medias se sugiere la Prueba de Mnima
Diferencia Significativa.
Ejemplo: El director de investigaciones de una cadena de restaurantes de comida rpida

diseo un experimento de bloques al azar en el cual 24 investigadores fueron
estratificados en seis bloques de cuatro, basndose en la experiencia en evaluacin de
servicio de comida, y los cuatro miembros de cada bloque fueron asignados
aleatoriamente para evaluar el servicio en uno de los cuatro restaurantes que posee la
cadena. Los resultados del experimento se presentan en la siguiente tabla, incluyendo
entre parntesis los rangos de cada bloque.
El valor crtico de extremo superior de la distribucin X2 con un nivel de significancia

de 0.05 y con 3 (c-1) grados de libertad es 7.815. puesto que la calculada es mayor
que el valor crtico, la hiptesis nula puede ser rechazada. Se llega a la conclusin de
que existen diferencias significativas, percibidas por los evaluadores, respecto al
servicio prestado en los cuatro restaurantes
Comparaciones Mltiples de Nemenyi

Ya que se rechaza la hiptesis nula y se llega a la conclusin de que existen evidencias de
una diferencia significativa, como en el ejemplo anterior, el siguiente paso consiste en una
comparacin simultnea de todas las parejas posibles de restaurantes, para determinar
cul, o cules difieren de los dems. Como paso siguiente de la prueba de rangos de
Friedman, se describe un proceso de comparacin mltiple a posteriori propuesto por P.

Nemenyi.
El primer paso consiste en obtener el rango promedio, R.j, para cada uno de los j
grupos ( j =1, 2, , c), el cual se calcula:
(donde j= 1,2,c). Luego se calculan las diferencias (en la que j j) entre todas las c
(c-1)/2 parejas de rangos promedio. El alcance crtico para el procedimiento de
Nemenyi se obtiene de
Alcance crtico=
QU c ,
cc 1
12 r
En la que para un nivel de significancia seleccionado Qu (c, ) es el valor crtico del

extremo superior de una distribucin de rangos studentizada (tabla 7) con c y
grados de libertad
Ejemplo: Para aplicar el procedimiento de Nemenyi al ejemplo de la cadena de

restaurantes de comida rpida, primer paso se obtienen los rangos promedio de los
cuatro rangos de sus correspondientes sumas de rangos.
R.1 = 14.5; R.2 = 6.0; R.3 = 24.0; R.4 = 15.5
_
_
_
_
R.1 = 2.42 R.2 = 1.0 R.3 = 4.00 R.4 = 2.58
Existen 4(4-1)/2 = 6 comparaciones por pareja que se deben realizar porque existen
cuatro restaurantes. Las diferencias absolutas de los rangos promedio son
_
_
| R.1 - R.2 | = |2.42 1.00| = 1.42
_
_
| R.1 - R.3 | = |2.42 4.00| = 1.58
_
_
| R.1 - R.4 | = |2.42 2.58| = 0.16
_
_
| R.2 - R.3 | = |1.00 4.00| = 3.00
_
_
| R.2 - R.4 | = |1.00 2.58| = 1.58
_
_
| R.3 - R.4 | = |4.00 2.58| = 1.42
Puesto que los tres grupos tienen el mismo tamao de muestra, solamente hay un
alcance crtico que se utiliza en todas las comparaciones posibles. Al seleccionar un nivel
de significancia de 0.05, se determina el alcance crtico obteniendo primero Qu (c, )
= 3.63 de la tabla 7. Entonces:
Solamente la cuarta comparacin por parejas, | R.2 - R.3 | = |1.00 4.00| = 3.00, es
mayor que el alcance crtico de 1.91 de manera que el director de investigacin puede
llegar a la conclusin de que el servicio en el restaurante C es significativamente mejor
que en el B, pero no hay evidencia de diferencia significativamente en cualquiera de las
dems parejas de restaurantes.
Prueba Q de Cochran
Anlisis de la Varianza de dos vas sin interaccin con respuesta dicotmica
(Binaria)
Frecuentemente diseamos experimentos de tal manera que ms de dos muestras o

condiciones pueden estudiarse simultneamente. La Q de Cochran es una prueba
para comparar las proporciones de respuestas de un tipo (positivo o negativo) o (cero

o uno) de varios sujetos bajo ciertas condiciones de tratamiento.
Es una prueba para K muestras relacionadas porque los mismos sujetos son evaluados
bajo las mismas condiciones de tratamiento.
Ejemplo: Se desean comparar tres mtodos de diagnstico para la brucelosis bovina

(M1,M2 y M3) para ello se tomaron al azar 14 sueros bovinos y se determino por cada
mtodo su positividad (resultado uno) y no positividad (resultado cero):
Se pide verificar si los tres mtodos de diagnstico son iguales o diferentes en su

especificidad. De ser diferentes indicar Cul es el mejor?
Decisin: Como Q=10,57 es mayor que el valor tabulado de Ji cuadrado = 9,21,

rechazamos Ho.
Conclusin: las respuestas no son todas iguales con los tres mtodos.
El mejor mtodo es el uno. Que puede verificarse con una prueba a

posteriori de mnima diferencia significativa.
La prueba de Kruskal-Wallis (tambin llamada la prueba H)

Es una prueba no paramtrica que utiliza rangos de datos muestrales de tres o ms
poblaciones independientes.
Se utiliza para probar la hiptesis nula de que las muestras independientes provienen
de poblaciones con medianas iguales
La hiptesis alternativa es la aseveracin de que las poblaciones tienen medianas que
no son iguales.
H0 : Las muestras provienen de poblaciones con medianas iguales.
H1 : Las muestras provienen de poblaciones con medianas que no son iguales.
Para aplicar la prueba de Kruskal-Wallis, calculamos el estadstico de prueba H, el cual
tiene una distribucin que puede aproximarse por medio la distribucin chi cuadrada,
siempre y cuando cada muestra tenga al menos cinco observaciones.
Cuando utilizamos la distribucin chi cuadrada en este contexto, el nmero de grados
de libertad es k 1,donde k Es el nmero de muestras.
Prueba de Kruskal - Wallis

Requisitos
Tenemos al menos tres muestras independientes, las cuales se seleccionan al
azar.
Cada muestra tiene al menos cinco observaciones. (Si las muestras tienen menos
de cinco observaciones, remtase a tablas especiales de valores crticos, como las
CRC Standard Probability and Statistics Tables and Fonnulae, publicadas por CRC
Press).
3. No existe el requisito de que las poblaciones tengan una distribucin normal o
alguna otra distribucin particular.
Notacin
N =nmero total de observaciones en todas las muestras combinadas
k = nmero de muestras
R1=suma de los rangos de la muestra 1, que se calcula utilizando el procedimiento
que se describe a continuacin
n i = nmero de observaciones de la muestra 1
Para la muestra 2, la suma de los rangos es R, y el nmero de observaciones es n2
, y se utiliza una notacin similar para las otras muestras.
Valores crticos
La prueba es de cola derecha. ) - 3(N + 1) gl = k 1. (Puesto que el estadstico de prueba
H puede aproximarse por medio de una distribucin chi cuadrada, utilice la tabla A-4
con k 1 grados de libertad, donde k es el nmero de muestras diferentes).
Procedimiento para calcular el valor del estadstico de prueba H

1.-Combine temporalmente todas las muestras en una muestra grande y asigne un
rango a cada valor muestral. (Ordene los valores del menor al mayor, y en caso de
empates, asigne a cada observacin la media de los rangos implicados).
2.-En cada muestra, calcule la suma de los rangos y calcule el tamao muestral.
3. Calcule H utilizando los resultados del paso 2, con la notacin y el estadstico de
prueba descritos en el recuadro anterior.
El estadstico de prueba H es bsicamente una medida de la varianza de las sumas de

rangos R1 , R2 ,..... , Rk. Si los rangos estn distribuidos de forma equitativa entre los
grupos muestrales, entonces H debe ser un nmero relativamente pequeo. Si las
muestras son muy diferentes, entonces los rangos sern excesivamente bajos en algunos
grupos y altos en otros, con el efecto neto de que H ser grande.
En consecuencia, slo los valores grandes de H nos llevan al rechazo de la hiptesis nula
de que las muestras provienen de poblaciones idnticas. La prueba de Kruskal-Wallis es,
por lo tanto, una prueba de cola derecha.
EJEMPLO Efectos de tratamientos en los pesos de lamos

La tabla 13-6 lista los pesos (en kg) de lamos que recibieron tratamientos diferentes.
En la seccin 12-2 utilizamos el anlisis de varianza para probar la hiptesis nula de que
las cuatro muestras de pesos provienen de poblaciones con la misma media. Ahora
usaremos la prueba de Kruskal-Wallis para probar la hiptesis nula de que las cuatro
muestras provienen de poblaciones con medianas iguales.
SOLUCIN
REQUISITO. La prueba de Kruskal-Wallis requiere de tres o ms muestras aleatorias e
independientes, con al menos 5 valores cada una. Las cuatro muestras son
independientes y aleatorias, y cada una tiene 5 valores. Una vez satisfechos todos los
requisitos, procedemos con la prueba.
Las hiptesis nula y alternativa son las siguientes:

H0 : Las poblaciones de los pesos de lamos con los cuatro tratamientos tienen medianas
iguales.
H1 :Las medianas de las cuatro poblaciones no son todas iguales.
PRUEBA DE
SIGNOS
ANOVA
MULTIFACTORIAL
CASO
TIPO DE
MUSICA
LUZ
DROGA
RENDIMIENTO DE
CALCULO
MATEMATICO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
HEAVY
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
AMBIENTAL
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
MOZART
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
NATURAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
ARTIFICIAL
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
TRATAMIENTO
TRATAMIENTO
TRATAMIENTO
PLACEBO
PLACEBO
PLACEBO
11
13
15
9
12
14
5
7
8
5
7
8
15
16
18
11
14
13
9
10
13
4
6
7
19
23
19
14
13
12
13
17
14
9
7
7
CASO
TIPO DE
MUSICA
LUZ
DROGA
RENDIMIENTO DE
CALCULO
MATEMATICO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
1
1
1
11
13
15
9
12
14
5
7
8
5
7
8
15
16
18
11
14
13
9
10
13
4
6
7
19
23
19
14
13
12
13
17
14
9
7
7
VARIABLE INDEPENDIENTES
TIPO
LUZ
DOGA
PARA LA INTERACCION DOBLE TIPO X LUZ

F(2.39)28 =0.06
P MENOR O IGUAL A 0.942
HAY EFECTO SIGNIFICATIVO F(1.30) =31.554
HAY EFECTO SIGNIFICATIVO F(2.30) =6.088
1
1
1
HEAVY
NATURAL
TRATAMIENTO
2
2
2
AMBIENTAL
ARTIFICIAL
PLACEBO
MOZART
COMO 0.06 ES MENOR A .942 , PROBABILIDAD NO SIGNIFICATIVA, NO

HAY INTERACCION SIGNIFICATIVA

Pruebas No Parametricas

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Pruebas No Parametricas

Uploaded by

Copyright:

Available Formats

PRUEBAS NO

Variable cualitativa ordinal.

Variables cuantitativas continuas o de razn

El procedimiento estadstico que se usar para el anlisis de las

1) El tipo de medida de la variable a analizar;

de los residuos y el tamao de la muestra;

Cuando se pretende probar una hiptesis respecto a uno o ms parmetros

Si los procedimientos estadsticos no requieren plantear inferencias acerca

Las pruebas paramtricas requieren supuestos acerca de la

Hay aplicaciones en la ciencia y la ingeniera donde los datos

Con las pruebas no paramtricas:

Las pruebas no paramtricas:

Son ms fciles de aplicar

Ventajas de los mtodos no paramtricos

1. Cuando la hiptesis a ser probada no se relaciona con ningn parmetro.

3. Cuando se han violado una o ms suposiciones necesarias para la

La correcta cuantificacin de la ocurrencia de un evento de inters es uno de los

Se observa la proporcin, respecto al total de una hoja, que un insecto a destruido (o

Kolmogorov-Smirnov, Reacciones extremas de Moses y Rachas de WaldWolfowitz.

Estos procedimientos tratan de averiguar si nuestros datos pueden proceder de una

Prueba de Bondad de Ajuste

Consiste en determinar si los datos de cierta muestra corresponden a

cierta distribucin poblacional. En este caso es necesario que los valores

Oi: frecuencia observada

la seleccin de alguno de ellos por los consumidores. La siguiente tabla muestra el

Frecuencia esperada defectuosos= (100) (49)/300

Consistente en comprobar si dos caractersticas cualitativas estn relacionadas entre s

conceptualmente difiere del anterior, operativamente proporciona los mismos resultados.

Determinar si existe independencia entre la actividad del sujeto y su estado de

Valor crtico= 5.99

Por lo tanto a un nivel de significacin del 0.005 deberemos rechazar la

Ejemplo Clsico de Chi Cuadrada: al comparar los resultados obtenidos

Planteamiento de hiptesis estadsticas

Ho: Fo = Fe. Las frecuencias observadas son iguales a las

Disposicin de ambas distribuciones de frecuencias. Para obtener la

Clculo del valor de 2 mediante la frmula:

o = frecuencia observada en una modalidad

Comparacin de la 2 calculada con el valor crtico que aparece en el

En vista de que el valor calculado de la ji cuadrada rebasa, en ambos casos,

hiptesis nula ( Ho: Fo = Fe ) con una p < 0.01.

Conclusin. Existen diferencias en la frecuencia de pacientes ubicados en

disminuir la presin sangunea. Si se trata a 100 sujetos y 51 de ellos experimentan

son significativas. Pero qu sucede con 52 disminuciones y 48 incrementos? O

Si se desear conocer la existencia de preferencia por alguno de los dos productos:

Decisin: Se acepta la Ho.

El estadstico de prueba x es el nmero de veces que ocurre el signo menos frecuente.

PRUEBA DE SIGNOS CON APROXIMACION NORMAL

Si el numero n de observaciones muestrales no nulas es grande, el contraste de signos

donde S* es el estadstico del contraste corregido para tener en cuenta la continuidad

b) En un contraste de la cola superior

En un contraste de la cola inferior

Sea P la proporcin de la poblacin que prefiere el helado de chicle, por lo que S =

CONCLUSION: No existe suficiente evidencia para argumentar preferencia

Discriminacin por gnero La cadena de restaurantes Hatters recibi acusaciones de

Ha: la proporcin de hombres contratados es diferente a 0.5 (P0.5)

Si denotamos a los hombres contratados con + y a las mujeres contratadas con -,

Por lo que rechazamos la hiptesis nula de que la proporcin de hombres

Aseveraciones acerca de la mediana de una sola poblacin

Conclusin: La mediana de la temperatura corporal de adultos saludables es

Un artculo informa cerca de un estudio en el que se modela el motor de un cohete

Prueba de rangos con signo de Wilcoxon para datos apareados

ms informacin que la prueba del signo, tiende a proporcionar conclusiones que

Una prueba no paramtrica que utiliza rangos ordenados de datos muestrales

1.- En la tabla 12-3, el rengln de diferencias se obtiene calculando esta