You are on page 1of 6

https://prezi.

com/vnmuq6wdkl49/prueba-de-shapiro-wilk-para-probar-
normalidad/
https://prezi.com/vnmuq6wdkl49/prueba-de-shapiro-wilk-para-probar-
normalidad/
http://www.uv.es/~friasnav/SupuestosParametrica.pdf .-------- teor

http://webdelprofesor.ula.ve/ciencias/segninis/Docencia/ANEXO_A_Sahapiro-
Wilks.pdf ejer
En estadstica, el Test de ShapiroWilk se usa para contrastar la normalidad de un
conjunto de datos. Se plantea como hiptesis nula que una muestra x1, ..., xn proviene de
una poblacin normalmente distribuida. Fue publicado en 1965 por Samuel
Shapiro y Martin Wilk.1 Se considera uno de los test ms potentes para el contraste de
normalidad, sobre todo para muestras pequeas (n<50).
El estadstico del test es:

donde

x(i) (con el subndice i entre parntesis) es el nmero que ocupa la i-sima posicin
en la muestra;

= (x1 + ... + xn) / n es la media muestral;


las variables ai se calculan2

donde

siendo m1, ..., mn son los valores medios del estadstico ordenado, de variables
aleatorias independientes e identicamente distribuidas, muestreadas de
distribuciones normales. V es la matriz de covarianzas de ese estadstico de orden.
La hiptesis nula se rechazar si W es demasiado pequeo.3 El valor
de W puede oscilar entre 0 y 1.
Interpretacin: Siendo la hiptesis nula que la poblacin est
distribuida normalmente, si el p-valor es menor a alfa (nivel de
significancia) entonces la hiptesis nula es rechazada (se concluye
que los datos no vienen de una distribucin normal). Si el p-valor es
mayor a alfa, no se rechaza la hiptesis y se concluye que los datos
siguen una distribucin normal.
La normalidad se verifica confrontando dos estimadores alternativos
de la varianza :

un estimador no paramtrico al numerador, y


un estimador paramtrico (varianza muestral), al denominador.
EJEMPLO

Ejemplo 1.

Con los datos correspondientes a la variable Trans de la encuesta Enctrans.sav y con referencia a los

encuestados que viven en Barcelona, se quiere comprobar si su distribucin en cuanto al tipo de transporte
utilizado se adapta a los resultados de un estudio realizado por el Ayuntamiento de Barcelona, que son los
siguientes: el 40% de los desplazamientos al trabajo se realizan en metro; el 30% en autobs; el 20% en

transporte privado y 10% otros medios.

La distribucin de frecuencias de la variable Trans es:

En este caso para realizar el contraste Chi-cuadrado es necesario definir las cuatro categoras
contempladas en la hiptesis nula. Para ello, se crea una nueva variable, Trans2, a partir de Trans con las
siguientes categoras: Metro, Bus, Privado (que resultar de agregar Coche y Moto) y Otros (que agrupar
Tren y Otros).Una vez creada la nueva variable, con la secuencia Analizar > Pruebas no paramtricas >
Chi-cuadrado se llega al cuadro de dilogo en donde se selecciona la variable Trans2 y se introduce en
Valores esperados las frecuencias relativas de cada categora segn la hiptesis nula correctamente
ordenadas: 0,4 para la categora 1; 0,3 para la 2; 0,2 para la 3 y 0,10 para la 4. Al aceptar se obtienen
los siguientes resultados:
Como todas las categoras presentan frecuencia esperada mayor que 5 se puede aplicar el contraste Chi-
cuadrado sin modificar el nmero de categoras. El valor del estadstico Chi-cuadrado permite rechazar la
hiptesis nula para niveles de significacin superiores al 2,7%. As pues, al 5% de significacin se llega a

la conclusin de que la distribucin del tipo de transporte que utilizan los alumnos no se adapta a la
publicada por el ayuntamiento.

222222222222222222222222222222

Caso
Por fistulizacin se obtuvo el pH de seis muestras de bilis heptica, con los siguientes resultados:
7.83, 8.52, 7.32, 7.79, 7.57, 6.98

Se quiere saber si la bilis heptica puede considerarse neutra, para lo que se har uso del contraste de la
media, el cual requiere que la muestra proceda de una poblacin normal. Es necesario pues contrastar si
se puede suponer tal cosa.

Efectivamente, el estadstico de contraste W arroja un valor de 0.969151, lo suficientemente alto como


para que no exista evidencia sobre la no normalidad. En conclusin, ser admisible realizar el contraste de
la media al objeto de analizar si la bilis heptica puede considerarse neutra.

Fggfgggggg

Contrastaremos la normalidad de los siguientes datos muestrales


(n=10)

0.93 1.20 1.10 1.26 1.38 1.24 1.32 1.14 1.24 1.18

Con los clculos pertinentes obtenemos el valor de b=0.3653 y de


la cuasivarianza Sc2=0.01561. Al final tenemos que W=0.9498.

La regin crtica es 0.9498 10,. Vamos a variar el valor de para


obtener distintos valores de W10,. Para =0.1 tenemos que
W10,0.1=0.869, para =0.05 tenemos que W10,0.05=0.842 y para
=0.01 tenemos que W10,0.01=0.781. En todos los casos se acepta
H0, es decir, los datos muestrales siguen una distribucin normal.

333333333333333333333
44444444444444444444444

6666666666
EJEMPLO
En un centro de investigacin sobre trastornos de la alimentacin se llev
caboun estudio para probar una nueva terapia en mujeres anorxicas.
Losefectos benficos de la intervencin se observaran en el peso ganado
(enkg.) por las mujeres al trmino de tres meses. El estudio se realiz conuna
muestra aleatoria de siete mujeres y los datos obtenidos son lossiguientes.61 -
4 8 -2 5 0

Antes de proceder a analizar los datos con pruebas de inferencia estadstica


sedesea corroborar si se distribuyen de manera normal. Probar la hiptesis
nulade que la distribucin de la muestra es normal.
SOLUCIN
Variable en escala de razn:
peso ganado
Paso 1.

Establecer las hiptesis a probar


Ho: La distribucin de la muestra es normal.Hi: La distribucin de la muestra no
es normal.
Paso 2.
Elegir la prueba estadstica
Dado que interesa probar que la muestra presenta distribucin normal yse
cuenta con puntajes individuales y en escala de razn, y la muestra fuetomada
de forma aleatoria, se aplicar la prueba de Shapiro-Wilk.
Paso 3. Especificar alfa
Se emplear un

= 0.05
Paso 4. Regin de Rechazo
Todos los valores menores o iguales a W
t
con un alfa de .05
Paso 5. Decisin
Para obtener el valor observado de W y tomar la decisin estadstica seaplica
el procedimiento con la frmula de W

777777777777777777

http://knuth.uca.es/repos/l_inf_est/pdf/actual/lib_inf.c5.pdf

88888888

Se han medido los tiempos de ejecucin de cierta tarea por parte de seis operarios, con los
siguientes resultados en horas: 6.55, 5.58, 4.33, 2.53, 5.49, 8.64. Se quiere saber si las
mediciones provienen de una poblacin normal.

x = c(6.55, 5.58, 4.33, 2.53, 5.49, 8.64)


shapiro.test(x)
Shapiro-Wilk normality test

data: x
W = 0.9827, p-value = 0.9643

El test nos devuelve una probabilidad crtica muy grande, 0.9643, lo que no nos da evidencias
suficientes para rechazar la hiptesis de normalidad.

999999999999999999999999999

EJEMPLO Contrastar la hiptesis de que los datos siguientes provienen de una distribucin
normal: (20, 22, 24, 30, 31, 32, 38). Para aplicar el test calcularemos los valores j n, a
directamente en la tabla 10, entonces: a17= 0.6233 a27= 0.3031 a37= 0.1401 Por lo tanto, A
ser: A a x x a x x a x x = + + 17 7 1 27 6 2 37 5 2 ( ) ( ) ( ) = 0.6233. (18) + 0.3031 (10) +
0.1401(7)=15.2311 Como: 2 s = 34.9796, 2 ns = 244.8571 2 A = 231.9864 El estadstico resultante
ser: = 231.9864 = 0.9474 244.8571 El valor de para n=7 y un nivel de significacin de 0.05
es, 0.803, menor que el obtenido, por lo que aceptamos la hiptesis de normalidad.

http://www.estadisticacondago.com/images/estadistica_inferencial/pruebas%20de%20normalidad.pdf
http://carleos.epv.uniovi.es/~carleos/docencia/epig/pl/00GuionesPracticas.pdf 1111

12

http://webpersonal.uma.es/~MORILLAS/CNOPARAI.pdf intro

133333

https://www.slideshare.net/NoeliaBenitezSantos/seminario-9-estadistica-62174366

bibliografas:

http://www.ugr.es/~bioestad/guiaspss/practica7/

https://www.slideshare.net/NoeliaBenitezSantos/seminario-9-estadistica-62174366

http://carleos.epv.uniovi.es/~carleos/docencia/epig/pl/00GuionesPracticas.pdf

http://www.ub.edu/aplica_infor/spss/cap5-6.htm

http://www.sgapeio.es/INFORMEST/VICongreso/taller/applets/biomates/explora/explora_shapirow/explo

ra_shapirow.htm

You might also like