You are on page 1of 5

1

INSTITUTO TECNOLOGICO DE REYNOSA


ESTADISTICA INFERENCIAL
Integrantes del equipo:

Correa Garca Daniela Osmara Carmona Chaidez Gabriela Lizeth Cruz Ramrez Margarita Isabel Cisneros Espinoza Susana Priscilla Ramos Gonzlez Sergio Eduardo
Tema:

Prueba de Kolmogorov-Smirnov
Profesora:

Ing. Ana Maritza Ramrez Govea


Equipo nmero:

SEIS

Reynosa, Tamaulipas Noviembre 2011

Prueba de Smirnov - Kolmogorov (SK)


En esta prueba tambin se est interesado en el grado de concordancia entre la distribucin de frecuencia muestral y la distribucin de frecuencia terica, bajo la hiptesis nula de que la distribucin de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La prueba trabaja con la funcin de distribucin (distribucin de frecuencia acumulativa). Esta prueba pertenece al campo de la Estadstica No Paramtrica. Sea F0(x) la funcin de distribucin terica para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un valor menor o igual a x (tambin se interpreta como la proporcin esperada de observaciones que tengan un valor menor o igual a x). Es decir: Sea Sn (x) la funcin de distribucin emprica, calculada con base en los valores observados de la muestra n observaciones. Sn (x) representa la proporcin de valores observados que son menores o iguales a x, y est definida como: Sn (x) = P ( X x/ dados los resultados muestrales) = m/n donde m es el nmero de valores observados que son menores o iguales a x. En la prueba de Smirnov-Kolmogorov se est interesado en la mayor desviacin entre la funcin de distribucin terica y la emprica, es decir entre F0 (x) y Sn(x), para todo el rango de valores de x. Bajo la hiptesis nula se espera que estas desviaciones sean pequeas y estn dentro de los lmites de errores aleatorios. Por lo tanto, en la prueba S-K se calcula la mayor desviacin existente entre F0 (x) y Sn(x), denotada por Dmax(x) y est dada por: Dmax(x) = Max | FX (x) - Sn (x) | La distribucin de Dmax(x) es conocida y depende del nmero de observaciones n. Se acepta la hiptesis nula de que no existe diferencia significativa entre las distribuciones tericas y empricas si el valor de Dmax(x) es menor o igual que el valor crtico Dmaxp(a,n). (Ver tabla adjunta para valores crticos).
Reynosa, Tamaulipas Noviembre 2011

Esta prueba se puede realizar para valores agrupados en intervalos de clase y tambin para valores sin agrupar. Tabla tomada parcialmente del libro Simulation and Analysis of Industrial Systems, de Schmidt y Taylor. El procedimiento general para realizar esta prueba para valores agrupados en intervalos de clase es el siguiente: 1) Especificar la distribucin nula es f0(x,q), y estimar sus parmetros si es necesario. 2) Organizar la muestra en una distribucin de frecuencia, en intervalos de clase. 3) Con base en la distribucin observada de frecuencia, se calcula la distribucin acumulativa Sn(Xi) = mi/n, siendo Xi el lmite superior del intervalo de clase, y mi el nmero de valores de la muestra menores o iguales que Xi. Sn(Xi) corresponde simplemente a la frecuencia relativa acumulada hasta el intervalo i. 4) Se calcula la funcin de distribucin terica F 0 Xi). 5) Para cada intervalo de clase se calcula la diferencia entre F0 (Xi ) y Sn (Xi), y se busca la mxima Dmax = Max | FX (Xi) - Sn (Xi), i = 1, 2, , k. 6) Se busca en la tabla el valor crtico Dmaxp(a,n) con el nivel de significancia a. Si el valor observado Dmax es menor o igual que el valor crtico, entonces se acepta la hiptesis nula de que no existen diferencias significativas entre la distribucin terica y la distribucin dada por los resultados muestrales, es decir, que los valores generados siguen la distribucin que se haba supuesto. Cuando la muestra es pequea y/o los valores no se van a organizar en intervalos de clase el procedimiento es similar, slo que el paso 2 se cambia por ordenar los valores de la muestra en forma ascendente, de menor a mayor, y en los pasos 3 y 4 se calculan las funciones de distribucin terica y emprica para cada valor de la muestra. Ejemplo. Considere de nuevo el ejemplo de la prueba de habilidad aplicada a un grupo de 80empleados. Mediante la prueba de Smirnov Kolomogorov. Con un
Reynosa, Tamaulipas Noviembre 2011

nivel de significancia del 5%, pruebe la hiptesis de que los puntajes obtenidos siguen una distribucin normal. Solucin. De la tabla construida para realizar la prueba chi cuadrado tomaremos la informacin pertinente y la complementaremos con la informacin faltante, relativa al clculo de Sn(Xi). Los clculos se muestran a continuacin. El valor crtico para n = 80 valores y un nivel de significancia del 5% es Dmaxp(0.05,80) = 1.36/ = 0.152. Como la diferencia mxima observada fue de 0.0236 no hay razn para dudar que los puntajes se puedan aproximar mediante una distribucin normal. Ejemplo: Prueba de Smirnov - Kolmogorov - Valores agrupados. En la tabla siguiente se presentan los clculos para realizar la prueba S-K para la muestra de 100 nmeros aleatorios generados mediante un generador congruencial multiplicativo con a = 899, C = 0 y M = 32768, usados para la prueba chi cuadrado. La diferencia mxima observada es Dmax(x) = 0.09 y el valor crtico para un nivel de significancia del 1% es de 1.63/ = .163. Como Dmax(x) < D(0.01,100) no podemos rechazar la hiptesis nula y debemos concluir que la muestra tomada del generador de nmeros aleatorios proviene de una distribucin uniforme (0,1). Ejemplo. Prueba de Smirnov - Kolmogorov - Valores individuales. Para realizar la prueba de S-K no se requiere que las observaciones estn distribuidas en intervalos de clase, sino que puede realizarse sin agrupar los valores en intervalos de clase, principalmente cuando el tamao de la muestra es pequeo. En este caso es necesario ordenar los valores en forma ascendente, de menor a mayor, y calcular, para cada valor observado las distribuciones tericas F0(Xi) y empricas Sn(Xi) en la forma como se explic anteriormente. En la tabla siguiente se presenta la prueba para los primeros 20 nmeros aleatorios generados mediante el generador congruencial multiplicativo mencionado anteriormente. La diferencia mxima observada es 0.123 y la mxima permitida es 0.294 para 20 valores y un nivel de significancia del 5%, lo cual lleva a la conclusin de que no existe evidencia de que las observaciones no se distribuyan uniformemente en el intervalo (0,1).. Recordemos que F0(Xi) = Xi para la distribucin uniforme (0,1) Prueba de Smirnov - Kolmogorov - Valores individuales
Reynosa, Tamaulipas Noviembre 2011

Propiedades de la prueba de Smirnov Kolmogorov La prueba de Smirnov - Kolmogorov puede aplicarse para tamaos de muestra pequeos, lo que no sucede con la chi cuadrado. Adems, la prueba S-K es ms poderosa que la Ji dos, es decir, cuando se rechaza la hiptesis nula, se tiene una mayor confiabilidad en dicho resultado. La prueba S-K debe usarse cuando la variable de anlisis es continua. Sin embargo, si la prueba se usa cuando la distribucin de la poblacin no es continua, el error que ocurre en la probabilidad resultante est en la direccin segura. Es decir, cuando se rechaza la hiptesis nula, tenemos verdadera confianza en la decisin

Reynosa, Tamaulipas Noviembre 2011

You might also like