Professional Documents
Culture Documents
Correa Garca Daniela Osmara Carmona Chaidez Gabriela Lizeth Cruz Ramrez Margarita Isabel Cisneros Espinoza Susana Priscilla Ramos Gonzlez Sergio Eduardo
Tema:
Prueba de Kolmogorov-Smirnov
Profesora:
SEIS
Esta prueba se puede realizar para valores agrupados en intervalos de clase y tambin para valores sin agrupar. Tabla tomada parcialmente del libro Simulation and Analysis of Industrial Systems, de Schmidt y Taylor. El procedimiento general para realizar esta prueba para valores agrupados en intervalos de clase es el siguiente: 1) Especificar la distribucin nula es f0(x,q), y estimar sus parmetros si es necesario. 2) Organizar la muestra en una distribucin de frecuencia, en intervalos de clase. 3) Con base en la distribucin observada de frecuencia, se calcula la distribucin acumulativa Sn(Xi) = mi/n, siendo Xi el lmite superior del intervalo de clase, y mi el nmero de valores de la muestra menores o iguales que Xi. Sn(Xi) corresponde simplemente a la frecuencia relativa acumulada hasta el intervalo i. 4) Se calcula la funcin de distribucin terica F 0 Xi). 5) Para cada intervalo de clase se calcula la diferencia entre F0 (Xi ) y Sn (Xi), y se busca la mxima Dmax = Max | FX (Xi) - Sn (Xi), i = 1, 2, , k. 6) Se busca en la tabla el valor crtico Dmaxp(a,n) con el nivel de significancia a. Si el valor observado Dmax es menor o igual que el valor crtico, entonces se acepta la hiptesis nula de que no existen diferencias significativas entre la distribucin terica y la distribucin dada por los resultados muestrales, es decir, que los valores generados siguen la distribucin que se haba supuesto. Cuando la muestra es pequea y/o los valores no se van a organizar en intervalos de clase el procedimiento es similar, slo que el paso 2 se cambia por ordenar los valores de la muestra en forma ascendente, de menor a mayor, y en los pasos 3 y 4 se calculan las funciones de distribucin terica y emprica para cada valor de la muestra. Ejemplo. Considere de nuevo el ejemplo de la prueba de habilidad aplicada a un grupo de 80empleados. Mediante la prueba de Smirnov Kolomogorov. Con un
Reynosa, Tamaulipas Noviembre 2011
nivel de significancia del 5%, pruebe la hiptesis de que los puntajes obtenidos siguen una distribucin normal. Solucin. De la tabla construida para realizar la prueba chi cuadrado tomaremos la informacin pertinente y la complementaremos con la informacin faltante, relativa al clculo de Sn(Xi). Los clculos se muestran a continuacin. El valor crtico para n = 80 valores y un nivel de significancia del 5% es Dmaxp(0.05,80) = 1.36/ = 0.152. Como la diferencia mxima observada fue de 0.0236 no hay razn para dudar que los puntajes se puedan aproximar mediante una distribucin normal. Ejemplo: Prueba de Smirnov - Kolmogorov - Valores agrupados. En la tabla siguiente se presentan los clculos para realizar la prueba S-K para la muestra de 100 nmeros aleatorios generados mediante un generador congruencial multiplicativo con a = 899, C = 0 y M = 32768, usados para la prueba chi cuadrado. La diferencia mxima observada es Dmax(x) = 0.09 y el valor crtico para un nivel de significancia del 1% es de 1.63/ = .163. Como Dmax(x) < D(0.01,100) no podemos rechazar la hiptesis nula y debemos concluir que la muestra tomada del generador de nmeros aleatorios proviene de una distribucin uniforme (0,1). Ejemplo. Prueba de Smirnov - Kolmogorov - Valores individuales. Para realizar la prueba de S-K no se requiere que las observaciones estn distribuidas en intervalos de clase, sino que puede realizarse sin agrupar los valores en intervalos de clase, principalmente cuando el tamao de la muestra es pequeo. En este caso es necesario ordenar los valores en forma ascendente, de menor a mayor, y calcular, para cada valor observado las distribuciones tericas F0(Xi) y empricas Sn(Xi) en la forma como se explic anteriormente. En la tabla siguiente se presenta la prueba para los primeros 20 nmeros aleatorios generados mediante el generador congruencial multiplicativo mencionado anteriormente. La diferencia mxima observada es 0.123 y la mxima permitida es 0.294 para 20 valores y un nivel de significancia del 5%, lo cual lleva a la conclusin de que no existe evidencia de que las observaciones no se distribuyan uniformemente en el intervalo (0,1).. Recordemos que F0(Xi) = Xi para la distribucin uniforme (0,1) Prueba de Smirnov - Kolmogorov - Valores individuales
Reynosa, Tamaulipas Noviembre 2011
Propiedades de la prueba de Smirnov Kolmogorov La prueba de Smirnov - Kolmogorov puede aplicarse para tamaos de muestra pequeos, lo que no sucede con la chi cuadrado. Adems, la prueba S-K es ms poderosa que la Ji dos, es decir, cuando se rechaza la hiptesis nula, se tiene una mayor confiabilidad en dicho resultado. La prueba S-K debe usarse cuando la variable de anlisis es continua. Sin embargo, si la prueba se usa cuando la distribucin de la poblacin no es continua, el error que ocurre en la probabilidad resultante est en la direccin segura. Es decir, cuando se rechaza la hiptesis nula, tenemos verdadera confianza en la decisin