You are on page 1of 11

AO DE LA INTEGRACIN NACIONAL Y EL RECONOCIMIENTO DE NUESTRA DIVERSIDAD UNIVERSIDAD NACIONAL DE PIURA ESCUELA PROFESIONAL DE INGENIERIA INFORMATICA

INTEGRANTES: Crdova Holgun Fabrizio Merino Jurez Manuel Neira Mija Wilson Palacios Romero Richard Snchez Portocarrero Gustavo DOCENTE: Ing. Carmen Quito Rodrguez ASIGANTURA: Modelos Estocsticos FECHA: 11/04/2012

PIURA-PERU 2012

1. Prueba Chi cuadrada de Pearson para una muestra


La prueba estadstica de X2 para una muestra se emplea frecuentemente como prueba de bondad de ajuste, sin embargo, en un plan experimental, en el que se cuenta con un grupo muestral, con diversas subclases y las mediciones estn en escala nominal, resulta muy til este procedimiento. La eficacia de la prueba est de acuerdo con el tamao de la muestra, pues con un grado de libertad, si hay dos subclases, algunos autores consideran que la prueba es insensible, no obstante la informacin que aporta ms de dos categoras es satisfactoria en funcin de la frmula:

Donde: X2 = valor estadstico de Chi cuadrada. fo = frecuencia observada. fe = frecuencia esperada. La Chi cuadrada se utiliza cuando:

Cuando los datos puntualizan a las escalas nominal u ordinal. Se utiliza solo la frecuencia. Poblaciones pequeas. Cuando se desconocen los parmetros media, moda, etc. Cuando los datos son independientes. Cuando se quiere contrastar o comparar hiptesis. Investigaciones de tipo social - muestras pequeas no representativas >5. Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias. Cuando la muestra es seleccionada no probabilsticamente. X2 permite establecer diferencias entre f y se utiliza solo en escala nominal. Poblacin > a 5 y < a 20.

Pasos. 1. Arreglar las categoras y las frecuencias observadas. 2. Calcular los valores tericos esperados para el modelo experimental o tipo de distribucin muestral: normal, binomial y de Poisson. 3. Calcular las diferencias de las frecuencias observadas en el experimento con respecto a las frecuencias esperadas. 4. Elevar al cuadrado las diferencias y dividirlas entre los valores esperados de cada categora. 5. Efectuar la sumatoria de los valores calculados. 6. Calcular los grados de libertad (gl) en funcin de nmero de categoras [K]: gl = K - 1. 7. Comparar el estadstico X2 con los valores de la distribucin de Chi cuadrada en la tabla. 8. Decidir si se acepta o rechaza la hiptesis X2c X2t se rechaza Ho.

2. Prueba chi cuadrado de Pearson para dos y ms muestras independientes


Cuando las observaciones de una investigacin corresponden a muestras independientes y las mediciones se tienen en escala nominal, la prueba de Chi cuadrada es el procedimiento de eleccin para el contraste de hiptesis. Esta prueba estadstica se emplea en el anlisis de dos o ms grupos y de dos o ms variables. La eficacia de la prueba no se ha determinado con exactitud; sin embargo, a medida que el tamao de la muestra aumenta, el valor de probabilidad de error para aceptar hiptesis alternas (Ha o Ho) se acerca a 1. En sentido opuesto, cuando el nmero de la muestra es menor que 20, se pierde eficacia. En estas condiciones, es conveniente no aplicar la prueba de Chi cuadrada, pero existen alternativas. a. Si en el modelo experimental se tiene una tabla de contingencias de 2 X 2 y la muestra total es menor a 20 e incluye cero en alguna casilla, la prueba estadstica aconsejable ser la de probabilidad exacta de Fischer y Yates. b. Con grupos mltiples, pero con frecuencias pequeas, menores que cinco, se recomienda usar la prueba de Chi cuadrada de proporciones. Las dos alternativas propuestas aumentan notoriamente la eficacia con muestras de tamao pequeo y se limita la probabilidad de cometer el error del tipo I. La frmula es:

Donde: X2 = valor estadstico de Chi cuadrada. fo = frecuencia observada. fe = frecuencia esperada. Pasos: 1. Arreglar las observaciones en una tabla de contingencias. 2. Determinar el valor terico de las frecuencias para cada casilla. 3. Calcular las diferencias entre los valores observados con respecto a los tericos de cada casilla. 4. Elevar al cuadrado las diferencias y dividirlas entre el valor terico de la casilla correspondiente. 5. Obtener la sumatoria de los valores anteriores, que es el estadstico X2. 6. Calcular los grados de libertad (gl): gl = (K columnas -1) [H hileras -1]. 7. El valor de X2 se compara con los valores crticos de Chi cuadrada de la tabla de valores crticos de X2 y de acuerdo con los grados de libertad, y se determina la probabilidad. 8. Decidir si se acepta o rechaza la hiptesis X2c X2t se rechaza Ho.

Ejemplo 01:
Un investigador quiere comparar si hay diferencias en la cantidad de cigarros fumados por causa del estrs en personas que trabajan. Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en personas que trabajan. Hiptesis nula (Ho). No Habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en personas que trabajan.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica. El clculo de la frecuencia esperada se efecta en virtud de que para una hiptesis nula, a todas las casillas corresponde un valor igual, por lo tanto:

fo = 18 fe = 6

gl = 3 + 1 = 2 a = 0.05

El valor calculado de X2 se compara con los valores crticos de la tabla de valores crticos de X2. Se puede observar que para una probabilidad de 0.05 corresponde la cifra de 5.99; por lo tanto, el estadstico Chi cuadrada de 4.3 tiene una probabilidad mayor que 0.05. Decisin. En virtud de que la probabilidad obtenida al calcular el valor de X2 est dentro de la regin de rechazo, se acepta Ho y se rechaza Ha. X2c < X2t se rechaza Ha Entonces tenemos que: 4.3 < 5.99 se acepta Ho: No hay diferencias significativas entre el consumo de cigarros por causa del estrs. Interpretacin. El consumo de cigarros por causa del estrs se puede considerar como efecto del azar.

Ejemplo 02:
El gerente de una planta industrial pretende determinar si el nmero de empleados que asisten al consultorio mdico de la planta se encuentra distribuido de forma equitativa, durante los 5 das de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas de trabajo, se observo el siguiente nmero de consultas:

Lunes 49

Martes 35

Mircoles 32

Jueves 39

Viernes 45

Total 200

Con =0.05, existe alguna razn para creer que el nmero de empleados que asisten al consultorio mdico, no se encuentra distribuido de forma equitativa durante los das de trabajo de la semana? Planteamiento de la hiptesis.

Hiptesis alterna (Ha). El nmero de empleados que acuden al consultorio mdico no se encuentra distribuido en forma uniforme a lo largo de la semana. Hiptesis nula (Ho). El nmero de empleados que acuden al consultorio mdico se encuentra distribuido en forma uniforme a lo largo de la semana.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica. El clculo de la frecuencia esperada se efecta en virtud de que para una hiptesis nula, a todas las casillas corresponde un valor igual, por lo tanto:

fo = 18 fe = 6

( 4.9 gl = 5-1=4 a = 0.05

El valor calculado de X2 se compara con los valores crticos de la tabla de valores crticos de X2. Se puede observar que para una probabilidad de 0.05 corresponde la cifra de 9.49 por lo tanto, el estadstico Chi cuadrada de 4.9 tiene una probabilidad mayor que 0.05. Decisin. En virtud de que la probabilidad obtenida al calcular el valor de X2 est dentro de la regin de rechazo, se acepta Ho y se rechaza Ha. X2c < X2t se rechaza Ha Entonces tenemos que: 4.9< 9.49 se acepta Ho: El nmero de empleados que acuden al consultorio mdico se encuentra distribuido en forma uniforme a lo largo de la semana. Interpretacin. Los empleados acuden de forma uniforme al consultorio, a lo largo de la semana.

Ejemplo 03:

Comparar si el factor gnero influyes en la cantidad de cigarros fumados por causa del estrs en personas que trabajan. Eleccin de la prueba estadstica. El modelo experimental tiene dos muestras independientes. Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en hombres y mujeres que trabajan. Hiptesis nula (Ho). No Habr diferencia significativa entre la cantidad de cigarros fumados por causa del estrs en hombres y mujeres que trabajan.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica. Calculamos los valores tericos para cada casilla.

Una vez obtenidos los valores tericos, aplicamos la frmula.

= 0.05 + 1.49 + 0.18 + 0.04 + 1.23 + 0.16 = 3.15

Clculo de los grados de libertad (gl). gl = (K - 1) (H - 1) = (3 - 1) (2 - 1) = 2 El valor 3.15 con 2 grados de libertad se compara con los valores crticos de Chi cuadrada; as, se puede observar que a la cifra 5.99 corresponde la probabilidad de 0.05, lo cual significa que el estadstico calculado tiene una probabilidad mayor que 0.05. Decisin. En razn de que el valor de Chi cuadrada de 3.15 tiene una probabilidad mayor que 0.05, cae en la zona de rechazo. Por tanto se acepta Ho y se rechaza Ha. X2c < X2t por lo tanto como 3.15 < 5.99 se rechaza Ho. Si hay diferencias significativas entre el consumo de cigarros por causa del estrs entre hombres y mujeres que trabajan. Interpretacin. El consumo de cigarros por causa del estrs entre hombres y mujeres que trabajan, se debe a factores del azar.

Ejemplo 04:
En una investigacin transversal de enfermedad diarreica en nios menores de seis aos, un mdico tuvo el inters de conocer si existan diferencias respecto a condicin socioeconmica de una poblacin a la que estudio. Eleccin de la prueba estadstica. El modelo experimental tiene 3 o ms muestras independientes. Planteamiento de la hiptesis.

Hiptesis alterna (Ha). La mayor frecuencia de la enfermedad diarreica se observa en la condicin socioeconmica baja; a su vez, la mayor frecuencia observada en nios sanos es la condicin alta. Estas diferencias son significativas. Hiptesis nula (Ho). Las diferencias que se observan en las frecuencias de enfermedad diarreica en las tres clases socioeconmicas se deben al azar.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.

Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Contingencia de la diarrea.

Aplicacin de la prueba estadstica. Calculamos los valores tericos para cada casilla.

Una vez obtenidos los valores tericos, aplicamos la frmula.

Clculo de los grados de libertad (gl). gl = (K - 1) (H - 1) = (2 - 1) (3 - 1) = 2 a = 0.05 El valor crtico de Chi cuadrada con 2 grados de libertad ms cercano al calculado es de 10.83, con una probabilidad igual a 0.001. Decisin. El estadstico calculado de 29.64 con 2 grados de libertad tiene una probabilidad inferior a 0.001 y menor que 0.05, cayendo en el nivel de significancia. Por lo tanto, se acepta Ha y se rechaza Ho.

Interpretacin. Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en los tres grupos de condicin socioeconmica. La poblacin de nios de condicin socioeconmica baja muestran la frecuencia ms alta de diarrea, con respecto a los otros grupos sociales. Estas diferencias son significativas al nivel de confianza de p menor que 0.001, segn la grfica siguiente. Entre las clases socioeconmicas media y alta parece no existir diferencia alguna, lo cual se puede comprobar al construir las tablas de contingencias y al ejecutar la prueba X2 como ejercicio e interpretarla. Contingencia 2 X 2; clase media y alta en oposicin a clase baja.

X2(1gl) = 29.66 p menor que 0.001 Contingencia 2 X 2; clase media y alta en oposicin a clase baja.

X2(1gl) = 0.008 p menor que 0.05

You might also like