You are on page 1of 13

PRUEBAS DE HIPTESIS DE PROPORCIONES Y CHI CUADRADA (VARIABLES NO-MTRICAS) Como investigadores en muchas ocasiones estamos interesados en un fenmeno cuyo

comportamiento es expresado en porcentajes. Por ejemplo, podemos estar interesados en probar si la proporcin de potenciales electores que planean votar por el candidato del PRI es estadsticamente distinta de la proporcin que declar preferir el candidato del PAN. I. Prueba de Hiptesis de Proporciones para una Sola Muestra. Una encuesta realizada por Bancomer a 35 clientes indic que un poco ms del 74 por ciento tenan un ingreso familiar de ms de $200,000 al ao. Si esto es cierto, el banco desarrollar un paquete especial de servicios para este grupo. La administracin quiere determinar si el porcentaje verdadero es mayor del 60 por ciento antes de desarrollar e introducir este nuevo paquete de servicios. Los resultados mostraron que 74.29 por ciento de los clientes encuestados reportaron ingresos de $200,000 o ms al ao. El procedimiento para la prueba de hiptesis de proporciones es el siguiente: 1. Especifica la hiptesis nula y alternativa. Hiptesis Nula: H 0 = P .60 Hiptesis Alternativa: H a = P > .60 , donde P = la proporcin de clientes con ingresos familiares anuales de $200,000 o ms. 2. Especfica el nivel de significacin, , permitido. Para una = .05 , el valor de tabla de Z para una prueba de una sola cola es igual a 1.64. 3. Calcula el error estndar de la proporcin especficada en la hiptesis nula.
sp = p (1 p ) n

donde: p = proporcin especificada en la hiptesis nula. n = tamao de la muestra. Por consiguiente:


0.60(1 0.60) = .0828 35

sp =

4. Calcula la estadstica de prueba:

z=

( proporcin _ observada) ( proporcin _ H 0 ) sp


z= 0.7429 0.60 =1.73 0.0828

5. La hiptesis nula se rechaza porque el valor de la Z calculada es mayor que el valor crtico Z . El banco puede concluir con un 95 por ciento de confianza (1 = .95) que ms de un 60 por ciento de sus clientes tienen ingresos familiares de $200,000 o ms. La administracin puede introducir el nuevo paquete de servicios orientado a este grupo.

El presidente del PRI en 1988, basado en su experiencia, sostiene que un 95% de los votos para las elecciones presidenciales han sido a favor de su partido. Los partidos de oposicin levantaron una muestra de1,100 electores y encontraron que un 87% de ellos votara por el PRI. El presidente del PRI quiere probar la hiptesis, con un nivel de significacin de 0.05, que el 95% de los votos son para su partido.
2

Hiptesis Nula: H o : p = 0.95 Hiptesis Alternativa: H a : p 0.95 Tamao de muestra: n=1,100 Nivel de Significacin = 0.05. El primer paso es calcular el error estndar de la proporcin utilizando el valor hipottico del porcentaje que histricamente vota por el PRI:
p (1 p ) = n 0.95 * 0.05 = 0.0066 1100

SE p =

Ahora slo es necesario construir el intervalo de confianza:


po 1.96 * SE p

0.95 (1.96 * 0.0066) = 0.937 0.963

La proporcin de .87 de votos por el PRI en la encuesta no cae en la regin de aceptacin, por lo tanto el presidente del PRI debe de preocuparse por que la tendencia entre los votantes es a favorecer menos al PRI.

SEXO DEL PATRON Frequency Hombre 1634 Mujer 314 Total 1948 Percent 83.9 16.1 100.0 Valid Percent 83.9 16.1 100.0 Cumulative Percent 83.9 100.0

Valid

Probemos la hiptesis de que el porcentaje de microempresas cuyos dueos son hombres captado por la ENAMIN es distinto de 88 por ciento. Hiptesis Nula: H 0 = P = 0.88 Hiptesis Alternativa: H 0 = P 0.88
0.88(1 0.88) = .0074 1948

sp =

z=

0.839 0.88 = 5.54 0.0074

La hiptesis nula se rechaza porque el valor de la Z calculada es menor que el valor crtico Z de 1.96. Podemos concluir con un 95 por ciento de confianza (1 = .95) que la proporcin captada por la ENAMIN es estadsticamente distinta de 0.88.

II. Prueba de Hiptesis para Diferencias entre Dos Proporciones (Muestras Independientes). Algunas veces estamos interesados en analizar la diferencia entre las proporciones de poblaciones de grupos con distintas caractersticas. Por ejemplo, pensemos que la administracin de las tiendas Oxxo cree, sobre la base de una investigacin, que el porcentaje de hombres que visitan sus tiendas 9 o ms veces al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo mismo. Las especificaciones requeridas y el procedimiento para probar esta hiptesis es la siguiente:

1. Las hiptesis nula y alternativa son las siguientes: la proporcin de hombres que reportan 9 o ms visitas por mes es la misma o menor que la proporcin de mujeres que hacen lo mismo. la proporcin de hombres que reportan 9 o ms visitas por mes es mayor a la proporcin de mujeres que hacen lo mismo. La informacin proporcionada es:
n H = 45 nM = 71
H a = PH PM > 0 ,

H o = PH PM 0 ,

PH = .58

PM = .42

PH PM = .58 .42 = .16

2. Especifica el nivel de significacin de = .05 . El valor crtico para la prueba de una sola cola es de 1.64. 3. Estima el error estndar de la diferencia de las dos proporciones:
1 1 P (1 P ) n + n M H

s p hm =

donde:
P= n H PH + n M PM nH + nM

PH = proporcin muestra de hombres (H) PM = proporcin muestra de mujeres (M) NH = tamao de muestra hombres NM = tamao de muestra mujeres

Por lo tanto:
P= 45(.58) + 71(.42) = 0.48 45 + 71

y
1 1 s p hm = .48(1 .48) + = 0.10 45 71

4. Calcula de prueba estadstica:

Z=

(diferencia _ entre _ proporciones _ observadas) (diferencia _ entre _ proporciones _ Ho ) s ph m


Z= (.58 .42) (0) = 1.60 .10

La hiptesis nula es aceptada porque el valor de la Z calculada es menor que el valor crtico Z. La administracin no puede concluir con un 95 por ciento de confianza que la proporcin de hombres que visita 9 o ms veces los Oxxo es mayor que la proporcin de mujeres. SPSS no cuenta con procedimientos para hacer pruebas de hiptesis de proporciones. Probemos si el porcentaje de hombres dueos de microempresas es estadsticamente diferente del porcentaje de mujeres.

P=

1634(83.9) + 314(16.1) = 72.97 1634 + 314

y
1 1 s p hm = ..73(1 ..73) + = 0.0274 1634 314

Z=

(.839 .161) (0) = 24.74 .0274

La hiptesis nula es rechazada porque el valor de la Z calculada es mayor que el valor crtico Z. Podemos concluir que el porcentaje de hombres dueos de microempresas es estadsticamente superior al porcentaje de mujeres propietarias de microempresas.

III. Chi-Cuadrada
La mayora de la informacin que se trabaja en las ciencias sociales o administrativas es de carcter no-mtrico nominal. Por lo mismo, muchas de las tcnicas multivariadas ms populares, como la regresin lineal de mnimos cuadrados, presentan serias limitaciones analticas. Cmo analizar informacin nominal o categrica? es una prueba estadstica no paramtrica para diferencias entre dos o ms muestras donde frecuencias esperadas son comparadas en relacin con frecuencias obtenidas.
2 2

se utiliza para hacer comparaciones entre frecuencias y no entre valores medios.

Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto acerca de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que slo requiere datos nominales u ordinales. Estas medidas son importantes porque la mayora de la informacin en la investigacin social y administrativa es de carcter nominal u ordinal, y porque no siempre estamos seguros que la caracterstica que deseamos estudiar se distribuye normalmente en la poblacin. La prueba de significacin 2 se refiere esencialmente a la distincin entre frecuencias esperadas y frecuencias obtenidas.

Las frecuencias esperadas f e se refieren a los trminos de la hiptesis nula, segn la cual la frecuencia relativa (o proporcin) se supone es la misma entre los dos grupos. Por ejemplo, si se espera que un 50% de los negocios que llevan una contabilidad formal hayan iniciados sus actividades con ahorros personales, entonces tambin esperamos un 50% de aquellos que empezaron con financiamiento externo.

Las frecuencias obtenidas f o se refieren a los resultados obtenidos en el estudio y que, por consiguiente, pueden variar o no de un grupo a otro. Slo si la diferencia entre las frecuencias observadas y obtenidas es suficientemente grande, se rechaza la hiptesis nula, y se concluye que existe una diferencia real en la poblacin. Como resultado, la hiptesis nula para la 2 seala que las poblaciones o grupos no difieren con respecto a la frecuencia de ocurrencia de una caracterstica dada. Mientras que la hiptesis de investigacin seala que las diferencias entre las muestras reflejan diferencias reales en la poblacin con respecto a la frecuencia relativa de una caracterstica dada. Ejemplo: Hiptesis Nula: la frecuencia relativa de microempresas que llevan una contabilidad formal y que iniciaron su actividad con un financiamiento externo, es la misma que la frecuencia relativa de microempresas que llevan una contabilidad formal y que iniciaron su actividad con ahorros personales. Hiptesis Nula: la proporcin de microempresas con contabilidad formal y cuyo inicio fue gracias a financiamiento externo, es la misma que la de microempresas con contabilidad formal cuyo inicio fueron ahorros personales.

La informacin de la ENAMIN proporciona la siguiente informacin:


RECODE p25 (1=2) (2 thru 5=1) INTO contab. RECODE p17 (5=1) (else=2) INTO financia .

value labels contab 1 'Informal' 2 'Formal'/ financia 1 'Ahorro Personal' 2 'Prestamo' . execute. CROSSTABS /TABLES=contab BY financia /FORMAT= AVALUE TABLES /CELLS= COUNT.

CONTAB * FINANCIA Crosstabulation Count FINANCIA Ahorro Personal Prestamo 465 302 624 557 1089 859

CONTAB Informal Formal Total

Total 767 1181 1948

Una vez que tenemos las frecuencias esperadas y obtenidas, el valor de la 2 se obtiene de la siguiente manera:
2 =
( f0 fe )2 fe

Las frecuencias esperadas se obtienen de la siguiente manera:

10

f1e ,1 =

(Total _ Columa )(Total _ Re ngln) Total _ Total

Para la frecuencia observada de informal-personal, 465, tenemos:


(1089)(767) = 428.8 1948

f1e ,1 =

Personal Informal Formal Total 428.8 660.2 1089

Externo 338.2 520.8 859

Total 767 1181 1948

Noten que los totales de columnas y renglones no varan, lo que hicimos fue corregir las proporciones de tal forma que no existiera diferencia entre tipo de financiamiento. As
660.2 = .61 1089

520.8 = .61 859

Aplicando la formula:
( f0 fe )2 fe

2 =

11

2 2 2 2 ( 465 428.8) ( 302 338.2 ) ( 624 660.2 ) ( 557 520.8) = + + +

428.8

338.2

660.2

520.8

= 3.1 + 3.9 + 2.0 + 2.5

2 =11.5

Para interpretar este valor de 2 es necesario determinar los grados de libertad. Para cuadros con un nmero determinado de renglones y columnas, los grados de libertad se calculan:
df = (r 1)(c 1)

En esta caso (un cuadro de 2x2):


df = (2 1)(2 1) = (1)(1) = 1

Al observar la Tabla de Distribucin de 2 , encontramos que una 2 con 1 grado de libertad y .05 de nivel de significancia es igual a 3.841. Este el valor que debe excederse o igualar con el fin de rechazar la hiptesis nula. Como:
11.5 > 3.841

Debemos rechazar la hiptesis nula de que no hay diferencia entre microempresas que iniciaron con ahorros personales y microempresas que requirieron financiamiento externo en cuanto a llevar una contabilidad formal o no.
CROSSTABS /TABLES=contab BY financia /FORMAT= AVALUE TABLES /STATISTIC=CHISQ /CELLS= COUNT COLUMN.

12

CONTAB * FINANCIA Crosstabulation FINANCIA Ahorro Personal Prestamo CONTAB Informal Count 465 302 % within FINANCIA 42.7% 35.2% Formal Count 624 557 % within FINANCIA 57.3% 64.8% Total Count 1089 859 % within FINANCIA 100.0% 100.0%

Total 767 39.4% 1181 60.6% 1948 100.0%

Chi-Square Tests Value 11.445 b 11.131 11.489 df Asymp. Sig. (2-sided) 1 .001 1 .001 1 .001 Exact Sig. (2-sided) Exact Sig. (1-sided)

Pearson Chi-Square a Continuity Correction Likelihood Ratio Fisher's Exact Test .001 .000 Linear-by-Linear 11.439 1 .001 Association N of Valid Cases 1948 a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 338.22.

13

You might also like