You are on page 1of 75

Magíster en Educación

Contrastes de Hipótesis

Alvaro Cortínez Pontoni. Universidad de Tarapacá 1


Objetivos

 Conocer el proceso para contrastar hipótesis y su


relación con el método científico.

 Diferenciar entre hipótesis nula y alternativa

 Nivel de significación

 Significación

 Toma de decisiones, tipos de error y cuantificación del


error.

2
Elementos de una Prueba de Hipótesis

1.- Hipótesis Nula (H0), Hipótesis


Alternativa.
2.- Estadística de Prueba (Discrepancia).
3.- Región de Rechazo (Región Crítica).
4.- Regla de Decisión.
Contrastando una hipótesis Son demasiados...

No se si los fumadores
pesarán como el resto…
unos 70Kg (hipótesis
nula)...

¡Gran
diferencia!

Muestra Rechazo la
aleatoria de hipótesis
fumadores

X  85 kg
4
¿Qué es una hipótesis?
Creo que el porcentaje
de enfermos será el 5%
 Una creencia sobre la
población, principalmente sus
parámetros:
 Media
 Varianza
 Proporción/Tasa

 OJO: Si queremos contrastarla,


debe establecerse antes del
análisis.
5
Introducción breve: ¿Los fumadores pesan más?
En la población de no fumadores, el peso
medio es 70 kg.

¿Cómo podríamos ‘demostrar’ si


los fumadores pesan más…
... unos 5 kg más?

70 75

Veamos qué puede ocurrir si


tomamos muestras de tamaño 4 y
calculamos el peso medio… para cada caso.

6
Decidir si los fumadores pesan más: Tamaño muestral

¿Qué puede ocurrir si tomamos


muestras de tamaño 30 y 70 75
calculamos el peso medio?

7
Decidir si los fumadores pesan más: Tipos de error
Tomemos la decisión basándonos
en muestras de tamaño 4...

Puedo cometer 2 tipos de error.

Error de tipo II

Se acepta que Se acepta


no hay que sí hay
70 75
diferencias diferencias

Error de tipo I

8
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
Probabilidad β

Rechazo H0 Error de Correcto


Acepto H1
tipo I
Probabilidad α

9
Identificación de hipótesis
 Hipótesis nula Ho  Hip. Alternativa H1
 La que contrastamos  Niega a H0 (y creemos que es ‘mejor’).

 Los datos pueden refutarla


 Los datos pueden mostrar evidencia a
favor
 No debería ser rechazada sin una  No debería ser aceptada sin una gran
buena razón. evidencia a favor.

H 0 : p  50 % , , 
  , , 
 H1 : p  50 %

10
¿Quién es H0?

 Problema: ¿Hombres y mujeres conducen igual


de bien (o de mal)?¿Hay relación entre la forma
de conducir y el sexo?
 Solución:

 Traducir a lenguaje estadístico: p  50 %


 Establecer su opuesto:
p  50 %
 Seleccionar la hipótesis nula

H 0 : p  50 %
11
¿Quién es H0?

 Problema: ¿Una persona recibe en promedio 20


mensajes de Whatsapp por minuto?

 Solución:

 Traducir a lenguaje estadístico:   20


 Establecer su opuesto:   20
 Seleccionar la hipótesis nula

H 0 :   20
12
Razonamiento básico
Si supongo que H0 es cierta...

¿qué hace un
científico cuando su
teoría no coincide
con sus
predicciones?

  70
X  85

... el resultado del experimento sería improbable.


Sin embargo ocurrió.

13
Razonamiento básico
Si supongo que H0 es cierta...

Rechazo que H0 sea


cierta.

  70
X  85

... el resultado del experimento sería improbable.


Sin embargo ocurrió.

14
Razonamiento básico
Si supongo que H0 es cierta...
• No hay evidencia contra H0
¿Si una teoría hace
predicciones con •No se rechaza H0
éxito, queda
probado que es •El experimento no es concluyente
cierta?
•El contraste no es significativo

  70
X  72

... el resultado del experimento es coherente.

15
Región crítica y nivel de significación
Región crítica Nivel de significación: a
 Valores ‘improbables’ si...  Número pequeño: 1% , 5%
 Es conocida antes de realizar el  Fijado de antemano por el
experimento: resultados investigador
experimentales que refutarían H0  Es la probabilidad de rechazar H0
cuando es cierta

a=5%

Reg. Crit. Reg. Crit.

No rechazo H0
H0: =70

16
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: 70

Unilateral Unilateral

H1: <70 H1: >70


17
Significación: p

a
H0: =70
Bioestadística. U. Málaga. Tema 7: Contrastes de hipótesis 18
Significación: p

No se rechaza
H0: =70

a
H0: =70
X  72 19
Significación: p
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del
estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>a

P a

No se rechaza
H0: =70

P a

20
X  72
Significación : p

Se rechaza H0: =70

Se acepta H1: >70


a

X  85

21
Significación : p
El contraste es estadísticamente significativo cuando p< a
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

a P

Se rechaza H0: =40

Se acepta H1: >40


a P

X  85
22
Resumen: a, p y criterio de rechazo

 Sobre a  Sobre p
 Es número pequeño,  Es conocido tras
preelegido al diseñar el realizar el experimento
experimento

 Conocido a sabemos  Conocido p sabemos


todo sobre la región todo sobre el resultado
crítica del experimento

 Sobre el criterio de rechazo


 Contraste significativo = p menor que a
23
Resumen: a, p y criterio de rechazo

Estadísticos de contrastea

Edad del
encuestado
U de Mann-Whitney 259753,500
W de Wilcoxon 462319,500
Z -2,317
Sig. asintót. (bilateral) ,021
a. Variable de agrupación: Sexo del encuestado

 Sobre el criterio de rechazo


 Contraste significativo = p menor que a
24
Ejemplo
 Problema: ¿Está sesgada la moneda?

H 0 : prob cruz  50%



 H1 : prob cruz  50%

Experimento: Lanzar la moneda repetidamente:

P=50% P=25% P=12,5% P=6,25% P=3% P=1,5%


25
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

Los datos pueden refutarla

La que se acepta si las pruebas


 H0: Hipótesis nula no indican lo contrario
 Es inocente
Rechazarla por error tiene graves
consecuencias

 H1: Hipótesis alternativa


 Es culpable No debería ser aceptada sin una gran
evidencia a favor.

Rechazarla por error tiene


consecuencias consideradas menos
graves que la anterior

26
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

 H0: Hipótesis nula No especulativa


 (Ej.1) Es inocente
 (Ej.2) El nuevo tratamiento no tiene
efecto
 (Ej.3) No hay nada que destacar

 H1: Hipótesis alternativa Especulativa


 (Ej.1) Es culpable
 (Ej.2) El nuevo tratamiento es útil
 (Ej. 3) Hay una situación anormal

27
Tipos de error al tomar una decisión

Realidad
Inocente Culpable
Inocente
vere OK Error
dicto
Menos grave

Culpable
Error OK
Muy grave

28
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
El tratamiento no El tratamiento si tiene efecto
tiene efecto y así se pero no lo percibimos.
decide.
Probabilidad β

Rechazo H0 Error de Correcto


Acepto H1
tipo I El tratamiento tiene efecto y
El tratamiento no el experimento lo confirma.
tiene efecto pero se
decide que sí.

Probabilidad α

29
No se puede tener todo
Recordar lo que
pasaba con
b sensiblidad y
especificidad
a

 Para un tamaño muestral fijo, no se pueden reducir a la


vez ambos tipos de error.

 Para reducir b, hay que aumentar el tamaño muestral.

30
Conclusiones
 Las hipótesis no se plantean después de observar los datos.

 En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:

 H0 : Hipótesis científicamente más simple.


 H1 : El peso de la prueba recae en ella.

 α debe ser pequeño

 Rechazar una hipótesis consiste en observar si p<α

 Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I

 No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo
II

 Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de


equivocarnos.

31
Problema
Un nuevo dispositivo de filtrado se instala en una
planta química. Antes y después de su instalación
una m.a. respectiva arrojó la siguiente información
del porcentaje de impurezas:
Antes Después
y1  12,5 y 2  10,2
S1  101,17 S 2  94,73
2 2

n1  8 n2  9

¿ El dispositivo de filtrado ha reducido el porcentaje


de impurezas significativamente ?
Desarrollo
H 0 : 1   2 v/ s H1 : 1   2

Si  1   2
 y1  y 2   1   2 

2 2
t t n1  n2  2
n1  n2
SP
n1n2

Bajo H0 t0 
 y1  y 2 
12,5  10,2

2,3
 0,48
n1  n2 17 9,9  0,49
SP SP
n1n2 72

SP 
n1  1S1  n2  1S 2
2 2

7 101,17  8  94,73 1466,03
  97,73
n1  n2  2 15 15
Nivel de significancia a=0,05 t0,975(15)gl = 2,131
Región crítica C = ] - ; -2,131 ]  [ 2,131 ;  [
t0  CC  Se acepta H0
Es decir, el dispositivo nuevo no reduce
significativamente el porcentaje de impurezas.
H0 : 1   2 v/s H1 :  1   2
2
S1 101,17
Bajo H0 : F0  2 
S2 94,73
 1,068  Fn1 1,n2 1

a  0,05 F0,025( 7 ,8 )  0,204 F0,975( 7 ,8)  4,53


Región crítica C = ] 0 ; 0,204 ]  [ 4,53 ;  [
F0  CC  Se acepta H0 : 12 = 22
TABLAS DE CONTINGENCIA
EJEMPLO: al estudiar el estado físico de una persona, se
realizan preguntas como altura, peso, si realiza ejercicio, etc.

Se realizan por la sencilla razón de que en ocasiones las


variables están interrelacionadas entre sí.

En el EJEMPLO, una persona alta es razonable suponer que


tiene mayor peso, dos variables comúnmente relacionadas.
RECORDEMOS

{
Como por ejemplo:
- Edad

{
Cuantitativas - Peso
- Altura

Tipos de
variables

{
Como por ejemplo:

- Color de pelo
Cualitativas
- Color de ojos
- Sexo
Vamos a estudiar las posibles relaciones entre dos
variables cualitativas.

 Mediante la herramienta:

TABLA DE CONTINGENCIA
EJEMPLO. Si queremos estudiar la relación entre el color
de ojos y el color del pelo.

 
La variable X: Color de ojos La variable Y: Color de pelo
x1: ojos claros y1: pelo claro
x2: ojos oscuros y2: pelo oscuro
¿Cómo construir una tabla de contingencia?

EJEMPLO. En un hospital psiquiátrico se hace un estudio en el


que participan 30 pacientes con dos tipos de problemas
neuronales (altos y bajos), queremos comparar un fármaco nuevo
con otro antiguo. ¿Cómo podemos representar esta situación?
¿Cómo podemos ver si el tratamiento nuevo es preferible al
anterior?

Variable X: Tipo de tratamiento


x1: antiguo
x2: nuevo
Variable Y: Problemas neuronales
y1: altos
y2: bajos
Los pacientes nos dijeron el tipo de problema y que fármaco
tomaban

Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo),


Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujeto5
(alto, nuevo)…

Contamos cuantos hay del mismo tipo, es decir:

a = Problemas altos y tratamiento antiguo = 10


b = Problemas bajos y tratamiento antiguo = 4
c = Problemas altos y tratamiento nuevo = 5
d = Problemas bajos y tratamiento nuevo = 11
TABLA DE CONTINGENCIA

Tratamiento (X) Problemas neuronales (Y)

Altos (y1) Bajos (y2)

Antiguo (x1) a = 10 b=4

Nuevo (x2) c=5 d = 11

Estos 4 valores calculados llamaremos frecuencias absolutas


dobles (f), que nos dicen el número de sujetos que hay, con
valores específicos de las variables
Tratamiento (X) Problemas neuronales (Y)

Altos (y1) Bajos (y2)

Antiguo (x1) 10 (f11) 4 (f12)

Nuevo (x2) 5 (f21) 11 (f22)

EJEMPLO:
¿Cuántos sujetos hay con problemas neuronales “Bajos” y el
tratamiento “Nuevo”?

Seguimos la columna problemas neuronales “Bajos” y el


tratamiento “Nuevo”, y obtenemos:
f22 = 11
FRECUENCIAS RELATIVAS DOBLES

Obtenemos otra tabla como la anterior donde en cada celda


dividimos por el número de sujetos

En el EJEMPLO anterior recordemos que había 30 pacientes, por


tanto la tabla queda:

Tratamiento (X) Problemas neuronales (Y)


Altos (y1) Bajos (y2)
Antiguo (x1) 10/30 = 0,333 4/30 = 0,133
Nuevo (x2) 5/30 = 0,167 11/30 = 0,367
¿Para que sirven las frecuencias relativas dobles?

Tratamiento Problemas neuronales


Altos Bajos
Antiguo 0,333 (h11) 0,133 (h12)
Nuevo 0,167 (h21) 0,367 (h22)
Si estos valores los multiplicamos por 100 nos da el
porcentaje de sujetos correspondiente a esa celda

EJEMPLO: ¿Qué porcentaje de sujetos hay con


problemas “Altos” y tratamiento “Nuevo”?

0,167 x 100 = 16,7% es el porcentaje


FRECUENCIAS MARGINALES Y
DISTRIBUCIÓN MARGINAL

En la tabla de las frecuencias absolutas dobles anterior,


añadimos una columna a la derecha y una fila debajo, que
llamaremos “TOTAL”, en ambos casos.

La columna del TOTAL llamaremos distribución marginal de X


Cada valor llamaremos frecuencia marginal de X
La fila del TOTAL llamaremos distribución marginal de Y
Cada valor llamaremos frecuencia marginal de Y

¿Cómo se obtiene?
Sumando la fila para la distribución marginal de X
Sumando la columna para la distribución marginal de Y
EJEMPLO

Tratamiento Problemas neuronales TOTAL


Altos Bajos
Antiguo 10 4 10+4 = 14
(f1.)
Nuevo 5 11 5+11= 16
(f2.)
TOTAL 10+5 = 15 4+11 = 15 30 (n)
(f.1) (f.2)

El valor n, se obtiene sumando cualquier distribución marginal,


representa el número total de sujetos, que como recordamos
son 30 pacientes.
FRECUENCIAS CONDICIONALES Y
DISTRIBUCIÓN CONDICIONAL

Vamos a conocer estos términos con nuestro ejemplo

Se trabaja con la tabla de frecuencias absolutas, es decir:

Tratamiento Problemas neuronales TOTAL


Altos Bajos
Antiguo 10 (f11) 4 (f12) 14 (f1.)
Nuevo 5 (f21) 11 (f22) 16 (f2.)
TOTAL 15 (f.1) 15 (f.2) 30 (n)
Podemos obtener la distribución de X condicionada por
y1 ó y2
Podemos obtener la distribución de Y condicionada por
x1 ó x2

Calculemos una distribución de Y condicionada por X, esto


implica calcular:
La frecuencia condicional de y1 condicionada por x2
La frecuencia condicional de y2 condicionada por x2
Los datos que nos interesan son:

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5 11 16

Las frecuencias condicionales son:

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))
La interpretación

Tratamiento Problemas neuronales (Y) TOTAL


Altos (y1) Bajos (y2)
Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))

- El 31,25% de los pacientes con el tratamiento nuevo,


tienen problemas neuronales altos
- El 68,75% de los pacientes con el tratamiento nuevo,
tienen problemas neuronales bajos
ALGUNAS
REPRESENTACIONES
GRÁFICAS
Diagrama de barras
adosadas
Diagrama de barras apilado
Gráfico tridimensional
PRUEBA CHI CUADRADO

Ejemplo:

 La siguiente tabla de contingencia muestra la tabulación


cruzada de la variable Cantidad de libros en Biblioteca
(dividido en tres categorías, menos de 2000; entre 2000 y
4000 y más de 4000) y la dependencia del colegio (dividida
en tres categorías, Municipal, Particular Subvencionado y
Particular Pagado).
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación

DEPENDENCIA

CANTIDAD PARTICULAR PARTICULAR MUNICIPAL


LIBROS PAGADO SUBVENCIONADO Total

Menos de 2000 45 95 62 202

2000 - 4000 65 80 100 245

más de 4000 90 62 89 241


Total 200 237 251 688
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación


 Las entradas de la tabla representan el número de colegios
en la muestra con cada combinación de cantidad de libros en
la biblioteca y dependencia del colegio. Por ejemplo, 45
colegios particulares pagados tienen menos de 2000 libros.
 El test Chi-cuadrado de Pearson se basa en encontrar cual
hubiera sido el valor de cada entrada si las variables fueran
independientes. Es decir el valor esperado de cada celda de
la tabla si las variables cantidad de libros en la biblioteca y
dependencia del colegio son independientes.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación


 Si cantidad de libros en la biblioteca y dependencia del
colegio son independientes, la probabilidad del evento
conjunto "A1: tener menos de 2000 libros" y "B1:
dependencia particular pagada" es el producto de esas dos
probabilidades:

 Pr(A1 y B1) = Pr(A1)*Pr(B1)

 Pr(A1) = A1/A = 202/688,


 Pr(B1) = B1/B = 200/688
 Donde A y B son las frecuencias totales de los eventos.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación

 Por lo tanto:

 Pr(A1 y B1) = Pr(A1)*Pr(B1) = 202*200/(688*688) = 0.0854

 El número esperado en la entrada A1B1 es entonces:

 N* Pr(A1 y B1) = 688*0.0854 = 58,72


PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación


 En general la fórmula del valor esperado es:

 Eij = (NAi*NBj)/N.

 Eij = número esperado


 NAi= número de elementos en la categoría Ai
 NBi= número de elementos en la categoría Bi

 Para A1B1 el número esperado es:


 E11 = (202*200)/688 = 58,72
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación


 Este proceso se debe repetir para cada una de las entradas
de la tabla. Una vez hecho esto el estadístico Chi-cuadrado

Oij  E ij 
se calcula con la siguiente fórmula:
2


r c


2

i 1 j 1 E ij
 r = número de categorías de la variable en las filas
 c = número de categorías de la variable en las columnas
 Oij = número observado en entrada ij
 Eij = número esperado en la entrada ij
 Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de
libertad.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación


 En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad.
Realizando todos los cálculos con la tabla del ejemplo, el
estadístico da 27,389.
 Se debe comparar este número con el valor crítico de la
distribución Chi-cuadrado con 4 grados de libertad a un nivel
de significación estadística del 5%
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación

 El valor crítico de la distribución Chi-cuadrado con 4 grados


de libertad a un nivel de significación estadística del 5% el
valor crítico correspondiente es 9,48.

Rechace H 0 si  
2 2

obs c

No rechace H 0 si  
2 2

obs c

Como 27,389 > 9,48 se rechaza la hipótesis nula. Es


decir, las variables no son independientes.
PRUEBA CHI CUADRADO

Tablas de Contingencia y Medidas de Asociación

Limitaciones

La muestra de tamaño n debe ser suficientemente grande,


de modo que ninguna de las frecuencias esperadas Eij sea
menor que 1 y no más del 20 % de los mismos sea menor
que 5.
PRUEBA CHI CUADRADO
Ejemplo

 Considere un estudio sobre consumo que esta interesado en


investigar las preferencias de las familias por diferentes Tipos
de colegios.

 A priori, uno pensaría que sería más probable que familias


más numerosas eligieran colegios municipales o
subvencionados y que familias con menos miembros optaran
por colegio particulares pagados.
PRUEBA CHI CUADRADO
Ejemplo
 Supongamos que para investigar esta relación, el
investigador toma una muestra aleatoria de tamaño n=300 de
todas aquellas familias que matricularon a sus hijos en las
escuelas de una región.

 La siguiente tabla provee la clasificación de los 300 datos:


PRUEBA CHI CUADRADO

EJEMPLO
TAMAÑO DE
FAMILIA

DEPENDENCIA DEL
COLEGIO 2Y3 4Y5 más de 5 Total

PARTICULAR
PAGADO 25 37 8 70
PARTICULAR
SUBVENCIONADO 10 62 53 125
MUNICIPAL
5 41 59 105
Total 40 140 120 300
PRUEBA CHI CUADRADO
Ejemplo
 Nuestra tarea es determinar si el tamaño de la familia afecta
la decisión del tipo de colegio.

 La hipótesis nula es que las variables son independientes


(esto es, no hay relación entre tamaño familiar y la elección
del colegio); la hipótesis alternativa es que las variables no
son independientes.
PRUEBA CHI CUADRADO
Ejemplo
 Trabajemos con un nivel de confianza del 95% y calculemos
el estadístico de Pearson.

 Para esto asignemos las siguientes letras a los eventos de la


tabla:
 A1 Dependencia particular pagada
 A2 Dependencia particular subvencionada
 A3 Dependencia municipal
PRUEBA CHI CUADRADO
Ejemplo

 B1 Familia de 2 a 3 miembros
 B2 Familia de 4 a 5 miembros
 B3 Familia de más de 5 miembros

 Sabemos que el número esperado de observaciones que se


esperarían en la celda (Ai, Bj) si las variables fueran
independientes esta definido por:

 Eij = (NAi*NBj)/N, por lo tanto:


PRUEBA CHI CUADRADO
Ejemplo
 E11 = ( NA1 * NB1 ) / N =
 E12 = ( NA1 * NB2 ) / N =
 E13 = ( NA1 * NB3 ) / N =
 E21 = ( NA2 * NB1 ) / N =
 E22 = ( NA2 * NB2 ) / N =
 E23 = ( NA2 * NB3 ) / N =
 E31 = ( NA3 * NB1 ) / N =
 E32 = ( NA3 * NB2 ) / N =
 E33 = ( NA3 * NB3 ) / N =
PRUEBA CHI CUADRADO
Ejemplo
 E11 = ( N
70
A1 * NB1 ) /
40 N300 = 9.33

 E12 = ( N
70
A1 * NB2 ) /
140 N300 = 32.67

 E13 = ( N
70
A1 * NB3 ) /
120 N300 = 28

 E21 = ( N
125A2 * NB1 ) /
40 N300 = 16.67

 E22 = ( N
125 * N
A2 140 B2 ) / N300 = 58.33

 E23 = ( N
125 * N
A2 120 B3 ) / N300 = 50

 E31 = ( N
105 * N 14
B1 ) / N300 =
40
A3
49
 E32 = ( N
105 * N
A3
140 ) /
B2 N300 =
42
 E33 = ( N
105 * N
A3
120 ) /
B3 N300 =
PRUEBA CHI CUADRADO
Ejemplo
 La fórmula de cálculo del estadístico viene dada por


3 3 Oij  E ij  2
(25 9.33)
2
(37 32.67)
2


2
   
i 1 j 1 E ij
9.33 32.67

(828)   
2 2 2 2


(10 16.67) 
(62 58.33) 
(53 50) 
28 16.67 58.33 50

(514)  
2 2 2


(41 49) 
(59 42)  58.21
14 49 42
PRUEBA CHI CUADRADO
Ejemplo
 El valor crítico desde una tabla Chi-cuadrado con 4 grados de
libertad y un margen de error del 5% es 9,488

 Como el valor del estadístico de Pearson 58.21 es mayor al


valor crítico de la tabla se rechaza la hipótesis nula.

 Por lo tanto, podemos afirmar que no existe independencia


entre el tamaño de la familia y la elección del tipo de colegio.

You might also like