You are on page 1of 7

ESTUDIOS MATEMÁTICOS

PROGRAMA DEL DIPLOMA DEL BI

Prueba Chi-Cuadrado de Pearson (𝝌𝟐 )


Uso:

1. Se utiliza para averiguar si ciertos conjuntos de datos son independientes o no entre


sí.
a. Se dice que 2 variables son independientes si una no afecta a la otra

Aplicación de la prueba:

1. Se determina la hipótesis nula (H0) y la alternativa (H1)


a. Nula: Los datos son independientes.
b. Alternativa: Los datos no son independientes (son dependientes).

2. Establecer la matriz con los datos observados (Los datos se deben expresar en
frecuencia absoluta, no en porcentajes)

𝑇𝑜𝑡𝑎𝑙 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 ×𝑇𝑜𝑡𝑎𝑙 𝐹𝑖𝑙𝑎


3. Establecer la matriz con los datos esperados (𝑓𝑒 = )
𝑇𝑜𝑡𝑎𝑙

(𝑓𝑜 −𝑓𝑒 )2
4. Calcular el Chi-Cuadrado Estadístico (ꭕ2𝑐𝑎𝑙𝑐 = ∑ )
𝑓𝑒

5. Calcular el valor crítico (Tabla Chi-Cuadrado)

a. Se utiliza el nivel de significación (Porcentaje de confianza)


b. Se utiliza los Grados de Libertad
i. 𝑔. 𝑙. = (𝑓𝑖𝑙𝑎𝑠 − 1)(𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1)

6. Comparar el Chi-Cuadrado con el valor crítico

a. Si es menor SE ACEPTA LA HIPOTESIS NULA


b. Si es mayor SE RECHAZA LA HIPOTESIS NULA (Se acepta la hipótesis
alternativa)
Ejemplo:

1) En las afueras de una tienda de dulces se entrevistó a las personas que compraron
chocolates con sabores y al tabular la información se obtuvieron los siguientes
resultados:
a) De los hombres que compraron: 23 eran con sabor a frutillas, 18 sabor a café, 8
sabor a naranja y 8 sabor a vainilla.
b) De las mujeres: 6 eran sabor a café, 15 sabor a frutilla, 10 sabor a vainilla y 12 sabor
a naranja.

Realizar una prueba de Chi-Cuadrado a un nivel de significación del 5% para determinar


independencia o no entre las variables

Solución:

H0 = El sabor que se elige de chocolate es independiente del género


H1 = El sabor que se elige de chocolate no es independiente del género.

Datos observados:

Frutilla Café Naranja Vainilla TOTAL


Masculino 23 18 8 8 57
Femenino 15 6 12 10 43
TOTAL 38 24 20 18 100

Datos esperados:

Frutilla Café Naranja Vainilla TOTAL


Masculino 21,66 13,68 11,4 10,26 57
Femenino 16,34 10,32 8,6 7,74 43
TOTAL 38 24 20 18 100

2
(23 − 21,66)2 (18 − 13,68)2 (8 − 11,4)2 (8 − 10,26)2 (15 − 16,34)2
𝜒𝑐𝑎𝑙𝑐 = + + + +
21,66 13,68 11,4 10,26 16,34
(6 − 10,32)2 (12 − 8,6)2 (10 − 7,74)2
+ + +
10,32 8,6 7,74

2
𝜒𝑐𝑎𝑙𝑐 = 6,88

Valor Crítico = 7, 815 (Ver tabla de Chi-Cuadrado)


Significancia = 0,05 Grados de Libertad = (2 – 1)(4 – 1) = 3 (Continúa)
Como es menor, SE ACEPTA LA HIPÓTESIS NULA (El sabor que se elige del chocolate es
independiente del género)

2) Se solicita a los socios de un prestigioso club de San José que para la Asamblea Anual,
deben participar en uno de 3 eventos disponibles a saber: Billar, Tenis de Campo o Tenis
de Mesa y la participación quedó distribuida de la siguiente forma, Billar: 39 hombres y
21 mujeres, Tenis de Campo: 16 hombres y 14 mujeres, Tenis de mesa: 8 hombres y 17
mujeres.

Realice una prueba de Chi-Cuadrado a un nivel de significación del 10% para demostrar
independencia o no entre las variables establecidas.

Solución: (Usando la CPG)

H0 = El evento que se elige es independiente del género


H1 = El evento que se elige no es independiente del género

Datos observados:

Billar Tenis de Tenis de TOTAL


campo mesa
Masculino 39 16 8 63
Femenino 21 14 17 52
TOTAL 60 30 25 115

Datos esperados:

Billar Tenis de Tenis de TOTAL


campo mesa
Masculino 63
Femenino 52
TOTAL 60 30 25 115

 Insertar una matriz en la calculadora (MATRIX, EDIT)


o En nuestro caso debe ser de 2 x 3 (no se incluyen los totales)
o Digitamos los datos observados.
 Nos vamos a STAT, TEST y buscamos la opción de Chi-Cuadrado Test
o En Observed, nos vamos a MATRIX y damos enter a la matriz de los datos
observados.
o En Expected, nos vamos a MATRIX y damos enter a una matriz vacía
o Damos enter en Calculated.
 𝜒 2 = 7,79 (3𝑐𝑠)
 𝑝 = 0,0203 (este se compara con el 10%)
 Si es menor al porcentaje se rechaza la hipótesis.
 Si es mayor se acepta la hipótesis.
 𝑑𝑓 = 2 (grados de libertad)
o Por lo general, en lo que a pruebas se refiere, a ustedes les dan el valor crítico
que en este caso, para un 10% con 2 grados de libertad es de 4,605
 Como el Chi-Cuadrado es mayor que el valor crítico, se rechaza la hipótesis nula por
lo tanto, el evento que se elige no es independiente al género.
 Si van a MATRIX y dan enter a la matriz que ustedes escogieron como “Expected”,
aparecerán los valores esperados de la tabla de contingencia, la cual la pueden
completar:

Datos esperados:

Billar Tenis de Tenis de TOTAL


campo mesa
Masculino 32,9 16,4 13,7 63
Femenino 27,1 13,6 11,3 52
TOTAL 60 30 25 115
3) Con base en la siguiente tabla de datos esperados, realice una prueba de Chi-Cuadrado
a un nivel de significancia del 5% y un valor crítico de 7, 815 para demostrar la
independencia o no entre las variables relacionadas.

Color de camisa/blusa preferida


Género Negro Blanco Rojo Azul TOTAL
Masculino 48 12 33 57
Femenino 35 46 42 27
TOTAL

Solución:
 Definimos las hipótesis:
o H0 = El color preferido de camisa/blusa es independiente al género.
o H1 = El color preferido de camisa/blusa no es independiente al género.
 Usamos la CPG
o 𝜒 2 = 33,8 (3𝑐𝑠)
o 𝑝 = 2,22 𝑥 10−7 (3𝑐𝑠)
o 𝑑𝑓 = 3
 Se rechaza la hipótesis nula (El color preferido de camisa/blusa es no independiente
al género)
Práctica.

1) La siguiente tabla muestra los valores observados entre el género preferido de un libro
y las edades de 300 personas encuestadas a las afueras de una librería.

Género
Edad. Ficción Romántica. Ciencia Ficción TOTAL
0 – 25 años 23 16 41 80
26 – 50 años 54 38 38 130
51 o más 29 43 18 90
TOTAL 106 97 97 300

Realice una prueba de Chi-Cuadrado a un nivel de significancia del 5% para determinar si


existe independencia o no entre las variables.

a) Indique cuáles son las hipótesis.


b) Cuál es la frecuencia esperada para los que prefieren Ciencia Ficción en las edades
de 26 a 50 años.
c) Determine el número de grados de libertad del estudio.
d) Sabiendo que el valor crítico es de 9, 488, determine el valor 𝜒 2 y determine si hay
independencia o no entre las variables.

2) Realice una prueba de Chi-Cuadrado a un nivel de significancia del 10% para determinar
si existe independencia o no entre las variables estudiadas. La tabla de contingencia con
los datos observados se muestra a continuación:

Color de cabello
Color de ojos Negro Marrón Rubio TOTAL
Negro 35 43 12 90
Azul 8 27 48 83
Verde 9 20 25 54
TOTAL 52 90 85 227

a) Indique las hipótesis


b) Determine la frecuencia esperada de todas las variables
c) Escriba la cantidad de grados de libertad
d) Determine el valor “p” y determine si hay independencia o no entre las variables.
3) Realice una prueba de Chi-Cuadrado a un nivel de significancia del 1% para decidir si
existe o no independencia entre las variables.

Tipo de película
Género Aventura Policial Romántica Ciencia ficción TOTAL
Masculino 15 12 2 12 41
Femenino 7 9 18 5 39
TOTAL 22 21 20 17 80

a) Indique las hipótesis


b) Calcule la frecuencia esperada de todas las variables
c) Escriba el número de grados de libertad
d) Si el valor crítico es de 11, 345, compárelo con el valor de Chi-Cuadrado y analice el
resultado

You might also like