You are on page 1of 8

Prueba de Chi-cuadrado

El anlisis de una tabla de este tipo supone que las dos clasificaciones son
independientes. Esto es, bajo la hiptesis nula de independencia se desea
saber si existe una diferencia suficiente entre las frecuencias que se
observaron y las correspondientes frecuencias que se esperan, tal que la
hiptesis nula se rechace. La prueba chi-cuadrada proporciona los medios
apropiados para analizar este tipo de tablas.
El nmero de grados de libertad ser:
(nmero de categoras de una de las variables - 1) x (nmero de categoras de
la otra variable - 1)

Para realizar esta prueba debemos de establecer una comparacin entre los
datos observados y los esperados.
Si las dos caractersticas son independientes (asumiendo independencia
condicional), la frecuencia absoluta conjunta debe ser igual al producto de las
frecuencias absolutas marginales dividido para el total. Esto es algo que ocurre
con muy poca frecuencia al trabajar con las muestras.
En el caso de que las caractersticas sean dependientes, la afirmacin anterior
no se podr aplicar, es decir, si hallamos las frecuencias absolutas conjuntas a
partir de las frecuencias absolutas marginales encontraremos diferencia en
estas respecto a los valores obtenidos a partir de la tabla de datos (respecto a
las frecuencias absolutas conjuntas observadas). Todo esto est basado en los
datos de nuestra muestra, es decir, las relaciones que encontremos existen en
la muestra, pero lo que realmente nos interesa saber es si esta diferencia
existe tambin en nuestra poblacin y si es significativa como para poder
afirmar que existe dependencia entre las variables (rechazo de H0).

Para calcular la significacin de Chi-cuadrado (p) empleamos nuevamente


Excel. Para ello seleccionaremos la funcin PRUEBA.CHI. Los datos que
debemos introducir son las frecuencias absolutas conjuntas observadas
(rango_actual) y las frecuencias absolutas conjuntas esperadas
(rango_esperado). En la celda seleccionada para insertar esta funcin
aparecer el valor de p.

La significacin de Chi-cuadrado (p) es una medida ms exacta que el propio


valor de Chi y por ello emplearemos mejor este dato para comprobar si el
resultado es significativo o no.

Si p < 0,05 el resultado es significativo, es decir, rechazamos la hiptesis nula


de independencia y por lo tanto concluimos que ambas variables estudiadas
son dependientes, existe una relacin entre ellas. Esto significa que existe
menos de un 5% de probabilidad de que la hiptesis nula sea cierta en nuestra
poblacin.
Si p > 0,05 el resultado no es significativo, es decir, aceptamos la hiptesis
nula de independencia y por lo tanto concluimos que ambas variables
estudiadas son independientes, no existe una relacin entre ellas. Esto significa
que existe ms de un 5% de probabilidad de que la hiptesis nula sea cierta en
nuestra poblacin y lo consideramos suficiente para aceptar.
El valor de 0,05 es un valor establecido de acuerdo al nivel de confianza del
95%.

USO DE LA CHI CUADRADA.


* ANTECEDENTES HISTORICOS:
Karl Pearson hacia 1900 propuso uno de los primeros Tests Estadsticos que
desde la ptica de las distribuciones de la probabilidad sirve para calcular si los
resultados estadsticos de un experimento se alejan significativamente o no de
los resultados esperados del modelo terico, test que actualmente es conocido
como el Test Chi Cuadrado
Comprendiendo el modelo ideal de la Distribucin Chi Cuadrado:

La denominada Distribucin Chi Cuadrado (que usualmente se escribe y se


lee como: Ji Cuadrado), es una distribucin cuadrtica de la probabilidad que
utiliza bsicamente variables aleatorias continuas.
La Distribucin Chi Cuadrado de la probabilidad se denota mediante la letra
griega minscula ji elevada al cuadrado (2), es decir, en un delimitado espacio
conjuga un determinado nmero de variables aleatorias independientes entre
s, con unos valores de probabilidad ubicados entre 1 y 0 que son atribuibles a
esas variables, y con unos lmites de la probabilidad para el verdadero valor de
X delimitados por los Grados de Libertad atribuibles a las variables aleatorias
analizadas.
La Distribucin Chi Cuadrado permite calcular la probabilidad existente para
que unavariable X, que tiene un determinado Grado de Libertad frente a otras
variables del mismo conjunto, permanezca dentro de unos lmites ideales
previstos para X cuando tiene ese especfico Grado de Libertad o
independencia.
La frmula para calcular la probabilidad de que una variable X permanezca
dentro del lmite ideal correspondiente al respectivo Grado de Libertad es la
siguiente:

* PRUEBA CHI-CUADRADO
Chi-Cuadrado ( ) es el nombre de una prueba de hiptesis que determina si dos
variables estn relacionadas o no.
* Pasos:
1) Realizar una conjetura.
2) Escribir la hiptesis nula y la alternativa.
3) Calcular el valor de .
4) Determinar el valor de p y el grado de libertad.
5) Obtener el valor crtico.
6) Realizar una comparacin entre el chi-cuadrado calculado y el valor crtico.
7) Interpretar la comparacin.
8)
* TABLA DE CONTINGENCIA: Es la tabla que contiene los datos obtenidos
contados y organizados.
Ejemplo:

* FORMULACION DE LA HIPOTESIS

* NULA (H0): Es aquella en la que se asegura que los dos parmetros


analizados son independientes uno del otro.
* ALTERNATIVA (H1): Es aquella en la que se asegura que los dos parmetros
analizados s son dependientes.
* Melissa conjetura que el uso de cinturn de seguridad, en los conductores,
est relacionado con el gnero.
* H0: El uso del cinturn de seguridad es independiente del gnero.
* H1: El uso del cinturn de seguridad no es independiente del gnero.

* TABLA DE FRECUENCIAS ESPERADAS


Para calcular todos y cada uno de los valores de la tabla de frecuencias
esperadas se realiza:

REALIZAR UNA TABLA CON LOS VALORES DE LA TABLA DE CONTINGENCIA Y


AADIR UNA FILA EN LA PARTE INFERIOR Y UNA COLUMNA EN LA PARTE
DERECHA.

* CHI CUADRADO CALCULADO:


Para obtener el valor de Chi-Cuadrado Calculado se tiene la frmula

* GRADO DE LIBERTAD v
Para calcular el grado de libertad (v) se realiza:

* NIVEL DE SIGNIFICANCIA
* Es el error que se puede cometer al rechazar la hiptesis nula siendo
verdadera.
* Por lo general se trabaja con un nivel de significancia de 0.05, que indica que
hay una probabilidad del 0.95 de que la hiptesis nula sea verdadera.

* VALOR DEL PARAMETRO P

* TABLA PARA VALORES DE CHI-CUADRADO CRTICO

* COMPARACIN ENTRE LOS VALORES DEL CHI-CUADRADO CALCULADO Y EL


CRTICO
* Si el valor del chi-cuadrado calculado es menor o igual que el chi-cuadrado
crtico entonces se acepta la hiptesis nula, caso contrario no se la acepta.
*

Entonces se acepta la hiptesis nula, la cual es El uso del cinturn de


seguridad es independiente del gnero.

CONCLUSIONES
La chi cuadrada permite al investigador comprobar una hiptesis acerca de una
relacin entre dos medidas nominales.La lgica 2 es la siguiente:el nmero
total de observaciones en cada columna (puede ser de tratamiento o control) y
el nmero total de observaciones en cada rengln (positivo o negativo) son
considerados dados o fijados y se conoce como frecuencia marginal.
Si nosotros asumimos que columnas y renglones son independientes, podemos
calcular el nmero de observaciones esperadas que ocurran al azar y se
conoce como frecuencia esperada. Este tipo de estadstica compara la
frecuencia observada y la esperada de cada celda despus de multiplicar
columnas y renglones para encontrar si existe o no una relacin

LA CHI CUADRADA

Origen y autor
El matemtico ingls Karl Pearson (18571936), con formacin en literatura
medieval alemana, derecho romano, fsica, biologa y teora poltica del
socialismo, hasta 1890 sobresali por aplicar ampliamente la Estadstica y la
Teora de la Probabilidad a la solucin de diferentes problemas de la ingeniera
industrial, tales como determinar la resistencia, la fuerza o la durabilidad de
aleaciones, resortes, engranajes, materias primas, etc.; pero luego l termin
involucrado en las investigaciones biolgicas del zologo Walter Weldon y en
las investigaciones sobre antropometra, eugenesia y evolucin humana
realizadas por Francis Galton que requeran la elaboracin de clculos muy
precisos para la cuantificacin de los resultados obtenidos.
De este modo, como protegido de Francis Galton e influenciado por sus ideas
sobre la eugenesia para perfeccionar cientficamente el patrimonio gentico de
la especie humana, Pearson tambin comenz a aplicar la Estadstica y la
Teora de la Probabilidad en campos biolgicos muy variados: como la
valoracin matemtica de las muestras clnicas usadas en la inmunologa, la
valoracin de los resultados biomtricos, el clculo de los chances de
sobrevivencia de una especie frente a otras, el clculo de la probabilidad de
transmisin hereditaria de una caracterstica gentica favorable, la elaboracin
de tablas para calcular el grado de expansin entre la poblacin de ciertas
taras consideradas indeseables (retraso mental, albinismo, sordera, ceguera,
tartamudez, alcoholismo, homosexualidad, etc.), el clculo de la correlacin
existente entre las caractersticas biolgicas de los padres y las caractersticas
heredadas por sus hijos, la propuesta de nuevos mtodos para la cuantificacin
y la codificacin de la informacin estadstica recolectada respecto de las
caractersticas fsicas y mentales de los bebs que nacen anualmente en una
nacin, etc.

A travs de estas numerosas investigaciones Pearson axiomatiz los conceptos


de Regresin Lineal y de Coeficiente de Correlacin que inicialmente fueron
sugeridos por Galton, pero adems, ante la necesidad de establecer
parmetros ms exactos y objetivos para determinar cundo la desviacin
estadstica de un resultado obtenido respecto del resultado esperado en un
experimento es verdaderamente significativa, hacia 1900 Pearson propuso lo
que actualmente se conoce como el Test Chi Cuadrado asociado a la
Distribucin Chi Cuadrado, que es una prueba que se le aplica a los valores
estadsticos resultantes de un experimento para determinar cul es el grado de
confianza que se le puede atribuir a la creencia de que la desviacin
descubierta en los resultados obtenidos realmente se aleja del comportamiento
regularmente esperado del fenmeno.

Descripcin

El test de chi-cuadrado es nicamente para las leyes discretas, pero se puede


utilizar tambin para muestras continuas agrupadas en clases. El caso tpico
es, como siempre, el de una muestra de una ley desconocida. Las clases,
denotadas , son una particin del conjunto
de los valores posibles. La hiptesis a comprobar tiene que ver con las
probabilidades de las clases, para las cuales se toman valores tericos .

Bajo la hiptesis, la distribucin emprica de la muestra sobre las clases debe


estar cerca de la distribucin terica. La distribucin emprica es la de las
frecuencias de la muestra en las clases:

Se mide el ajuste de la distribucin emprica a la distribucin terica por la


distancia de chi-cuadrado.
Definicin 2.3 Se llama distancia de chi-cuadrado de con respecto a , y se
denota por , al valor:

La ''distancia'' de chi-cuadrado es por tanto una media ponderada de las


diferencias cuadrticas entre los valores de y . No es una distancia en el
sentido usual del trmino, pues ni siquiera es simtrica. La ley de probabilidad
de no tiene una expresin explcita en general. Se emplea entonces el
siguiente resultado.
Teorema 2.4 Bajo la hiptesis la ley de la variable aleatoria converge, cuando
tiende a infinito, a la ley de chi-cuadrado de parmetro.

Si la hiptesis es falsa, entonces la variable tiende a infinito. Por tanto


aplicaremos un test unilateral a la derecha (rechazo de los valores muy
grandes).

El ejemplo clsico del test es la experiencia de Mendel. En los guisantes, el


carcter del color esta codificado por un gen que toma dos formas de alelo y ,
correspondientes a los colores amarillo y verde respectivamente. El amarillo es
dominante, el verde recesivo. La forma lisa o arrugada es llevada por otro gen
con dos alelos (dominante) y

You might also like