You are on page 1of 12

Relación entre variables

cualitativas
Pasos
◦ Construir una tabla de contingencia
◦ Crear una tabla con las frecuencias esperadas fei
(frecuencias teóricas en caso de que X e Y fueran
independientes), calculadas a partir de las
frecuencias marginales según esta expresión:

f i• × f • j
f ei =
n
◦ Aplicar la prueba X2 para determinar la significación
estadística de las proporciones entre ambas
variables (no son iguales)
Relación entre variables cualitativas
Pasos
◦ Hipótesis: ¿existen diferencias de uso de
suelo según la litología de un valle (has)
Hipótesis nula el uso del suelo no varía
significativamente en función de la litología
Hipótesis alternativa el uso del suelo sí varía

Cultivos Pastos Bosque TOTAL

Granito 23 12 95 130

Arena 68 45 53 166

TOTAL 91 57 148 296

Las cifras en la columna de la derecha y en la fila inferior reciben el nombre


de frecuencias marginales
La cifra situada en la esquina inferior derecha es el gran total.
Relación entre variables cualitativas
Valores esperados
◦ Si las pautas de usos de suelo fueran
idénticas sobre las dos litologías misma
proporción de casos en las tres categorías
Afloramientos graníticos
Cultivos 91 x (130/296) = 39,97.
Pastos 57 x (130/296) = 25,03.
Bosque 148 x (130/296) = 65

Observados Esperados
Cultivos Pastos Bosque TOTAL Cultivos Pastos Bosque TOTAL

Granito 23 12 95 130 Granito 39,37 25,03 65 130

Arena 68 45 53 166 Arena 51,03 31,97 83 166

TOTAL 91 57 148 296 TOTAL 91 57 148 296


Relación entre variables cualitativas
Test X2
◦ Comparaciones entre:
una muestra y una distribución de valores esperados
obtenidos de acuerdo a una hipótesis de proporcionalidad.
Dos muestras entre sí o
Tres o más muestras entre sí.

◦ Test no paramétrico no requiere el


conocimiento de ciertas características de
la población de la que se han extraído las
muestras.
◦ Datos medidos en escala nominal.
Es posible un cambio de escala para transformar datos
ordinales o medidos en escala de intervalo
Las categorías deben ser por lo menos dos y excluyentes
(ningún individuo puede estar en más de una categoría a la
vez.
Relación entre variables cualitativas

Basado en la comparación entre valores observados


(O) y esperados (E), aplicando la fórmula

2
x =∑
2 (O − E )
E
Relación entre variables cualitativas
Utilización
◦ El valor es expresivo de las diferencias
existentes entre los valores observados y los
esperados.
Diferencias altas se rechaza la hipótesis nula
con un determinado nivel de probabilidad (nivel
de significación) aceptación hipótesis
alternativa
Diferencias bajas no se rechaza la hipótesis
nula/no se acepta la alternativa (no quiere decir
que ésta última pueda ser verdadera,
simplemente no existe una evidencia estadística
que la apoye.
Relación entre variables cualitativas
Resolución

x =∑
2 (O − E )2 =
(23 − 39,97) 2 (12 − 25,03) 2 (95 − 65) 2
+ + +
E 39,97 25,03 65
(68 − 51,03) 2 (45 − 31,97) 2 (53 − 83) 2
+ + =
51,03 31,97 83

= 7,20 + 6,78 + 13,85 + 5,64 + 5,31 + 10,84 = 49,62


Relación entre variables cualitativas
Verificación de hipótesis
◦ Conocer la probabilidad de obtener un valor
bajo la hipótesis nula distribución de
probabilidad de X2.
Para rechazar la hipótesis nula comparar el
valor obtenido con el correspondiente valor
crítico, en función de
α: nivel de significación prefijado (pe. 0,05)
Grados de libertad
f número de filas (habitualmente el número de
muestras).
k número de columnas (categorías de que consta
υ = ( f − 1)(k )
− 1 la variable nominal).
Para dos 2 filas y 3 columnas, el número de
grados de libertad es 2, ya que (2-1) (3-1) = 2.
Relación entre variables cualitativas
Verificación de hipótesis
◦ Tabla
Grados de libertad = 2
Alfa = 0,01
Valor crítico = 9,21
Significado existe una probabilidad del 1 % de alcanzar
un valor X2 igual o superior a 9,21 bajo la hipótesis nula.
◦ Valor obtenido = 49,62 > 9,21
Rechazo de la hipótesis nula se acepta la alternativa al
nivel de significación elegido (en caso contrario no existiría
una evidencia estadística que avale nuestra hipótesis de
investigación a ese nivel de significación).
Relación entre variables cualitativas
Verificación de hipótesis
◦ Como el valor obtenido es muy superior al valor
crítico, se puede plantear otro nivel de significación
más exigente
En la tabla el más alto es el de 0,001 -es decir, del 1 por
1.000-)
2 grados de libertad le corresponde un valor crítico de
13,82. Luego también a ese nivel de significación se puede
rechazar la hipótesis nula y aceptar la de investigación.
Relación entre variables cuantitativas

Covariabilidad (grado de asociación)


◦ Intenta averiguar si las propiedades medidas
en dos variables están relacionadas entre sí
◦ Variables cuantitativas
Cómo analizarlo.
Diagrama de dispersión
Indicadores estadísticos
Coeficientes de correlación
Regresión lineal
Estimación de la recta de regresión
Predicción del valor de una variable a partir del de
laotra variable

You might also like