Professional Documents
Culture Documents
MEDIDAS DE ASOCIACIÓN
ENTRE VARIABLES
ÍNDICE
I. ANÁLISIS DE CORRELACIÓN………….……………………… 3
Para determinar la asociación entre variables depende del tipo de variable, es decir:
VARIABLES CUANTITATIVAS
Análisis de Correlación Lineal Simple
Análisis de Regresión Lineal Simple
VARIABLES CUALITATIVAS
Uso del Chi2: Pruebas de Independencia y Homogeneidad
Evaluación de factores de riesgo en estudio comparativo de:
o cohorte (prospectivo)
o caso-control (retrospectivo)
I. ANÁLISIS DE CORRELACIÓN
Es un procedimiento que permite medir la asociación o relación lineal que puede existir entre
dos variables aleatorias cuantitativas y determina su grado de relación y sentido. El
coeficiente de correlación poblacional se obtiene:
3
Para tener una idea cuando dos variables cuantitativas están correlacionadas se recurre al
DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS, que consiste en graficar los puntos
en un plano cartesiano. A continuación presentamos gráficamente cuando dos variables
cuantitativas están correlacionadas:
4
Es la relación funcional entre dos variables uno conocida como variable dependiente “Y” y
la otra como independiente “X”
Donde:
Y es la variable dependiente
X es la variable independiente.
ß es el coeficiente de regresión
es el intercepto
e es una variable aleatoria con media 0 y varianza ²y/x.
2.1.1. Objetivos
Establecer una relación cuantitativa entre dos variables relacionadas.
PREDECIR y/o EXPLICAR el valor de una variable (v. Dependiente), dado el
valor de la otra variable relacionada (v. Independiente).
2.1.2. Supuestos
Normalidad
Homogeneidad
Independencia
Linealidad
5
Si b>0; indica que por cada unidad que se incremente en X, Y aumenta en
promedio en b unidades.
Para obtener los coeficientes “a” y “b” del modelo de regresión estimado, se
aplica el método de mínimos cuadrado obteniendo los valores:
Sin embargo, aún con la ecuación, como todos los puntos no están exactamente
sobre una línea recta, se cometen errores en el ajuste.
Ejemplo:
6
NUMERO DE COEFICIENTE DE
HIJOS EN INTELIGENCIA
LA FAMILIA PROMEDIO DE LOS HIJOS
1 110
2 105
3 100
4 101
5 98
6 97
7 86
8 84
9 70
10 60
Comentario: Del cuadro se aprecia que hay una correlación inversa de las variables
en estudio.
110
1; 110
Coeficiente de inteligencia
2; 105
3; 100 4; 101
100
5; 98
6; 97
90
7; 86
8; 84
80
70 9; 70
10; 60
60
0 1 2 3 4 5 6 7 8 9 10 11
Numero de hijos en la familia
Comentario: Del gráfico se aprecia que hay una correlación inversa de las variables en
estudio con tendencia lineal.
7
COEFICIENTE DE
NUMERO DE
INTELIGENCIA
HIJOS EN
PROMEDIO DE LOS
LA FAMILIA
HIJOS X² Y² X*Y
X Y
1 110 1 12100 110
2 105 4 11025 210
3 100 9 10000 300
4 101 16 10201 404
5 98 25 9604 490
6 97 36 9409 582
7 86 49 7396 602
8 84 64 7056 672
9 70 81 4900 630
10 69 100 4761 690
55 920 385 86452 4690
ΣX ΣY ΣX² ΣY² ΣX*Y
10*4690-55*920
r = ---------------------------------------------
√(10 ∗ 385 − (55)²) ∗ (10 ∗ 86452 − (920)²)
r = - 0.957
Interpretación: Existe una correlación lineal inversa intensa entre el número de hijos
en la familia y el coeficiente de inteligencia promedio de los hijos; es decir; a medida
que aumenta el número de hijos entonces el coeficiente de inteligencia promedio
disminuye.
8
Paso 1.- Planteamiento de hipótesis.
H0 : 0
H1 : 0
Paso 2.- Niveles de significación. (teórico) ”= 0.05”
Paso 3.- Estadístico de prueba.
TAREA:
9
III. APLICACIONES DE CHI CUADRADO
Se utiliza para variables cualitativas con escala de medición nominal. Fórmula de trabajo:
10
Solución:
1. Verificar que sean variables cualitativas
2. Planteamiento de hipótesis
H0: La Hipertensión Arterial es independiente de la práctica de algún deporte
H1: La Hipertensión Arterial está asociada a la práctica de algún deporte
3. Determinación del nivel de significación α = 0.05
4. Cálculo de frecuencias esperadas y 2:
47 x 69
E11 32.43
100
47 x31
E12 14.57
100
53 x 69
E21 36.57
100
53 x31
E22 16.43
100
38 32.43 31 36.57 9 14.57 22 16.43
2 2 2 2
c2
32.43 36.57 14.57 16.43
2
c 5,8227
Ejemplo:
Evaluar la presencia de hipertensión arterial en pacientes provenientes de tres distritos de
la ciudad de Talara (Diciembre del 2006).
11
1. Planteamiento de la hipótesis
Ho: Las muestras provienen de poblaciones homogéneas según la
presencia de hipertensión arterial.
H1: Las muestras no provienen de poblaciones homogéneas según la
presencia de hipertensión arterial.
2. Nivel de significación: α = 0.05
3. Frecuencias esperadas y cálculo de 2 :
c2 ...
63.75 49.58 23.34
c2 59.34
12
IV. ODDS RATIO Y RIESGO RELATIVO
riesgo relativo
odds ratio
Exposición Sí a b
No c d
NOTA: Si : RR o OR < 1 : FACTOR PROTECTOR
RR o OR = 1 : SIN EFECTO
RR o OR > 1 : FACTOR DE RIESGO
Ejemplo:
Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del
infarto miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se
realiza un estudio comparativo tipo caso control y se obtienen los siguientes resultados:
13
Se pide calcular e interpretar el odds ratio (OR):
P (F/E) 23/58
ODDS1 = ---------- = -----------
P (F’/E) 35/58
P (F/E’) 34/166
ODDS2 = ---------- = -----------
P (F’/E’) 132/166
ODDS1 23*132
OR = ----------- = -------------------- = 2.55
ODDS2 34*35
Ejemplo
Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto
del miocardio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene
los siguientes resultados:
P (E/F) 10/135
RR = --------- = ------------ = 1,66
P (E/F’) 21/470
14
15
16