You are on page 1of 34

TAREA DOMICILIARIA

Parte 1: Investigación
Definición y ejemplo de cálculo de los siguientes tipos de correlación:
a) Spearman
b) Biserial
c) Biserial puntual
d) Tetracórico

Parte 2: Trabajo en Excel y/o SPSS


Resolver los ejercicios propuestos de este archivo

Procedimiento
Formar grupos de trabajo (de tres a cinco integrantes)
Ambos trabajos presentarlo en Power Point
Habrá exposición por grupo en la primera semana de noviembre
CORRELACIÓN Y REGRESIÓN
La correlación y la regresión son dos técnicas que
permiten estudiar la relación entre dos variables
cuantitativas (escala de intervalo o de razón). Por
ejemplo:

• Presión sanguínea y edad


• Estatura y peso

Ambas técnicas estudian la naturaleza y la intensidad


entre variables.

1. Análisis bivariado
2. Regresión lineal simple
Herramientas Cuantitativas
para la Toma de Decisiones

CORRELACIÓN Y REGRESIÓN
1. ANÁLISIS BIVARIADO
A. CONCEPTO
• Consiste en analizar la interacción de dos variables.
Ejemplo.
Analizar la relación entre los siguientes resultados de dos tests
(Matemáticas y Ciencias) aplicados a un grupo de alumnos:
Tabla 1: Resultados de dos Tests (Matemático y Ciencia)
Puntuación Puntuación Ciencias
Alumno
Matemática Test X Test Y
A 83 160
B 46 38
C 92 143
D 81 67
E 70 124
F 70 117
G 75 132
H 88 143
I 74 121
J 79 113
DIAGRAMA DE DISPERSIÓN

Es la expresión gráfica de la relación entre dos variables


cuantitativas.
(1) Una primera herramienta para este análisis es el “diagrama
de dispersión o nube de puntos”, el mismo que consiste en
graficar los pares ordenados correspondientes.
Gráfico 1. Diagrama de dispersión o nube de puntos
Y
LÍNEA DE REGRESIÓN

NUBE DE PUNTOS (estrecha


o ancha)
La forma que adopta el diagrama de dispersión, indica la
naturaleza e intensidad de la relación.

(2) El diagrama de dispersión que se muestra a


continuación representa gráficamente la forma en que se
asocian las dos variables. En estudio, pudiendo ésta ser
lineal.

La misma que puede ser:


LINEAL POSITIVA

r=+ X
LINEAL NEGATIVA

r=- X
NINGUNA RELACIÓN

r=0
En nuestro ejemplo propuesto en la tabla 1 para elaborar
una relación lineal y el diagrama de dispersión de las
variables (Test “X” y Test “Y”)

Para ellos se trazan dos ejes coordenados mutuamente


perpendiculares (horizontal y vertical), ubicando una
variable en cada eje y considerando una escala
apropiada. (Véase Gráfico Nº 1)

Se ubican cada uno de los pares ordenados. Por


ejemplo, el par ordenado del alumno “A” sería (83,160),
para el alumno “B” sería (46,38), y así sucesivamente
(Véase Gráfico Nº 2) y se puede deducir una relación
lineal positiva entre los resultados obtenidos por los
alumnos en ambos tests.
Gráfico 2. Diagrama de dispersión de las puntuaciones de
los alumnos de Matemática y Ciencias

180
160
140
120
T E S T "Y "

100
80
60
40
20
0
0 20 40 60 80 100

T E S T "X "
COEFICIENTE DE CORRELACIÓN DE PEARSON

• Mide el grado de asociación de dos variables cuantitativas.


• El objetivo es determinar que tan intensa es la relación
mediante el coeficiente de correlación. Se simboliza con la
letra “r” y su valor puede fluctuar de la siguiente forma:

Correlación Ninguna Correlación


negativa Correlación positiva
perfecta perfecta

Valor negativo de “r” Valor negativo de “r”

-1.00 0.00 1.00

Correlación negativa Correlación positiva


• Cuando el valor de “r” se aproxima a + 1 ó – 1 se dice que la
correlación es perfecta; en cambio, si el valor de “r” se
acerca a cero, se afirma que la correlación es escasa o nula.
• El coeficiente de correlación no nos permite determinar la
causa de la relación entonces la “r” lineal es útil sólo para
conocer la existencia de relación lineal entre dos variables
(covariación)
El coeficiente de correlación puede calcularse con la
siguiente fórmula:
N XY   X Y
r
n X 2

 (  X) 2 n  Y 2  ( Y) 2 
En donde: n : Número de sujetos de la muestra
X : Puntuaciones de la Variable “X”
Y : Puntuaciones de la Variable “Y”
Ejemplo:
• Para simplificar los cálculos correspondientes, se tabulan de la
siguiente forma:
Tabla 2. Resultados de los Tests
(Matemática y Ciencias)
ALUMNO X Y X2 Y2 XY
A 83 160 6889 25600 13280
B 46 38 2116 1444 1748
C 92 143 8464 20449 13156
D 81 67 6561 4489 5427
E 70 124 4900 15376 8680
F 70 117 4900 13689 8190
G 75 132 5625 17424 9900
H 88 143 7744 20449 12584
I 74 121 5476 14641 8984
J 79 113 6241 12769 8927
TOTAL  X  758  Y  1158  X 2
 58916 Y 2
 146330  XY  90846
* EN ESTE CASO “n” ES IGUAL A 10.
Fuente: Tabla 1
Aplicando la fórmula:

N XY   X Y
r
n X 2

 (  X) 2 n  Y 2  ( Y) 2 
10(90846)  (758)(1158)
r
10(58916)  (758) 10(146330)  (1158) 
2 2

30696 30696
r 
14596122336 42256.5528
r  0.726

INTERPRETACIÓN:
• La correlación es positiva (por el signo del resultado), lo cual significa
que ambas variables varían en un mismo sentido.
• La correlación es numéricamente igual a 0.726, valor que puede ser
aceptado como “alta”.
Tabla 3. Significación del coeficiente de correlación de
Pearson según Garrett

VALOR r
INTERPRETACIÓN RELACIÓN
De A
0.00 0.19 “r” DEBIL RELACIÓN CASI NULA

0.20 0.39 “r” BAJA RELACIÓN DEFINIDA PERO DÉBIL

0.40 0.69 “r” MODERADA RELACIÓN CONSISTENTE

0.70 0.89 “r” ALTA RELACIÓN MARCADA

0.90 1.00 “r” VERDADERAMENTE RELACIÓN MUY MARCADA


ALTA
Altura Peso
en en
cm. Kg.
162 61
154 60
180 78
158 62
171 66
169 60
166 54
176 84
163 68
... ...

UNE Estadística Oscar Tinoco


2. REGRESIÓN LINEAL SIMPLE

CONCEPTO

• La regresión lineal implica una relación de independencia


entre dos variables, una de las cuales es independiente y
la otra dependiente.
• Permite, también, predecir el valor de una variable (v.
dependiente), dado el valor de otra u otras variables
relacionadas (v. independientes)
• Las variables deben ser de naturaleza cuantitativa y de
preferencia continua.
Tabla 1. Modelo de Regresión Lineal

Variable dependiente Variable independiente

Y = B0 + B1 X

Intersección en Y Pendiente de la recta de regresión


(Coeficiente independiente) (Coeficiente asociada a “x”)

Como todos los puntos no caen exactamente sobre la recta,


existe una diferencia entre el valor observado y el ajustado.
Coeficiente de Determinación
APLICACIÓN:

• Cuando el investigador presume que los datos de las


variables en estudio tienen una relación lineal formula
el modelo indicado y realiza las mediciones
correspondientes, tal como se muestra en la siguiente
tabla 2.
• A partir de estos datos reales se “estiman” los valores
de los coeficientes B1 y B0 mediante un procedimiento
denominado “Método de los mínimos cuadrados”.
Tabla 2. Estimadores mínimo cuadráticos para
obtener B1 y B0.

n  XY    X  Y 
B1 
n  X   X 
2 2
(1)

B1  Y  b X (2)

EJEMPLO:
• Con los datos del Análisis Bivariado de la Tabla 3
obtener la recta de regresión lineal entre la variable
independiente (Test X) y la variable dependiente (Test Y)
Los resultados de este estudio son presentados de la
siguiente manera:
Tabla 3. Resultados de los Datos de los
Test “X” y Test “Y”

TEST X TEST Y
ALUMNOS
(MATEMÁTICA) (CIENCIAS)
A 83 160
B 46 38
C 92 143
D 81 67
E 70 124
F 70 117
G 75 132
H 88 143
I 74 121
J 79 113
• Con los datos obtenidos se elabora una tabla como el que sigue:
ALUMNO X Y X2 XY
A 83 160 6889 13280
B 46 38 2116 1748
C 92 143 8464 13156
D 81 67 6561 5427
E 70 124 4900 8680
F 70 117 4900 8190
G 75 132 5625 9900
H 88 143 7744 12584
I 74 121 5476 8984
J 79 113 6241 8927
TOTAL 758 1158 58916 90846

N 10 PROMEDIOS
X X 75.8
Y Y 115.8
 XY
X 2

 X 2
• Para obtener B1 utilizamos la fórmula (1)
n  XY    X  Y 
Reemplazando: B1 =
n  X   X 
2 2

B1 = (10)(90846)  (758)(1158)  30696  2.1


(10)(58916)  574564 14596

• Para obtener B0 usamos la fórmula (2)

Reemplazando: B0 = YX
B0 = 115.8 – (2.1) (75.8) = -43.38

• Para obtener usamos el Modelo de Regresión Lineal (3)

Y  B0  B1 Y

Reemplazando: Entonces, la recta de regresión es:

Y  43.38  2.1 X
EJEMPLOS:

• Con la recta de regresión hallada, determinar cuál sería el


puntaje que obtendrá un estudiante en el Test “Y” si obtuvo
una puntuación 100 en el test “X”.
• Aplicando la ecuación de regresión lineal
Y  B0  B1 X (3)
• Reemplazando:
Y = -43.38 + (2.1) (100)
Y = -43.38 + 210
Y = 166.22
Rpta:El alumno obtendrá una puntuación de 166.22 en el
Test “Y” con una puntuación de 100 en el Test “X”.
EJERCICIO
La empresa de seguros “El Pacífico”, considera que existe relación entre el
número de entrevistas y el importe de seguros médicos vendidos. Para
documentar este aserto, recopiló la siguiente información muestral.
Número de Entrevistas Seguros Médicos Vendidos

14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110

¿Cuál es la variable dependiente, y cuál la independiente?


Determine el coeficiente de correlación.
Determine la ecuación de regresión
Encontrar la función que mejor explique los datos
experimentales, con soporte en Excel.
EJERCICIO
Se quiere estudiar la
relación entre la PUREZA
DEL OXIGENO (Y)
producido en un proceso
químico de destilación y el
NIVEL DE
HIDROCARBUROS (X)
presentes en el
condensador principal de
la unidad de destilación.
Ejercicio
Ejercicio
Uno de los problemas más desafiantes que enfrena el
campo de control de contaminación del agua lo presenta la
industria de curtido de pieles. Los deshechos de las
curtidurías son químicamente complejos. Se caracterizan
por los altos valores de demanda bioquímica de oxígeno,
sólidos volátiles y otras medidas de contaminación. Se
obtienen datos de 33 muestras de estos deshechos en un
estudio que realizo la UPVM. Se registraron las lecturas de
x, la reducción porcentual de sólidos totales y y la reducción
porcentual en la demanda química de oxigeno para las 33
muestras. Hallar el modelo de regresión lineal mínimo que
se ajusta a los datos. La tabla siguiente muestra las lecturas
tomadas.

You might also like