You are on page 1of 9

Repblica Bolivariana de Venezuela

Universidad Bicentenaria de Aragua


Vicerrectorado Acadmico
Facultad de Ciencias Administrativas Sociales
Escuela de Psicologa

ANLISIS DE CORRELACIN Y REGRESIN

Integrante
Crisanny Betancourt
CI.N 27881179

Guanare Diciembre 2016

ANLISIS DE CORRELACIN Y REGRESIN


Al trabajar con dos variables cuantitativas podemos estudiar la relacin que
existe entre ellas mediante la correlacin y la regresin. Aunque los clculos de
ambas tcnicas pueden ser similares en algunos aspectos e incluso dar resultados
parecidos, no deben confundirse. En la correlacin tan solo medimos la direccin y la
fuerza de la asociacin de una variable frente a la otra, pero nunca una relacin de
causalidad. Solo cuando tenemos una variable que es causa o depende de otra,
podremos realizar entonces una regresin.
La correlacin puede decir algo acerca de la relacin entre las variables. Se
utiliza para entender:
Si la relacin es positiva o negativa
La fuerza de la relacin.
La correlacin es una herramienta poderosa que brinda piezas vitales de
informacin.
En el caso del ingreso familiar y el gasto familiar, es fcil ver que ambos suben
o bajan juntos en la misma direccin. Esto se denomina correlacin positiva.
En caso del precio y la demanda, el cambio se produce en la direccin opuesta,
de modo que el aumento de uno est acompaado de un descenso en el otro. Esto se
conoce como correlacin negativa.
El principal objetivo del anlisis de correlacin consiste en determinar que tan
fuerte es la relacin entre las variables. Las variables que se vinculan se llaman:
Variable Dependiente.- es la variable que se predice o calcula. Cuya
representacin es "Y "
Variable/s Independiente/s.- es la o las variables que proporcionan las bases
para el clculo. Cuya letra de representacin es: X. Esta o estas variables suelen
ocurrir antes en el tiempo que la variable dependiente.
En este orden de ideas, las variables como su nombre lo indican van hacer lo
que va a variar, lo que se va a someter a estudio.

Variables dependientes: Son las variables de respuesta que se observan en el


estudio y que podran estar influenciadas por los valores de las variables
independientes. En la pgina electrnica Enciclopedia libre 2010 cita a Hayman
(1974.Pg, 69) la define como propiedad o caracterstica que se trata de cambiar
mediante la manipulacin de la variable independiente. La variable dependiente es el
factor que es observado y medido para determinar el efecto de la variable
independiente.
Variables independientes: aqulla que es manipulada por el investigador en un
experimento con el objeto de estudiar cmo incide sobre la expresin de la variable
dependiente. A la variable independiente tambin se la conoce como variable
explicativa, y mientras que a la variable dependiente se la conoce como variable
explicada.
Por otra parte los diagramas de dispersin son planos cartesianos en los que se
marcan los puntos correspondientes a los pares ordenados (X,Y) de los valores de las
variables. La representacin grfica ms til para describir el comportamiento
conjunto de dos variables es el diagrama de dispersin o nube de puntos, donde cada
caso aparece representado como un punto en el plano definido por las variables.
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden
darse, alguna de las siguientes relaciones: Lineal, Logartmica, Exponencial,
Cuadrtica, etc. Dentro de estas nubes de puntos se pueden generar lneas poligonales
a partir de ecuaciones de regresin, que permitan predecir el comportamiento de la
variable dependiente.
Ejemplo:
Las variables a estudiar para este ejemplo de grafico de dispersin en calidad
son:
Cantidad de tinta en litros
Nmero de errores de impresin

Ejemplo resuelto de diagrama de dispersin


La regresin es una tcnica que permite predecir un valor numrico basndonos
en el conocimiento de otro diferente. El trmino regresin fue introducido por Francis
Galton en su libro Natural inheritance (1889), partiendo de los anlisis estadsticos
de Karl Pearson. Su trabajo se centr en la descripcin de los rasgos fsicos de los
descendientes a partir de los de sus padres. Estudiando la altura de padres e hijos
lleg a la conclusin de que los padres muy altos tenan una tendencia a tener hijos
que heredaban parte de esta altura, pero los datos revelaban tambin una tendencia a
regresar a la media.
Los tipos de regresin ms comunes entre dos

variables son las del tipo

polinmico como la regresin: lineal, cuadrtica y cbica. La primera regresin


genera una recta, las otras diferentes tipos de parbolas. Otros tipos de regresin que
se pueden usar con dos variables son la logartmica y la exponencial, la regresin
logartmica permite transformar una curva en una lnea recta. Cuando hay ms de una
variable independiente x, la regresin ms utilizada en la regresin mltiple. A
continuacin se expresan matemticamente los diferentes modelos comentados:

REGRESIN
Lineal

ECUACIN
^y = 0 + 1 X

Logartmica

^y = 0 + 1 ln(X )

Exponencial

^y = 0 e

Cuadrtica

^y = 0 + 1 X+ 2 x 2

Cbica

^y = 0 + 1 X+ 2 x 2+ 3 x 3

Lineal Mltiple

^
y i= 0 + 1 X i1 + 2 X i 2+...+ k X ik

Ejemplo de regresin correlacin lineal:


Se tienen las notas de un examen parcial de diez alumnos de las asignaturas de
matemticas y espaol.
Matemtica 40

56

64

65

66

68

75

76

85

95

s
Espaol
45
59
67
59
69
70
61
82
75
100
Se supone que los alumnos con mejores notas en matemticas, variable
independiente X, tienen las mejores notas en espaol, variable dependiente Y.
Esta pregunta se puede responder con un anlisis de regresin correlacin.
Lo primero que se hace es construir un grfico de dispersin de puntos para
mirar la tendencia de la nube de puntos, como el que se muestra a continuacin

Grfico de Dispersin

103

espaol

88
73
57
42
37

52

68
matemticas

83

98

Grfico de dispersin de puntos de las notas de las asignaturas de matemticas y espaol


Datos generados con una calculadora de mano:
x =69, y =68.7 ; x=690 ; x 2=49,688 y=687 ; y 2=49,207 ; xy=49,223

Luego se calcula el coeficiente de correlacin r.


49,223
r=

690(687)
10

( 49,688 69010 )( 49,207 68710 )


2

=0.891

Este valor de r de 0.891 muestra que hay una alta correlacin entre las notas
de matemticas y espaol.
Para hacer la recta de regresin debemos calcular:
690(687)
10
=0.88
6902
49,688
10

49,223
b1=

b0 = 68.7 - 0.876

(69) = 8.27

La recta de regresin queda determinada de la siguiente manera:


Y
= 8.27 + 0.88 X .A continuacin se observan los valores estimados por la
recta de regresin de la asignatura de espaol, ^y , para cada valor observado y
y el desvo o error asociado a cada dato, y - ^y , estos son:
" ^y

43.30

57.31

64.32

65.20

66.07

67.82

73.96

74.83

82.71

91.47

"
rror

1.70

1.69

2.68

-6.20

2.93

2.18

-12.96

7.17

-7.72

8.53

Se puede comprobar que la suma de los desvos es igual 0.


El grfico de regresin es el siguiente:
Regresin simple

100

espaol

85
70
56
41
37

52

68

83

98

matemticas

Grfico de Regresin de la asignatura Matemtica y Espaol. Se observa la


recta de regresin y los datos observados en forma de lnea discontinua.
Coeficiente de Correlacin. Pesaron,
El coeficiente de correlacin ms utilizado es el de Pesaron, este es un ndice
estadstico que mide la relacin lineal entre dos variables cuantitativas, es una forma
de medir la intensidad de la relacin lineal entre dos variables.
En estadstica, el coeficiente de correlacin de Pearson es un ndice que mide la
relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la

covarianza, la correlacin de Pearson es independiente de la escala de medida de las


variables. El coeficiente de correlacin entre dos variables aleatorias X e Y es el
cociente donde XY es la covarianza de (X,Y) y X y Y las desviaciones tpicas de
las distribuciones marginales. (Enciclopedia Libre Wikipedia (2010). Parra.1)).
El valor del coeficiente de correlacin puede tomar valores desde menos uno
hasta uno, -1 < r < 1, indicando que mientras ms cercano a uno sea el valor del
coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal
entre las dos variables. El coeficiente de correlacin de clculo r es un estimador
muestral del coeficiente poblacional Rho, .
Ejemplo