You are on page 1of 28

Estadstica y

Probabilidad II

El Coeficiente de Correlacin Lineal
y
la Recta de Mnimos Cuadrados

Ciclo escolar 2013-2014
Relacin entre variables.
En la prctica es frecuente encontrar una relacin
entre dos o ms variables. Por ejemplo, el peso
de los hombres adultos depende en cierto grado
de su estatura, las circunferencias de los crculos
depende en cierto grado de su radio, y la presin
de una masa de gas depende de su temperatura y
volumen.
Entonces, es mejor expresar esta relacin en
forma matemtica, lo cual sucede determinando
una ecuacin que enlaza las variables.

Ajuste de curvas.
Para hallar una ecuacin que relacione variables, un primer
paso es recolectar datos que muestran los valores
correspondientes de las variables en consideracin. Por
ejemplo, supngase que y denotan la estatura y peso
de hombres adultos, respectivamente; entonces, una
muestra de individuos revelara las estaturas , , ... , ,
asi como los pesos correspondientes , , ... , .
El prximo paso es marcar los puntos , , ...
, sobre un sistema de coordenadas rectangulares.
El conjunto resultante se llama a veces diagrama de
dispersin. A partir del diagrama de dispersin es posible,
con frecuencia visualizar una curva suave que aproxima los
datos.

X Y
1
X
2
X
N
X
1
Y
2
Y
N
Y

1 1
,Y X

2 2
,Y X

N N
Y X ,
Distintos tipos de diagramas.
Teora de correlacin.
Si todos los valores de las variables satisfacen
una ecuacin exactamente, decimos que las
variables estn perfectamente correlacionadas
o que hay correlacin perfecta entre ellas.

Correlacin Lineal.
Si e son las dos variables de cuestin, un diagrama de
dispersin muestra la localizacin de los puntos sobre
un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersin parecen estar en una recta, como
en la figura (a) y (b), la correlacin se llama lineal. En tales
casos, una ecuacin lineal es adecuada a efectos de regresin.

X Y
) , ( Y X
a) Correlacin Lineal
Directa (positiva).
a) Correlacin Lineal
Inversa (negativa).
a) Correlacin Nula.
Correlacin Lineal.
Si Y tiende a crecer cuando X crece, como en la figura
(a), la correlacin se dice positiva, o directa.
Si Y tiende a decrecer cuando X crece, como en la
figura (b), la correlacin se dice negativa o inversa.
Si no hay relacin entre las variables, como en la figura
(c), decimos que no hay correlacin entre ellas.

Un Ejemplo.
Un centro comercial sabe en funcin de la distancia, en
kilmetros, a la que se site de un ncleo de poblacin,
acuden los clientes que figuran en la tabla.






a) Trazar el diagrama de dispersin
b) Calcular el coeficiente de correlacin lineal
c) Calcular la recta de mnimos Cuadrados

No de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40
0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

Covarianza.
La definicin formal de covarianza es la siguiente:



Al igual que con la desviacin estndar podemos
obtener este resultado mediantes formulas cortas.

N
Y Y X X
s
N
i
i i
XY

1
Y X XY s
XY

Covarianza.
X Y
8 15
7 19
6 25
4 23
2 34
1 40

Covarianza.
X Y XY
8 15 120
7 19 133
6 25 150
4 23 92
2 34 68
1 40 40
4.6667 26 100.5
Promedios
Y X XY s
XY

26 6667 . 4 5 . 100
XY
s
8342 . 20
XY
s
Desviacin Estndar.
La definicin formal de la desviacin estndar para la
variable X es la siguiente:



Y aqu tenemos su forma corta


De manera anloga podemos obtener el de la variable Y

N
X X
s
N
i
i
X

1
2

2
2
X X s
X


2
2
Y Y s
Y

Desviacin Estndar.
X Y X
2
Y
2
XY
8 15 64 225 120
7 19 49 361 133
6 25 36 625 150
4 23 16 529 92
2 34 4 1156 68
1 40 1 1600 40
4.6667 26 28.3333 749.3333 100.5
Promedios

2
2
X X s
X


2
6667 . 4 3333 . 28
X
s
5604 . 2
X
s
5635 . 8
Y
s
Coeficiente de correlacin lineal.
La forma breve del coeficiente de correlacin
lineal es :
Y X
XY
s s
s
r
5635 . 8 5604 . 2
8342 . 20
r
9502 . 0 r
Propiedades del coeficiente de
correlacin.
El coeficiente de correlacin no vara al hacerlo la escala de
medicin. Es decir, si expresamos la altura en metros o en
centmetros el coeficiente de correlacin no vara.

El signo del coeficiente de correlacin es el mismo que el
de la covarianza.
a) Si la covarianza es positiva, la correlacin es directa.
b) Si la covarianza es negativa, la correlacin es inversa.
c) Si la covarianza es nula, no existe correlacin.

El coeficiente de correlacin lineal es un nmero real
comprendido entre -1 y 1.
1 1 r
Propiedades del coeficiente de
correlacin.
Si el coeficiente de correlacin lineal toma valores
cercanos a -1 la correlacin es fuerte e inversa, y ser
tanto ms fuerte cuanto ms se aproxime a -1.
Si el coeficiente de correlacin lineal toma valores
cercanos a 1 la correlacin es fuerte y directa, y ser
tanto ms fuerte cuanto ms se aproxime a 1.
Si el coeficiente de correlacin lineal toma valores
cercanos a 0, la correlacin es dbil.
Si , los puntos de la nube estn sobre la
recta creciente o decreciente. Entre ambas variables
hay dependencia funcional.
1 r 1
La recta de Mnimos Cuadrados.
La recta de mnimos cuadrados que aproxima el
conjunto de puntos , ,, tiene
por ecuacin:

donde las constantes quedan fijadas al resolver
simultneamente las ecuaciones



que se llaman ecuaciones normales para la recta de
mnimos cuadrados.

1 1
,Y X
2 2
,Y X
N N
Y X ,
b mx y




X b X m XY
bN X m Y
2
La recta de Mnimos Cuadrados.
Las constantes y de las ecuaciones
anteriores se pueden hallar de las formulas



2
2

X X N
Y X XY N
m
m b


2
2
2

X X N
XY X X Y
b
La recta de Mnimos Cuadrados.
Tambin pueden obtenerse de su forma corta:


2
X
XY
s
s
m
X m Y b

0655 . 41
6667 . 4 2283 . 3 26

b

2283 . 3
5604 . 2
8342 . 20
2

m
0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0
5
10
15
20
25
30
35
40
45
0 1 2 3 4 5 6 7 8 9
No de Clientes
D
i
s
t
a
n
c
i
a

0655 . 41 2283 . 3 x y
Actividad
En un Centro de Salud hacen el seguimiento de la
tensin arterial de sus pacientes, y los resultados
constatan que aquellos que tienen sobrepeso,
tienen una tensin arterial superior a la media.
Calcule el coeficiente de correlacin de Pearson y
la recta de mnimos cuadrados para corroborar
estos resultados en una muestra de 10 pacientes.
X=Peso (Kg)
72 76 78 81 89 95 108 115 120 130
Y=Tensin
Sistlica(mm Hg)
115 121 125 130 141 150 165 170 177 178
Actividad
La tabla nos muestra las
puntuaciones en Literatura (X), y
las puntuaciones en Matemtica
(Y) de un grupo de alumnos de
un determinado centro
educativo.

Trace el diagrama de dispersin,
calcule el coeficiente de
correlacin, y la recta de
mnimos cuadrados.
N
Estudiante
X Y
1 10 30
2 30 15
3 38 37
4 40 25
5 60 35
6 65 5
7 80 20
8 90 10

You might also like