You are on page 1of 12

TEMA 5.

TÉCNICAS PARA EL ESTUDIO DE LA 
RELACIÓN ENTRE VARIABLES (I) 

CONCEPTO CORRELACIÓN Y 
CORRELACIÓN DE PEARSON 

Análisis de datos de la investigación educativa


ÍNDICE 

1.  Intr oducción…………………………………………….3 


2.  Objetivos………………………………………………..3 
2.1  Gener ales…………………………………………...3 
2.2  Específicos………………………………………….3 
3.  Desar r ollo de los distintos apar tados………………….4 
3.1  Definición…………………………………………..4 
3.2  Condiciones de aplicación…………………………5 
3.3  Pr opiedades………………………………………...5 
3.4  Inter pr etación……………………………………...6 
4.  Actividades o pr oblemas………………………………8 
5.  Soluciones a los pr oblemas pr opuestos……………….8 
6.  Bibliogr afía……………………………………………12


1.  Intr oducción 

Hasta  ahora  hemos  tratado  la  descripción  de  variables  por  separado, 
examinado  su  distribución  y  frecuencias,  caracterizando  y  determinando  la 
posición  de  individuos  en  el  conjunto  de  la  distribución.  En  este  trabajo  nos 
ocuparemos del estudio conjunto de dos variables, podremos detectar relaciones 
entre dos variables. La medida de las relaciones entre variables se encuentra en la 
base  de  un  conjunto  de  métodos  de  investigación  a  los  que  dan  su  nombre  los 
métodos  correlaciónales.  Por  tanto  este  tema  que  seguidamente  abordaremos  se 
centra en el concepto de correlación  y el coeficiente de correlación de Pearson. 

2.  Objetivos. 

2.1  Gener ales.

·  Conseguir  que  los  alumnos  conozcan  el  concepto  de  correlación  y  sepan 
calcular el concepto de correlación de Pearson. 

2.2  Específicos.

·  Los alumnos deben saber calcular la correlación de Pearson.
·  Los alumnos deben conocer el concepto de correlación.


3. Desar r ollo de los distintos apar tados 

3.1  Definición 
Hablamos de correlación cuando nos referimos a la relación existente entre 
dos variables, su intensidad y su sentido (positivo o negativo). 
La  covarianza  definida  anteriormente  como  promedio  de  desviaciones 
conjuntas  de  dos  variables  sobre  sus  respectivas  medias,  no  resulta  ser  una 
medida  adecuada  de  la  relación  entre  dos  variables,  pues  el  valor  de  Sxy  esta 
relacionado con el valor de la  media de X y con el  valor de la  media de Y. por 
este  motivo,  si  cambiamos  la  unidad  de  medida,  la  covarianza  se  vera 
modificada. 
Podemos  afirmar  que  el  valor  de  la  covarianza  depende  de  la  unidad  de 
medida. Para evitar el efecto de la  unidad de  medida sobre  Sxy  podemos dividir 
las puntuaciones diferenciales por las respectivas desviaciones típicas  Sx  y Sy. El 
nuevo índice de relación que obtengamos tendrá la ventaja de ser invariante ante 
cualquier  cambio  en  la  unidad  de  medida.  A  este  índice  de  correlación  se  le 
denomina  coeficiente  de  correlación  de  Pearson  o  también  coeficiente  de 
correlación producto­momento. 
La  formula  del  coeficiente  de  correlación  de  Pearson  también  suele 
expresarse de la siguiente forma, con objeto de eliminar errores que provengan de 
la presencia de números decimales en el valor que adopta la media:


3.2 Condiciones de aplicación 
Aplicar  el  coeficiente  de  correlación  de  Pearson  exige  que  las  variables 
estén  medidas  al  menos  en  una  escala  de  intervalos  y  que  se  de  una  relación 
lineal  entre  ellas.  Es  decir,  que  los  puntos  del  diagrama  de  dispersión  se 
posicionen  en  la  forma  aproximada  de  una  línea  recta.  Por  tanto,  usar  el 
coeficiente  de  correlación  de  Pearson  presupone  la  sospecha  de  que  entre  los 
grupos de puntuaciones se da una relación lineal. 

3.3 Pr opiedades 

a. El  coeficiente  de  correlación  de  Pearson  se  encuentra  comprendido 


entre los valores ­1 y 1. 

b. En  el  caso  de  que  rxy  valga  1,  tendrá  que  cumplirse  que  para  cada 
pareja de valores, sus puntuaciones típicas son iguales:  Zx  =  Zy. En el 
polo opuesto, es decir, si rxy vale ­1, entonces se cumple que para todo 
par  de  valores,  las  puntuaciones  típicas  son  iguales  pero  de  distinto 
signo: Zx  = ­Zy. 

c. En  el  caso  de  que  rxy  es  cero  es  que  no  hay  relación  lineal  entre  las 
variables medidas.


d. La  transformación  lineal  de  las  variables  no  modifica  el  valor  del 
coeficiente de correlación, aunque sí podría cambiar su signo. Es decir, 
si  calculamos  la  correlación  entre  las  variables  x  e  y,  el  valor  de  esta 
será,  en  valor  absoluto,  el  mismo  que  obtengamos  entre  la  variable 
ax+b, donde a y b son constantes. 

3.4 Inter pr etación 

Al interpretar el coeficiente de correlación de Pearson nos situaremos en un 
nivel meramente descriptivo. 
Al igual que ocurría con la covarianza, la correlación entre dos variables es 
positiva si ambas cavarían en el mismo sentido, es decir, cuando a puntuaciones 
por encima de la  media en X corresponde puntuaciones por encima de la  media 
en Y, y a puntuaciones por debajo de la media en X corresponden puntuaciones 
por  debajo  de  la  media  en  Y.  por  el  contrario,  la  correlación  entre  X  e  Y  es 
negativa,  cuando  cavarían  en  sentido  opuesto,  es  decir,  a  puntuaciones  por 
encima de la media en X corresponde puntuaciones por debajo de la media en Y, 
y viceversa. 
Si tenemos en cuenta el  valor de  la correlación, podemos afirmar que,  un 
coeficiente de correlación de Pearson igual a 1 ó ­1, implica que en el diagrama 
de dispersión correspondiente a  las  variables X e Y los puntos se disponen a  lo


largo  de  una  línea  recta,  y  por  tanto  podemos  decir  que  la  covariación  entre 
ambas variables es total. 
Un coeficiente de correlación igual o próximo a cero indica que no existes 
relación  lineal  entre  las  dos  variables,  aunque  podría  existir  otro  tipo  de 
correlación no lineal. 
Resulta difícil precisar a partir de que valor de  rxy podemos considerar que 
existe  una  correlación  lineal  entre  dos  variables.  Siempre  debemos  tener  en 
cuenta para la interpretación el tipo de variables a las que se aplica. Sin embargo, 
para  tener  un  referente,  y  siendo  conscientes  de  que  estos  coeficientes  no  son 
aplicables a todas las situaciones, tomamos los determinados por Bisquerra: 

r = 1                      correlación perfecta. 
0´8 < r < 1            correlación muy alta 
0´6< r < 0´8          correlación alta 
0´4< r < 0´6          correlación moderada 
0´2< r < 0´4          correlación baja 
0< r < 0´2             correlación muy baja 
r = 0                      correlación nula 

Además  debemos  tener  presente  que  la  existencia  de  una  correlación  no 
implica que necesariamente deba existir una relación causal directa. Por relación 
causal directa se entiende que si X e Y están correlacionadas, entonces X es en 
gran parte la causa de Y, o Y es en parte la causa de X. 
No  obstante,  es  habitual  que  tras  encontrar  una  elevada  correlación  entre 
variables  se  hipoteticen  relaciones  causa­efecto.  Pero  la  existencia  de  una 
relación de este tipo  habrá de ser comprobada recurriendo a otras estrategias de 
investigación y a otras técnicas estadísticas.


4. Actividades o pr oblemas 

1)  El  Equipo  Directivo  de  un  Centro  de  Educación  Secundaria  está 
interesado  en  conocer  la  relación  que  existe  entre  el  tiempo  semanal 
(horas) que  dedican  los alumnos al estudio y  las calificaciones  medias 
de los  mismos al  final de trimestre. Eligiendo 11 alumnos al azar, han 
encontrado  los  siguientes  resultados.  Calcular  el  coeficiente  de 
correlación de Pearson. 
2)  Para  comprobar  la  fiabilidad  de  una  prueba  de  razonamiento  espacial, 
un psicopedagogo se dispone a aplicarla en dos momentos distintos a un 
grupo  de  10  sujetos.  Si  la  prueba  es  fiable  se  espera  que  las 
puntuaciones  logradas  en  ambos  casos  correlacionen  entre  sí.  A  partir 
de los datos recogidos, que mostramos a continuación, ¿en qué medida 
podemos afirmar que la prueba es fiable? 

1ª aplicación: 18 14 11 16 15 12 19 10 19 14 
2ª aplicación: 17 15  9 18 15 11 18 10 17 16 

5. Soluciones a los pr oblemas pr opuestos. 

1)X  Y  X ∙ Y  x  y  x ∙ y 


5  7  35  ­0.46  0.45  ­0.21 
2  4  8  ­3.46  ­2.55  8.82 
4  5  20 ­1.46  ­1.55  2.26 
7  8  56 1.54  1.45  2.23 
10  9  90 4.54  2.45  11.12 
4  6  24 ­1.46  ­0.55  0.80 
8  9  72  2.54  2.45  6.22 
1  4  4  ­4.46  ­2.55  11.37 
3  5  15 ­2.46  ­1.55  3.81 
6  7  42 0.54  0.45  0.24 
10  8  80  4.54  1.45  6.58 
60  72  446  53.24


Como se puede ver en la tabla anterior se muestran los resultados de 
x  e  y  que  son  puntuaciones  diferenciales  que  se  han  conseguido  restándoles  las 
medias  a  las  puntuaciones  directas.  El  valor  de  la  media  en  cada  una  de  las 
variables  las  mostraré  a  continuación  junto  con  las  operaciones  para  calcular  la 
covarianza de cada variable. 

Media 

X = ∑ X = 60 = 5.46                      Y =  ∑ Y = 72 = 6.55 


n        11                                            n      11 

Covarianza 

S xy =∑  Xi ∙ Yi  ­ X ∙ Y = 446  ­ 5.45 ∙ 6.55 = 4.79 


n  11 

El resultado de la covarianza al ser positivo, nos indica cierta tendencia  a 
que  a  un  tiempo  semanal  de  estudio  por  encima  de  la  media  corresponden 
calificaciones por encima de la media, y a un tiempo de estudio por debajo de la 
media corresponden calificaciones por debajo de la media. 

Para  calcular  el  coeficiente  de  correlación  de  Pearson  nos  ayudarán  los 
resultados  del  ejercicio  anterior.  Pero  además  tendremos  que  calcular  la 
desviación  típica  de  x  e  y.  Y  para  la  desviación  típica  necesitaremos  los 
resultados  de  la  varianza  de  x  e  y  respectivamente.  Mostraré  a  continuación  el 
procedimiento  y  los  resultados  del  proceso  necesario  para  obtener  lo  solicitado 
por el problema. 

S² x = ∑x’² · fi ­ X² = 420 – 29.7 = 8.48 


n  11


S² y = ∑ x’² ·fi ­ X² = 506 – 42.9 = 3.1 
n                    11 

S x = √ 8.48 = 2.91 

S y = √ 3.1 = 1.76 

Coeficiente de correlación de Pearson → r xy =  S xy 


Sx ∙ Sy 

r xy = 4.79  = 0.94 
2.91∙ 1.76 

Viendo  los  resultados  llegamos  a  la  conclusión  de  que  estamos  ante  una 
correlación muy alta, lo que quiere decir a puntuaciones altas en cuanto a notas se 
corresponden altas horas de trabajo y estudio semanal. 

2) 
X  Y  XY  X 2  Y 2 
18  17  306  324  289 
14  15  210  196  225 
11  9  99  121  81 
16  18  288  256  324 
15  15  225  225  225 
12  11  132  144  121 
19  18  342  361  324 
10  10  100  100  100 
19  17  323  361  289 
14  16  224  196  256 
148  146  2249  2284  2234

10 
N = 10 

rxy =_________n åxy – åx åy __________ = ____10 · 2249 – 148 · 146__   =


Ön åxi 2  – (åxi) 2 Önåyi 2  – (åyi) 2 Ö10 · 2284 – 148 2 Ö10 · 2234 ­ 146 2 

=  882____ = _____882 ___=  0.90 
30.59 · 32           978.88 

Viendo los resultados, llegamos a la conclusión de que la prueba es fiable, 
ya  que  existe  una  correlación  muy  alta.  Como  el  resultado  es  positivo  las  dos 
variables correlacionan en el mismo sentido. A puntuaciones X por encima de la 
media en la primera aplicación, corresponden valores X por encima de la  media 
en la segunda aplicación.

11 
6. Bibliogr afía 

GIL,  J.;  DIEGO,  J.L.;  RODRÍGUEZ,  G.  y  GARCÍA,  E.  (1996).  Problemas  de  Estadística 
Básica Aplicada a las Ciencias de la Educación. Sevilla: Kronos. 
GIL, J.; RODRÍGUEZ, G. y GARCÍA, E. (1995). Estadística Básica Aplicada a las Ciencias 
de la Educación. Sevilla: Kronos

12 

You might also like