Professional Documents
Culture Documents
TÉCNICAS PARA EL ESTUDIO DE LA
RELACIÓN ENTRE VARIABLES (I)
CONCEPTO CORRELACIÓN Y
CORRELACIÓN DE PEARSON
Análisis de datos de la investigación educativa
1
ÍNDICE
2
1. Intr oducción
Hasta ahora hemos tratado la descripción de variables por separado,
examinado su distribución y frecuencias, caracterizando y determinando la
posición de individuos en el conjunto de la distribución. En este trabajo nos
ocuparemos del estudio conjunto de dos variables, podremos detectar relaciones
entre dos variables. La medida de las relaciones entre variables se encuentra en la
base de un conjunto de métodos de investigación a los que dan su nombre los
métodos correlaciónales. Por tanto este tema que seguidamente abordaremos se
centra en el concepto de correlación y el coeficiente de correlación de Pearson.
2. Objetivos.
· Conseguir que los alumnos conozcan el concepto de correlación y sepan
calcular el concepto de correlación de Pearson.
2.2 Específicos.
· Los alumnos deben saber calcular la correlación de Pearson.
· Los alumnos deben conocer el concepto de correlación.
3
3. Desar r ollo de los distintos apar tados
3.1 Definición
Hablamos de correlación cuando nos referimos a la relación existente entre
dos variables, su intensidad y su sentido (positivo o negativo).
La covarianza definida anteriormente como promedio de desviaciones
conjuntas de dos variables sobre sus respectivas medias, no resulta ser una
medida adecuada de la relación entre dos variables, pues el valor de Sxy esta
relacionado con el valor de la media de X y con el valor de la media de Y. por
este motivo, si cambiamos la unidad de medida, la covarianza se vera
modificada.
Podemos afirmar que el valor de la covarianza depende de la unidad de
medida. Para evitar el efecto de la unidad de medida sobre Sxy podemos dividir
las puntuaciones diferenciales por las respectivas desviaciones típicas Sx y Sy. El
nuevo índice de relación que obtengamos tendrá la ventaja de ser invariante ante
cualquier cambio en la unidad de medida. A este índice de correlación se le
denomina coeficiente de correlación de Pearson o también coeficiente de
correlación productomomento.
La formula del coeficiente de correlación de Pearson también suele
expresarse de la siguiente forma, con objeto de eliminar errores que provengan de
la presencia de números decimales en el valor que adopta la media:
4
3.2 Condiciones de aplicación
Aplicar el coeficiente de correlación de Pearson exige que las variables
estén medidas al menos en una escala de intervalos y que se de una relación
lineal entre ellas. Es decir, que los puntos del diagrama de dispersión se
posicionen en la forma aproximada de una línea recta. Por tanto, usar el
coeficiente de correlación de Pearson presupone la sospecha de que entre los
grupos de puntuaciones se da una relación lineal.
3.3 Pr opiedades
b. En el caso de que rxy valga 1, tendrá que cumplirse que para cada
pareja de valores, sus puntuaciones típicas son iguales: Zx = Zy. En el
polo opuesto, es decir, si rxy vale 1, entonces se cumple que para todo
par de valores, las puntuaciones típicas son iguales pero de distinto
signo: Zx = Zy.
c. En el caso de que rxy es cero es que no hay relación lineal entre las
variables medidas.
5
d. La transformación lineal de las variables no modifica el valor del
coeficiente de correlación, aunque sí podría cambiar su signo. Es decir,
si calculamos la correlación entre las variables x e y, el valor de esta
será, en valor absoluto, el mismo que obtengamos entre la variable
ax+b, donde a y b son constantes.
3.4 Inter pr etación
Al interpretar el coeficiente de correlación de Pearson nos situaremos en un
nivel meramente descriptivo.
Al igual que ocurría con la covarianza, la correlación entre dos variables es
positiva si ambas cavarían en el mismo sentido, es decir, cuando a puntuaciones
por encima de la media en X corresponde puntuaciones por encima de la media
en Y, y a puntuaciones por debajo de la media en X corresponden puntuaciones
por debajo de la media en Y. por el contrario, la correlación entre X e Y es
negativa, cuando cavarían en sentido opuesto, es decir, a puntuaciones por
encima de la media en X corresponde puntuaciones por debajo de la media en Y,
y viceversa.
Si tenemos en cuenta el valor de la correlación, podemos afirmar que, un
coeficiente de correlación de Pearson igual a 1 ó 1, implica que en el diagrama
de dispersión correspondiente a las variables X e Y los puntos se disponen a lo
6
largo de una línea recta, y por tanto podemos decir que la covariación entre
ambas variables es total.
Un coeficiente de correlación igual o próximo a cero indica que no existes
relación lineal entre las dos variables, aunque podría existir otro tipo de
correlación no lineal.
Resulta difícil precisar a partir de que valor de rxy podemos considerar que
existe una correlación lineal entre dos variables. Siempre debemos tener en
cuenta para la interpretación el tipo de variables a las que se aplica. Sin embargo,
para tener un referente, y siendo conscientes de que estos coeficientes no son
aplicables a todas las situaciones, tomamos los determinados por Bisquerra:
r = 1 correlación perfecta.
0´8 < r < 1 correlación muy alta
0´6< r < 0´8 correlación alta
0´4< r < 0´6 correlación moderada
0´2< r < 0´4 correlación baja
0< r < 0´2 correlación muy baja
r = 0 correlación nula
Además debemos tener presente que la existencia de una correlación no
implica que necesariamente deba existir una relación causal directa. Por relación
causal directa se entiende que si X e Y están correlacionadas, entonces X es en
gran parte la causa de Y, o Y es en parte la causa de X.
No obstante, es habitual que tras encontrar una elevada correlación entre
variables se hipoteticen relaciones causaefecto. Pero la existencia de una
relación de este tipo habrá de ser comprobada recurriendo a otras estrategias de
investigación y a otras técnicas estadísticas.
7
4. Actividades o pr oblemas
1) El Equipo Directivo de un Centro de Educación Secundaria está
interesado en conocer la relación que existe entre el tiempo semanal
(horas) que dedican los alumnos al estudio y las calificaciones medias
de los mismos al final de trimestre. Eligiendo 11 alumnos al azar, han
encontrado los siguientes resultados. Calcular el coeficiente de
correlación de Pearson.
2) Para comprobar la fiabilidad de una prueba de razonamiento espacial,
un psicopedagogo se dispone a aplicarla en dos momentos distintos a un
grupo de 10 sujetos. Si la prueba es fiable se espera que las
puntuaciones logradas en ambos casos correlacionen entre sí. A partir
de los datos recogidos, que mostramos a continuación, ¿en qué medida
podemos afirmar que la prueba es fiable?
1ª aplicación: 18 14 11 16 15 12 19 10 19 14
2ª aplicación: 17 15 9 18 15 11 18 10 17 16
8
Como se puede ver en la tabla anterior se muestran los resultados de
x e y que son puntuaciones diferenciales que se han conseguido restándoles las
medias a las puntuaciones directas. El valor de la media en cada una de las
variables las mostraré a continuación junto con las operaciones para calcular la
covarianza de cada variable.
Media
Covarianza
El resultado de la covarianza al ser positivo, nos indica cierta tendencia a
que a un tiempo semanal de estudio por encima de la media corresponden
calificaciones por encima de la media, y a un tiempo de estudio por debajo de la
media corresponden calificaciones por debajo de la media.
Para calcular el coeficiente de correlación de Pearson nos ayudarán los
resultados del ejercicio anterior. Pero además tendremos que calcular la
desviación típica de x e y. Y para la desviación típica necesitaremos los
resultados de la varianza de x e y respectivamente. Mostraré a continuación el
procedimiento y los resultados del proceso necesario para obtener lo solicitado
por el problema.
9
S² y = ∑ x’² ·fi X² = 506 – 42.9 = 3.1
n 11
S x = √ 8.48 = 2.91
S y = √ 3.1 = 1.76
r xy = 4.79 = 0.94
2.91∙ 1.76
Viendo los resultados llegamos a la conclusión de que estamos ante una
correlación muy alta, lo que quiere decir a puntuaciones altas en cuanto a notas se
corresponden altas horas de trabajo y estudio semanal.
2)
X Y XY X 2 Y 2
18 17 306 324 289
14 15 210 196 225
11 9 99 121 81
16 18 288 256 324
15 15 225 225 225
12 11 132 144 121
19 18 342 361 324
10 10 100 100 100
19 17 323 361 289
14 16 224 196 256
148 146 2249 2284 2234
10
N = 10
= 882____ = _____882 ___= 0.90
30.59 · 32 978.88
Viendo los resultados, llegamos a la conclusión de que la prueba es fiable,
ya que existe una correlación muy alta. Como el resultado es positivo las dos
variables correlacionan en el mismo sentido. A puntuaciones X por encima de la
media en la primera aplicación, corresponden valores X por encima de la media
en la segunda aplicación.
11
6. Bibliogr afía
GIL, J.; DIEGO, J.L.; RODRÍGUEZ, G. y GARCÍA, E. (1996). Problemas de Estadística
Básica Aplicada a las Ciencias de la Educación. Sevilla: Kronos.
GIL, J.; RODRÍGUEZ, G. y GARCÍA, E. (1995). Estadística Básica Aplicada a las Ciencias
de la Educación. Sevilla: Kronos
12