You are on page 1of 5

6.8 Coeficiente de determinacin. Coeficiente de correlacin.

Una vez ajustada la recta de regresin a la nube de observaciones es importante


disponer de una medida que mida la bondad del ajuste realizado y que permita
decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos.
Como medida de bondad del ajuste se utiliza el coeficiente
de determinacin, definido como sigue

(6.15)
o bien

Como scE < scG, se verifica que 0 < R < 1.


2

El coeficiente de determinacin mide la proporcin de variabilidad total de la


variable dependiente
respecto a su media que es explicada por el modelo de
regresin. Es usual expresar esta medida en tanto por ciento, multiplicndola por
cien.
Por otra parte, teniendo en cuenta que

- =

, se se obtiene

(6.16)
Dadas dos variables aleatorias cualesquiera X e Y , una medida de la relacin
lineal que hay entre ambas variables es el coeficiente de correlacin definido por
(6.17)
donde
representa la desviacin tpica de la variable X (anlogamente para
). Un buen estimador de este parmetro es el coeficiente de correlacin lineal
muestral (o coeficiente de correlacin de Pearson), definido por
(6.18)

Por tanto, r
. Este coeficiente es una buena medida de la bondad del ajuste
de la recta de regresin. Evidentemente, existe una estrecha relacin entre r y
aunque estos estimadores proporcionan diferentes interpretaciones del modelo:
1

* r es una medida de la relacin lineal entre las variables X e Y.


*

mide el cambio producido en la variable Y al realizarse un cambio de una


unidad en la variable X.
1

De las definiciones anteriores se deduce que:

Es importante estudiar si r es significativo (distinto de cero) ya que ello


implica que el modelo de regresin lineal es significativo. Desafortunadamente la
distribucin de r es complicada pero para tamaos muestrales mayores que 30 su
desviacin tpica es
1/ , y puede utilizarse la siguiente regla

En la interpretacin del coeficiente de correlacin se debe tener en cuenta


que:
r = 1 indica una relacin lineal exacta positiva (creciente) o negativa
(decreciente),
r = 0 indica la no existencia de relacin lineal estocstica, pero no indica
independencia de las variables ya que puede existir una relacin no lineal incluso
exacta,
valores intermedios de r (0 < r < 1 -1 < r < 0) indican la existencia de una
relacin lineal estocstica, ms fuerte cuanto ms prximo a +1 ( -1) sea el valor
der.
Para poder interpretar con mayor facilidad el coeficiente de correlacin
muestral se exponen varias nubes de observaciones y el ajuste lineal obtenido:
Figura 6.7. Existe una dependencia funcional lineal, las observaciones estn
sobre la recta de regresin. r = R2 = 1, recta de regresin: y = x.

Figura 6.7. Dependencia funcional lineal.


Figura 6.8. La relacin lineal entre las variables es muy pequea y no parece que
exista otro tipo de relacin entre ellas, la nube de puntos indica que las variables
son casi independientes.
r = 0 192, R = 0 037, recta de regresin: y = 6 317 + 0 086x.
'

'

'

Contraste de regresin: = 0 687 F


influencia de la variable regresora en Y.
R

'

1,18

'

p - valor = 0 418. Se acepta la no


'

Figura 6.8. Observaciones casiindependientes.

Figura 6.9. Existe una dependencia funcional entre las observaciones pero no de
tipo lineal, por tanto la correlacin es muy pequea
r = 0 391, R = 0 153, recta de regresin: y = 32 534 - 1 889x.
'

'

'

'

Contraste de regresin: = 3 252 F


p-valor = 0 088. Se acepta que no
existe relacin lineal con = 0 05. En base a la Figura 6.6. se debe de hacer un
ajuste del tipo parablico Y = + x + x .
'

'

1,18

'

Figura 6.9. Existe una relacin cuadrtica.


Figura 6.10. La nube de datos se ajusta razonablemente a una recta con
pendiente positiva.
r = 0 641, R = 0 410, recta de regresin: y = -3' 963 + -1 749x.
'

'

'

Contraste de regresin: = 12 522


influencia lineal de la variable x.
R

'

1,18

p - valor = 0 002. Se rechaza la no


'

Figura 6.10. Relacin estocstica lineal.


Figura 6.11. Existe una fuerte dependencia lineal negativa entre las dos variables
y la correlacin es muy alta (prxima a 1).
r = 0 924, R = 0 846, recta de regresin: y = -2 528 - 2 267x
'

'

'

Contraste de regresin: = 105 193


existencia de una relacin lineal.
R

'

1,18

'

p - valor = 0 000. Se acepta la


'

You might also like