You are on page 1of 25

REGRESIN LINEAL O MNIMOS CUADRADOS

Y CORELACION

Son datos de pares ordenados (x,y),


mostrados en el plano cartesiano.
Producen cantidad de datos
presentados por puntos dispersos,
pero juntos.
Estos puntos se relacionan a una
perfil particular que es una recta.
La cercana de los puntos a la lnea
se correlaciona con la covarianza y
el coeficiente de correlacin de
Pearson.
Regresin Lineal Simple
Es una tcnica, cuantifica la relacin que puede
ser observada cuando se grafica un diagrama de
puntos dispersos correspondientes a dos
variables, cuya tendencia es rectilnea; relacin
y a bx
que cabe compendiar mediante una ecuacin
del mejor ajuste de la forma:

En esta ecuacin se presenta:


y: representa los valores de la coordenada a lo largo del eje vertical en el grfico
(ordenada); que resulta ser la variable dependiente, explicada, respuesta predictando.

x: indica la magnitud de la coordenada sobre el eje horizontal (abscisa) que representa a la


variable independiente, explicativa, predictor.

a: (puede ser negativo, positivo o igual a cero) es llamado el intercepto;

b: (puede ser negativo o positivo) se denomina la pendiente o coeficiente de regresin.


La importancia de las distribuciones bidimensionales radica en investigar como influye una
variable sobre la otra. Esta puede ser una dependencia causa efecto,

Por ejemplo,
La cantidad de lluvia (causa=X), da lugar a un aumento de la produccin agrcola (efecto=Y).

El aumento del precio de un bien (X), da lugar a una disminucin de la cantidad demandada (Y).

El peso de una persona (X) est relacionado con su estatura (talla) (Y)
Si utilizamos un sistema de coordenadas
cartesianas para representar la distribucin
bidimensional, obtendremos un conjunto de
puntos conocido con el diagrama de
dispersin, cuyo anlisis permite estudiar
cualitativamente, la relacin entre ambas
variables tal como se ve en la figura.

El siguiente paso, es la determinacin de la


dependencia funcional entre las dos
variables x e y que mejor ajusta a la
distribucin bidimensional.

Se denomina regresin lineal cuando la


funcin es lineal, es decir, requiere la
determinacin de dos parmetros: la pendiente
y la ordenada en el origen de la recta de
regresin, y=ax+b.
La regresin nos permite adems, determinar el
grado de dependencia de las series de valores X
e Y, prediciendo el valor y estimado que se
obtendra para un valor x que no est en la
distribucin.

Vamos a determinar la ecuacin de la recta que


mejor ajusta a los datos representados en la
figura. Se denomina error ei a la diferencia yi-y,
entre el valor observado yi, y el valor ajustado y=
axi+b, tal como se ve en la figura. El criterio de
ajuste se toma como aqul en el que la
desviacin cuadrtica media sea mnima, es
decir, debe de ser mnima la suma.
El extremos de una funcin: mximo o mnimo
se obtiene cuando las derivadas de s respecto
de a y de b sean nulas. Lo que da lugar a un
sistema de dos ecuaciones con dos incgnitas
del que se despeja a y b.
Coeficiente de correlacin ( r )

y b ax
-1 r +1

t b ax
N XY - X Y Y X
a b
N X X
2 2 -a
N N
Coeficiente de correlacin [r]
El coeficiente de correlacin, identificado como r o R , es una medida de
asociacin entre las variables aleatorias X y Y, su valor vara entre -1 y +1.
Es otra tcnica de la distribucin bidimensional, indica la intensidad o
grado de dependencia entre las variables X e Y. Es un nmero que se
obtiene:

El numerador es el producto de las desviaciones de los valores X e Y


respecto de sus valores medios. En el denominador tenemos las
desviaciones cuadrticas medias de X y de Y.

Si: r=1, la correlacin lineal es perfecta, directa.


r=-1, la correlacin lineal es perfecta, inversa
r=0, no existe correlacin alguna, independencia total de los valores X e Y
Vamos a determinar la ecuacin de la recta que
mejor ajusta a los datos representados en la
figura.

Se denomina error ei a la diferencia yi-y, entre el


valor observado yi, y el valor ajustado y= axi+b,
tal como se ve en la figura inferior. El criterio de
ajuste se toma como aqul en el que la
desviacin cuadrtica media sea mnima, es
decir, debe de ser mnima la suma
El extremos de una funcin: mximo o mnimo se obtiene cuando las derivadas
de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos ecuaciones con dos
incgnitas del que se despeja b (pendiente) y a (intercepto)

S
0...... b=
N XiYi - Xi Yi S
0...... a=
Yi - b Xi
b N Xi 2 ( Xi ) 2 a N

Coeficiente de correlacin [r] :El coeficiente de correlacin, comnmente


identificado como r o R , es una medida de asociacin entre las variables
aleatorias Xi y Yi, cuyo valor vara entre -1 y +1.
El coeficiente de correlacin es otra tcnica de estudiar la distribucin bidimensional, que
nos indica la intensidad o grado de dependencia entre las variables X e Y. El coeficiente de
correlacin r es un nmero que se obtiene mediante la frmula.

N XiYi - Xi Yi N XiYi - Xi Yi
N Xi
r= r=
2
( Xi ) N Yi ( Yi)
2 2 2
N X Y
El numerador es el producto de las desviaciones de los valores X e Y respecto de sus
valores medios. En el denominador tenemos las desviaciones cuadrticas medias de X y
de Y.

El coeficiente de correlacin puede valer cualquier nmero comprendido entre -1 y +1.


Cuando r=1, la correlacin lineal es perfecta, directa.
Cuando r=-1, la correlacin lineal es perfecta, inversa
Cuando r=0, no existe correlacin alguna, independencia total de los valores
XeY
Nmero de :Paso 3: Estime la pendiente (b)
x x y y x.y
pares de datos por medio de la relacin
1 x y
2 xy - n
b=
3 x 2

( x ) 2

n

:Paso 4: Estime el intercepto (a)

por medio de la relacin

y x
n a= - (b. )
Monto de las n n
x x y y xy
sumas
Variantes de la regresin lineal

La funcin potencial
y=cxa
Se puede trasformar en

Si usamos las nuevas variables X=log x e Y=log y, obtenemos la relacin lineal


Y=aX+b.
Donde b=log c
Datos para la estimacin de la relacin largo-peso en el threadifin
bream Nemipterus marginatus b
a

b
Nmero
L = Longitud
W = Peso (en g) Log10L(=x) Log10(=y)
W = aL Y = aX
total (cm)

1 8,1 6,3 0,908 0,799


2 9,1 9,6 0,959 0,982
3
4
10,2
11,9
11,6
18,5
1,009
1,076
1,064
1,267
log10 W = a b.log10 L
5 12,2 26,2 1,086 1,425
6 13,8 36,1 1,140 1,558
7 14,8 40,1 1,170 1,603 y = log10 W x = log10 L
8 15,7 47,3 1,196 1,675
9 16,6 65,6 1,220 1,817
10 17,7 69,4 1,248 1,841
11 18,7 76,4 1,272 1,883
12 19,0 82,5 1,279 1,916 log10 Y = a b.log10 X
13 20,6 106,6 1,314 2,028
14 21,9 119,8 1,340 2,078
15
16
22,9
23,5
169,2
173,3
1,360
1,371
2,228
2,239
Y = a bX
Paso 1 Obtenga el logaritmo de los valores de largo y peso.
Paso 2 Calcule los montos indicados en la seccin referente a regresin, determinando los
valores de x e y tal como se indica en las Ecuaciones 8a y 8b.
Paso 3 Estime a y b utilizando las Ecuaciones 2 y 3.
Paso 4 Tome el antilogaritmo de a, a fin de obtener en la Ecuacin 6.
Paso 5 Anote la Ecuacin 6 sustituyendo los parmetros y b por sus valores
estimados
Paso 6 Utilizando las magnitudes calculadas en el Paso 2, determine los valores de r y
r y verifique en la Tabla 2.
Ejercicio (a) Lleve a cabo los Pasos 1 al 6 (con P = 0,01) para los datos de largo-peso
: indicados en la Tabla 2.
(b) Haga un listado de otras posibles tranformaciones por linerizacin, e indique
ejemplos de su uso en biologa pesquera.

You might also like