Professional Documents
Culture Documents
En un Anlisis de Regresin simple existe una variable respuesta o dependiente (y) que puede ser el nmero de especies, la abundancia o la presencia-ausencia de una sola especie y una variable explicativa o independiente (x).
El propsito es obtener una funcin sencilla de la variable explicativa, que sea capaz de describir lo ms ajustadamente posible la variacin de la variable dependiente.
Como los valores observados de la variable dependiente difieren generalmente de los que predice la funcin, sta posee un error. La funcin ms eficaz es aquella que describe la variable dependiente con el menor error posible o, dicho en otras palabras, con la menor diferencia entre los valores observados y predichos. La diferencia entre los valores observados y predichos (el error de la funcin) se denomina variacin residual o residuos.
1 Tecnolgico de Mrida, Mtodos Numricos
Para estimar los parmetros de la funcin se utiliza el ajuste por mnimos cuadrados. Es decir, se trata de encontrar la funcin en la cual la suma de los cuadrados de las diferencias entre los valores observados y esperados sea menor.
Sin embargo, con este tipo de estrategia es necesario que los residuos o errores estn distribuidos normalmente y que varen de modo similar a lo largo de todo el rango de valores de la variable dependiente. Estas suposiciones pueden comprobarse examinando la distribucin de los residuos y su relacin con la variable dependiente.
Cuando la variable dependiente es cuantitativa (por ejemplo, el nmero de especies) y la relacin entre ambas variables sigue una lnea recta, la funcin es del tipo,
donde c es el intercepto o valor del punto de corte de la lnea de regresin con el eje de la variable dependiente (una medida del nmero de especies existente cuando la variable ambiental tiene su mnimo valor) y b es la pendiente o coeficiente de regresin (la tasa de incremento del nmero de especies con cada unidad de la variable ambiental considerada). Si la relacin no es lineal pueden transformarse los valores de una o ambas variables para intentar linearizarla.
Coeficiente de determinacin
10
Si no es posible convertir la relacin en lineal, puede comprobarse el grado de ajuste de una funcin polinomial ms compleja. La funcin polinomial ms sencilla es la cuadrtica (y= c + bx + bx2) que describe una parbola, pero puede usarse una funcin cbica u otra de un orden aun mayor capaz de conseguir un ajuste casi perfecto a los datos.
REGRESION POLINOMIAL Algunos datos cientficos o de ingeniera, pueden presentar un patrn como este:
Que como puede intuirse, se representan pobremente mediante una lnea recta. En estos casos, se ajusta mejor una curva a los datos. Para ello se recomienda regresin polinomial. El procedimiento de mnimos cuadrados se puede extender fcilmente y ajustar datos a un polinomio de grado m. Y = ao + a1x + a2x2 + a3x3 + + amxm
14 Tecnolgico de Mrida, Mtodos Numricos
( Yi a - a x - a x
o
1 i
2 i
a3xi3 - - amxim )2
i=1
REGRESION POLINOMIAL Entonces, el problema de determinar polinomios de grado m con mnimos cuadrados es equivalente a resolver un sistema de m+1 ecuaciones lineales simultneas. As como en la regresin lineal, el error en la regresin polinomial se puede cuantificar mediante el error estndar de aproximacin:
Sy/x =
Sr n (m+1)
Adems del error estndar, se puede calcular tambin el coeficiente de determinacin, de la misma manera que para el caso lineal: St - Sr St
r2=
REGRESION POLINOMIAL Ejemplo: a partir de los datos de la tabla que se presenta a continuacin, ajuste un polinomio de segundo grado, utilizando regresin polinomial.
Xi 0 1 2 3 4 5 Yi 2,1 7,7 13,6 27,2 40,9 61,1
Para el caso que nos ocupa, m = 2 (el grado del polinomio que necesitamos) n = 6 (la cantidad de datos)
Xi 0 1 2 3 4 5 Xi 15
Xi2 0 1 4 9 16 25 Xi2 55
O en un formato ms familiar:
Resolviendo ese sistema con alguna tcnica como la eliminacin gaussiana, se obtiene:
ao =
2.47857
a1 =
2.35929
a2 =
1.86071
REGRESION POLINOMIAL Debemos calcular Sr y St Sr nos servir para calcular el error estndar de aproximacin basado en la regresin polinomial.(SUMA DE LOS CUADRADOS) St nos servir para calcular el coeficiente de determinacin.
Xtrazo Ytrazo Xi 0 1 2 3 4 5 Xi 15 Yi 2,1 7,7 13,6 27,2 40,9 61,1 Yi 152,6 2,5000 25,4333 Xi2 0 1 4 9 16 25 Xi2 55 Xi3 0 1 8 27 64 125 Xi3 225 Xi4 0 1 16 81 256 625 Xi4 979 XiYi 0 7,7 27,2 81,6 163,6 305,5 XiYi 585,6
ao = 2.47857
Xi2 Yi 0 7,7 54,4 244,8 654,4 1527,5 Xi2Yi 2488,8
a1 = 2.35929
a2 = 1.86071
( Yi - ao - a1xi - a2xi2 )2 0,14332 1,00286 1,08158 0,80491 0,61951 0,09439 Sr 3,74657
Sy/x = Sy =
2
Sy/x =
3.74657 63
= 1.1175
error estndar aproximacin de
= 22.4205
El resultado indica que el 99.851% de la incertidumbre original se ha explicado mediante el modelo.
X
0 1
Y
2.1 7.7
0 0 -10 1 2 3 4 5 6
2
3 4 5 6 7 8
13.6
27.2 40.9 61.1 160 140 120 100 80
60
40 20 0 -20 0 -40 2
X
0 1
Y
2.1 7.7
2
3 4 5 6 7 8
13.6
27.2 40.9 61.1