You are on page 1of 3

1.

Objetivos generales: Realizar un Anlisis de Regresin Lineal Simple completo cuando se presenta en los pares de
observaciones a ser asociadas, datos atpicos. Mostrar el uso de la RLS cuando cumple con los requisitos exigidos al
aplicar dicho mtodo, de tal manera que el modelo fijado sea correcto. Objetivos especficos: Presentar la Prueba de
Hiptesis que nos permitir decidir si la observacin sospechosa es realmente atpica. Eliminar cientficamente los
datos atpicos. Encontrar una ecuacin del modelo de regresin que presente lo ms preciso posible la relacin
entre dos variables en torno al problema de los datos atpicos haciendo uso de la estadstica inferencial. Hacer
inferencias respecto a sus parmetros.
2. Problemas en el Anlisis de Regresin: Algunos de los problemas estadsticos implicados en el anlisis de
regresin son: Identificar la existencia de datos atpicos Obtener un buen estimador de los parmetros del
modelo Contrastar hiptesis sobre dichos parmetros Determinar la bondad del modelo para los datos
particulares Comprobar que se cumplen las hiptesis exigidas
3. FUNDAMENTO TERICO Regresin Lineal Simple.- Cuando la relacin entre las dos variables tiende a una recta,
se dice Regresin Lineal. As por ejemplo, observar las Figuras a,b y c. El modelo de regresin lineal simple Yi = o + |
X i + ui MRLSP Yi = o + | X i + ei Modelo aleatorio (MRLSM) Modelo determinstico Yi = a + bX i
4. Mtodo de Mnimos Cuadrados Ordinarios Yi = a + bX i Los valores de los estimadores resultan de la aplicacin
del Mtodo de Mnimos Cuadrados Ordinarios que consiste en minimizar los errores (ei).De ese procedimiento se
obtiene dos ecuaciones normales: n n Yi = na + b X i AAAAAA 1 i=1 i=1 n n n Yi X i = a X i + b X i2 AAA 2
i=1 i=1 i=1 Estimadores de Regresin: X iYi - X i Yi /n b = ... observaciones Xi2 - ( X )2 /n i xi yi b = ..........
desviaciones xi2 a = Y - bX
5. Propiedades de los erroresLos errores definidos como ei = Yi Yi satisface las siguientes propiedades:
n 1) ei = 0 i =1 n n n n n ei = (Yi Yi ) = (Yi o | X i ) = Yi no | X i = 0 i =1 i =1 i =1 i =1 i =1
n 2) ei X i = 0 i =1 n n n ei X i = (Yi Yi )X i = (Yi o | X i )X i i =1 i =1 i =1 n n n = Yi X i o X i |
X i2 = 0 i =1 i =1 i =1 n 3) eiYi = 0 i =1 n n n n eiYi = ei (o + | X i ) = o ei | ei X i = 0 i =1 i
=1 i =1 i =1
6. Anlisis de Varianza: Para obtener la estimacin de la varianza de los errores, se debe descomponerla varianza
total del modelo. Para ello se parte de la definicin de los errores: ei = Yi Yi (Yi Yi ) = Yi Yi Y + Y = (Yi Y )
(Yi Y ) n n n (Yi Y ) = (Yi Y ) + (Yi Yi ) 2 2 2 i =1 i =1 i =1La varianza de los errores representada por es
desconocida y se estima utilizando la suma de cuadrados de los errores. Un estimador insesgado de es: n SCE i (Yi
Yi ) 2 S = CME = 2 = =1 n2 n2 e
7. Distribucin de los estimadores MCO Para hacer inferencias, se asumen que los errores son independientes y ei :
N (0,o 2 ) . Tambin las son una combinacin lineal de as Yi. Por lo tanto, una combinacin lineal de v.a. normales e
independientes se distribuyen normalmente, es decir: : N | |, o | 2 i) | 2 | \ xi . | 2 1 X 2 (| ii) o : N o , o + 2
( | | \ n xi . | | 2 || i : N o + | X i , o 2 1 + xi | | iii) Y x .. 2 \ \n | 2| 1 ( X o X )2 | | iv) Yi / X =X : N o
+ | X 0 , o 1 + + || x 2 \ \ n .. 0
8. Inferencia acerca de los parmetros P o t 0 S o s o s o + t 0 S o ( = 1 a l f a P | t 0 S s | s | + t
0 S ( = 1 ( o | |
9. |1 xi2 | |1 xi2 | ( P Yi t0 S e + 2 2 | s E (Y / X i ) s Yi + t0 S e + 2 2 | ( =1o \n x . \ n x .( | 1 (Xo
X)2 | | 1 (Xo X)2 |(PYi t0 Se2 1+ + sY / X = X sYi + t0 Se2 1+ + |( =1o | \ n x . \ n x . ( 2 0 2
10. 1) Ho : o = o0 Ho : | = |0 o > o0 a) | > |0 a) H1 : o < o 0 b) H1 : | < |0 b) o =o | =| 0 c) 0 c)2)
Elegir la distribucin t de student3) n.s. o = alfa4) a) Si t c > t1 o ; n 2 = ?, entonces se rechaza H 0 b) Si t c < to ; n
2 = ?, entonces se rechaza H 0 c) S i t c > t1 o / 2 ; n 2 = ?, e n to n c e s s e r e c h a z a H 0 t c = o o tc = |
|5) S o S |6) Conclusin
11. 1) Ho : YS = YS 0 H1 : YS = YS02) Elegir la distribucin t de student3) n.s. o = alfa4) S i t c > t1 o / 2 ; n 2 = ?, e
n to n c e s s e r e c h a z a H 0 YS YS | 1 ( Xo X )2 |5) tc = Donde : SY = Se 1+ + 2 | \ x . 2 S Y S n S6)
Conclusin
12. Aplicacin Un investigador debe realizar el anlisis de regresin para un conjunto de profesionales cuando las
variables de estudio son los aos de experiencia y los ingresos que perciben. Uno de los objetivos es fijar un modelo
de regresin sin considerar las observaciones sospechosas y otro objetivo es hacer inferencias acerca de sus
parmetros. Los datos considerados en el estudio son:
13. Verificando la normalidad de los errores y detectando los datos atpicos El grfico permitir verificar: Si la
distribucin de los errores es normal y sin outliers o datos atpicos. Si la varianza de los errores es constante y si
se requieren transformaciones de las variables. Si la relacin entre las variables es efectivamente lineal o presenta
algn tipo de curvatura. Si hay dependencia de los errores, especialmente en el caso de que la variable
independiente sea el tiempo.
14. Realizando las pruebas de hiptesis para eliminar datos sospechosos o extraos.
15. Realizando la prueba de hiptesis para la primera observacin sospechosa:
16. Realizando la prueba de hiptesis para la segunda observacin sospechosa:
17. Realizando la prueba de hiptesis para la tercera observacin sospechosa:
18. FIJACIN DEL MODELO DE REGRESIN LINEAL SIMPLE SIN LAS OBSERVACIONES ATPICAS Antes de utilizar el
modelo de regresin lineal debemos preguntarnos: Qu tambin se ajusta la ecuacin a los datos? El modelo
puede ser utilizado para la prediccin? Cumple con los supuestos para que garantice su correcta aplicacin? Para
responder las primeras interrogantes observamos el siguiente cuadro: Ahora procedemos a la comprobacin de
supuestos. Para que tenga validez las inferencias como las pruebas de hiptesis y las estimaciones es necesario
comprobar los supuestos bsicos.
19. LINEALIDAD El diagrama de dispersin es un grfico que Esto mismo lo podemos hacer de una visualiza una
primera aproximacin no muy manera ms directa recurriendo al riguroso estudio de la linealidad. En este caso,
diagrama de dispersin con observaciones como no presenta alguna configuracin especial estandarizadas para los
errores y las entonces se corrobora la supuesta linealidad. Aqu estimaciones de Y. Una ventaja es de quese
comparan los errores y las estimaciones de Y, las variables estn en la misma escala.siendo:
20. NORMALIDAD Se puede observar en ambos casos una buena aproximacin a la normalidad.Pero, si queremos ser
ms rigurosos recurrir a procedimientos analticos. Uno delos mtodos estadsticos que prueba la normalidad de los
datos es la prueba deKolmogorov-Smirnov o la prueba de Shapiro-Wilk.
21. HOMOSCEDASTICIDAD Este exige que para todo el recorrido de lavariable X la varianza del error sea constante.
Uno de los recursos es el grfico de los errores ylas estimaciones de Y estandarizadas paracomprobar la
homocedasticidad. Si no hayhomocedasticidad (heterocedasticidad) la nubede puntos tiene forma de "embudo", sea
a laderecha o a la izquierda, lo que es indicativo quela magnitud de los residuos vara en un sentido oen otro. Pero,
para ser ms rigurosos, un mtodo analtico es calcular la correlacin entre los errores en valores absolutos y las
puntuaciones predichas. Se considera en valores absolutos para que la correlacin no sea cero.
22. INDEPENDENCIA DE LOS ERRORES Para verificar la independencia de los errores utilizamos la Durbin-Watson
23. INFERENCIA ACERCA DE LOS PARMETROS
24. CONCLUSIN: En la aplicacin expuesta se ha mostrado el anlisis de regresin lineal simple completo, desde la
verificacin de la normalidad de los errores, deteccin de datos atpicos, eliminacin cientfica de los datos
sospechosos, identificacin del modelo sin observaciones sospechosas, comprobacin de supuestos e inferencia
acerca de los parmetros. Se ha mostrado en detalle los mtodos estadsticos utilizados cuando se realiza un
Anlisis de Regresin Lineal Simple. Se ha encontrado la ecuacin del modelo de regresin lo ms precisa posible
sin los datos atpicos. Se ha eliminado mediante pruebas de hiptesis los datos atpicos . Se ha realizado
inferencias acerca de los parmetros en los resultados de las pruebas F y t.

You might also like