Professional Documents
Culture Documents
Estudiantes:
LUIS DAVID ANGEL B. (langel@espol.edu.ec)
WILLIAM DAVID OA G. (wona@espol.edu.ec)
II TRMINO-2015
Contenido
1.
RESUMEN ...................................................................................................................................... 1
1.
SUMMARY .................................................................................................................................... 2
2.
INTRODUCCIN........................................................................................................................... 3
3.
OBJETIVOS.................................................................................................................................... 4
3.1 General .......................................................................................................................................... 4
3.2 Especfico ...................................................................................................................................... 4
4.
METODOLOGA ........................................................................................................................... 4
4.1 Regresin Lineal............................................................................................................................ 4
4.2 Contraste de hiptesis.................................................................................................................... 5
5.
RESULTADOS ............................................................................................................................... 7
6.
CONCLUSIONES......................................................................................................................... 10
7.
RECOMENDACIONES ............................................................................................................... 11
8.
REFERENCIAS ............................................................................................................................ 11
1. RESUMEN
El presente trabajo abarca uno de los temas relacionados con la estadstica inferencial, el cual
es la regresin lineal simple. Con esta regresin se pretende establecer una relacin de
dependencia de una variable respecto a otra.
La variables fueron tomadas de una poblacin objetivo, la cual es personas de complexin
delgada, de la cual se tomaron como datos puntuales el peso y estatura. Para establecer la
relacin de dependencia primero se hizo un anlisis de correlacin. Una vez obtenidos los
resultados de este anlisis se procedi a hacer el clculo de regresin lineal y por ltimo un
anlisis de varianza la cual nos permite concluir con una prueba de hiptesis.
Los clculos fueron desarrollados de dos diferentes formas. La primera mediante el uso de
formulaciones obtenidas en clases y libros, y la segunda mediante el uso de un software
estadstico. El uso de este software es para corroborar los resultados obtenidos mediante las
formulaciones.
Haciendo un anlisis de los resultados se obtuvo un coeficiente de correlacin de 0.951, el
cual nos indica que nuestras variables estn fuertemente relacionadas. Para le construccin de
la ecuacin de regresin, obtuvimos valores de 0 , 1 de -124.63, 112.48 respectivamente.
Finalmente realizando la prueba de hiptesis se logr demostrar que el valor de 1 es diferente
de cero.
1. SUMMARY
This project is about a topic related to inferential statistics, which is the simple linear
regression. This regression is to establish a relationship of dependency of one variable over
another.
The variables were taken from a target population, which is "slim people", which weight and
height were used as data points. To set the dependency ratio first became a correlation
analysis. After obtaining the results of this analysis we proceeded to make the calculation of
linear regression and finally an analysis of variance which allows us to conclude with a
hypothesis test.
Calculations were developed in two different ways. The first using formulations obtained in
classes and books, and the second using statistical software. Use of this software is to
corroborate the results obtained by the formulations.
Making an analysis of the results a correlation coefficient of 0.951, which indicates that our
variables are strongly related, was obtained. For you build the regression equation, we
obtained values 0 , 1 of -124.63, 112.48 respectively. Finally performing hypothesis testing
was possible to demonstrate the value of _ (1) it is different of zero
2. INTRODUCCIN
El presente trabajo se refiere al tema de la aplicacin de regresin lineal, el cual es una parte
de la estadstica inferencial que se puede definir como un modelo matemtico usado para
aproximar la relacin de dependencia entre una variable dependiente Y, las variables
independientes Xi y un trmino aleatorio .
El inters que nos lleva a hacer este trabajo es aplicar la teora recibida en clases en algn
problema de nuestra vida diaria, para este caso, nuestro problema es determinar si existe
algn tipo de relacin entre el peso de una persona y su estatura.
Para la realizacin del proyecto se tom mediciones de peso y estatura a diez personas
seleccionadas al azar. La poblacin de la cual se tomaron a estas personas corresponde a las
personas de complexin delgada.
Para entender el propsito de este trabajo, supongamos que tenemos una variable Y que se
explica deterministamente a travs de X, pero no conocemos su relacin funcional, pero que
experimentalmente podemos fijar valores de X a Y.
Para ser ms especficos supongamos que tenemos la variable PESOS de una persona que se
puede explicar a travs de la ESTATURA. Esta relacin la hemos establecido
experimentalmente, pero su relacin funcional no es conocida. Para establecer su relacin
funcional presentaremos principios y su aplicacin para una tcnica que denominamos
Regresin, utilizando un modelo que ha sido rotulado como Modelo de Regresin Lineal
Simple, estimaremos los parmetros de este modelo y utilizando la denominada tabla de
Anlisis de varianza, propondremos Contrastes de Hiptesis basados en la particin de una
forma cuadrtica denominada Suma Cuadrtica Total .
3. OBJETIVOS
3.1 General
Determinar la relacin que existe entre el peso y la estatura en las personas.
3.2 Especfico
Obtener pesos y estaturas de personas de una poblacin definida.
Aplicar regresin lineal para encontrar una relacin funcional entre peso y estatura.
4. METODOLOGA
Para el desarrollo del proyecto utilizaremos la tcnica estadstica denominada Regresin
Lineal, para luego aplicar un contraste de hiptesis para validar dicha regresin.
4.1
4.2
( ) = 0
4.3
4.4
= 0 + 1
=1
=1
= 0 + 1 2
=1
=1
4.5
=1
Para medir la variabilidad de los valores observados alrededor de la recta que fue definida
anteriormente, utilizamos la Suma Cuadrtica del Error (SCE) la cual se define como:
= ( )2
4.6
=1
La Suma Cuadrtica Residual tiene (n-2) grados de libertad, ya que se pierden dos grados de
libertad al estimar 0 y 1; por lo que la media cuadrtica del error es:
=
=1
( )2
2
4.7
Otra suma cuadrtica que debe de ser definida es la Suma Cuadrtica de la Regresin, la cual
se define como:
= ( )
4.8
=1
Luego para saber la calidad del modelo definimos el coeficiente de determinacin 2 que se
lo define como el cociente de la Suma Cuadrtica de Regresin para la Suma Cuadrtica
Total, esto es
2 =
4.9
4.10
Estas sumas cuadrticas que hemos definido sern tiles para la elaboracin del contraste de
hiptesis.
Antes de empezar a realizar la regresin lineal sera de gran utilidad hacer una prueba de
correlacin entre las variables. El valor de correlacin me permite saber si existe relacin
lineal entre las dos variables. El valor de correlacin est entre -1 y 1. Para valores de menos
uno cuando una variable crece la otra disminuye, cuando es 1 las dos variables aumentan o
disminuyen.
=
4.11
presenta a continuacin.
Una vez ya obtenido el modelo es necesario conocer que tan vlido es, para eso utilizaremos
la tabla de anlisis de varianza (TABLA ANOVA). Este modelo consiste en un arreglo
rectangular el cual se presenta a continuacin.
Tabla 1
Tabla de anlisis de varianza
> (;1,)
5. RESULTADOS
A continuacin se presenta la muestra obtenida de la poblacin objetivo.
Tabla 2
Muestra de estaturas y pesos
X
Estatura(m)
1.57
1.83
1.77
1.72
1.72
1.60
1.78
1.75
1.74
1.69
Y
Pesos(kg)
56.00
84.00
72.50
66.00
69.00
55.00
80.00
71.50
70.00
61.00
Con los datos de la tabla 2 se procede a encontrar la relacin funcional entre estatura y peso,
en donde la variable independiente va a ser la estatura.
Haciendo el anlisis de regresin se puede observar que el valor es cerca de uno por lo que se
espera que tengan una relacin lineal fuerte.
= 0.95
Sabiendo esto procedemos a encontrar su funcin de relacin.
Aplicando las ecuaciones 4.4 y 4.5 encontramos los valores de 0 y 1 y obtenemos la
siguiente funcin de relacin.
= 124.63 + 112.48
Ilustracin 1
Funcin de relacin entre peso y estatura
100.00
y = 112.48x - 124.63
Pesos (kg)
80.00
60.00
40.00
20.00
0.00
1.55
1.60
1.65
1.70
Estatura (m)
1.75
1.80
1.85
723.806
= 0.903
800.995
Lo cual nos permite afirmar que la potencia de explicacin del modelo es 90.3%, siendo este
aceptable. En algunas aplicaciones de la ingeniera el valor mnimo permisible del coeficiente
de determinacin es 90%.
A continuacin se presenta la tabla de ANOVA.
Tabla 3
Anlisis de varianza para la validez del modelo
Fuente de
variacin
Grados de
libertad
Sumas
cuadrticas
Medias
cuadrticas
Estadstico
de prueba
Regresin
723.806
723.806
75.016
Error
77.189
9.648
Total
800.995
Ilustracin 2
Distribucin F de Fisher
Se puede observar que el valor es cerca de uno por lo que se espera que tengan una relacin
lineal fuerte. Tambin podemos observar que el valor P es cero. Esto nos indica que no existe
evidencia estadstica para rechazar la hiptesis nula. Es decir que no se puede rechazar la
opcin de que haya correlacin. Esto significa que la correlacin se dio porque existe y no por
coincidencia.
A continuacin se presenta el anlisis de regresin lineal realizado en minitab
10
Ilustracin 4
Regresin lineal realizada en minitab
Ilustracin 5
Tabla ANOVA obtenida en minitab
6. CONCLUSIONES
11
Mediante un anlisis de correlacin se determin que las variables Peso y Estatura estn
fuertemente relacionadas con un coeficiente de correlacin de 0.951.
La relacin entre las variables no se dio de coincidencia, esto puedo ser corroborado con el
valor p de la prueba.
Se logr obtener la relacin funcional de las variables Peso y Estatura.
Mediante prueba de hiptesis se comprob que el valor de 1 es diferente de cero. La funcin
no es constante, existe relacin lineal.
7. RECOMENDACIONES
El tamao de la muestra no es lo suficientemente grande como para proveer una estimacin
muy precisa de la fuerza de relacin, por lo que se recomienda utilizar una muestra con
cuarenta datos o ms.
Tener cuidado al interpretar el valor P, ya que con una muestra que contiene pocos puntos de
datos, la exactitud del valor P es sensible a errores residuales no normales.
8. REFERENCIAS
[1] CANAVOS, C. (1988), Probabilidad y Estadstica, Aplicaciones y Mtodos, (Tercera
Edicin), Mc Graw Hill, Mxico-Mxico.
[2] ZURITA, G. (2010), Probabilidad y Estadstica, Fundamentos y Aplicaciones, (Segunda
Edicin), Ediciones del Instituto de Ciencias Matemticas ESPOL, Guayaquil-Ecuador.