You are on page 1of 13

ANLISIS DE REGRESIN

SIMPLE ENTRE PESO Y


ESTATURA

FACULTAD DE CIENCIAS NATURALES Y MATEMTICAS

ESTADSTICA Y PROBABILIDAD PARA INGENIEROS

Profesor: Ing. Wendy Plata

Estudiantes:
LUIS DAVID ANGEL B. (langel@espol.edu.ec)
WILLIAM DAVID OA G. (wona@espol.edu.ec)

II TRMINO-2015

Contenido
1.

RESUMEN ...................................................................................................................................... 1

1.

SUMMARY .................................................................................................................................... 2

2.

INTRODUCCIN........................................................................................................................... 3

3.

OBJETIVOS.................................................................................................................................... 4
3.1 General .......................................................................................................................................... 4
3.2 Especfico ...................................................................................................................................... 4

4.

METODOLOGA ........................................................................................................................... 4
4.1 Regresin Lineal............................................................................................................................ 4
4.2 Contraste de hiptesis.................................................................................................................... 5

5.

RESULTADOS ............................................................................................................................... 7

6.

CONCLUSIONES......................................................................................................................... 10

7.

RECOMENDACIONES ............................................................................................................... 11

8.

REFERENCIAS ............................................................................................................................ 11

1. RESUMEN
El presente trabajo abarca uno de los temas relacionados con la estadstica inferencial, el cual
es la regresin lineal simple. Con esta regresin se pretende establecer una relacin de
dependencia de una variable respecto a otra.
La variables fueron tomadas de una poblacin objetivo, la cual es personas de complexin
delgada, de la cual se tomaron como datos puntuales el peso y estatura. Para establecer la
relacin de dependencia primero se hizo un anlisis de correlacin. Una vez obtenidos los
resultados de este anlisis se procedi a hacer el clculo de regresin lineal y por ltimo un
anlisis de varianza la cual nos permite concluir con una prueba de hiptesis.
Los clculos fueron desarrollados de dos diferentes formas. La primera mediante el uso de
formulaciones obtenidas en clases y libros, y la segunda mediante el uso de un software
estadstico. El uso de este software es para corroborar los resultados obtenidos mediante las
formulaciones.
Haciendo un anlisis de los resultados se obtuvo un coeficiente de correlacin de 0.951, el
cual nos indica que nuestras variables estn fuertemente relacionadas. Para le construccin de
la ecuacin de regresin, obtuvimos valores de 0 , 1 de -124.63, 112.48 respectivamente.
Finalmente realizando la prueba de hiptesis se logr demostrar que el valor de 1 es diferente
de cero.

1. SUMMARY
This project is about a topic related to inferential statistics, which is the simple linear
regression. This regression is to establish a relationship of dependency of one variable over
another.
The variables were taken from a target population, which is "slim people", which weight and
height were used as data points. To set the dependency ratio first became a correlation
analysis. After obtaining the results of this analysis we proceeded to make the calculation of
linear regression and finally an analysis of variance which allows us to conclude with a
hypothesis test.
Calculations were developed in two different ways. The first using formulations obtained in
classes and books, and the second using statistical software. Use of this software is to
corroborate the results obtained by the formulations.
Making an analysis of the results a correlation coefficient of 0.951, which indicates that our
variables are strongly related, was obtained. For you build the regression equation, we
obtained values 0 , 1 of -124.63, 112.48 respectively. Finally performing hypothesis testing
was possible to demonstrate the value of _ (1) it is different of zero

2. INTRODUCCIN
El presente trabajo se refiere al tema de la aplicacin de regresin lineal, el cual es una parte
de la estadstica inferencial que se puede definir como un modelo matemtico usado para
aproximar la relacin de dependencia entre una variable dependiente Y, las variables
independientes Xi y un trmino aleatorio .
El inters que nos lleva a hacer este trabajo es aplicar la teora recibida en clases en algn
problema de nuestra vida diaria, para este caso, nuestro problema es determinar si existe
algn tipo de relacin entre el peso de una persona y su estatura.
Para la realizacin del proyecto se tom mediciones de peso y estatura a diez personas
seleccionadas al azar. La poblacin de la cual se tomaron a estas personas corresponde a las
personas de complexin delgada.
Para entender el propsito de este trabajo, supongamos que tenemos una variable Y que se
explica deterministamente a travs de X, pero no conocemos su relacin funcional, pero que
experimentalmente podemos fijar valores de X a Y.
Para ser ms especficos supongamos que tenemos la variable PESOS de una persona que se
puede explicar a travs de la ESTATURA. Esta relacin la hemos establecido
experimentalmente, pero su relacin funcional no es conocida. Para establecer su relacin
funcional presentaremos principios y su aplicacin para una tcnica que denominamos
Regresin, utilizando un modelo que ha sido rotulado como Modelo de Regresin Lineal
Simple, estimaremos los parmetros de este modelo y utilizando la denominada tabla de
Anlisis de varianza, propondremos Contrastes de Hiptesis basados en la particin de una
forma cuadrtica denominada Suma Cuadrtica Total .

3. OBJETIVOS
3.1 General
Determinar la relacin que existe entre el peso y la estatura en las personas.

3.2 Especfico
Obtener pesos y estaturas de personas de una poblacin definida.
Aplicar regresin lineal para encontrar una relacin funcional entre peso y estatura.

4. METODOLOGA
Para el desarrollo del proyecto utilizaremos la tcnica estadstica denominada Regresin
Lineal, para luego aplicar un contraste de hiptesis para validar dicha regresin.

4.1 Regresin Lineal


Supongamos que Y puede ser explicada por X en trminos de una recta que tiene pendiente
1 e intercepcin B0 con el eje Y, de tal manera que Y puede ser definido por la siguiente
relacin funcional.
= 0+ 1 +

4.1

Donde es el error aleatorio al efectuar la medida de Y.


Dado el modelo condicional se va a trabajar con los siguientes supuestos.
( / = )= 0 + 1

4.2

( ) = 0

4.3

Para estimar los parmetros 0 y 1 utilizaremos el criterio de mnimos cuadrados, que


simplificadas determinan las ecuaciones normales que permiten obtener una estimacin de
punto de los parmetros del modelo. Estas ecuaciones son:

4.4

= 0 + 1
=1

=1

= 0 + 1 2
=1

=1

4.5

=1

Para medir la variabilidad de los valores observados alrededor de la recta que fue definida
anteriormente, utilizamos la Suma Cuadrtica del Error (SCE) la cual se define como:

= ( )2

4.6

=1

La Suma Cuadrtica Residual tiene (n-2) grados de libertad, ya que se pierden dos grados de
libertad al estimar 0 y 1; por lo que la media cuadrtica del error es:

=
=1

( )2
2

4.7

Otra suma cuadrtica que debe de ser definida es la Suma Cuadrtica de la Regresin, la cual
se define como:

= ( )

4.8

=1

Luego para saber la calidad del modelo definimos el coeficiente de determinacin 2 que se
lo define como el cociente de la Suma Cuadrtica de Regresin para la Suma Cuadrtica
Total, esto es
2 =

4.9

Donde SCT se define como:


= +

4.10

Estas sumas cuadrticas que hemos definido sern tiles para la elaboracin del contraste de
hiptesis.
Antes de empezar a realizar la regresin lineal sera de gran utilidad hacer una prueba de
correlacin entre las variables. El valor de correlacin me permite saber si existe relacin
lineal entre las dos variables. El valor de correlacin est entre -1 y 1. Para valores de menos
uno cuando una variable crece la otra disminuye, cuando es 1 las dos variables aumentan o
disminuyen.
=

4.11

4.2 Contraste de hiptesis


Ya hemos han examinado propiedades tericas de los estimadores para el modelo de
regresin. Ahora vamos a emplear esas propiedades para llevar a cabo un anlisis de
regresin, es decir, se desarrollar una prueba de hiptesis para la cantidad de inters de este
modelo, el cual es 1. Si la respuesta Y se encuentra relacionada linealmente con la variable
de prediccin X, la pendiente 1 tiene que ser diferente de cero. Existen algunas formas para
formular la prueba de hiptesis, las cuales pueden ser consultadas en el libro de CANAVOS,

Probabilidad y Estadstica, Aplicaciones y Mtodos [1]. Para este trabajo utilizaremos el


anlisis de varianza.
Para entrar a contraste de hiptesis primero realicemos el anlisis de varianza, la cual se

presenta a continuacin.
Una vez ya obtenido el modelo es necesario conocer que tan vlido es, para eso utilizaremos
la tabla de anlisis de varianza (TABLA ANOVA). Este modelo consiste en un arreglo
rectangular el cual se presenta a continuacin.
Tabla 1
Tabla de anlisis de varianza

Fuente: ZURITA, G. (2010), Probabilidad y Estadstica, Fundamentos y Aplicaciones [2]

La tabla ANOVA contiene algunos resultados obtenidos anteriormente pero adems se


presentan nuevos.
Ahora llevemos el problema de regresin lineal al contexto de estadstica inferencial. La
aspiracin es que dado el modelo = 0+ 1 + , el valor de la pendiente 1 no sea
cero, por lo que el contraste de hiptesis se postula como:
: 1 = 0 1: 1 0
Con (1-) 100% de confianza la Hiptesis Nula debe ser rechazada si el estadstico de orden
prueba
=

> (;1,)

5. RESULTADOS
A continuacin se presenta la muestra obtenida de la poblacin objetivo.
Tabla 2
Muestra de estaturas y pesos

X
Estatura(m)
1.57
1.83
1.77
1.72
1.72
1.60
1.78
1.75
1.74
1.69

Y
Pesos(kg)
56.00
84.00
72.50
66.00
69.00
55.00
80.00
71.50
70.00
61.00

Con los datos de la tabla 2 se procede a encontrar la relacin funcional entre estatura y peso,
en donde la variable independiente va a ser la estatura.
Haciendo el anlisis de regresin se puede observar que el valor es cerca de uno por lo que se
espera que tengan una relacin lineal fuerte.
= 0.95
Sabiendo esto procedemos a encontrar su funcin de relacin.
Aplicando las ecuaciones 4.4 y 4.5 encontramos los valores de 0 y 1 y obtenemos la
siguiente funcin de relacin.
= 124.63 + 112.48
Ilustracin 1
Funcin de relacin entre peso y estatura

100.00
y = 112.48x - 124.63

Pesos (kg)

80.00
60.00
40.00
20.00
0.00
1.55

1.60

1.65

1.70
Estatura (m)

1.75

1.80

1.85

Luego con la ecuacin 4.6 obtenemos la suma cuadrtica del error.


= 77.189
Sabiendo que la media aritmtica de la variable a ser explicada es 68.5 la suma cuadrtica de
regresin es
= 723.806
Por lo que la suma cuadrtica total es.
= 800.995
Con esta informacin el coeficiente de determinacin es.
2 =

723.806
= 0.903
800.995

Lo cual nos permite afirmar que la potencia de explicacin del modelo es 90.3%, siendo este
aceptable. En algunas aplicaciones de la ingeniera el valor mnimo permisible del coeficiente
de determinacin es 90%.
A continuacin se presenta la tabla de ANOVA.
Tabla 3
Anlisis de varianza para la validez del modelo

Fuente de
variacin

Grados de
libertad

Sumas
cuadrticas

Medias
cuadrticas

Estadstico
de prueba

Regresin

723.806

723.806

75.016

Error

77.189

9.648

Total

800.995

Corresponde ahora que postulemos el contraste de hiptesis relativo a la pendiente 1 de la


recta que explica el peso de las personas en trminos de la edad.
: 1 = 0 1: 1 0
Puesto que el estadstico de prueba es
= 75.016 > (;1,)
Para valores de =0,1 y 0,05, obtenemos que
(0,1;1,8) = 3.46
(0,05;1,8) = 5.32

Ilustracin 2
Distribucin F de Fisher

En la ilustracin numero 1 podemos observar que el valor p es aproximadamente cero, es


decir, el valor p es menor a 0.05. Ante esta evidencia estadstica, decidimos rechazar la
hiptesis nula que postula que la pendiente de la recta de regresin es cero.
Para comprobar los resultados obtenidos hacemos uso del software minitab.
Haciendo el anlisis de correlacin obtenemos que
Ilustracin 3
Correlacin obtenida con minitab

Se puede observar que el valor es cerca de uno por lo que se espera que tengan una relacin
lineal fuerte. Tambin podemos observar que el valor P es cero. Esto nos indica que no existe
evidencia estadstica para rechazar la hiptesis nula. Es decir que no se puede rechazar la
opcin de que haya correlacin. Esto significa que la correlacin se dio porque existe y no por
coincidencia.
A continuacin se presenta el anlisis de regresin lineal realizado en minitab

10

Ilustracin 4
Regresin lineal realizada en minitab

Como se puede observar en la ilustracin 4, la ecuacin obtenida en minitab corresponde a la


obtenida mediante las formulas. Lo mismo sucede con la tabla ANOVA la cual se presenta a
continuacin.

Ilustracin 5
Tabla ANOVA obtenida en minitab

Los resultados obtenidos en la ilustracin 5 son los mismos obtenidos anteriormente.


Podemos observar que el valor p es cero, lo cual nos permite no rechazar la hiptesis nula, es
decir, hemos corroborado que la pendiente de la regresin no es cero.
Hemos logrado obtener buenos resultados y corroborarlos con el uso de minitab. Cabe
recalcar que la poblacin a la cual se le tomo el peso y la estatura corresponde a las personas
delgadas, es decir, personas sin sobrepeso. El filtrado de la poblacin se la realizo para
poder obtener una regresin lineal con la menor cantidad de datos aberrantes posibles.

6. CONCLUSIONES

11

Mediante un anlisis de correlacin se determin que las variables Peso y Estatura estn
fuertemente relacionadas con un coeficiente de correlacin de 0.951.
La relacin entre las variables no se dio de coincidencia, esto puedo ser corroborado con el
valor p de la prueba.
Se logr obtener la relacin funcional de las variables Peso y Estatura.
Mediante prueba de hiptesis se comprob que el valor de 1 es diferente de cero. La funcin
no es constante, existe relacin lineal.

7. RECOMENDACIONES
El tamao de la muestra no es lo suficientemente grande como para proveer una estimacin
muy precisa de la fuerza de relacin, por lo que se recomienda utilizar una muestra con
cuarenta datos o ms.
Tener cuidado al interpretar el valor P, ya que con una muestra que contiene pocos puntos de
datos, la exactitud del valor P es sensible a errores residuales no normales.

8. REFERENCIAS
[1] CANAVOS, C. (1988), Probabilidad y Estadstica, Aplicaciones y Mtodos, (Tercera
Edicin), Mc Graw Hill, Mxico-Mxico.
[2] ZURITA, G. (2010), Probabilidad y Estadstica, Fundamentos y Aplicaciones, (Segunda
Edicin), Ediciones del Instituto de Ciencias Matemticas ESPOL, Guayaquil-Ecuador.

You might also like