You are on page 1of 5

Universidad Csar Vallejo Trujillo

Direccin de Investigacin
Cultura Estadstica para la Investigacin

CORRELACIN LINEAL REGRESIN LINEAL SIMPLE

CORRELACIN: Cuando al aumentar el valor de una variable crece tambin el de la otra, la


correlacin es directa, e inversa en caso contrario.

EL COEFICIENTE DE CORRELACION R DE PEARSON

Interpretacin del Coeficiente de Correlacin de Pearson

1
Universidad Csar Vallejo Trujillo
Direccin de Investigacin
Cultura Estadstica para la Investigacin

REGRESIN LINEAL SIMPLE

Una de las aplicaciones ms importantes de la estadstica implica la estimacin del valor medio
de una variable de respuesta Y o la prediccin de algn valor futuro de Y con base el
conocimiento de un conjunto de variables independientes relacionadas, X1, X2, . . . XK.

Los conceptos de anlisis de regresin se presentan empleando un modelo de regresin muy


sencillo, uno que relaciona Y con una sola variable X. Aprenderemos a ajustar este modelo a un
conjunto de datos mediante el mtodo de los mnimos cuadrados.

LA RECTA DE AJUSTE TENDR POR ECUACIN:

X: VARIABLE INDEPENDIENTE o EXPLICATIVA


Y: VARIABLE DEPENDIENTE o EXPLICADA.

CLCULO DE LOS COEFICIENTES 0 y 1:

1 Clculo de 1:

2 Clculo de 0:

EL COEFICIENTE DE DETERMINACION R2

Como medida de bondad del ajuste se utiliza el coeficiente de determinacin, definido como
sigue:

( )

Donde: R: Coeficiente de Correlacin.

2
Universidad Csar Vallejo Trujillo
Direccin de Investigacin
Cultura Estadstica para la Investigacin

EJERCICIOS

1. Segn investigaciones, el porcentaje de desembolso por empresas manufactureras


estadounidenses en plantas y equipo que fue destinado al control de polucin durante el
periodo 2009-2013, fue como sigue:*

2009 2010 2011 2012 2013


9.3 4.8 4.3 3.3 4.3
*Fuente: Survey of Current Business.

a) Realice el anlisis de Correlacin e interprete el valor R.


b) Obtenga un modelo de regresin lineal, donde X: tiempo en aos desde 2009.
c) Grafique la ecuacin de la Recta.
d) Use el modelo calculado en (a) para estimar el porcentaje en 2018.

2. La siguiente tabla muestra la produccin de soya, en millones de toneladas, en una regin de


Brasil, como funcin del rea cultivada en millones de hectreas:

rea (Millones de hectreas) 10,1 12,1 12,9 16,2 21,0


Produccin (Millones de toneladas) 15 25 30 40 60
*Fuente: Ministerio de Agricultura de Brasil/New York Times.

a) Existe una correlacin directa o inversa? Justifique su respuesta.


b) Obtenga la ecuacin de la recta de regresin lineal.
c) Interprete el coeficiente 1.
d) Use el modelo calculado para hacer una estimacin.

3. La siguiente tabla y grfica muestran el consumo mensual de energa en funcin del rea del
domicilio:
rea 119,8 125,4 136,6 148,8 158,9 170,9 183,9 207,2 223,0 272,2
(m2)
Consumo 1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
(kw-hrs)

a) Calcule e interprete el Coeficiente de Correlacin R.


b) Establezca la recta de regresin de mnimos cuadrados que permita predecir el
consumo de energa en funcin del rea del domicilio.
c) Represente grficamente los puntos y la recta de mnimos cuadrados. Comente al
respecto.
d) Interprete la pendiente de la recta de regresin.
e) Calcule e interprete el Coeficiente de Determinacin R2.

3
Universidad Csar Vallejo Trujillo
Direccin de Investigacin
Cultura Estadstica para la Investigacin

4. En el servicio central de turismo del pas se ha observado que el nmero de plazas hoteleras
ocupadas es diferente segn sea el precio de la habitacin. Sobre el total de plazas ocupadas
en un ao se tiene:

Precio (US$./noche) 260 650 1000 1400 2100 2500 2700 3300 4000
N Habitaciones
4725 2610 1872 943 750 700 700 580 500
Ocupadas

a) Representa grficamente para comprobar que existe cierta dependencia lineal entre
las variables.
b) Halle la ecuacin de la recta de regresin del precio sobre el nmero de habitaciones.
c) Cuntas habitaciones se llenaran a 1500 US$?

5. En 2001 se public un trabajo Diseando plantas en climas difciles en la revista Field Crops
Research, los datos usados en la investigacin son:

Duracin 92 92 96 100 102 102 106 106 121 143


Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3

Con X = la duracin de la cosecha de porotos de soya en das, Y = rendimiento de la


cosecha en toneladas por hectrea.

a) Estime la recta de regresin mediante el mtodo de mnimos cuadrados. Interprete


los estimadores en el contexto de la pregunta
b) Existe una relacin lineal significativa entre la duracin y el rendimiento de la
cosecha?
c) Estime el rendimiento si la duracin de la cosecha fue de 104 das.

6. La siguiente tabla presenta los datos sobre el nmero de cambios de aceite al ao (X) y el
costo de la reparacin (Y), en miles de pesos, de una muestra aleatoria de 8 autos de una
cierta marca y modelo.

N Cambios de
Aceite
3 5 2 3 1 4 6 4
Costo (miles de
150 150 250 200 350 200 50 125
pesos)
a) Haga un grfico de dispersin con los datos.
b) Encuentre la recta de regresin de mnimos cuadrados.
c) Interprete la pendiente.
d) Estima cul ser el costo de reparacin de un auto que ha tenido 4 cambios de aceite.

4
Universidad Csar Vallejo Trujillo
Direccin de Investigacin
Cultura Estadstica para la Investigacin

7. Una juguetera ha examinado la evolucin reciente de las ventas de su mueco Qco (Y, en
millones de euros) junto con los gastos de publicidad de ese mueco (X, en millones de
euros), obtenindose los siguientes resultados:

Ao 2003 2004 2005 2006 2007 2008 2009


Y 126 135 156 156 150 150 180
X 20 25 30 32,5 35 32 34

A partir de esta informacin, responda a las siguientes cuestiones:

a) Se puede afirmar que al aumentar los gastos en publicidad se incrementarn las


ventas? Obtenga los parmetros del ajuste lineal que explique las ventas en funcin
de los gastos. Interprete dichos coeficientes e indique la bondad del ajuste realizado.
b) Si para este ao 2017 aumentsemos los gastos de publicidad en un 1%, en qu
porcentaje se espera que variasen las ventas, segn el modelo lineal?

8. Con el objetivo de estudiar la relacin lineal entre el precio de los automviles y el nmero
de unidades vendidas, se procedi a recoger datos sobre tales magnitudes durante el pasado
mes en una determinada regin. Los resultados obtenidos fueron los siguientes:

Precio
7,5 9 10,5 12 14 16 18 20,5 23,5 27
(miles de euros)
Cantidad
450 425 400 350 325 300 290 280 260 200
vendida por mes

En funcin a los datos recabados para esa regin y mes:

a) Una empresa radicada en la regin tiene previsto para el mes prximo aumentar el
precio de su modelo ms vendido en 500 euros. Si suponemos como vlida la relacin
lineal entre las dos variables analizadas para los datos del pasado mes, cmo
afectara este hecho a las ventas de dicho modelo?
b) Si el modelo ms caro de la tabla anterior se abaratase para el mes prximo un 3%,
cmo variaran las ventas de dicho modelo?

You might also like