You are on page 1of 23

CORRELACION Y REGRESION

REGRESIÓN LINEAL SIMPLE


Noción e Importancia
El estudio estadístico de las relaciones, entre dos variables de intervalo,
presenta los aspectos fundamentales siguientes:
a) Existencia de asociación entre las dos variables
b) Dirección de la asociación
c) Grado de Asociación
d) Naturaleza forma de la asociación
Los dos primeros aspectos quedan determinados, cuando se halla el
coeficiente de correlación r de pearson. Este coeficiente indica:
La existencia o no covariación o variación conjunta entre dos variables,
según sea o no distinto de cero.

La dirección de la asociación, por su signo positivo o negativo

El grado de la covariación, según el mayor o menor valor que alcance


entre 0, y más o menos uno.
En cuanto al cuarto aspecto, naturaleza y forma de relación, se estudia y
resuelve mediante el análisis de regresión. Este análisis es el que sirve para
establecer la función matemática y la forma geométrica que representen lo más
exactamente posible la variación conjunta de ambas variables. De ahí que
pueda decirse propiamente que sirve para estudiar la naturaleza y la forma de
asociación entre dos variables de intervalo.
Elementos y tipos de análisis de Regresión
Los elementos fundamentales del análisis de la regresión son las variables
y la ecuación de regresión.
Las variables pueden ser dos o más. Una de ellas es la variable
dependiente y las restantes son las variables independientes.
En cuanto a los tipos, se tiene una regresión simple y regresión múltiple.
La primera se refiere a la naturaleza y forma de covariación entre dos
variables únicamente, y la segunda entre más de dos variables.

Análisis de Regresión Lineal Simple


Sirve para estudiar la naturaleza y forma de la asociación entre dos variables,
siempre que dicha relación pueda ser expresada matemáticamente por la
ecuación de la línea recta
Supongamos que tenemos los datos empíricos que representan para cada uno
de los sujetos de un grupo los valores de dos variables, por ejemplo, la edad y la
estatura. Entonces llevando en un espacio de coordenadas cartesianas los
valores de la edad en la abcisa y los de la estatura en la ordenada,
obtendríamos una serie de puntos. Esta serie suele recibir el nombre de la nube
de puntos y constituye la representación gráfica de a posición en el espacio
cartesiano de cada sujeto del grupo, respecto a las variables en cuestión
ESTIMACIÓN DE PARÁMETROS DE REGRESIÓN LINEAL SIMPLE
O también:
EJERCICIOS

1. La dirección de una empresa quiere estudiar la rentabilidad de su inversión


en publicidad. Para ello ha recogido datos del volumen de ventas y del gasto en
publicidad referidos a los años 2000 – 2009 expresados en millones de soles.

a) Construya el diagrama de dispersión y calcule el coeficiente de correlación e


interprete su resultado
b) Especifique y estime el modelo lineal que explique las ventas de la empresa
en función de la inversión publicitaria. Interprete los parámetros estimados.
c) En el año 2010, la empresa va a invertir 85 millones de soles en publicidad.
Calcule el volumen de ventas esperado.
d)Calcule el coeficiente de determinación e interprete
DIAGRAMA DE DISPERSION
a)
GASTO VENTAS
10 50
15 100
18 150
20 200
25 200
35 300
50 400
55 500
60 650
65 700
O también:
b)

GASTO (X) VENTAS(Y) XY X2 Y2


10 50 500 100 2500 =35,3
15 100 1500 225 10000
18 150 2700 324 22500 325
20 200 4000 400 40000
25 200 5000 625 40000
35 300 10500 1225 90000
50 400 20000 2500 160000
55 500 27500 3025 250000
60 650 39000 3600 422500
65 700 45500 4225 490000
total 353 3250 156200 16249 1527500

156200−10(35,3)(325)
𝑟= =0,982
(16249−10(35,32 ))(1527500−10(3252 ))
GASTO VENTAS
(X) (Y) XY X2 Y2
10 50 500 100 2500
15 100 1500 225 10000
18 150 2700 324 22500
20 200 4000 400 40000
25 200 5000 625 40000
35 300 10500 1225 90000
50 400 20000 2500 160000
55 500 27500 3025 250000
156200 − 10(35,3)(325) 60 650 39000 3600 422500
=
16249 − 10(35,32 ) 65 700 45500 4225 490000
total 353 3250 156200 16249 1527500

10,95
Luego la ecuación estimada es:
= 325 − 10,95 35,3 = −61,49
Y=-61,49+10,95X
c)

Y=-61,49+10,95X

Reemplazando en la ecuación, tenemos:

Y= - 61,49+10,95(85)=869,26

d)

R2=r2=0,9822=0,96
2. Si el coeficiente de correlación lineal de una variable bidimensional
(X,Y) resulta ser igual a –0.98, ¿qué interpretación se puede obtener de
tal resultado?

a) que existe una mala asociación lineal entre las variables ya que el
coeficiente de correlación resulta ser negativo

b) que existe una fuerte asociación lineal entre ambas variables ya que
se explica el 98% de la variabilidad de un a de las variables a partir de la
información de la otra

c) que existe una fuerte asociación lineal entre ambas variables ya que
se explica el 96% de la variabilidad de un a de las variables a partir de la
información de la otra
3. Dada la siguiente distribución bidimensional de las variables X (sexo) e Y (nivel educativo),

El porcentaje de hombres con nivel educativo 16 es:


a)35%

b) 59,3%

c) 40,7%

d) 13,56%
4.
Asigne los coeficientes de correlación lineal r = 0,4,
r = –0,85 y r = 0,7, a los siguientes diagramas de
dispersión

You might also like