Professional Documents
Culture Documents
2.1. Definición.
Dada una muestra de 𝒏 datos 𝒙𝟏 , 𝒚𝟏 , 𝒙𝟐 , 𝒚𝟐 , … , 𝒙𝒏 , 𝒚𝒏 observados de la
variable bidimensional 𝒙, 𝒚 .
La regresión lineal simple de la variable dependiente 𝒚 con respecto a la variable
independiente 𝒙, consiste en obtener la ecuación de la recta o modelo de
regresión:
𝒚 = 𝒂 + 𝒃𝒙
que mejor se ajuste a los valores de la muestra, con el fin de poder predecir o
pronosticar los valores de 𝒚 dado 𝒙.
2.2. Diagrama de dispersión.
Es el primer paso en el análisis de regresión.
Consiste en diseñar una gráfica de los datos muestrales en el plano coordenado
𝑋𝑌.
3.1. Definición.
El coeficiente o índice de correlación lineal de Pearson de los 𝑛 datos
𝒙𝟏 , 𝒚𝟏 , 𝒙𝟐 , 𝒚𝟐 , … , 𝒙𝒏 , 𝒚𝒏 de una variable bidimensional 𝒙, 𝒚 es el número
abstracto o relativo 𝒓 que se calcula por:
ഥ 𝒚𝒊 − 𝒚
𝒙𝒊 − 𝒙 ഥ
𝑪𝒐𝒗𝒙𝒚 𝒏
𝒓= =
𝑺𝒙 . 𝑺𝒚 𝑺𝒙 . 𝑺𝒚
Interpretación:
Si 𝒓 = 𝟏, se dice que hay una correlación lineal perfecta positiva.
Si 𝒓 = −𝟏, se dice que hay una correlación lineal perfecta negativa.
Si 𝒓 = 𝟎, se dice que no hay correlación entre las dos variables.
4. Ejemplo de aplicación
x y
2800 420
4100 540
3520 505
4800 647
5100 752
4600 620
3857 618
Ecuación de regresión: 𝒚 = 𝒂 + 𝒃𝒙 , donde:
σ 𝑥𝑖 −𝑥ҧ 𝑦𝑖 −𝑦ത
𝒃= σ 𝑥𝑖 −𝑥ҧ 2
y = 69.29940109 + (0.125687326)x
y = 69.29940109 + (0.125687326)(6000)
𝒂 = 𝑦ത − 𝑏𝑥ҧ
y = 823.4233571 = 823 turistas
x y 𝑥 𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥 𝑖 − 𝑥ҧ 2
2800 420 -1311 -166 217626 1718721
4100 540 -11 -46 506 121
3520 505 -591 -81 47871 349281
4800 647 689 61 42029 474721
5100 752 989 166 164174 978121
4600 620 489 34 16626 239121
3857 618 -254 32 -8128 64516
28777 4102 480704 3824602
Coeficiente de correlación.
x y 𝑥 𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത 𝑥 𝑖 − 𝑥ҧ 2 𝑦𝑖 − 𝑦ത 2
2800 420 -1311 -166 217626 1718721 27556
4100 540 -11 -46 506 121 2116
3520 505 -591 -81 47871 349281 6561
4800 647 689 61 42029 474721 3721
5100 752 989 166 164174 978121 27556
4600 620 489 34 16626 239121 1156
3857 618 -254 32 -8128 64516 1024
28777 4102 480704 3824602 69690
ഥ 𝒚𝒊 − 𝒚
𝒙𝒊 − 𝒙 ഥ
𝑪𝒐𝒗𝒙𝒚 𝒏
𝒓= =
𝑺𝒙 . 𝑺𝒚 𝑺𝒙 . 𝑺𝒚
Indicaciones:
En grupos de 3 alumnos, resolver las pregunta 1, 4, 6, 8 y 10 de la separata de
problemas propuestos.
Tiempo: 30 minutos.
Presentación: cuadernillo de hojas cuadriculadas.
5. Resumen
Regresión lineal, sirve para determinar la relación que existe entre las variables.
Puede ser simple o múltiple.
Correlación lineal, cuantifica el grado de relación entre las variables. Puede ser
simple o múltiple.
Ecuación de regresión lineal simple, sirve para realizar predicciones o
pronósticos acerca de la variable dependiente en función de la variable
independiente.
Método de mínimos cuadrados, sirve para obtener la ecuación de regresión
lineal simple.
Coeficiente o índice de correlación lineal simple, es la medida del nivel de
relación entre dos variables.