You are on page 1of 6

Regresión Lineal

Ingrid Lukaschewsky González

Estadística

Instituto IACC

Mayo 13 de 2019
Desarrollo

Le han solicitado elaborar un estudio de desempeño laboral en la empresa Luz Ltda. con el fin de
observar la incidencia y determinar si es relevante que un empleado realice actividades personales
en su horario de trabajo. Es por esto que se tomó como referencia el tiempo en horas que un
empleado navega en internet en su puesto durante la semana hábil y verificar si existe relación
entre el consumo de internet y las siguientes variables: edad, antigüedad laboral, sueldo mensual
que percibe y su escolaridad, además de si el sexo del funcionario incide en este comportamiento
de actividades no laborales en su lugar de trabajo.
De acuerdo con los datos entregados:

a) Realice un gráfico de dispersión e indique el tipo de relación entre las variables edad del
trabajador y horas conectadas a internet.

Relación entre las variables edad del trabajador y horas


conectadas a Internet.
25

20

15
Horas

y = -0.3488x + 27.39
10 R² = 0.7502

0
0 10 20 30 40 50 60 70
Edad

Horas conectado a Internet (semanal) Linear (Horas conectado a Internet (semanal))


b) Con respecto a las mismas variables de la letra a), construya un modelo de regresión e
interprete el valor de la pendiente.
Se sabe que b = Sxy / Sˆ2x = - 0,34875852

a = Y – b * X = 27,39032965

Regresion : y = - 0,34875852 + 27,39032965

El modelo de regresión seria:

y = -0,34875852x + 27,39032965

Interpretación: El tipo de relación que existe es negativa, por lo que a medida que
aumenta la edad, disminuye las horas en internet. Por lo tanto posee una pendiente
negativa.

c) Estime el número de horas que un trabajador está conectado a internet, si tiene 62 años.

Sabemos que:

y = -0,34875852x + 27,39032965

x = 62

y = -0,34875852*( 62 ) + 27,39032965

y = -21,623028 + 27,39032965

y = 5,76730165

Para un trabajador de 62 años de edad se estima que pasa 5,76730165 horas


conectado a Internet.
d) Si un trabajador está conectado 18 horas a internet, ¿qué edad se puede estimar que
tiene el trabajador?
Se sabe:

y = -0,34875852x + 27,39032965

y = 18

18 = -0,34875852x + 27,39032965

0,34875852x = 27,39032965 – 18

0,34875852x = 9,39032965

x = 9,39032965 / 0,34875852

x = 26,9250186347

Se estima que un trabajador que pasa 18 horas en internet tendría una edad aproximada
de 26 años.

e) Desde la gerencia se requiere establecer un modelo de regresión para las variables:


sueldo mensual y antigüedad de los trabajadores, para realizar estimaciones respecto a esas
variables. Entonces:
e.1) Construya el modelo lineal y exponencial.

Sueldo Mensual (miles de $)


Lineal
1600.0
y = 77,404x + 118,07
1400.0 R² = 0,7726

1200.0 Exponencial
y = 296,76e0,1094x
1000.0 R² = 0,8098
800.0

600.0 Sueldo Mensual (miles de $)

400.0 Linear (Sueldo Mensual


200.0 (miles de $))
Expon. (Sueldo Mensual
0.0 (miles de $))
0 5 10 15
e.2) Estime qué modelo se ajusta mejor a los datos. Justifique su respuesta.
De acuerdo a los modelos planteados, el modelo exponencial es el más confiable, porque se
ajusta mejor a los datos, ya que su coeficiente de determinación es mayor (0,8098 o 80,98%), por
lo que las estimaciones serán más confiables.

e.3) Utilizando el modelo más adecuado, determine el sueldo mensual de un trabajador, si


lleva 15 años en la empresa.

Y= 296.760.1094x

Y= 296.760.1094*15

Y= 13278.43

e.4) Utilizando el mismo modelo anterior estime la antigüedad de un trabajador, con un


sueldo mensual de $750.000.

$750.000= 296.760.1094 * 15

X=21.7208
Bibliografía

 Contenido semana 6 IACC Estadística, Regresión Lineal

You might also like