You are on page 1of 8

www.siresistemas.com/clases Ing.

Oscar Restrepo

TRABAJO DE APLICACIÓN

La siguiente base de datos se conformó por la información suministrada en la entidad


financiera BankAmerica, en el año anterior. A partir de esta consulta, se pretende
aplicar y reforzar los diferentes temas vistos en el curso nivelatorio.

SEXO TIPO DE SALARIO ANUAL EXPERIENCIA MESES


CONTRATO ( dólares) LABORAL DESDE EL
(meses) CONTRATO
Hombre Indefinido $57500 144 77
Hombre Anual $40200 236 78
Mujer Anual $21450 381 75
Mujer Temporal $21900 190 80
Hombre Anual $45000 238 78
Hombre Indefinido $32100 67 79
Hombre Indefinido $36,000 114 75
Mujer Temporal $21900 215 76
Mujer Anual $27900 244 78
Mujer Anual $24000 143 80
Mujer Temporal $30380 307 77
Hombre Anual $28350 165 78
Hombre Temporal $27750 228 77
Mujer Indefinido $35100 240 78
Hombre Temporal $27320 56 75
Hombre Indefinido $40800 444 76
Hombre Indefinido $46430 120 75
Hombre Temporal $42350 432 76
Hombre Anual $26250 168 77
Mujer Anual $38850 144 77
Mujer Anual $21750 108 78
Hombre Indefinido $24280 49 78
Mujer Anual $16950 151 79
Mujer Anual $21150 314 78
Mujer Indefinido $31050 240 80
Hombre Indefinido $60375 284 76
Hombre Indefinido $32550 191 77
Hombre Anual $42000 209 78
Hombre Anual $31350 229 76
Hombre Anual $29100 324 77
Hombre Indefinido $31360 264 76
Hombre Indefinido $36180 252 78
Hombre Temporal $19255 208 78
Hombre Indefinido $23565 240 78
Hombre Anual $35085 35 77
Mujer Anual $23725 288 77
Hombre Indefinido $29640 180 78
Hombre Indefinido $30730 258 78
Hombre Indefinido $60985 284 77
Mujer Temporal $35560 284 78

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

Se solicita,

1. Clasificar cada variable en categórica o cuantitativa ( Discreta o continua )


Sexo: Categórico.
Tipo de contrato: Categórico
Salario anual: Cuantitativo continuo
Experiencia laboral: Cuantitativo discreto
Meses desde el contrato: Cuantitativo discreto

2. Elaborar una distribución de frecuencias, una distribución de frecuencias relativas y


trace un Histograma para los datos que representa la variable “Salario
Anual”.

Número de datos 40
Dato mayor 60985
Dato menor 16950
Cálculo de intevalo 6,286797971
Número intervalos (m) 6
Rango 44035
Ancho intervalo 7339,166667

Rango= Dmayor- Dmenor


Cálculo del intervalo= 1 + 3.3log(n)
El número de intervalos es la aproximación al entero más cercano
Ancho del intervalo = Rango/m
Tabla de distribución de frecuencias

No Linf Lsup Yi fi Fi hi Hi
1 16950 24289,17 20619,58 11 11 0,275 0,275
2 24289,167 31628,33 27958,75 12 23 0,3 0,575
3 31628,333 38967,5 35297,92 8 31 0,2 0,775
4 38967,5 46306,67 42637,08 5 36 0,125 0,9
5 46306,667 53645,83 49976,25 1 37 0,025 0,925
6 53645,833 60985 57315,42 3 40 0,075 1

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

3. Determinar los estadísticos de centro, de variación y de forma para la variable


“Salario Anual”. Realice un breve informe.
Medidas de tendencia central
Media:
Mediana: Semisuma de los datos centrales:
Moda: El dato que más se repite: 21900

Medidas de dispersión:
Varianza:
Desviación estándar:
Coeficiente de variación:

Medida de forma

Breve informe:
El salario promedio anual es de 32704.25, con una desviación de 10524.49. Esta
desviación nos muestra que los datos están muy dispersos. El coeficiente de variación
indica que el 38.18% de los datos se ajusta a la media. La asimetría nos muestra un
valor cercano a cero, quiere decir que los datos están concentrados en el centro.

4. Elaborar una distribución de frecuencias porcentual y trace un diagrama circular


porcentual para la variable “Tipo de Contrato”. Realice un breve informe.

Tabla de frecuencias
No fi  Fi  hi(%) Hi(%)
Indefinido  16  16  40  40 
Anual  16  32  40  80 
Temporal  8  40  20  100 

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

Breve informe:
Existen tres tipos de contratos: Indefinido, temporal y anual. En los 40 datos se tiene
igual concentración en el indefinido y anual (80%) entre los dos. El menor porcentaje de
empleados tiene contrato temporal (20%). Esto nos ayuda a pensar que existe cierta
estabilidad laboral.

5. Aplicar las técnicas de Análisis Exploratorio de Datos ( Diagrama de Tallo y Hojas


y Diagrama de Caja)para la variable “Experiencia laboral”. realice un breve
comentario sobre lo encontrado.
Diagrama de Tallo y Hojas
fi 
0  35  49  56  67  4
1  08  14  20  43  44  44 51 65 68 80 90 91 12
2  08  09  15  228  29  36 38 40 40 40 44 52 58 64 84  84  84  88 18
3  07  14  24  81  4
4  32  44  2

Para realizar el diagrama de Tallo y Hojas se seleccionó las centenas como el tallo y las
decenas y unidades como las hojas. Existen más datos concentrados en el intervalo de 2
centenas, es decir entre 200 y 300.

Diagrama de Caja:
Luego de organizar los datos de menor a mayor se encontró que:

Mediana  228,5 
Cuartil 1   149,25 
Cuartil 3  269 

X X
35 444
149.25 228.5 269
El 25% de la experiencia laboral es inferior a 149.5, y otro 25% es superior a 269
meses. Además el 50% de los datos centrales están entre 149.25 y 269 meses.

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

6. Elaborar la Tabla de Contingencia que relacione las variables “Tipo de Contrato”


(en la columna) y “Sexo” del empleado (en la fila).

Contingencia  Tipo Contrato
Total 
Sexo  Anual  Indefinido Temporal general 
Hombre  8  14  4  26 
Mujer  8  2  4  14 
Total general  16  16  8  40 

7. Con base en la Tabla de Contingencia evaluar las siguientes probabilidades:

a. El empleado sea hombre


P=26/40=0.65
b. El empleado es contrato indefinido
P=16/40=0.4
c. El empleado es de contrato temporal o anual
P=(16+8)/40=0.6
d. El empleado sea mujer o de contrato temporal
P=(14+8-4)/40=0.45
e. Dado que el empleado es hombre, que sea de contrato indefinido
P=14/26= 0.5384
f. El empleado es de contrato indefinido, dado que es mujer
P=2/14=0.1428
g. El empleado no sea contrato anual
P= 24/40=0.60

8. Al suponer que la variable “Salario Anual” sigue una distribución aproximadamente


normal, con media aritmética = $ 31268 y una desviación estándar = $ 10568 ,
calcular la probabilidad de que un empleado tenga un salario:

a. Entre $20000 y $40000

La probabilidad es de 64.93%

b. Mayor de $ 50000

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

La probabilidad es de 3.84%
c. El 90% de los empleados, ¿qué salario tienen?

El 90% de los empleados tienen un salario inferior a 44847.88

9. Siendo la variable independiente “ Experiencia laboral” y la variable dependiente


“Salario Anual”,

a. Determinar la ecuación de regresión

Los resultados son:


N=40

Reemplazando se tiene

La ecuación de regresión es:

b. Interpretar el valor de la pendiente


La pendiente significa que por cada mes de experiencia laboral el salario
aumenta en $15.80
c. Dibujar el diagrama de dispersión y trazar la línea de “mejor ajuste”

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

d.

e. Estimar el salario anual de un empleado que tiene una experiencia laboral de


200 meses

f. Calcular el error estándar de estimación e interprete su valor

La dispersión de los datos respecto a la recta dada es de 10690.59. Es una dispersión


muy alta.

g. Calcular el coeficiente de determinación y el coeficiente de correlación.


interprete cada valor
Coeficiente de determinación:

La variación en la experiencia laboral explica un 1.97% de la variabilidad en el salario


anual. Este coeficiente es muy bajo indicando que los datos se ajustan en casi nada a la
recta encontrada.

Coeficiente de correlacion:

El coeficiente de determinación es muy pequeño.

h. Calcular la covarianza e interprete su valor

www.siresistemas.com/fundacion www.siresistemas.com/
www.siresistemas.com/clases Ing. Oscar Restrepo

La covarianza es muy alta. Existe una gran dispersión entre las dos variables.

10. Elabore la distribución de probabilidades para la variable Meses desde el contrato.

x  p(x) 
75 0,1
76 0,15
77 0,25
78 0,375
79 0,05
80 0,075
Suma  1

E.J.J.R

www.siresistemas.com/fundacion www.siresistemas.com/

You might also like