Professional Documents
Culture Documents
La rotación del personal es uno de los problemas más frecuentes que enfrentan las personas y
empresas en la actualidad. Se tienen muchas teorías sobre las razones que inciden en que el índice
de rotación incremente.
Durante este estudio se observarán los patrones que existen detrás de la rotación de personal y
también detrás de la rotación en una empresa.
Para este análisis se cuenta con una base de empleados de un banco y algunas variables que
describen su comportamiento. Así mismo se cuenta con información sobre la nómina de los
empleados y algunos datos sobre la empresa para la que trabajan. A partir de estos datos se buscará
encontrar modelos que ayuden a describir, conocer, sustentar y pronosticar las razones detrás de
la rotación del personal.
- Estadística descriptiva
- Estadística multivariada
- Árboles de decisión
- Regresión Lineal y Logística
La base de datos cuenta con 50,000 observaciones y 21 variables con la siguiente descripción:
2. Realiza un análisis exploratorio para analizar la relación que existe entre los individuos de
una población, solamente utilizando estadística:
a. Busca segmentos o grupos de población con características similares dentro de la
información de los individuos y de las empresas.
Estado Civil: Como se observa en la gráfica, las personas casadas fueron más propensas a rotar:
Otra diferencia significativa, fue la del comportamiento en el buró de crédito, ya que los
rotadores presentan mayores niveles de morosidad:
Aunado a lo anterior, los rotadores presentaron mayor uso de su tarjeta de crédito en los
últimos 6 meses:
la que presentó mayor variación para rotación individual = 1 es la que corresponde a la
distribución de la var ArraiEmp (años de arraigo en el empleo), pues se nota claramente
que desde los primeros años se encuentran los picos más altos.
b. Define cuáles crees que serían las variables más relevantes para tu modelo hasta
este punto
Si es suficiente, ya que en ambos modelos (con variables de empresa e individual), las principales
variables tomadas en cuenta por los modelos mejores rankeados por error de clasificación,
fueron, según mi caso, las siguientes:
Modelo de árbol con variables de empresa (las seleccionadas en azul corresponden a las
variables de empresa y ocupan los últimos puestos de acuerdo a su importancia):
Modelo de árbol sin utilizar variables de empresa. Si comparamos estos resultados con los datos
del árbol anterior en donde si se consideran las variables de empresa, vemos que las más
importantes se mantienen y ocupan el mismo lugar en importancia.
4. ¿En tu opinión, sería adecuado incorporar las variables de empresas para estimar la
probabilidad de rotación de un individuo? Justifica elaborando varios modelos y compara
los resultados.
La mayoría se comporta con morosidad, aunque hay una alta frecuencia de quienes si
van al corriente con sus pagos:
El árbol registra que la mayoría de los rotadores rentan y no cuentan con vivienda
propia:
Para el árbol de decisión, los mayores rotadores van al corriente con sus pagos:
Asi mismo registra el uso de tarjeta de crédito del 75% en los últimos 6 meses:
La regresión reporta una alta concentración de rotadores en las zonas urbanas de CDMX
y Guadalajara:
La regresión reporta como máximo el uso del 65% de tarjetas en los últimos 6 meses,
para rotadores:
d. Qué características tiene los empleados con baja probabilidad de rotación en ambos
modelos.
Las características son un tanto ambiguas ya que las frecuencias de las diferentes
categorías de las variables aparecen casi al mismo nivel y no se nota una marcada
tendencia excluyente, por ejemplo:
Se observa que las frecuencias de dependientes económicas son casi las mismas para
las categorías de con y sin:
El mismo caso para el tiempo de arraigo en el empleo: