You are on page 1of 20

Introducción

La rotación del personal es uno de los problemas más frecuentes que enfrentan las personas y
empresas en la actualidad. Se tienen muchas teorías sobre las razones que inciden en que el índice
de rotación incremente.

Durante este estudio se observarán los patrones que existen detrás de la rotación de personal y
también detrás de la rotación en una empresa.

Para este análisis se cuenta con una base de empleados de un banco y algunas variables que
describen su comportamiento. Así mismo se cuenta con información sobre la nómina de los
empleados y algunos datos sobre la empresa para la que trabajan. A partir de estos datos se buscará
encontrar modelos que ayuden a describir, conocer, sustentar y pronosticar las razones detrás de
la rotación del personal.

Las herramientas que se utilizarán para el análisis serán:

- SAS Enterprise Guide


- SAS Enterprise Miner

Las técnicas que se aplicarán serán:

- Estadística descriptiva
- Estadística multivariada
- Árboles de decisión
- Regresión Lineal y Logística

La base de datos cuenta con 50,000 observaciones y 21 variables con la siguiente descripción:

Cliente Número de cliente


Edad Número de años cumplidos
EdoCivil Estado Civil
1.- Soltero
2.- Casado
3.- Unión Libre
4.- Divorciado
5.- Viudo
DepEco Dependientes económicos
1.- Tiene dependientes económicos
0.- No tiene dependientes económicos
AntCte Antigüedad del cliente en el banco
Sueldo Ingreso mensual del empleado
Urbana Domicilio en tipo de urbana
1.- CDMX, Monterrey y Guadalajara
2.- Zona urbana
3.- Zona rural
VivProp El empleado tiene vivienda propia
1.- Vivienda propia
0.- Renta
Buro Comportamiento en Buro de Crédito
1.- Al corriente en sus créditos
2.- Presenta morosidad
3.- Fraude
UtilTarj Utilización promedio en los 6 meses de su tarjeta de crédito
ArraiEmp Arraigo o años en el empleo
Invers Tiene inversiones
1.- Si tiene
0.- No tiene
SdoInv Saldo de la inversión
Rot_Indiv Existió Rotación
1.- Hubo rotación
0.- No hubo rotación
Empleados Número de empleado activos de la empresa (variable de
empresa)
Ventas Monto de ventas anuales de la empresa (variable de
empresa)
Varventas Variación anual en monto de ventas de la empresa (variable
de empresa)
NoClientes Número de clientes que tiene la empresa (variable de
empresa)
1 Pocos
2 Moderados
3 Muchos
Giro El tipo de giro de la empresa (variable de empresa)
1.- Fabricante de bienes
2.- Servicios
Empresa Empresa en la que labora el empleado (variable de empresa)
Rot_Emp Rotación en la empresa (variable de empresa)
1.- Baja
2.- Media
3.- Alta
Instrucciones
1. Genere un análisis univariado de la base para detectar anomalías. Genera los filtros, ajustes
y transformaciones que consideres necesarios para corregir la información.

Se realizó reemplazo de valores negativos en la variable VarVentas:

Se realizaron las siguientes transformaciones en las variables que presentaron sesgo:

2. Realiza un análisis exploratorio para analizar la relación que existe entre los individuos de
una población, solamente utilizando estadística:
a. Busca segmentos o grupos de población con características similares dentro de la
información de los individuos y de las empresas.

Se utilizaron los estadísticos de somatización clasificando por rotación individual y se encontró


lo siguiente: (en amarillo las semejanzas y en rojo las diferencias)
De acuerdo a los datos de la media se puede inferir que los datos de empresa (que son la
mayoría) no son determinantes en el modelo, así como los de la edad y el sueldo.

En cambio, otros valores como los siguientes si presentaron diferencias significativas:

Estado Civil: Como se observa en la gráfica, las personas casadas fueron más propensas a rotar:

Las personas residentes de zonas urbanas presentaron mayor número de rotación:


Así mismo, las que no cuentan con vivienda propia y rentan presentaron mayor número de
rotación:

Otra diferencia significativa, fue la del comportamiento en el buró de crédito, ya que los
rotadores presentan mayores niveles de morosidad:

Aunado a lo anterior, los rotadores presentaron mayor uso de su tarjeta de crédito en los
últimos 6 meses:
la que presentó mayor variación para rotación individual = 1 es la que corresponde a la
distribución de la var ArraiEmp (años de arraigo en el empleo), pues se nota claramente
que desde los primeros años se encuentran los picos más altos.

b. Define cuáles crees que serían las variables más relevantes para tu modelo hasta
este punto

Se eligen la variable Buro,DepEco,Edad,VivProp,ArraiEmp,UtlzTarj y EdoCivil

c. Los niveles de rotación de los individuos son similares por giro?

El giro 2 (servicios) presenta la mayor rotación o no rotación:


3. Determine si la información disponible de los individuos (sin utilizar variables de empresa)
es suficiente para definir un patrón de comportamiento que describa la propensión a rotar
de los empleados. Utiliza un árbol, una red y una regresión. Elije el modelo optimo (variable
objetivo= Rot_indiv).

Si es suficiente, ya que en ambos modelos (con variables de empresa e individual), las principales
variables tomadas en cuenta por los modelos mejores rankeados por error de clasificación,
fueron, según mi caso, las siguientes:
Modelo de árbol con variables de empresa (las seleccionadas en azul corresponden a las
variables de empresa y ocupan los últimos puestos de acuerdo a su importancia):

Modelo de regresión con variables de empresa:

Modelo de árbol sin utilizar variables de empresa. Si comparamos estos resultados con los datos
del árbol anterior en donde si se consideran las variables de empresa, vemos que las más
importantes se mantienen y ocupan el mismo lugar en importancia.

Modelo de regresión sin considerar variables de empresa e incluyendo variables individuales.


Así mismo, las tasas de clasificación errónea mejoran notablemente para los modelos de árbol
y regresión en los modelos en los que se descartaron las variables de empresa:

Tabla de comparación de modelos que utilizaron variables de empresa:

Tabla de comparación de modelos que no utilizaron variables de empresa:

4. ¿En tu opinión, sería adecuado incorporar las variables de empresas para estimar la
probabilidad de rotación de un individuo? Justifica elaborando varios modelos y compara
los resultados.

No, por las razones antes mencionadas y la comparación de los resultados.

5. De los modelos generados anteriormente, selecciona el mejor modelo de árbol y el mejor


modelo de regresión y aplica cada uno en una nueva población y determina:
a. Qué características tienen los empleados con alta probabilidad de rotación con
ambas metodologías

Están comprendidos en el rango de edad de los 33 a los 39 años:

La mayoría de ellos son casados:

Tienen dependientes económicos, aunque no es muy determinante, ya que hay un


alto número de rotaciones con individuos sin dependientes económicos:
La mayoría de ellos no cuentan con vivienda propia y rentan:

La mayoría se comporta con morosidad, aunque hay una alta frecuencia de quienes si
van al corriente con sus pagos:

La mayoría de los rotadores permanecen de 2 a 3 años en sus empleos:


La mayoría de ellos son de zonas urbanas:

b. Qué características tienen los empleados con alta probabilidad de rotación en el


árbol y no en la regresión

La edad es muy similar: de los 30 a los 38

El estado civil solo abarca a los solteros:


La mayoría no tienen dependientes económicos:

El árbol registra mayor concentración en la zona rural:

El árbol registra que la mayoría de los rotadores rentan y no cuentan con vivienda
propia:
Para el árbol de decisión, los mayores rotadores van al corriente con sus pagos:

Asi mismo registra el uso de tarjeta de crédito del 75% en los últimos 6 meses:

El arraigo en el empleo es de 1 año para el árbol de decisión:


La rotación en la empresa es baja para el árbol de decisión:

c. Qué características tienen los empleados con alta probabilidad de rotación en la


regresión y no en el árbol

La edad se mantiene en ambos modelos de 30 a 39 años:

El estado civil es variado, aunque predominan los solteros:


Se registra un alto nivel de rotación para individuos con o sin dependientes económicos-

La regresión reporta una alta concentración de rotadores en las zonas urbanas de CDMX
y Guadalajara:

La regresión reporta mayor concentración de rotadores que cuentan con vivienda


propia:
La regresión reporta para la variable buro que la mayoría de los rotadores van al
corriente de sus pagos:

La regresión reporta como máximo el uso del 65% de tarjetas en los últimos 6 meses,
para rotadores:

La regresión reporta un arraigo máximo de 3 años en el empleo para rotadores:


Así mismo, se reporta una rotación en la empresa de 1 años:

d. Qué características tiene los empleados con baja probabilidad de rotación en ambos
modelos.

Las características son un tanto ambiguas ya que las frecuencias de las diferentes
categorías de las variables aparecen casi al mismo nivel y no se nota una marcada
tendencia excluyente, por ejemplo:

Se observa que las frecuencias de dependientes económicas son casi las mismas para
las categorías de con y sin:
El mismo caso para el tiempo de arraigo en el empleo:

Lo mismo para la utilización de tarjeta:

Para el caso de Buro se aprecia una marcada tendencia al cumplimiento:


Conclusión: es una excelente idea realizar la comparación de modelos a través de la
unión de los archivos de puntuación; pues, de esta manera, podemos observar
claramente en que características acierta o yerra cada uno. Así mismo, nos permite
comprender mejor el comportamiento de las variables, así como la elección de una
decisión en base a estos resultados comparados.

You might also like