You are on page 1of 17

MODELOS Y METODOLOGÍAS DE CREDIT SCORE PARA PERSONAS NATURALES: UNA REVISIÓN

LITERARIA

Models and methodologies for credit scoring in personal banking: A literature review

David Esteban Rodríguez-Guevara


Magíster en Administración Financiera. Instituto Tecnológico Metropolitano, Medellín- Colombia,
davidrodriguez@itm.edu.co

Jairo Alfonso Becerra-Arévalo


Magíster en Administración Financiera. Instituto Tecnológico Metropolitano. Medellín-Colombia,
jairobecerra@itm.edu.co

Daniel Cardona-Valencia
Especialista en Finanzas y Mercado de Capitales. Instituto Tecnológico Metropolitano. Medellín-Colombia,
danielcardona@itm.edu.co

Cómo citar / How to cite


Rodríguez-Guevara, D.E., Becerra-Arévalo, J.A. y Cardona-Valencia, D. (2017). Modelos y metodologías de credit
score para personas naturales: una revisión literaria. Revista CEA, 3(5), 13-28.

Recibido: 14 de agosto de 2016


Aceptado: 29 de septiembre de 2016

Resumen Abstract

Este trabajo pretende aportar literariamente This paper provides a literature review on risk
una revisión de los modelos para la calificación scoring models for credit granting in personal
del riesgo crediticio (modelos de Credit Score) banking. The methods by Abdou & Pointon
utilizados en el otorgamiento de crédito (2011), Glennon, Kiefer, Larson, & Choi (2008),
personal; teniendo en cuenta los métodos de and Saavedra-García (2010) are considered.
Abdou & Pointon (2011); Glennon, Kiefer, The aim is to create a sorting scheme to explain
Larson, & Choi (2008); Saavedra-García & the multiple mathematical and econometrical
Saavedra-García (2010), se pretende crear un models used for credit scoring and to produce
esquema de orden para explicar los múltiples an up-to-date list supported by scholars and
modelos matemáticos y econométricos experts in the field.
utilizados en el credit score, con el fin de
generar un listado actualizado que esté Keywords: discriminant analysis, credit score,
sustentado por académicos y expertos en el parametric models, non-parametric models,
tema. semiparametric models.

Palabras clave: análisis discriminante, credit


score, modelos paramétricos, modelos no
paramétricos, modelos semi-paramétricos.

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 13
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

1. INTRODUCCIÓN (1979); García Sánchez & Sánchez Barradas


(2005); Gartner & Schiltz (2005); Glennon,
Los credit score son metodologías estadísticas Kiefer, Larson, & Choi (2008); Gutiérrez Girault
o matemáticas que se especializan en el (2007) y Saavedra-García & Saavedra-García,
pronóstico e identificación de un cliente que 2010), se encargaron de realizar una
pueda tener o no riesgo de impago de un identificación teórica a través del tiempo,
crédito (Rodríguez & Trespalacios, 2015); son actualizando cada vez la base científica que
usados principalmente para la aprobación de permitía tomar una decisión de uso del mejor
los créditos, determinación de clasificación de modelo o método para hallar credit score; por
créditos, asignación de precio de los créditos, lo tanto, la intención de este trabajo es realizar
generación de alertas tempranas y estrategias una revisión completa de los autores anteriores
de cobranza (García Sánchez & Sánchez e identificar bajo un esquema único la
Barradas, 2005). De lo anterior, resulta constitución de las metodologías usadas para
oportuno indicar que las metodologías de credit score para personas naturales hasta
credit score usadas en entidades bancarias o 2015.
prestantes son directamente aplicadas en
personas naturales pero muy poco en personas
jurídicas. 2. MARCO DE REFERENCIA

La función primordial del credit score es Basilea II y la administración del riesgo


identificar el riesgo de impago de un cliente,
«discriminando» a los clientes nuevos con la Basilea II recomienda a las entidades crediticias
historicidad de impago de clientes antiguos; realizar análisis de riesgo de cartera basándose
para ello, es indispensable un análisis de sus en indicadores financieros de los posibles
variables personales; a estos procesos se candidatos involucrando variables como:
conocen como análisis discriminante; los liquidez, rendimientos, deuda, servicio a la
desarrollos de dichos análisis pueden ser deuda, activos e IRB (Internal Rating-Based
variados dependiendo de las necesidades de approach); y si bien, estas variables descritas
las entidades que los soliciten, requiriendo el son las mínimas requeridas, involucrar una
tipo, forma de los datos obtenidos, la veracidad gran cantidad de estas que permitan describir
y la eficiencia de los modelos. Estas a un conjunto de personas son bienvenidas
metodologías nacieron con el análisis lineal siempre y cuando tengan un contexto frente a
discriminante (LDA) descritos por Fisher (1936) los créditos. Cabe agregar que, frente a la
como una variante de los modelos ANOVA y metodología, Basilea no establece
que fueron la entrada a los modelos de directamente una metodología estándar, ya
identificación de quiebra, y a través de los años que se propone que los estudios y modelos
han tomado vertientes de uso con modelos para su análisis sean directamente
lineales, no lineales, paramétricos, no responsabilidad de las entidades, siempre y
paramétricos, estadísticos y econométricos cuando puedan ser fieles a la determinación
que buscan encontrar el medidor perfecto. del riesgo crediticio implícito de los clientes
(Rodríguez & Trespalacios, 2015).
Así mismo, a modo de compilación, han
existido autores que se han encargado de Así mismo, García Sánchez & Sánchez Barradas
abordar varias teorías y compilarlas de acuerdo (2005) indican:
con su funcionalidad ; sea el caso de Abdou &
Pointon (2011); Anderson & Narasimhan

14 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

«La gestión de riesgos es fundamental discriminando los usos y los enfoques en que se
para cualquier empresa cuya desenvuelven.
rentabilidad de negocio esté
íntimamente ligada a los riesgos que García Sánchez & Sánchez Barradas (2005)
asume. Cualquier entidad económica explican que los modelos de credit score se
necesita identificar, valorar y cuantificar pueden referenciar en: modelos tradicionales y
su exposición al riesgo, optimizando al en los modelos de enfoque moderno.
mismo tiempo la rentabilidad, que se
traslada directamente al cliente Los modelos tradicionales, son caracterizados
mediante unos precios más competitivos por análisis de expertos que se enfocan en el
y la generación de mayores beneficios». «Carácter, Capital, Capacidad, Colateral y
Ciclo», y si bien estos modelos son
Credit Score y su uso para empresas normalmente usados de manera intuitiva, el
autor indica que pueden llegar a ser
Según Thomas, Edelman & Crook (2002), las difícilmente aplicables entre los clientes,
entidades financieras al momento de evaluar la definiendo el hecho que las características por
capacidad crediticia de sus clientes siempre cada cliente hacen difícil su aplicación.
tienen en cuenta variables de tipo cualitativo y Mientras, que los modelos de enfoque
cuantitativo, pero, dependiendo de las moderno, son de aplicación matemática, como
necesidades y del uso que se deba dar dichas los modelos Z-Score, modelos Z, modelos de
variables desentenderán del tipo de empresa a respuesta binaria, Creditmetrics y VaR (Value at
la que se le hará el estudio. Risk).

Los estudios de personas naturales toman Gutiérrez Girault (2007) realiza una relación
entonces variables enfocadas a las totalmente directa para identificación de credit
características de la persona, la descripción del score mostrando que los modelos más usados
ser resultando en una infinidad de variables para las entidades bancarias son: análisis
cualitativas (por ejemplo: genero, estrato, tipo discriminante, regresión lineal, regresión
de vivienda, municipalidad, raza), o logística, modelos Probit, modelos Logit,
cuantitativas (por ejemplo: ingresos, egresos, métodos no paramétricos de suavizado,
patrimonio, salario, número de personas a métodos de programación matemática,
cargo, número de vehículos); mientras que un modelos basados en cadenas de Markov,
estudio de credit score para una persona algoritmos de particioamiento recursivo
jurídica, como lo muestra Gonçalves & Braga (árboles de decisión), sistemas expertos,
(2008) se usa variables de indicadores algoritmos genéticos, redes neuronales y,
financieros: la razón corriente, la liquidez, finalmente, el «juicio humano», dándole a su
activos, encaje bancario, cobertura en pasivos, explicación un factor favorable a los modelos
provisión, rentabilidad de activos y patrimonio de respuesta bivariada (modelos Probit).
entre otros.
Glennon et al. (2008), en su estudio, muestra
Anteriores revisiones literarias una explicación más característica desde el
ámbito estadístico, explica en su documento el
Para identificar el proceso de referenciación de trato de los datos, teniendo especial cuidado
los modelos usados para el credit score, es en el tipo de información (datos transversales y
importante tener en cuenta la explicación de de series de tiempo), el desarrollo del score-
algunos autores sobre los métodos usados card para las observaciones, y los tipos de

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 15
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

modelos que se pueden utilizar para este fin; 3. RESULTADOS


en este apartado se subdividen los modelos de
forma paramétrica, donde solamente se Teniendo en cuenta el método de descripción
muestra al modelo Logit como el único modelo de los modelos propuesto por Glennon et al.,
paramétrico, semi-paramétrica, mostrando (2008) y Saavedra-García & Saavedra-García
una función combinada de un modelo Logit y (2010), se establece que los modelos más
una red neuronal, y no paramétrica como el representativos de credit score hasta el año
modelo CHAID (Chi-squared Automatic 2015 se parten en tres tipos de modelos
Interaction Detector). generales: 1) Los modelos paramétricos, 2)
modelos no paramétricos, 3) modelos semi-
Saavedra-García & Saavedra-García (2010), parámetricos. En general responden a la
muestran bajo un sistema similar al de García relación matematica f(Y,X), el cual busca
Sánchez & Sánchez Barradas (2005), donde se identificar el resultado de riesgo o no riesgo
parten los modelos de análisis de crédito en (variable dependiente) frente a una serie
modelos tradicionales y modelos modernos, indeterminada de variables socioeconómicas
los primeros identifican modelos matemáticos (variables independientes); dando una
paramétricos que analizan las variables con descripción de su uso y la formulación
modelos Logit, Lineales y hasta sistemas matemática que desarrolla el método:
expertos; los segundos utilizan modelos
empresariales especiales: modelo MKV Modelos paramétricos
(Kealhofer, McQuown and Vasicek) y el modelo
CyRCE (Capital y Riesgo de Crédito en Países Estos modelos tienen la condición matemática
Emergentes). de describir la sensibilidad de discriminación
por medio de parámetros o estimaciones
Abdou & Pointon (2011) separan su resultado obtenidas bajo el proceso MCO (Mínimos
en métodos avanzados estadísticos y métodos Cuadrados Ordinarios); permiten identificar la
tradicionales estadísticos. Los primeros son sensibilidad o cambio presentado por las
modelos que usan programación genética y variables usadas según el tipo de modelo;
redes neuronales para determinar los operando de dos formas: Univariantes y
resultados de una discriminación bivariada o Multivariantes.
multivariada, y los segundos, los que usan
métodos clásicos de análisis paramétrico.  Modelos paramétricos Univariantes –
Igualmente, los modelos descritos por Abdou & Modelos ANOVA
Pointon (2011) tienen en cuenta modelos
lineales, análisis discriminante, análisis Palacio, Lochmúller, Murillo, Pérez & Vélez
probabilístico (Probit) y logístico (Logit), (2011), explican que usando datos de
árboles de decisión, sistemas expertos encuestas realizadas a los clientes, y
(Modelos Bayesianos), redes neuronales, y asumiendo un proceso similar al bayesiano que
programación genética; a esta investigación el usa promedios de expertos, se revisan las
autor expone también los métodos usuales de variables más representativas que pueden
verificación de resultados y bondad de ajuste representar el riesgo de impago de crédito con
(curva ROC, el costo de error en la clasificación, un proceso de un solo factor o ANOVA; si bien
y la matriz de confusión). este estudio toma varias variables en el
estudio, el proceso estadístico utilizado revisa
una a una de las variables para identificar

16 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

cuales presentan efecto en la variable Cuando se obtengan las estimaciones, la


dependiente. predicción depende de la puntuación de corte
optimo que discrimina los valores 0 y 1 de
 Modelos paramétricos multivariantes forma perfecta.

 Análisis discriminante  Modelos LDA (Linear Discriminant Analysis)


Fisher (1936), Puertas & Marti (2012) y Mures, - Modelo Z – Score
García, & Vallejo (2011), explican que el análisis
discriminante es una relación de De la misma forma que Fisher (1936) obtuvo el
comportamiento de múltiples variables proceso discriminante, estos modelos fueron
identificadas frente a una variable usados por Altman (1968), Altman (1980) y
dependiente, la cual estructura varios posibles Elliott, Siu & Fung (2014) en sus estudios para
resultados o grupos de ecuaciones lineales que identificar en el primer caso la probabilidad de
identifican la combinación eficiente para quiebra de una entidad, que después utilizo
separar o discriminar a los buenos o malos para estudiar la probabilidad de impagos en
pagadores. una entidad bancaria, a dichos trabajos se les
conoció como modelos LDA, Modelos Z y
El proceso distingue una serie de modelos modelos Z – score; la ecuación del modelo Z es
lineales tal que así (1): (3):

𝑋𝑋 = 𝜆𝜆1 𝑥𝑥1 + 𝜆𝜆2 𝑥𝑥2 + ⋯ + 𝜆𝜆𝑖𝑖 𝑥𝑥𝑖𝑖 (1) 𝑍𝑍 = 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 + 𝜀𝜀𝑖𝑖 (3)

Donde: Donde:

𝜆𝜆𝑖𝑖 = Representa los parámetros de la relación 𝑍𝑍 = índice general


de combinaciones de variables. 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago
𝑋𝑋, representa una cantidad n de modelos 𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas.
posibles que nacen de las combinaciones entre
variables. Cuando se tuviesen los parámetros  Modelos Least – Absolute – Value (LAV)
hallados por cada grupo de datos, se toma la
serie de datos en diferencia entre las medias Glorfeld (1990) demuestra que el modelo lineal
(desviaciones estándar) quedando (2): discriminante tiene amplios fallos, debido a la
violación de los supuestos lineales; este autor
𝐷𝐷 = 𝜆𝜆1 𝑑𝑑1 + 𝜆𝜆2 𝑑𝑑2 + ⋯ + 𝜆𝜆𝑖𝑖 𝑑𝑑𝑖𝑖 (2) propone hacer un análisis de credit score
tomando un modelo OLS (Ordinary Least
De esto, se busca encontrar una función de Squares), condicionando el vector de
varianzas y covarianzas que determine el residuales contrastados contra el valor
modelo con menos valores residuales entre absoluto de la diferencia entre los datos reales
ellos. y los pronosticados, siendo este el
determinante del mínimo error expresado.
𝑛𝑛 𝑛𝑛

𝑆𝑆 = ∑ ∑ 𝜆𝜆𝑝𝑝 𝜆𝜆𝑞𝑞 𝑆𝑆𝑝𝑝𝑝𝑝 Estos modelos garantizan que los valores de los
𝑝𝑝=1 𝑞𝑞=1 parámetros tengan distribuciones más
ajustadas, haciendo que la media de los errores
sea asintótica mostrando entonces que la

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 17
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

afectación de los datos por outliers sea menor Donde:


en LAV que en modelos LDA o MDA. 𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de
Para ello, es requerido minimizar la sumatoria impago
de los errores tal que (4): 𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago
𝑛𝑛
(4) 𝑋𝑋𝑖𝑖𝑖𝑖 = Variables cualitativas o cuantitativas
min 𝑧𝑧 = ∑(𝜀𝜀𝑖𝑖+ − 𝜀𝜀𝑖𝑖− ), 𝑖𝑖 = 𝑛𝑛
𝑖𝑖
La diferencia entre los modelos MLP y los
Y, dado que el modelo lineal requiere un valor modelos discriminantes, radica en la
cercano a cero, es imprescindible que dichos construcción de varias combinaciones lineales,
errores sean totalmente positivos (5). en cambio toma los preceptos del modelo
lineal usando la bondad de ajuste para definir
𝑛𝑛 (5) el modelo optimo, y así obtener un valor
𝑦𝑦𝑖𝑖 − (𝛼𝛼 + ∑ 𝛽𝛽𝑗𝑗 𝑥𝑥𝑖𝑖𝑖𝑖 ) + 𝜀𝜀𝑖𝑖+ − 𝜀𝜀𝑖𝑖− = 0 porcentual que defina el valor de impago.
𝑗𝑗

 Modelo Logístico (Logit)


Donde:
Según, Constangioara (2011); Gonçalves &
𝑦𝑦𝑖𝑖 = es la respuesta bivariada de riesgo de Braga (2008); Lipovetsky & Conklin (2004);
impago Majer (2006); Rayo, Lara, & Camino (2010);
𝛼𝛼, 𝛽𝛽𝑗𝑗 = son los parámetros de cambio que Rodríguez & Trespalacios (2015); Támara,
afectan la probabilidad de impago Aristizábal, & Velásquez (2010), el modelo
𝑥𝑥𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas logístico es una respuesta para el incorrecto
𝜀𝜀𝑖𝑖 = residuales de la función funcionamiento de los modelos MLP, este usa
la función logística matemática para
 Modelos Lineales Probabilísticos (MLP) determinar un crecimiento condicionado en
donde los valores más cercanos a cero
Como los describen Hardy & John (1985), (incluyendo −∞) sean iguales a cero, y a
Santos & Famá (2007), Bumacov, Ashta & Singh medida de crecen al +∞, tomarán la forma del
(2014), Puertas & Marti (2012), los modelos valor 1, por lo tanto son modelos con
lineales probabilísticos son modelos en donde parámetros no lineales que nacen de la máxima
la mejor combinación lineal de las variables en verosimilitud. Su funcionamiento como un
estudio pueden arrojar una respuesta bivariada modelo econométrico dependerá del uso de la
eficiente, pero son sensibles a presentar bondad de ajuste, tablas de confusión y curvas
problemas de especificación si violasen los ROC para determinar el nivel de discriminación
supuestos de linealidad (Gujarati, 2004) (6). propuesto (7).

𝑌𝑌𝑖𝑖 = 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + 𝛽𝛽3 𝑋𝑋𝑖𝑖3 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 + 𝜀𝜀𝑖𝑖 (6) 𝑧𝑧𝑡𝑡 = 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 (7)

18 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

Siendo el modelo en la función logística (8):

1 1 (8)
𝑃𝑃𝑖𝑖 = 𝐸𝐸(𝑦𝑦 = 1|𝑋𝑋) = + 𝜀𝜀𝑖𝑖 = + 𝜀𝜀𝑖𝑖
1+ 𝑒𝑒 −(𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑡𝑡2 +⋯+𝛽𝛽𝑘𝑘𝑋𝑋𝑡𝑡𝑡𝑡 ) 1 + 𝑒𝑒 −𝑧𝑧𝑡𝑡
Donde: Donde:

𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de 𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de


impago impago
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago
afectan la probabilidad de impago
𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas
𝑋𝑋𝑖𝑖𝑖𝑖 = Variables cualitativas o cuantitativas. 𝑧𝑧 = es la distribución normal estandarizada

 Modelos Probabilísticos (Probit)  Modelos Tobit

Así mismo, Melo & Granados (2011); S. Moreno Autores como, Fernández & Pérez (2005);
(2013); Rayo et al. (2010); Roszbach (2004); Olagunji & Ajiboye (2010), Tan, Yen & Loke
Támara et al. (2010) y Webster (2011) (2011) y Roszbach (2004) indican que dichos
muestran que los modelos Probit también han modelos proporcionan un mejor ajuste de la
sido ampliamente usados por su condición de realidad de los datos al tener comprometida la
establecer normalidad al proceso de información cuando existen con problemas de
predicción, dándoles a las variables mayor especificación de normalidad, condicionando la
estabilidad en el proceso de ajuste. variabilidad de los errores. Si bien, estos
modelos son similares al modelo Probit, su uso
Su uso dependerá entonces de la función es menos comercial por su complejidad en el
normal (9): uso y que no siempre son tan generales para la
construcción de un modelo de predicción de
𝑃𝑃𝑖𝑖 = 𝑃𝑃(𝑌𝑌 = 1|𝑋𝑋) = 𝑃𝑃(𝐼𝐼𝑡𝑡∗ ≤ 𝐼𝐼𝑡𝑡 ), que es igual a riesgo de crédito.

𝑃𝑃𝑖𝑖 = 𝑃𝑃(𝑍𝑍𝑡𝑡 ≤ 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 ), igual a


𝑦𝑦𝑖𝑖∗ = 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 (11)
𝑃𝑃𝑖𝑖 = 𝐹𝐹(𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 ) (9)
Siendo 𝑦𝑦𝑖𝑖∗ una variable inobservable, la cual
Se dará entonces la CDF de la distribución puede tener dos resultados
normal para el modelo lineal, quedando (10): 𝑦𝑦𝑖𝑖 = 𝑦𝑦𝑖𝑖∗ , 𝑠𝑠𝑠𝑠 𝑦𝑦𝑖𝑖 > 0
𝑦𝑦𝑖𝑖 = 0, 𝑠𝑠𝑠𝑠 𝑦𝑦𝑖𝑖 ≤ 0
1 𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑖𝑖2 +⋯+𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 𝑧𝑧 2 (10)
𝐹𝐹(𝐼𝐼) = ∫ 𝑒𝑒 − 2 𝑑𝑑𝑑𝑑
√2𝜋𝜋 −∞
+ 𝜀𝜀𝑖𝑖

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 19
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

Para todos los casos la función para obtener el resultado óptimo sería (12):

𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 (12)


𝑙𝑙𝑙𝑙𝑙𝑙 = ∑ [−𝑙𝑙𝑙𝑙𝑙𝑙 + 𝑙𝑙𝑙𝑙𝑙𝑙(𝑦𝑦𝑖𝑖 − 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 )] + ∑ ln [1 − Φ ( )]
𝜎𝜎
𝑦𝑦𝑖𝑖 >0 𝑦𝑦𝑖𝑖 =0

Donde:
Donde:
𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de
impago 𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de
impago
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago
afectan la probabilidad de impago
𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas 𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas
𝜙𝜙 𝑦𝑦 Φ= son funciones de densidad acumulada
para una distribución normal estándar  Modelos Logit Mixtos

 Modelos Logit Multinomiales Kukuk & Rönnberg (2013) y Moreno (2013),


propone una alternativa para los modelos Logit
Una propuesta alternativa al modelo Logit y y Probit convencionales, esta autora
Probit, Chaudhuri & Cherical (2012) y recomienda su uso por su flexibilidad a la hora
Gonçalves & Braga (2008) tienen en cuenta el de predecir el nivel de crédito sin caer en los
uso que propone Basilea II en la forma que se errores convencionales de los modelos Logit y
debe analizar los créditos en rangos de Probit, ella muestra que usando un condicional
maduración (A,B,C,D,E, siendo A, un buen binomial se obtendrá la siguiente ecuación
pagador, y B,C,D,E pagadores morosos), por lo (14), donde:
tanto, el cambio dirigido para los autores radica
en que la variable Y, puede tener 5 respuestas 𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de
posibles. impago
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
𝑃𝑃𝑖𝑖 = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝑌𝑌𝑖𝑖 = 𝑗𝑗), que es igual a (13): afectan la probabilidad de impago
𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas
𝑒𝑒 (𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑖𝑖2 +⋯+𝛽𝛽𝑘𝑘𝑋𝑋𝑖𝑖𝑖𝑖 ) (13) ̃ 𝜃𝜃̃ = parámetros hallados por máxima
𝛽𝛽,
𝑃𝑃𝑖𝑖 = , 𝑗𝑗
∑𝐽𝐽𝑘𝑘=0 𝑒𝑒 (𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑖𝑖2 +⋯+𝛽𝛽𝑘𝑘𝑋𝑋𝑖𝑖𝑖𝑖 ) verosimilitud
= 0,1,2,3,4

̃ 𝜃𝜃̃) = ∫ Λ( 𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑡𝑡2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑡𝑡𝑡𝑡 )𝑓𝑓(𝛽𝛽𝑖𝑖 |𝛽𝛽,


𝑃𝑃(𝑦𝑦𝑖𝑖 = 1|𝑥𝑥𝑖𝑖 , 𝛽𝛽, ̃ 𝜃𝜃̃ )𝑑𝑑𝛽𝛽𝑖𝑖 , que es igual a:
𝛽𝛽 𝑖𝑖

𝑒𝑒 (𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑖𝑖2 +⋯+𝛽𝛽𝑘𝑘𝑋𝑋𝑖𝑖𝑖𝑖 ) (14)


𝑃𝑃(𝑦𝑦𝑖𝑖 = 1|𝑥𝑥𝑖𝑖 , 𝛽𝛽𝑘𝑘 ) = Λ(𝛼𝛼 + 𝛽𝛽2 𝑋𝑋𝑖𝑖2 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 ) =
∑ 𝑒𝑒 (𝛼𝛼+𝛽𝛽2 𝑋𝑋𝑖𝑖2 +⋯+𝛽𝛽𝑘𝑘 𝑋𝑋𝑖𝑖𝑖𝑖 )

20 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

La diferencia encontrada frente al Logit correctamente los datos; la operación


convencional, es que los modelos permiten matemática se asemeja a una operación lineal
utilizar parámetros simulados, cuando se que identifica los espacios que existen entre los
establece esta simulación, se pone también a datos, son llamados «hiperplanos», que
favor el hecho que los residuos son simulados, muestran la distancia discriminante que hay en
estandarizándolos y creando una mejor respuestas de tipo binomial [0,1]. El factor de
predicción. entrenamiento de los datos sería (15):

Modelos No Paramétricos 𝑦𝑦(𝑥𝑥) = 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠(𝑤𝑤 𝑇𝑇 𝑥𝑥 + 𝑏𝑏) (15)

A diferencia de los modelos paramétricos, los Que identifican dos posibles relaciones de
modelos no paramétricos se estructuran en discriminación (16):
procesos matemáticos que ocultan el proceso
interno y se especifican en las variables de 𝑤𝑤 𝑇𝑇 𝑥𝑥 + 𝑏𝑏 ≥ +1, 𝑠𝑠𝑠𝑠 𝑦𝑦𝑘𝑘 = +1 (16)
{ 𝑇𝑇
entrada y la de salida; son normalmente usados 𝑤𝑤 𝑥𝑥 + 𝑏𝑏 ≤ −1, 𝑠𝑠𝑠𝑠 𝑦𝑦𝑘𝑘 = −1
con procesos de nodos o redes que asemejan
al cerebro, encontrándose: Donde:

 Redes Neuronales (Neuronal networks) 𝑦𝑦𝑘𝑘 = es un valor -1 o 1 que determina la clase a


la que pertenece 𝑥𝑥, siendo este un vector real
Desai, Crook & Overstreet (1996);West de carácter p dimensional.
(2000);Esteve (2007); Pérez & Fernández 𝑤𝑤 = es un vector normal en el hiperplano
(2007) y Soydaner & Kocadağlı (2015), explican
que el uso de las redes neuronales utilizan un Siendo esta una función lineal clásica que
sistema artificial que se asemeja al cerebro tomará el nombre de hiperplano cuya función
humano, y que es capaz de identificar es analizar las distancias de cada punto y se
comportamientos variables de varios bifurca en posiciones de [-1, +1] mostrando la
individuos a la vez dando un resultado de ecuación óptima que sirve para entrenar y
predicción eficiente, su estructura se basa en discriminar la información, proporcionando
neuronas de información que se interconectan una predicción óptima.
y determinan bajo entrenamiento de
información, el resultado más similar a la  Modelos Bayesianos (Naive Models)
realidad. Para su desarrollo es requerido el uso
de un perceptron multicapa, que se estimula Chang, Fung, Lucas, Oliver & Shikaloff (2000),
con ecuaciones que definen una entrada y una Baesens, Castelo & Vanthienen (2002), Mileris
salida y comportamiento de los datos a modo (2010) y Webster (2011) usan modelos de
de entrenamiento; cuando esté totalmente predicción netamente probabilísticos que usan
entrenado es capaz de re direccionar nuevos una función tal que (17):
datos a resultados predecibles.
𝑃𝑃(𝑋𝑋|𝐶𝐶𝑖𝑖 )𝑃𝑃(𝐶𝐶𝑖𝑖 ) (17)
𝑃𝑃(𝐶𝐶𝑖𝑖 |𝑋𝑋) =
 SVM (Support – Vector – Machine) 𝑃𝑃(𝑋𝑋)

Martens et al. (2010); J. F. Moreno & Melo Donde 𝑃𝑃(𝐶𝐶𝑖𝑖 |𝑋𝑋) es la probablidad posterior
(2011) y Zhou, Lai & Yen (2009) identifican un condicionada de 𝐶𝐶𝑖𝑖 en 𝑋𝑋; 𝑃𝑃(𝐶𝐶𝐶𝐶) es la
proceso nacido de las redes neuronales que probabilidad de 𝐶𝐶𝑖𝑖 ; 𝑃𝑃(𝑋𝑋|𝐶𝐶𝑖𝑖 ) es la probabilidad
usa geometría euclidiana para discriminar de X condicionada en 𝐶𝐶𝑖𝑖 ; 𝑃𝑃(𝑋𝑋) es la

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 21
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

probabilidad de 𝑋𝑋; siendo esta una función vectoriales potencializan los procesos de
maximizada para todos los casos de los identificación de las variables eliminando el
clientes, sobre esta función es requerido hacer proceso de sesgamiento de los datos
un entrenamiento de los datos quedando que mostrando una serie de datos normalizada y
(18): eficiente, prometiendo que un uso de cualquier
modelo paramétrico ofrezca la identificación
𝑛𝑛
(18) de un modelo no solo insesgado, también
𝑃𝑃(𝑋𝑋|𝐶𝐶𝑖𝑖 ) = ∏ 𝑃𝑃(𝑥𝑥1 |𝐶𝐶𝑖𝑖 ) ∗ 𝑃𝑃(𝑥𝑥2 |𝐶𝐶𝑖𝑖 ) ∗ … altamente eficiente. Algunos ejemplos son:
𝑘𝑘=1
∗ 𝑃𝑃(𝑥𝑥𝑛𝑛 |𝐶𝐶𝑖𝑖 )
 Maximum score
Esta probabilidad será entonces una función
normalizada para los errores que puedan Bult (1993) hace un comparativo de los
proporcionar. Esta metodología trabaja modelos semi-paramétricos contrastados con
esencialmente como un árbol de decisión, y un modelo paramétrico estándar como lo es el
puede ser amplificada si se tiene una variable modelo Logit; según el autor, la desventaja del
de respuesta (A, B, C, D, E) mostrando una uso de los modelos paramétricos se enfoca en
flexibilidad mayor en su uso. que su estimación no proporciona un dato
robusto por su amplio nivel de supuestos
Modelos Semi-paramétricos (Hybrid Models) implícitos. Los modelos semi-paramétricos en
cambio combinan el proceso de los
Abdou & Pointon (2011); Akkoç (2012); Mileris estimadores con funciones no paramétricas
(2010) y Moreno & Melo (2011) identifican que que identifican una función de probabilidad de
los modelos paramétricos pueden tener densidad normal para los errores. Para ello, la
problemas de especificación a la hora de condición ecuacional será (19):
verificar la eficiencia de los errores de los
modelos; si bien pueden tener errores 1, 𝑠𝑠𝑖𝑖 𝑦𝑦𝑖𝑖 = 𝛽𝛽 ′ 𝑥𝑥𝑖𝑖 + 𝑢𝑢𝑖𝑖 > 0 (19)
normales, pueden no ser del todo eficientes e 𝑦𝑦𝑖𝑖∗ = {
0, 𝑒𝑒𝑒𝑒 𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
insesgados, lo que produce problemas de
especificidad.
Donde 𝑦𝑦𝑖𝑖 es una variable respuesta
Teniendo en cuenta lo anterior, el uso de inobservable y 𝑦𝑦𝑖𝑖∗ es el indicador de respuesta;
modelos que involucren procesos de redes cuando se obtiene dicho valor inobservable, se
neuronales o de análisis genético o someterá a un proceso probabilístico tal que
discriminador por medio de máquinas (20):

𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝑦𝑦𝑖𝑖∗ = 1|𝑥𝑥𝑖𝑖 ) = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝑦𝑦𝑖𝑖 > 0|𝑥𝑥𝑖𝑖 ) = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝛽𝛽′ 𝑥𝑥𝑖𝑖 + 𝑢𝑢𝑖𝑖 > 0|𝑥𝑥𝑖𝑖 ) = 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃(𝑢𝑢𝑖𝑖 > −𝛽𝛽′ 𝑥𝑥𝑖𝑖 |𝑥𝑥𝑖𝑖 ) = 1 − 𝐹𝐹(−𝛽𝛽′ 𝑥𝑥𝑖𝑖 )

𝑆𝑆(𝛽𝛽) = ∑𝑁𝑁 𝑁𝑁 ∗ ′
𝑖𝑖=1 𝑆𝑆𝑖𝑖 (𝛽𝛽) = ∑𝑖𝑖=1 𝑦𝑦𝑖𝑖 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠( 𝛽𝛽 𝑥𝑥𝑖𝑖 ) (20)

𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de 𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas


impago
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago

22 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

 Técnica CHAID (CHi-squared Automatic  Neuronal Network + Logit Models


Interaction Detection)
Sustersic, Mramor & Zupan (2007) presentan
Antipov & Pokryshevskaya (2010), Espin-García un uso sofisticado para los modelos logísticos
& Rodríguez-Caballero (2013) explican en su muy similar al usado en la técnica CHAID,
tesis que los árboles de decisión son usados dando uso de redes neuronales para identificar
para optimizar el proceso que una regresión las variables optimas usando un sistema de PCA
logística o paramétrica no puede contrastar (Análisis de Componentes Principales), acto
fácilmente, y es que los errores presentados en seguido utiliza un proceso de modelos
las regresiones paramétricas presentan fallas logísticos para identificar el modelo
demasiado amplias cuando la base de datos no econométrico que permite estimar el
es eficiente. Los autores manifiestan que el uso discriminador de Credit Score más apropiado.
de árboles de decisión antes de operar los
modelos paramétricos ofrece un uso prudente  Decision trees – CART (Clasification and
de las variables antes de operarlas, Regression Trees) models
evidenciando cuáles serán los parámetros más
eficientes e insesgados antes de cualquier Zhang, Zhou, Leung & Zheng (2010),Baklouti
operación econométrica. (2014); Díaz Sepulveda (2012); Kočenda &
Vojtek (2009) explican que los árboles de
 LS-SVM (Least Squares- Support Vector decisión basados en funciones bayesianas
Machines) pueden ser usados como modelos de
discriminación para el credit score, los árboles
Un uso diferenciado mostrado por Tsai (2008), de decisión se comportan de alguna manera
Zhou et al. (2009) del uso de un modelo similar una red neuronal dirigida, es necesaria
mezclado entre las máquinas de soporte una técnica más sofisticada para no dejar en
vectorial y los modelos lineales, estos procesos paralelo el hecho que los árboles de decisión
primero pueden discriminar la información de solamente por medio de los nodos o variables
los datos por medio de un «kernel», que es un no son capaces de dar un valor único de salida,
centro neurálgico de entrenamiento de los por lo que el uso de regresión lineal es
datos que permite identificar de forma no necesaria en dichos procedimientos (21).
lineal el mejor proceso de discriminación, y
sobre este determinar un modelo lineal que 𝑖𝑖(𝜏𝜏) = 𝜙𝜙({𝑌𝑌 = 1|𝜏𝜏}) (21)
permite la relación matemática para un
pronóstico eficiente de los datos. Si bien estos Donde 𝜏𝜏 es el nodo y 𝜙𝜙 define la probabilidad
modelos no son del todo paramétricos y de éxito del nodo. Para la relación lineal de esta
difíciles en algunos casos de crear, son muy expresión se encuentra entonces (22):
potentes y tienen una aceptabilidad grande al
momento de dar un resultado matemático. (22)
𝑖𝑖(𝜏𝜏) = ∑ (𝑌𝑌𝑖𝑖 − 𝑌𝑌̅(𝜏𝜏))2
𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑖𝑖∈𝜏𝜏

Donde 𝑌𝑌𝑖𝑖 será (23):


𝑝𝑝 𝑝𝑝
(23)
𝑌𝑌 = 𝐹𝐹(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … , 𝑥𝑥𝑝𝑝 ) = 𝛼𝛼 + ∑ 𝛽𝛽𝑘𝑘 𝑥𝑥𝑗𝑗 = 𝛼𝛼 + ∑ 𝛽𝛽𝑘𝑘 𝑔𝑔𝑗𝑗 (𝑥𝑥) = 𝑓𝑓(𝑥𝑥)
𝑗𝑗=1 𝑗𝑗=1

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 23
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

𝑌𝑌𝑖𝑖 = es la respuesta bivariada de riesgo de uso de modelos paramétricos o semi-


impago paramétricos aduciendo su amplia eficiencia.
𝛼𝛼, 𝛽𝛽𝑘𝑘 = son los parámetros de cambio que
afectan la probabilidad de impago Para todos los modelos identificados es una
𝑋𝑋𝑖𝑖𝑖𝑖 = variables cualitativas o cuantitativas premisa el uso de una regresión lineal o función
lineal siendo esta la base de sus análisis, esto se
4. CONCLUSIONES debe que el aspecto de discriminación de la
información en la variable dicotómica 𝑌𝑌𝑖𝑖 ; lo
Para los análisis de credit score en personas cierto es que los modelos se refinan en su uso
naturales se identificaron tres tipos de mejorando la característica lineal a no lineal
metodologías claves, modelos paramétricos, asumiendo que la información y los datos no
no paramétricos y semi-paramétricos, de los son perfectamente lineales ni tampoco son
cuales se destacan en uso y mención los totalmente normales para poder teóricamente
modelos Logit, los modelos LDA, los modelos definir un elemento de simplicidad como tal.
de regresión censurada, los modelos LS-SVM,
SVM, las redes neuronales, los árboles de
decisión CART y los modelos bayesianos. REFERENCIAS

Los modelos pueden ser variados y totalmente Abdou, H. A. & Pointon, J. (2011). Credit
abierto a las necesidades de análisis de las Scoring, Statistical Techniques and
entidades financieras que los requieran; es de Evaluation Criteria: A Review of the
acotar que la amplia variedad de metodologías Literature. Intelligent Systems in
responde a una pregunta obvia de todo Accounting, Finance and Management,
investigador, ¿cuál modelo es más eficiente?, y 18(2–3), 59–88.
la respuesta es evidente, no existe un modelo http://doi.org/10.1002/isaf.325
o un método perfecto de identificación de
credit score por varias situaciones, la primera Akkoç, S. (2012). An empirical comparison of
de ellas es la calidad de los datos y las variables conventional techniques, neural networks
presentadas; la dependencia o el uso de un and the three stage hybrid Adaptive Neuro
modelo dependerá de la calidad de la Fuzzy Inference System (ANFIS) model for
información y sobre que variables se deberán credit scoring analysis: The case of Turkish
trabajar; pero tomando un punto estricto en la credit card data. European Journal of
revisión bibliográfica, el modelo más utilizado Operational Research, 222(1), 168–178.
por los autores es el modelo Logit o Probit, por http://doi.org/10.1016/j.ejor.2012.04.009
su facilidad de interpretación, su facilidad de
manejo en el proceso matemático, y si bien, Altman, E. I. (1968). the Prediction of Corporate
no son los más óptimos si son un referente Bankruptcy. The Journal of Finance,
base para la discriminación de clientes. XXIII(September), 589–609.

Otra es la real necesidad de la medición y está Altman, E. I. (1980). Commercial Bank Lending:
sometida al criterio del investigador, muchos Process, Credit Scoring, And Costs Of Errors
son los consultores que tienen preferencia por In Lending. Journal Of Financial And
la metodología no paramétrica para identificar Quantitave Analysis, XV(4), 813–832.
un modelo óptimo, pero también es de
investigadores ortodoxos de la econometría el Anderson, J. & Narasimhan, R. (1979).
Assessing Project Implementation Risk: A

24 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

Methodological Approach. Management Constangioara, A. (2011). Consumer Credit


Science, 25(6), 512–521. Scoring. Romanian Journal Of Economic
http://doi.org/10.1287/mnsc.25.6.512 Forecasting, 3, 162–178.

Antipov, E. & Pokryshevskaya, E. (2010). Desai, V. S.; Crook, J. N. & Overstreet, G. A.


Applying CHAID for logistic regression (1996). A comparison of neural networks
diagnostics and classification accuracy and linear scoring models in the credit
improvement. Journal of Targeting, union environment. European Journal of
Measurement and Analysis for Marketing, Operational Research, 95(1), 24–37.
18(2), 109–117. http://doi.org/10.1016/0377-
http://doi.org/10.1057/jt.2010.3 2217(95)00246-4
Baesens, B.; Castelo, R. & Vanthienen, J. (2002). Díaz, J. F. (2012). Comparación entré Árboles
Learning Bayesian network classifiers fot de Regresión CART y Regresión Lineal.
credit scoring using Markov Chain Monte Universidad Nacional de Colombia.
Carlo search. Ieee, (2), 2–5.
Elliott, R. J.; Siu, T. K. & Fung, E. S. (2014). A
Baklouti, I. (2014). A Credit Scoring Model for Double HMM approach to Altman Z-scores
Microfinance Bank Based on Fuzzy and credit ratings. Expert Systems with
Classifier Optimized by a Differential Applications, 41(4 PART 2), 1553–1560.
Evolution Algorithm. IUP Journal Of http://doi.org/10.1016/j.eswa.2013.08.05
Financial Risk Management, 11(2), 7–24. 2

Bult, J. R. (1993). Semiparametric versus Espin-García, O. & Rodríguez-Caballero, C. V.


Parametric Classification Models: An (2013). Metodología para un scoring de
Application to Direct Marketing. Journal Of clientes sin referencias crediticias.
Marketing Research, 30(3), 380–390. Cuadernos de Economía, 32(59), 139–164.
http://doi.org/10.1007/978-3-642-21551-
3 Esteve, E. M. (2007). Un modelo de credit
scoring basado en el conocimiento de la
Bumacov, V.; Ashta, A. & Singh, P. (2014). The aplicación de Basilea II y su papel innovador
Use of Credit Scoring in Microfi nance en el sector bancario. Asociación Española
Institutions and Their Outreach. Strategic de Dirección y Economía de la Empresa.
Change, 23(1), 401–413.
http://doi.org/10.1002/jsc Fernandez, H. & Pérez, F. O. (2005). El modelo
Chang, K. C.; Fung, R.; Lucas, A.; Oliver, R. & logístico : una herramienta estadística para
Shikaloff, N. (2000). Bayesian networks evaluar el riesgo de crédito. Revista
applied to credit scoring. IMA Journal of Ingenierias Universidad de Medellín, 4, 55–
Management Mathematics, 11(1), 1–18. 75.
http://doi.org/10.1093/imaman/11.1.1
Fisher, R. A. (1936). The use of multiple
Chaudhuri, K. & Cherical, M. M. (2012). Credit measurements in taxonomic problems.
rationing in rural credit markets of India. Annals of Eugenics, 7(2), 179–188.
Applied Economics, 44(7), 803–812. http://doi.org/10.1111/j.1469-
http://doi.org/10.1080/00036846.2010.52 1809.1936.tb02137.x
4627

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 25
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

García Sánchez, M. & Sánchez, C. (2005). Kočenda, E. & Vojtek, M. (2009). Default
Antecedentes: modelos para estimar el Predictors and Credit Scoring Models for
riesgo de crédito. Riesgo de crédito en Retail Banking. CESIFO WORKING PAPER
México: aplicación del modelo NO. 2862C. Retrieved from www.CESifo-
CreditMetrics. Universidad de las Américas group.org/wp
Puebla.
Kukuk, M. & Rönnberg, M. (2013). Corporate
Gartner, K. & Schiltz, E. (2005). What’s Your credit default models: A mixed logit
Score? Educating College Students About approach. Review of Quantitative Finance
Credit Card Debt. Legal Studies Research and Accounting, 40(3), 467–483.
Paper Series WHAT’S, 24(1), 401–432. http://doi.org/10.1007/s11156-012-0281-
4
Glennon, D.; Kiefer, N. M.; Larson, C. E. & Choi, Lipovetsky, S. & Conklin, M. (2004). Decision
H. (2008). Development and Validation of Making By Variable Contribution in
Credit Scoring Models. Journal of Credit Discriminant, Logit, and Regression
Risk, Forthcoming, 1(1), 1–70. Retrieved Analyses. International Journal of
from Information Technology & Decision
http://papers.ssrn.com/abstract=1180302 Making, 3(2), 265–279.
http://doi.org/10.1142/S02196220040010
Glorfeld, L. W. (1990). A Robust Methodology 33
for Discriminant Analysis Based on Least-
absolute-value Estimation. Managerial and Majer, I. (2006). Application scoring: logit
Desicion Economics, 11(1), 267–277. model approach and the divergence
method compared (06 No. 10). Warsaw.
Gonçalves, R. M. L. & Braga, M. J. (2008).
Determinantes de risco de liquidez em Martens, D.; Van Gestel, T.; De Backer, M.;
cooperativas de crédito: uma abordagem a Haesen, R.; Vanthienen, J. & Baesens, B.
partir do modelo logit multinomial. Revista (2010). Credit rating prediction using Ant
de Administração Contemporânea, 12(4), Colony Optimization. Journal of the
1019–1041. Operational Research Society, 61(4), 561–
http://doi.org/10.1590/S1415- 573. http://doi.org/10.1057/jors.2008.164
65552008000400007
Melo, L. F. & Granados, J. C. (2011). Regulación
Gujarati, D. (2004). Econometría (4ta Edició). y valor en riesgo. Ensayos Sobre Política
McGraw-Hill Interamericana. Retrieved Economica, 29(64), 110–177.
from
https://books.google.es/books?id=8RttQg Mileris, R. (2010). Estimation of loan applicants
AACAAJ default probability applying discriminant
analysis and simple Bayesian classifier.
Gutiérrez, M. A. (2007). Modelos de Credit Economics and Management, 15(1), 1078–
Scoring - Qué, Cómo, Cuándo y Para Qué. 1084. Retrieved from
http://www.ktu.lt/lt/mokslas/zurnalai/eko
Hardy, W. E. & John, I. (1985). A Linear vad/15/1822-6515-2010-1078.pdf
Programming Alternative to Discriminant
Analysis in Credit Scoring. Agribussiness, Moreno, J. F. & Melo, L. F. (2011). Pronóstico
I(4), 285–292. de incumplimientos de pago mediante

26 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28
David Esteban Rodríguez-Guevara / Jairo Alfonso Becerra-Arévalo / Daniel Cardona-Valencia

máquinas de vectores de soporte: una http://eds.b.ebscohost.com/eds/detail?vid


aproximación inicial a la gestión del riesgo =2&sid=a4134bcc-0c4d-42d1-b74e-
de crédito. Boletín de Prensa DANE, 677, 1– 04f1be482687@sessionmgr112&hid=115
33. &bdata=Jmxhbmc9ZXMmc2l0ZT1lZHMtbG
l2ZQ==#db=bth&AN=51381543
Moreno, S. (2013). El Modelo Logit Mixto para
la construcción de un Scoring de Crédito. Rodriguez, D. & Trespalacios, A. (2015).
Universidad Nacional de Colombia. Medición de valor en riesgo en cartera de
clientes a través de modelos logísticos y
Mures, J.; García, A. & Vallejo, E. (2011). simulación de Montecarlo.
Aplicación del análisis discriminate y
regresión logística en el estudio de la Roszbach, K. (2004). Bank Lending Policy,
morosidad en las entidades financieras Credit Scoring, and the Survival of Loans.
comparación de resultados. Revista de La Review of Economics and Statistics, 86(4),
Facultad de Ciencias Económicas Y 946–958.
Empresariales, 1, 175–199. Retrieved from http://doi.org/10.1162/003465304312524
http://search.proquest.com/docview/818 8
448211?accountid=10344
Saavedra-García, M. L. & Saavedra-García, M. J.
Olagunji, F. & Ajiboye, A. (2010). Agricultural (2010). Modelos para medir el riesgo de
lending decision: a tobit regression crédito de la banca *. Cuadernos de
analysis. African Journal of Food Administración, 23(40), 295–319.
Agriculture, Nutrition and Development, Retrieved from
10(5), 1–27. http://www.scielo.org.co/scielo.php?script
http://doi.org/10.4314/ajfand.v10i5.57897 =sci_arttext&pid=S0120-
35922010000100013&lang=pt
Palacio, A. P.; Lochmúller, C.; Murillo, J. G.;
Pérez, M. A. & Vélez, C. A. (2011). Modelo Santos, J. O. & Famá, R. (2007). Avaliação da
cualitativo para la asignación de créditos de aplicabilidade de um modelo de credit
consumo y ordinario - el caso de una scoring com varíaveis sistêmicas e não-
cooperativa de crédito. Revista Ingenierias sistêmicas em carteiras de crédito bancário
Universidad de Medellín, 10(19), 89–100. rotativo de pessoas físicas. Revista
Pérez, F. O. & Fernández, H. (2007). Las redes Contabilidade & Finanças, 18, 105–117.
neuronales y la evaluación del riesgo de http://doi.org/10.1590/S15197077200700
crédito. Revista Ingenierías, 6(10), 77–91. 0200009

Puertas, R. & Marti, M. L. (2012). Análisis Del Soydaner, D. & Kocadağlı, O. (2015). Artificial
Credit Scoring. Revista Administración de Neural Networks with Gradient Learning
Empresas, 53(3), 303–315. Algorithm for Credit Scoring. Journal of the
School of Bussiness Administration, 44(2),
Rayo, S.; Lara, J. & Camino, D. (2010). Un 3–12.
modelo de credit scoring para instituciones
de microfinanzas en el marco de Basile II. Sustersic, M.; Mramor, D. & Zupan, J. (2007).
Journal of Economics, Finance & Consumer credit scoring models with
Administrative Science., 15(28), 89–124. limited data. Ljubljana Meetings Paper,
Retrieved from 1(1),1–21.

Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28 27
Modelos y metodologías de credit score para personas naturales: una revisión Literaria

http://doi.org/10.1016/j.eswa.2008.06.01 Webster, G. (2011). Bayesian Logistic


6 Regression Models for Credit Scoring.
Rhodes University.
Támara, A. L.; Aristizábal, R. E. & Velásquez, H.
(2010). estimación de las provisiones West, D. (2000). Neural network credit scoring
esperadas en una institución financiera models. Computers and Operations
utilizando modelos Logit. Revista Ciencias Research, 27(11–12), 1131–1152.
Estratégicas, 18(24), 259–270. http://doi.org/10.1016/S0305-
0548(99)00149-5
Tan, A. K. G.; Yen, S. T. & Loke, Y. J. (2011).
Credit card holders, convenience users and Zhang, D.; Zhou, X.; Leung, S. C. H. & Zheng, J.
revolvers: A tobit model with binary (2010). Vertical bagging decision trees
selection and ordinal treatment. Journal of model for credit scoring. Expert Systems
Applied Economics, 14(2), 225–255. with Applications, 37(12), 7838–7843.
http://doi.org/10.1016/S1514- http://doi.org/10.1016/j.eswa.2010.04.0
0326(11)60013-5 54

Thomas, L.; Edelman, D. & Crook, J. (2002). Zhou, L.; Lai, K. K. & Yen, J. (2009). Credit
Credit scoring and its applications. Scoring Models With Auc Maximization
Based on Weighted Svm. International
Tsai, C. F. (2008). Financial decision support Journal of Information Technology &
using neural networks and support vector Decision Making, 8(4), 677–696.
machines. Expert Systems, 25(4), 380–393. http://doi.org/10.1142/S0219622009003
http://doi.org/10.1111/j.1468- 582
0394.2008.00449.x

28 Revista CEA, ISSN –p 2390-0725, ISSN –e 2422-3182, Vol.3 – No. 5, enero-junio 2017 pp. 13-28

You might also like