modelo de scoring
DESCRIPTION
scoringTRANSCRIPT
-
UNIVERSIDAD TECNOLGICA EQUINOCCIAL
FACULTAD DE CIENCIAS DE LA INGENIERA
CARRERA DE INFORMTICA Y CIENCIAS DE LA COMPUTACIN
TEMA:
DISEO DEL SISTEMA DE INDICADOR FINANCIERO BASADO EN EL
SCORING DE COBRANZAS; PARA USO EMPRESARIAL, 2009
TESIS
PREVIA LA OBTENCIN DEL TTULO DE INGENIERO EN INFORMTICA Y
CIENCAS DE LA COMPUTACIN
AUTOR:
JOFFRE DANIEL FLORES ESCOBAR
DIRECTOR DE TESIS:
MAT. MAURICIO GARCIA
QUITO ECUADOR
2010
-
III
Del contenido del presente trabajo se responsabiliza el autor
______________________
Daniel Flores Escobar
-
V
DEDICATORIA
Dedico este trabajo a mi madre por estar siempre a mi lado y quien me supo
dedicar todo su esfuerzo para que sea un profesional, adems de orientarme
e inculcarme principios para luchar en este duro camino.
A mis hermanos Diego y Diana quienes han sido los pilares de mi vida y la
fuerza para nunca dejarse vencer y siempre luchar hasta culminar cada meta
impuesta.
Daniel Flores
-
VI
AGRADECIMIENTO
Agradezco a Dios por permitirme alcanzar esta meta y ser mi luz capaz de
iluminar todo momento sombro.
A mi madre y hermanos quienes me dieron su apoyo, gua y comprensin sin
condicin ni medida.
A mis abuelitos Jorge y Rosita por estar a mi lado y ser un ejemplo de lucha
y sacrificio
Quiero agradecer a la Universidad Tecnolgica Equinoccial por los
conocimientos impartidos en sus aulas a travs de sus maestro y en especial
al director de este proyecto Mat. Mauricio Garca por su gua y aportes en
este trabajo.
Y a todos los que no recuerdo pero que ayudaron a que pueda culminar esta
meta.
-
VII
NDICE GENERAL
DEDICATORIA ........................................................................................................ V
AGRADECIMIENTO .............................................................................................. VI
NDICE GENERAL ............................................................................................... VII
NDICE DE CONTENIDOS ................................................................................. VIII
NDICE DE ILUSTRACIONES .............................................................................. XI
NDICE DE ECUACIONES .................................................................................. XII
NDICE DE TABLAS ............................................................................................ XIII
RESUMEN ............................................................................................................. XIV
SUMMARY ............................................................................................................ XVI
CAPTULO I .............................................................................................................. 1
CAPTULO II ........................................................................................................... 14
CAPTULO III ......................................................................................................... 34
CAPTULO IV .......................................................................................................... 57
CAPTULO V ........................................................................................................... 75
BIBLIOGRAFA ...................................................................................................... 78
ANEXOS ................................................................................................................... 80
-
VIII
NDICE DE CONTENIDOS
CAPTULO I .............................................................................................................. 1
1. INTRODUCCIN .................................................................................................. 1
1.1 PROBLEMA A RESOLVER .......................................................................... 1
1.2 MARCO TERICO ....................................................................................... 2
1.3 JUSTIFICACIN ......................................................................................... 11
1.4 OBJETIVOS ................................................................................................. 12
1.4.1 Objetivo General ................................................................................... 12
1.4.2 Objetivos Especficos ............................................................................ 12
1.5 HIPTESIS .................................................................................................. 13
1.6 ALCANCE ................................................................................................... 13
CAPTULO II ........................................................................................................... 14
2. CREDIT SCORING ............................................................................................. 14
2.1 CONCEPTOS ............................................................................................... 14
2.2 MTODOS EMPLEADOS EN LA CONSTRUCCIN DE SCORE DE
CREDITOS ............................................................................................................. 21
2.3 REGRESION LOGSTICA .......................................................................... 23
CAPTULO III ......................................................................................................... 34
3. METODOLOGA ................................................................................................. 34
3.1 MODELAMIENTO ...................................................................................... 34
3.1.1 Seleccin de la muestra .......................................................................... 35
3.1.2 Definicin de buenos y malos clientes ................................................... 40
3.1.3 Definicin y seleccin de datos .............................................................. 41
-
IX
3.1.4 Anlisis preliminar de la Muestra ........................................................... 48
3.1.5 Anlisis Multivariado ............................................................................ 50
3.1.6 Diseo del Score Card ........................................................................... 53
3.1.7 Validacin del Modelo ........................................................................... 56
CAPTULO IV .......................................................................................................... 57
4. DESARROLLO .................................................................................................... 57
4.1 DISEO Y DESARROLLO ........................................................................ 57
4.2 HERRAMIENTAS DE DESARROLLO....................................................... 58
4.2.1 Microsoft .Net ....................................................................................... 58
4.2.2 SQL Server 2005 ................................................................................... 60
4.2.3 SPSS...................................................................................................... 61
4.3 DISEO DEL SISTEMA ............................................................................. 62
4.3.1 Web Service .......................................................................................... 62
4.3.2 Modelado del Sistema ............................................................................ 64
4.3.3 Casos de Uso ......................................................................................... 65
4.4 Creacin del Web Service ............................................................................. 66
4.5 Probador Web Service .................................................................................. 70
CAPTULO V ........................................................................................................... 75
5. CONCLUSIONES Y RECOMENDACIONES ................................................... 75
5.1 CONCLUSIONES ............................................................................................ 75
5.2 RECOMENDACIONES ................................................................................... 76
BIBLIOGRAFA ...................................................................................................... 78
-
X
ANEXOS ................................................................................................................... 80
1. ANEXO 1............................................................................................................... 80
2. ANEXO 2............................................................................................................... 84
3. ANEXO 3............................................................................................................... 93
4. ANEXO 4............................................................................................................. 100
-
XI
NDICE DE ILUSTRACIONES
Ilustracin 1. Ejemplo de Transformacin ................................................................... 10
Ilustracin 2. Concepto de Score ................................................................................. 16
Ilustracin 3. Tcnicas Para el Desarrollo Scoring Crediticio ...................................... 22
Ilustracin 4. Grfico Funcin Logstica ..................................................................... 25
Ilustracin 5. Grfico de Dispersin ............................................................................ 31
Ilustracin 6. Grfica Resultado Ejemplo Regresin Logstica .................................... 33
Ilustracin 7. Esquema de Seleccin de la Muestra ..................................................... 39
Ilustracin 8. Distribucin de los Sujetos por Rangos de Edad .................................... 48
Ilustracin 9. Transformacin de una variable ............................................................. 49
Ilustracin 10. Diseo del Score Card Cgido Sql ....................................................... 54
Ilustracin 11. Caractersticas Herramientas .Net ........................................................ 59
Ilustracin 12. Sql Server 2005 ................................................................................... 60
Ilustracin 13. Funcionamiento de un Web Service ..................................................... 63
Ilustracin 14. Caso de Uso ......................................................................................... 66
Ilustracin 15. Cdigo .Net Creacin del Web Service ................................................ 67
Ilustracin 16. Creacin Referencia Web .................................................................... 68
Ilustracin 17. Busqueda del Servicio Web ................................................................. 69
Ilustracin 18. Seleccin del Web Seervice ................................................................. 70
Ilustracin 19. Codigo .Net Creacin del Probador Web Service ................................. 71
Ilustracin 20. Pantalla Probador Web Service ............................................................ 73
-
XII
NDICE DE ECUACIONES
Ecuacin 1. Regresin Logstica ................................................................................... 8
Ecuacin 2. Modelo General ....................................................................................... 25
Ecuacin 3. Funcin Lineal con Parmetros ................................................................ 26
Ecuacin 4. Funcin Logstica .................................................................................... 27
-
XIII
NDICE DE TABLAS
Tabla 1. Ventajas y Desventajas del Scoring Crediticio ............................................... 19
Tabla 2. Nmero Registros por primeros y ltimos dgitos de la Cedula ..................... 37
Tabla 3. Periodo Morosidad en Meses ......................................................................... 44
Tabla 4. Parametrizacin Scoring Crediticio ............................................................... 74
-
XIV
RESUMEN
Este trabajo se ha planteado optimizar y reducir los errores en los anlisis de crditos,
mediante la creacin de una herramienta de evaluacin crediticia (Scoring Crediticio) de
otorgamiento til para la toma de decisiones, disminuyendo el riesgo en funcin del
historial de crdito de una persona.
En el marco de este estudio y en el transcurso de los captulos se ha realizado una
revisin y descripcin del contenido de la investigacin para la solucin del problema
planteado para cual fue objeto este tema de tesis.
Es as que reconociendo las caractersticas y particularidades de los datos obtenidos; as
como el resultado que se desea obtener que esta demarcado en clasificar a un sujeto de
acuerdo a su riesgo crediticio para definirlo apto o no para ser sujeto de crdito, se ha
escogido la funcin de regresin logstica para la obtencin del modelo que mejor se
ajusta a las caractersticas de los datos que se posee.
Tambin que se genero una herramienta Web Service con la finalidad de que cualquier
institucin o persona que desee consultar el score de un sujeto, pueda acceder a la
misma sin importar la plataforma ni las herramientas que posea siendo esta una
herramienta flexible con el fin de independizar la arquitectura de una aplicacin
concreta, lgicamente, dentro de ciertas restricciones, impuestas por la naturaleza de los
sistemas de informacin o sistemas de control automticos.
-
XV
Adems el score se convierte en una herramienta que asume una probabilidad de
incumplimiento, tomando en cuenta las similitudes presentadas entre los datos
histricos con el fin de discriminar de una manera tcnica el otorgamiento de un crdito.
Este proyecto parte fundamentalmente de la base de datos la cual debe cumplir con la
caracterstica de robustez y confiabilidad ya que para la obtencin del score y para que
el mismo sea predictivo se necesita de una gran cantidad de datos los cuales juegan un
papel muy importante para el clculo del mismo y adems que los datos sean correctos,
pero a su ves la muestra de datos obtenidos es pequea pero que tiene todas las
caractersticas fundamentales para el modelamiento del score.
-
XVI
SUMMARY
This work is to optimize and reduce errors in credit analysis, by creating a credit
assessment tool (Credit Scoring) granting useful for decision making, reducing the risk
based on credit history of a person.
As part of this study and in the course of the chapters make a review and description of
the research content for the solution of the problem which was the subject for this thesis
topic.
Which also generated a Web Service tool for the purpose of any institution or person
you want to see the score of a person, can access it regardless of platform or tools
having this being a flexible tool to wean the architecture of a particular application, of
course, within certain restrictions imposed by the nature of information systems and
automatic control systems.
In addition, the score becomes a tool that assumes a probability of default, taking into
account similarities between the historical data presented to discriminate in a technical
way the granting of credit.
This project is mainly from the database which must comply with the property of
robustness and reliability as to obtain the score and that it needed to be predictive of a
large amount of data which play an important role in the calculation thereof and further
-
XVII
that the information is correct, but your see the sample data is small but has all the basic
features for modeling of the score.
-
CAPTULO I
-
1
CAPTULO I
1. INTRODUCCIN
En este captulo se presenta los objetivos principales del trabajo y su justificacin, as
como la descripcin resumida del contenido de la tesis.
1.1 PROBLEMA A RESOLVER
La gran mayora de los prstamos que a diario conceden las entidades financieras
podran ser otorgados mediante tcnicas de clasificacin, que en base a caractersticas
propias del cliente, determinen la probabilidad de que en un futuro este pueda hacer
frente a sus obligaciones de pago. Permitiendo clasificarle en dos grupos: el integrado
por individuos con una elevada probabilidad de devolver el crdito y el de aquellos
individuos que, previsiblemente, no harn frente a sus compromisos crediticios.
As de esta manera, mediante la utilizacin de modelos de scoring para la evaluacin
del riesgo de crdito, se puede determinar la probabilidad de que una persona incurra en
mora o clasificarle como un sujeto apto para acceder a un crdito.
-
2
1.2 MARCO TERICO
Un banco es un tipo muy especial de empresa, que capta dinero del pblico, lo presta
conjuntamente con recursos propios de la entidad a terceros, quienes pagan intereses por
el uso de ese dinero. As, usualmente, los recursos con los que un banco genera sus
ingresos son, en parte propios (patrimonio o capital), y mayoritariamente ajenos
(depsitos del pblico). Por ello, dado que la mayora del dinero que un banco
administra no le pertenece, la gestin bancaria requiere un proceso constante de
evaluacin y medicin de los riesgos a los que se exponen los recursos de los
depositantes en las operaciones de la entidad. Estos riesgos, en conjunto, se llaman
Riesgo Bancario y su administracin suele ser regulada por la Superintendencia de
Bancos y Seguros (SBS) en el Ecuador y sus pares en todo el mundo.
Para regular el riesgo la SBS se crearon varias leyes entre las cuales tenemos la Ley
General de Instituciones de Sistema Financiero que dice en el Ttulo IV del Patrimonio
Captulo I Capital y Reservas, en el artculo 47 de esta ley en la que se indica: Con el
objeto de preservar su solvencia, las instituciones del sistema financiero debern
mantener, en todo tiempo, el conjunto de relaciones tcnicas que establezca la Junta
Bancaria mediante resolucin de carcter general, siguiendo los estndares
internacionales, especialmente los establecidos por el Comit de Basilea1.
1 El acuerdo de Basilea consta de 25 principios que representan los requerimientos mnimos que deben ser implementados por las
autoridades bancarias para lograr un sistema de supervisin bancaria efectiva.
-
3
Entre los acuerdos del Comit de Basilea se encuentran dos principios fundamentales en
los cuales se basa la creacin y uso de los datos de las instituciones financieras en una
base de datos llamada Central de Riesgo los cuales son:
Principio 15. Los supervisores bancarios deben determinar que los bancos tengan
polticas, prcticas y procedimientos adecuados, que incluyan la estricta regla de
CONOCE A TU CLIENTE, lo cual promueve altos estndares de tica y
profesionalismo en el sector financiero. Estas medidas previenen que los bancos sean
utilizados por elementos criminales, en una forma voluntaria o involuntaria.
Principio 21. Los supervisores bancarios deben de asegurarse que cada banco mantenga
registros adecuados, diseados de manera que concuerden con polticas contables
consistentes, con prcticas que permitan al supervisor obtener una visin verdadera y
precisa de la condicin financiera del banco y de la rentabilidad de sus negocios y que el
banco haga publicaciones regulares del estado financiero, que reflejen realmente su
condicin.
Y es por eso que la Superintendencia de Bancos y Seguros del Ecuador en una de sus
normativas emitidas en marzo del 2008 para la conformacin de la Central de Riesgos
solicita a todos los Buros de Crdito, que los mismos debern reportar la informacin
crediticia de los clientes sobre la base de modelos estadsticos predictivos y no sobre la
informacin en bruto que reportan las instituciones bancarias de los clientes.
-
4
Los comienzos del Credit Scoring se remontan del ao 1936 cuando Fisher, introduce
el concepto de discriminar objetos dentro de una poblacin especfica.
Esta idea fue desarrollada ms ampliamente por Durand en 1941 donde fue aplicada en
un contexto financiero para discriminar entre un Buen y un Mal pagador.
Uno de los modelos estadsticos predictivos denominado scoring crediticio fue
inventado por dos matemticos de Stanford, Bill Fair y Earl Isaac, quienes observaron
que los acreedores no buscaban el historial de crdito, sino un pronstico de aptitud de
crdito del individuo. Con el desarrollo de un sistema analtico que hoy en da se conoce
como el FICO Score (Fair Isaac Corporation Score) una de las herramientas ms usadas
a nivel mundial en relacin al anlisis de riesgo de crditos.
La utilizacin de modelos de credit scoring para la evaluacin del riesgo de crdito, y
ordenar a los deudores y solicitantes de financiamiento en funcin de su riesgo de
incumplimiento, comenz en los 70s pero se generaliz a partir de los 90s. Esto se ha
debido tanto al desarrollo de mejores recursos estadsticos y computacionales, como por
la creciente necesidad por parte de las instituciones bancarias de hacer ms eficaz y
eficiente la originacin de financiaciones, y de tener una mejor evaluacin del riesgo de
su portafolio.
El scoring crediticio se refiere al uso de conocimiento sobre el desempeo y
caractersticas de prstamos en el pasado para pronosticar el desempeo de prstamos
en el futuro. As, cuando un analista de crdito valora el riesgo comparando
-
5
mentalmente una solicitud de crdito en el presente con la experiencia que este mismo
analista ha acumulado con otros clientes con solicitudes parecidas, est aplicando
scoring, aunque sea un scoring implcito y subjetivo. De igual manera, cuando un micro
prestamista adopta una poltica de no renovar prstamos a clientes que han tenido
atrasos mayores a 30 das en su prstamo anterior, est aplicando scoring, aunque sea un
scoring simple y unidimensional. Por eso, aunque el nombre scoring puede sonar nuevo,
es una prctica antigua.
Los mtodos o modelos de credit scoring, a veces denominados score-cards o
classifiers, son algoritmos que de manera automtica evalan el riesgo de crdito de un
solicitante de financiamiento o de alguien que ya es cliente de una entidad crediticia.
Tienen una dimensin individual, ya que se enfocan en el riesgo de incumplimiento del
individuo o empresa, independientemente de lo que ocurra con el resto de la cartera de
prstamos
En una primera aproximacin a los mismos, se los puede definir como mtodos
estadsticos utilizados para clasificar a los solicitantes de crdito, o incluso a quienes ya
son clientes de una entidad evaluadora, entre las clases de riesgo bueno y malo2.
Aunque originalmente en los 70s se basaban en tcnicas estadsticas (en particular, el
anlisis discriminante), en la actualidad tambin estn basados en tcnicas matemticas,
economtricas y de inteligencia artificial. En cualquier caso, los modelos de credit
2 Hand, D.J. y W.E. Henley. (1997) Statistical Classification Methods in Consumer Credit Scoring: A Review, Journal of the Royal Statistical Association Series A, Vol. 160, No. 3, pp. 523-41.
.
-
6
scoring emplean principalmente la informacin del evaluado contenida en las
solicitudes de crdito y/o en fuentes internas y/o externas de informacin.
El resultado de la evaluacin se refleja en la asignacin de alguna medida que permita
comparar y ordenar a los evaluados en funcin de su riesgo, a la vez cuantifica. Por lo
general, los modelos de credit scoring le asignan al evaluado un puntaje o score, o una
calificacin o rating. Algunos mtodos los asignan a grupos, en donde cada grupo tiene
un perfil de riesgo distinto; sin embargo, en la prctica esto equivale a una calificacin.
A su vez, estos ordenamientos de los deudores permiten obtener estimaciones ms
concretas del riesgo; en general se busca obtener alguna estimacin de la probabilidad
de incumplimiento del deudor (PD, por probabilidad de default) asociada a su score,
rating o calificacin.
Esta estimacin se puede obtener directamente del score en el caso de los modelos
economtricos, o tambin en funcin de la tasa de incumplimiento (TD, por tasa de
default) histrica observada en el grupo de deudores con la misma calificacin o score
similar.
La utilizacin de modelos de credit scoring para la evaluacin del riesgo de crdito, es
decir, para estimar probabilidades de default y ordenar a los deudores y solicitantes de
financiamiento en funcin de su riesgo de incumplimiento, comenz en los 70s pero se
generaliz a partir de los 90s. Esto se ha debido tanto al desarrollo de mejores recursos
estadsticos y computacionales, como por la creciente necesidad por parte de la industria
bancaria de hacer ms eficaz y eficiente la originacin de financiaciones, y de tener una
-
7
mejor evaluacin del riesgo de su portafolio. Estos modelos generalmente se asocian a
lo que se ha dado en llamar data mining (minera de datos), que son todos aquellos
procedimientos que permiten extraer informacin til y encontrar patrones de
comportamiento de los datos.
Para evaluar el riesgo crediticio o la conveniencia de otorgar un crdito, hay una gran
variedad de metodologas disponibles: anlisis discriminante, regresin lineal, regresin
logstica, modelos probit, modelos logit, mtodos no paramtricos de suavizado,
mtodos de programacin matemtica, modelos basados en cadenas de Markov,
algoritmos de particionamiento recursivo (rboles de decisin), sistemas expertos,
algoritmos genticos, redes neuronales y, finalmente, el juicio humano, es decir, la
decisin de un analista acerca de otorgar un crdito. Aunque esta ltima presenta la
ventaja de ser ms eficaz en tratar las excepciones a la experiencia pasada, los mtodos
de credit scoring son ms eficientes a la vez que sus predicciones ms objetivas y
consistentes, por lo que pueden analizar y tomar decisiones sobre una gran cantidad de
solicitudes de crdito en poco tiempo y a un bajo costo
Dada la relevancia en el proceso de gestin crediticia, un punto fundamental de este
proyecto es determinar una variable dependiente (bueno/malo), para lo cual se
estableci que el modelo estadstico de regresin logstica es el ms apropiado para el
desarrollo de este proyecto.
Adems se estableci que la regresin lineal no tiene el sustento terico apropiado para
la construccin de modelos con una variable dependiente binaria (por ejemplo, bueno o
-
8
malo). El trmino de error en una regresin lineal se asume normalmente distribuido, y
este supuesto es violado cuando la variable dependiente slo puede tomar dos valores.
Adems, la regresin lineal puede crear probabilidades estimadas mayores que uno y
menores que cero.
As se identific que lo ms apropiado para el desarrollo de este proyecto es el modelo
de regresin logstica ya que es una tcnica que sirve para modelar la relacin entre la
variable dependiente binaria y las variables independientes. Es una forma de modelo
lineal generalizado (GLM) y est dado por la frmula:
logit(pi) = log(pi/(1 pi))=0 + 1x1i + + kxki
Fuente: Anlisis de datos multivariantes Elaborado por: Daniel Flores
Donde pi es la probabilidad de que una observacin tome un valor particular, y los i
son los parmetros asociados con cada variable independiente. El modelo resultante de
la regresin logstica utiliza las variables independientes para predecir la probabilidad
de que la variable dependiente tome un valor particular. Este modelo no se basa en el
supuesto estadstico de que el trmino de error est distribuido normalmente ni en el
supuesto de homoscedasticidad es decir que los diferentes grupos obtenidos presenten la
misma varianza o dispersin (las poblaciones de Y correspondientes a diversos valores
de X tienen la misma varianza. Si se cumple, todos los valores de Y que corresponden a
Ecuacin 1. Regresin Logstica
-
9
diversos valores de X sern igual de confiables cercana o alejamiento con el cual estn
distribuidos los valores de Y alrededor de sus medias. Todos los valores de Y
correspondientes a diversos valores de X son igualmente importantes), y produce
probabilidades estimadas entre 0 y 1, las que sern asociadas a un score.
De acuerdo a lo explicado en la metodologa de regresin logstica, un paso importante
en el proceso de desarrollo es determinar que variables independientes tienen una fuerte
relacin lineal con la funcin logit de la variable dependiente, es decir la funcin logit
ser utilizada para predecir el resultado binario, por ejemplo bueno / malo a sabiendas
que existen diferentes factores que pueden inferir en el resultado. Esta funcin logit es
un tipo de regresin en donde la variable dependiente es una variable dummy ejemplo 0
buen cliente 1 mal cliente.
En algunos casos una variable puede tener una fuerte asociacin con la funcin logit de
la variable dependiente, sin que esta relacin sea lineal. Como resultado, esta relacin
puede no ser detectada o puede producir resultados no esperados. Transformar la
variable puede servir para detectar la relacin no lineal que de otra manera se perdera, o
para fortalecer dicha relacin. Tpicas transformaciones de variables incluyen la raz
cuadrada, el cuadrado, el binario (indicador), el logaritmo y el inverso. Por ejemplo, la
Ilustracin 1(a) indica una relacin no-lineal entre la Variable 1 y la variable
dependiente. Sin embargo, despus de aplicar la transformacin de raz cuadrada,
mostrada en la Ilustracin 1(b), la relacin no lineal se convierte en lineal.
-
10
Ilustracin 1. Ejemplo de Transformacin
Para este modelo, se emplear metodologas estndares y anlisis de distribuciones para
hacer lo siguiente:
a. Determinar la necesidad de transformacin para cada variable independiente;
b. Determinar la transformacin ptima para cada variable; y
c. Considerar la inclusin de las variables transformados en el desarrollo de los
modelos.
Este proceso asegurar que cada variable sea representada apropiadamente.
Es as que mediante esta tcnica se lograr clasificar a los individuos dentro de las
categoras (bueno/malo) de la variable dependiente, segn la probabilidad que tenga de
pertenecer a una de ellas dada la presencia de determinadas variables.
Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores
A
Variable 1
B
Raz cuadrada de Variable 1
Variable Dependiente
Variable Dependiente
-
11
1.3 JUSTIFICACIN
El sistema financiero desempea un papel crucial en el desarrollo de un pas, que afecta
tanto a la adecuada asignacin de recursos en el tiempo como a la correcta valoracin
del riesgo. En los ltimos aos, la globalizacin de la economa de mercado ha
disminuido la estabilidad y seguridad del negocio financiero, multiplicando los riesgos a
los que se enfrentan estas entidades, entre ellos el riesgo de crdito, o posibilidad de que
no se produzca la devolucin puntual de una determinada cantidad de dinero que se
prest en el pasado.
Por eso se ha visto la necesidad de disear una aplicacin, la cual ayudar a tener una
correcta toma de decisiones con la mayor efectividad posible, basados en un sistema de
Scoring de Cobranzas, ya que en el Ecuador las Instituciones Financieras y, Pequeas y
Medinas Empresas PYMES, en los ltimos tiempos viene enfrentndose a la
problemtica de la morosidad, que se situ en el 5.8%3 de los sujetos de crdito en el
Ecuador, en el ao 2008.
En donde este diseo de scoring basado en informacin historial crediticia como
montos que debe a una institucin financiera, el tiempo de endeudamiento, morosidad,
el nmero de crditos recibidos, etc. de un determinado sujeto, sern evaluados
permitiendo agilizar el proceso de cobro en una empresa asignando una puntuacin de
forma consistente, determinado las probabilidades de que el sujeto incurra en mora.
3 Fuente: CreditReport Buro de Informacin Crediticia
-
12
1.4 OBJETIVOS
1.4.1 Objetivo General
Disear un modelo de Scoring, utilizando un conjunto de indicadores
financieros histricos de la Central de Riesgo, categorizando a los clientes en
base a su propensin para hacer un adecuado manejo de los mismos.
1.4.2 Objetivos Especficos
Presentar un modelo de score que permita identificar a un cliente con la
tipologa de riesgoso, para evitar perdidas en un crdito asignado.
Analizar de forma automtica las caractersticas y/o condiciones que un
cliente posee para catalogarse como riesgoso.
Definir un mecanismo analtico - matemtico que constituya de una forma
rpida, confiable, exacta y consistente para predecir el riesgo de un solicitante
para cumplir con sus deudas en el futuro, es decir minimiza el riesgo de
cobranzas.
-
13
1.5 HIPTESIS
Demostrar que este sistema de scoring permitir o no determinar si una
persona es sujeto de crdito.
Identificar aquellos clientes que tienen la tipologa de clientes riesgosos para
evitar cualquier tipo de fraude en el crdito asignado.
1.6 ALCANCE
Este sistema generar un valor numrico estadsticamente validado en base a anlisis
descriptivos que permita agilizar la toma de decisiones a la vez que busca reducir el
nivel de prdidas ya que se asigna puntuaciones de forma consistente, determinando las
probabilidades de que una solicitud se convierta en una cuenta con buen
comportamiento para predecir la recuperacin del crdito.
El sistema se basar en frmulas de evaluacin de las caractersticas relevantes que se
obtendr de la informacin historial crediticia para predecir la recuperacin del crdito.
A cada caracterstica se le asigna un valor numrico estadsticamente validado que
permita obtener un puntaje mediante el cual se pondr ms afn en la cobranza de una
deuda a un cliente.
-
CAPTULO II
-
14
CAPTULO II
2. CREDIT SCORING
En este captulo se tratar sobre las definiciones del score crediticio, los mtodos
empleados para la construccin y sobre la regresin logstica que es el mtodo
seleccionado para el desarrollo de este proyecto.
2.1 CONCEPTOS
Los modelos de scoring crediticio nacen alrededor de los aos 1950s cuando Bill Fair y
Earl Isaac fundan su compaa dedicada a apoyar las actividades de importantes
empresas financieras y de ventas al menudeo. Posteriormente, en los aos 1960s se
inicia el periodo en el que se desarrolla la industria de las tarjetas de crdito con lo cual
los bancos ven una gran posibilidad de empezar utilizar modelos de scoring.
Bsicamente el credit scoring es un mtodo que se emplea para identificar diferentes
grupos dentro de una poblacin cuando no se pueden observar las caractersticas que los
definen sino nicamente las relaciones con estas.
Se denomina credit scoring a un sistema que permite asignar una calificacin de riesgo,
una puntuacin, a un demandante de crdito (cliente real o cliente potencial).
-
15
Los modelos de scoring crediticio son aplicaciones que permiten apoyar la toma de
decisiones. Estos modelos surgen como una necesidad de poder evaluar de forma gil y
rpida las capacidades de endeudamiento de clientes ante la solicitud de un crdito.
Aunque existen diversos tipos de compaas y distintos tipo de crditos, la idea general
de un modelo de scoring crediticio es, por un lado, seleccionar aquellos individuos que
poseen mejores condiciones econmicas para retornar a la compaa el valor total del
prstamo solicitado; por otra parte, los modelos de scoring crediticio permiten mitigar el
riesgo en que se incurrira si se aprueba un crdito a un individuo que no cumple con
una capacidad de pago y endeudamiento.
En trminos ms formales el credit scoring es un mtodo de evaluacin del riesgo de
crdito que emplea informacin histrica y tcnicas estadsticas, para tratar de aislar los
efectos que tienen las caractersticas de varios aplicantes sobre la reincidencia y el
incumplimiento. El mtodo arroja un puntaje o score que la institucin financiera puede
emplear para ranquear sus aplicaciones de crdito en trminos de riesgo4.
Y con lo mencionado anteriormente predecir el comportamiento de pago futuro de las
obligaciones crediticias que contraen las personas en funcin de su comportamiento
crediticio histrico, para lo cul utiliza toda la informacin de entidades Reguladas por
la Superintendencia de Bancos y Seguros SBS.
El credit scoring constituye, por tanto, un problema de clasificacin propiamente dicho,
pues dado un conjunto de observaciones cuya pertenencia a una determinada clase es
4 Lewis, E.M. (1990) An Introduction to Credit Scoring, San Rafeal: Athena, LIC# 90-92258.
-
16
conocida a priori, se busca una regla que permita clasificar nuevas observaciones en dos
grupos: los que con alta probabilidad podrn hacer frente a sus obligaciones crediticias,
y los que, por el contrario, resultarn fallidos.
De ah que para esta investigacin se defini que el puntaje obtenido estadsticamente se
encuentre dentro de un rango de 1 a 999 siendo 1 el puntaje menor y 999 el mayor
puntaje a obtener cuando un sujeto posee el mejor historial crediticio.
Ilustracin 2. Concepto de Score
Muy malas
Muy Buenas
1
200
400
600
800
999
Scor
e
BuenasMalas
AltoRiesgo
BajoRiesgo
20 %
60 %20 %
Fuente: Datos de la Central de Riesgo Elaborado Por: Daniel Flores
-
17
As tambin el grafico muestra el objetivo del clculo que es exponer el riesgo que
actualmente un sujeto representa a un prestamista. Parmetros severos como el historial
de crdito, incluyendo historial de pagos, longitud de la historia de la cuenta, prstamos
y otros son formulados para producir un nmero de tres dgitos que oscila entre 1 y 999.
Este puntaje se divide en 3 categoras principales: Riesgo Bajo, Riesgo Medio y Riesgo
Alto.
Adems el grafico indica que el 60% de todas las personas con una puntuacin de
crdito de 550-900 presenta o present problemas con su crdito y para obtener uno
necesitar de requisitos poco favorables. El 20% de los sujetos no presentan ningn
problema en sus crditos obteniendo u score superior a los 700 y no presentan ningn
riesgo para las instituciones bancarias al ser sujetos de crdito, y el restante 20% se
encuentran con un score entre 1 y 549 los que representan un riesgo alto al ser sujeto de
crdito ya que poseen crditos vencidos o en demanda judicial en la institucin
bancaria.
Esto hace que el sistema se base en el desempeo pasado de clientes que tienen
caractersticas similares a aquellos a ser evaluados. El credit scoring termina, por tanto,
siendo un predictor del riesgo, cuya fortaleza no radica en la habilidad para explicar
causalidades (por qu algunos clientes incumplen y otros no) sino en la objetividad de la
metodologa aplicada.
-
18
Con el score, la institucin que utilice el sistema observar un valor numrico el cual
significa el riesgo y dependiendo de su valor el usuario aceptar o rechazar una
solicitud de prstamo5.
Los beneficios no slo se leen en una reduccin de la subjetividad del analista inmersa
en la concesin del crdito, al estar los mtodos tradicionales apoyados
fundamentalmente en informacin cualitativa mantenida en la mente del evaluador, sino
que al basarse en informacin cuantitativa mantenida en los sistemas de cmputo de la
institucin financiera y por ende cuantificables a bajo costo, se pueden lograr
reducciones de costos de morosidad y de evaluaciones de prstamos de tal forma que se
mejore la eficiencia (mejores colocaciones) y por ende la rentabilidad.
A la par coexisten tanto ventajas como desventajas en esta metodologa, dejando
siempre al final la opcin al prestamista de optar por un sistema de otorgamiento de
crditos subjetivo (scoring implcito) en donde el analista valora el riesgo del prestatario
comparando mentalmente las caractersticas de un aplicante con su experiencia
acumulada de otras aplicaciones similares o por un scoring estadstico que haga uso del
conocimiento cuantitativo del desempeo de clientes pasados almacenados en una base
de datos con el fin de pronosticar comportamientos futuros. Esto conduce, en virtud de
la seriedad acadmica, a exponer los pros y contras de hacer uso de esta tcnica.
5 Estrictamente no todos los mtodos conducen a una 'puntuacin' o 'scorecard'. Algunos indican directamente la posibilidad de que un cliente sea bueno y si la aprobacin del crdito vale la pena.
-
19
De lo que se pudo realizar el anlisis las ventajas y desventajas del uso de un modelo de
score se encuentran descritas en la siguiente tabla.
Tabla 1. Ventajas y Desventajas del Scoring Crediticio
VENTAJAS DESVENTAJAS
Cuantifica el riesgo como probabilidad Requiere de una slida y extensa base de
datos
Multivariable Ignora toda informacin no existente en la
base de datos
Puede ser validado Solo destaca los casos de alto riesgo
Consistente Puede necesitar de un consultor externo,
por ende genera gastos operativos
Transparente Su funcionamiento requiere de un sistema
transaccional
La consistencia surge de la homogeneidad en la calificacin otorgada a cada grupo de
clientes que comparta las mismas caractersticas, todas las solicitudes idnticas tendrn
por tanto el mismo valor de riesgo predicho; el hecho de contar con un modelo
matemtico que arroje un valor hace que el proceso de obtencin de esta probabilidad
Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores
-
20
sea explcito y como consecuencia de fcil comunicacin tanto a nivel de alta gerencia
como de analistas.
El contar con modelos estadsticos da la posibilidad de contrastacin de los mismos,
validando los modelos sea con informacin previa al periodo muestral empleado,
permitiendo observar como habra funcionado scoring si hubiera estado implementado
al momento de estos desembolsos o verificando, previo a la fase de implementacin, la
consistencia del modelo con los nuevos clientes. Esta fase suele denominarse
backtesting.
Del otro lado, se tiene un conjunto de desventajas que se deben considerar antes de
incurrir en un proceso de obtencin e implementacin de un modelo scoring para el
otorgamiento de crditos. La disponibilidad de una slida y extensa informacin es uno
de los principales obstculos al momento de desarrollar un modelo estadstico. Adems,
la cantidad de informacin registrada no debe slo ser buena sino vasta para que los
modelos desarrollados puedan compensar la ausencia de informacin financiera con
mucha capacidad de pronstico empleando un gran nmero de caractersticas menos
significativas. La calidad de las bases de datos es fundamental, no slo en cantidad de
registros almacenados en cada variable (porcentaje bajo de clientes en blanco) sino en la
confiabilidad de la informacin archivada. Por ejemplo, puede ser que la variable sueldo
no sea un buen predictor dentro de los modelos tal vez porque los clientes tienden a
mentir sobre su salario, por lo que la correlacin entre sueldo y riesgo es falsa, o por que
los vendedores de crdito adulteran la cifra ante la posibilidad de obtener una
aprobacin segura del crdito vendido por parte del analista.
-
21
2.2 MTODOS EMPLEADOS EN LA CONSTRUCCIN DE SCORE
DE CREDITOS
Las tcnicas ms importantes en la construccin de modelos de score crediticio son:
Modelos Estadsticos Se consideran los siguientes mtodos:
Mtodos Paramtricos Comprenden tcnicas como Anlisis Discriminante
(Discriminant Analysis) y Regresin Logstica (Logistic Regression).
Mtodos No Paramtricos. Incluye tcnicas de rboles de Decisin, K-Nearest
Neighbor (K-NN) y Kernel Density.
Modelos de Computacin Suave o Soft Computing Se plantean principalmente dos
modelos:
Redes Neuronales Artificiales (Artificial Neural Networks, ANN).
Mquinas Vectoriales de Soporte (Support Vector Machines, SVM). Conjuntos
Rugosos (Rough Sets).
Modelos Hbridos Estos mtodos representan una extensin a los modelos existentes y
consisten en una combinacin de tcnicas estadsticas o de soft computing otros
modelos relacionados.
-
22
La ilustracin 3 muestra un organigrama sobre las tcnicas mas utilizadas para
desarrollar un modelo de score crediticio explicados anteriormente, adems de una
clasificacin de las tcnicas influyentes en la construccin del modelo.
Ilustracin 3. Tcnicas Para el Desarrollo Scoring Crediticio
El organigrama presenta un resumen de la clasificacin de los diferentes modelos para
el desarrollo de un scoring crediticio, estos se clasifican en modelos estadsticos del cual
se dividen en paramtricos (Anlisis Discriminante y Logit) y tres no paramtricos
(rboles de regresin, K vecinos mas cercanos y la densidad de Kernel), adems del
modelo soft computing del que se deriva los modelos que utilizan redes neuronales y
por ltimo tambin se encuentran los modelos hbridos.
Modelos de Scoring
Crediticio
Modelos Estadisticos
Paramtricos
Anlisis Discriminante
Regresion Logstica
No Paramtricos
K vecinos ms cercanos
Arboles de Decisin
Densidad de Kernel
Soft Computing
Redes Neuronales
Modelos Hibrido
Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores
-
23
Los modelos paramtricos parten de una funcin de distribucin o clasificacin
conocida, y reducen el problema a estimar los parmetros que mejor ajusten las
observaciones de la muestra6. Los modelos no paramtricos, conocidos tambin como
mtodos de distribucin libre pues no se encuentran sujetos a ninguna forma funcional,
estos modelos presentan pocas restricciones, por lo que en ocasiones resultan, ms
fciles de aplicar que los paramtricos y permiten reconstruir la funcin de clasificacin
en todo tipo de situaciones, incluidas aquellas en las que la funcin sea sencilla y
conocida (por ejemplo, lineal).
En los modelos de soft computing del que se deriva el modelo de redes neuronales esta
conformado por un conjunto de procesadores simples interconectados a los cuales se les
denomina nodos, organizados en capas lo que permite el procesamiento de la
informacin.
2.3 REGRESION LOGSTICA
La Regresin Logstica (Logistic Regression, LR) es una tcnica estadstica
ampliamente utilizada en los modelos de score crediticio, as como en otras reas. Esta
tcnica considera un conjunto de variables independientes o predictoras y una variable
dependiente con dos posibles valores (variable dictoma) ejemplo:
Vota o no vota en unas elecciones
Diagnstico positivo o negativo en una prueba mdica
6 Martha Galicia Romero, nuevos Enfoques de Riesgo de Crdito
-
24
Las principales caractersticas que presenta este modelo se resumen en:
Variables binarias: Identifica la pertenencia del individuo a cada uno de los grupos
analizados:
Se identifica con un 1 al individuo que pertenece al grupo cuya probabilidad de
pertenencia estimar el modelo.
Se identifica con un 0 al individuo que no pertenece al grupo objeto de anlisis.
Variables explicativas: Son las variables que sirven para discriminar entre los grupos y
que determinan la pertenencia de un elemento a un grupo u otro. Pueden ser:
Variables cuantitativas que un campo de variacin que toma todos los valores
reales
Variables cualitativas con distintas alternativas u opciones posibles.
Resultado del anlisis: El resultado es un valor numrico que indica la probabilidad de
pertenencia de un elemento al grupo que se le asign el valor 1, es decir, el grupo objeto
de anlisis.
La funcin logstica es una funcin de distribucin, y como se ha explicado toma los
valores entre 1 y 0, tiene la forma de S como se muestra en el siguiente grafico:
-
25
Ilustracin 4. Grfico Funcin Logstica
La forma general es:
Ecuacin 2. Modelo General
zez
11
Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores
Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores
-
26
Donde Z es la probabilidad de la clase recordando que la variable dependiente posee dos
valores posibles. Para el caso de un modelo de score, se consideran dos posibles
resultados: un cliente con buen hbito de pago y uno moroso. Para complementar, z obedece al siguiente modelo matemtico:
Ecuacin 3. Funcin Lineal con Parmetros
nnxwxwxwz ....2211
Donde Xi (i = 1,2,..., n) es el conjunto de variables predictoras o conjunto de entrada,
es el punto de interseccin y Wi es el conjunto de coeficientes o vector de pesos W
que ajustan el modelo.
En nuestro caso las variables predictoras o Wi podran ser las siguientes a modo de
ejemplo:
Monto del crdito.
Plazo del crdito.
Das de mora.
Nmero de Calificaciones E en la base de la Central de riesgo, etc
Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores
-
27
Puesto que el modelo anterior no es lineal respecto a las variables independientes, se
considera la inversa de la funcin logstica, que es el logit o logaritmo de la odds o
ventaja de que un suceso ocurra, definindose sta como el cociente entre la
probabilidad de que ocurra un acontecimiento y la probabilidad de que no ocurra, que es
su complementaria, como puede observarse en la siguiente expresin:
Ecuacin 4. Funcin Logstica
nn xwxwxwpp
.....]1
log[ 2211
En donde p es la probabilidad del resultado de inters, ejemplo: la probabilidad a priori
de que un individuo tenga buen hbito de pago o la probabilidad de que un individuo
pueda ser moroso o incurrir en fraude.
La formulacin anterior facilita la interpretacin del modelo y de sus coeficientes, que
reflejan, de este modo, el cambio en el logit correspondiente a un cambio unitario en la
variable independiente considerada.
Fuente: Introduccin al anlisis de regresin lineal Elaborado Por: Daniel Flores
-
28
Ejemplo:
Predecir la probabilidad de tener tarjeta de crdito basado en los ingresos de una
persona.
Basado en la siguiente tabla de datos:
Rango Ingresos #Tarjetas Crdito # Casos yi 0-500 19 6 3,16666667 500-600 0 0 0 600-700 0 0 0 700-800 15 4 3,75 800-900 32 7 4,57142857 900-1000 70 22 3,18181818 1000-1100 163 47 3,46808511 1100-1200 269 56 4,80357143 1200 - 1300 332 58 5,72413793 1300 - 1400 385 59 6,52542373 1400 - 1500 329 43 7,65116279 1500 - 1600 185 26 7,11538462 1600 - 1700 85 9 9,44444444 1700 - 1800 5 2 2,5 1800 - 1900 26 4 6,5 1900 - 2000 0 0 0 2000 - 2100 0 0 0 2100 - 2200 0 0 0 2200 - 2300 2 1 0 2300 - 2400 12 1 12
Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores
-
29
Variable Dependiente:
1 = Posee
Poseer Tarjeta (previamente categorizada )
0 = No posee
Variables que no son cuantitativas:
Nivel de Ingresos
Nivel de Ingresos Variables Dummy
Alto Medio Bajo
Alto 1 0 0
Medio 0 1 0
Bajo 0 0 1
Sin Ingresos 0 0 0
Creamos tres variables dicotmicas o categricas las cuales no van a ser numricas
siendo estas unas variables dicotmicas: basndonos en el nivel de ingresos la primera
de ellas sera Alto. Quien lo sea tendr valor 1 en esa variable y valor cero en las
variables Medio y Bajo. Los de nivel de Ingreso Medio tendrn valor 1 en la
segunda variable y cero en las otras, etc. No necesitamos crear, en cambio, una variable
llamada Sin Ingresos: lo ser quien tenga valores cero en las tres anteriores. Esta
ltima es la categora base de las dummy.
Fuente: Tabla de Ejemplo Nivel de Ingreso Elaborado Por: Daniel Flores
-
30
Una vez realizada esta transformacin, estas variables pueden ser incorporadas en una
ecuacin de regresin: sus valores slo pueden variar entre cero y uno y sus coeficientes
b indicarn, en cada caso, cuanto aumentan o disminuyen los odds de probabilidad del
evento que se procura predecir cuando una de estas variables pasa de cero a uno.
De lo explicado anteriormente la probabilidad de tener tarjeta de crdito se ver
reflejada en la siguiente la funcin logstica
=
Donde:
= Probabilidad de poseer Tarjeta de Crdito
= Probabilidad de no poseer Tarjeta de Crdito
Puesto que los datos se encuentran agrupados por el ingreso anual, la variable es la
media del grupo.
As por ejemplo de la tabla indicada anteriormente de 6 personas con un ingreso de
entre 0 y 500 dlares su media es de 19/6, observando que hay 20 rangos de ingresos
diferentes de la muestra tomada.
Elaborado Por: Daniel Flores
-
31
Obteniendo el siguiente grafico (Ilustracin 5)
Ilustracin 5. Grfico de Dispersin
As pues arbitrariamente a manera de ejemplo se determin que la probabilidad de
poseer una tarjeta de crdito basada en los ingresos de una persona sera la siguiente:
=exp ( 1 + )
1 + exp ( 1 + 2 )
Donde:
es la probabilidad de que un sujeto posea una tarjeta de crdito con un ingreso .
0
2
4
6
8
10
12
14
0 500 1000 1500 2000 2500 3000
Y
Ingresos
Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores
Fuente: Revisin Bibliogrfica Elaborado Por: Daniel Flores
-
32
Interpretndose la misma de la siguiente manera: Cuando el ingreso es mayor existe la
posibilidad de poseer mayor nmero de tarjetas de crdito basndonos en la media
obtenida con el grupo de ejemplo.
Para lo cual previamente toco realizar una nueva reagrupacin de los datos basndonos
en la tabla de ejemplo anterior para no obtener valores igual a 0 y verificar que el
modelo no sea rechazado.
Rango
Ingresos
#Tarjetas
Credito # Casos yi
0-500 19 6 3,16666667
700-800 15 4 3,75
800-900 32 7 4,57142857
900-1000 70 22 3,18181818
1000-1100 163 47 3,46808511
1100-1200 269 56 4,80357143
1200 - 1300 332 58 5,72413793
1300 - 1400 385 59 6,52542373
1400 - 1500 329 43 7,65116279
1500 - 1600 185 26 7,11538462
1600 - 1700 85 9 9,44444444
1700 - 1800 5 2 2,5
1800 - 1900 26 4 6,5
2300 - 2400 12 1 12
Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores
-
33
Donde se obtuvo la grfica ajustada en la que se observa la curva logstica.
Ilustracin 6. Grfica Resultado Ejemplo Regresin Logstica
Con la imagen se puede demostrar que los puntos se ajustan a una curva en forma de s
en la que se observa que a mayor ingreso existe mayor probabilidad de obtener o poseer
mayor nmero de tarjetas de crdito.
0
2
4
6
8
10
12
14
0 500 1000 1500 2000 2500 3000
Y
Ingresos
yi
yi
Fuente: Microsoft Excel Datos de Ejemplo Elaborado Por: Daniel Flores
-
CAPTULO III
-
34
CAPTULO III
3. METODOLOGA
En este captulo trataremos sobre la metodologa utilizada para el desarrollo del modelo
del scoring y las fases que incluye el modelamiento.
3.1 MODELAMIENTO
El modelo busca determinar el riesgo de no pago o incumplimiento futuro asociado a
una operacin crediticia, ordenando la poblacin y dando la posibilidad de manejar
ofertas comerciales diferenciadas por punto de corte. Dando adicionalmente la facilidad
de utilizar mltiples puntos de corte que van desde el rechazo (punto mas bajo) hasta la
aprobacin inmediata (puntaje ms alto otorgando rpidamente el ndice de riesgo
asociado a esa evaluacin).
Las fases que incluyen el proceso de modelamiento son las siguientes:
1. Seleccin de la muestra
2. Definicin de buenos y malos clientes
3. Definicin y seleccin de datos
4. Anlisis preliminar de los datos
5. Anlisis multivariado
6. Diseo del scorecard
7. Validacin del modelo
-
35
3.1.1 Seleccin de la muestra
Con la finalidad de desarrollar un sistema scoring es necesario contar con una muestra
de clientes que tengan informacin historial credticia. Este requerimiento genera una
dicotoma entre dos elementos de decisin.
La muestra debe incorporar informacin suficiente acerca de las diferentes conductas de
pago de los clientes (buena y mala conducta en los extremos) a fin de identificar las
mejores caractersticas que lograrn recoger estos comportamientos.
Es aqu justamente donde se genera el conflicto, dado que con esta muestra se necesita
definir el criterio de bueno y malo a emplear para encontrar las caractersticas relevantes
en el modelo. Para esto, en cambio, se necesitar informacin histrica suficiente y por
lo tanto un razonable horizonte temporal.
Para el caso de esta tesis de fijar un perodo de 72 meses, de informacin de datos de la
base de la Central de Riesgo donde se encuentra informacin consolidada de los
prestamos otorgados por las instituciones reguladas por la misma, contando con
informacin que a la vez recoja una madurez adecuada (comportamiento estable).
El perodo de observacin es el tiempo t en el que el investigador decide situarse y
observar el desempeo del cliente. Es este perodo de desempeo o performance el que
va a ser empleado para predecir el comportamiento futuro. En el punto de resultado se
asigna una calificacin (bueno o malo) al cliente con base en un resumen del
comportamiento en el periodo de desempeo. De ah la importancia de madurez de la
-
36
cartera para no calificar como bueno a un cliente que es malo, pero que no logra denotar
un comportamiento porque inicia a pagar su obligacin.
Integrada la informacin de deudores directos del Sistema Crediticio, se puedo obtener
una muestra de aproximadamente un 1% de personas registradas en la base de datos
integrada de la Central de Riesgo (obteniendo una muestra de las personas que tienen
en su documento de identificacin el dgito verificador ltimo digito igual a 3).
Adicionalmente se obtuvo una muestra con la informacin de la central de riesgo de
cdulas cuyo ltimo dgito sea igual a 8, esta muestra se utiliz para la validacin final
del modelo (backtesting).
Para efectos de anlisis se tomaron datos reportados por Instituciones Financieras
Reguladas por la Superintendencia de Bancos a diferentes fechas desde enero 2002
hasta la ultima fecha de corte que se pudo obtener informacin reportada por las
Instituciones Bancarias a la Superintendencia de Bancos y de la cual se realizar un
anlisis (backtesting) con la informacin mencionada hasta enero del 2007 hacia atrs
para con esto verificar la probabilidad de prediccin que posee el score.
Lo explicado en los anteriores prrafos se refleja en la siguiente tabla donde mostramos
el nmero total registros en la base datos de la Central de Riesgos reportada por las
instituciones reguladas por la Superintendencia de Bancos, divididos por el ltimo
digito de la cdula de identidad y los primeros dos dgitos de la misma, de las cuales se
-
37
tomaron muestras aleatorias como se indic de las cdulas que su ltimo digito termina
en 3 y en 8.
Tabla 2. Nmero Registros por primeros y ltimos dgitos de la Cedula
Fuente: Direccion Nacional del Registro Civil Elaborado Por: Daniel Flores
-
38
3.1.1.1 Perodo de performance
Como se mencion anteriormente es importante escoger un perodo que reflejando la
actual poblacin de clientes muestre un comportamiento estable de cartera. Un
indicador til es la tasa de morosidad.
entestotaldeclientesdemalosclisidadtasademoro
##
Donde:
entesdemaloscli# : Es el nmero de clientes malos
entestotaldecli# : Es el total de clientes
De tal forma que el indicar representa el porcentaje de clientes cuyo crdito se encuentra
en estado de vencido en relacin con el total de clientes.
La tasa de morosidad se construye por perodo de cosecha (fecha de venta de las
operaciones de crdito) y tiene por objeto mostrar en forma grfica y por mes de
colocacin la relacin clientes malos sobre total de clientes7, con el fin de sealar los
perodos en que esta razn se estabiliza como equivalentes a un comportamiento estable
de la cartera.
Un periodo se considera como estable en la medida que la razn de la cosecha t presente
pequeas variaciones en relacin a la cosecha t-1 y t+1. En trminos estadsticos se
7 Credit Scoring and its Aplication, Lyn Tomas, David Edelman and Jonathan Crook
-
39
puede argumentar que se necesita, durante la ventana temporal elegida, que la razn tasa
de morosidad siga una distribucin uniforme. La eleccin de periodos con tasas de
morosidad decrecientes no implica necesariamente una mejora en el comportamiento de
la cartera, puede ser que estas cosechas por ser cercanas a la fecha actual estn
reflejando carteras poco maduras y por ende no comparables con otros periodos de
anlisis. A este tipo de estudios se los conoce como anlisis de cosechas.
El siguiente esquema sintetiza la importancia del proceso de seleccin de la muestra, un
acertado periodo de performance, con lo cual aseguramos que la definicin de bueno y
malo permita modelar un adecuado comportamiento de pago en el futuro.
Ilustracin 7. Esquema de Seleccin de la Muestra
Fuente: Credi Report Buro de Informacin Creditica Elaboracin Credit Report Buro de Informacin Crediticia
-
40
As tambin que en el esquema arriba expuesto se puede observar que identificando las
caractersticas del sujeto en el punto de observacin basado en la informacin histrica
que se posee se definir si este sujeto es bueno o malo y a su vez se podr verificar que
tan predictor es el mismo al verificar su comportamiento basado en el score con
informacin a fechas de corte de posteriores.
3.1.2 Definicin de buenos y malos clientes
La implementacin de un modelo credit score requiere la definicin de buen y mal
cliente. Establecer que un cliente es malo no implica necesariamente que todos los
restantes sean buenos. En el camino se pueden encontrar al menos dos definiciones
adicionales. Los 'indeterminados' o aquellos casos que no se pueden definir como
buenos o como malos, y los ' experiencia insuficiente' o aquellos casos en que la cuenta,
producto de su poco o corto uso, no se puede definir como buena sin caer en un juicio
prematuro.
Resulta evidente que la definicin escogida no va a afectar la metodologa empleada
para calificar al cliente. (esta asume que la definicin crea una particin). Sin embargo,
la forma como definamos buenos y malos s va a tener efecto sobre los resultados del
scoring.
Cuando se habla de malos se busca describir al conjunto de clientes, que dada la
experiencia no quiere seleccionar para su actividad intermediadora. Para el caso de los
-
41
modelos de riesgo, usualmente esta definicin hace alusin a esa cartera que de conocer
su comportamiento no se hubiese aceptado.
De aqu se sigue que la definicin de bueno y malo se basar prcticamente en el
comportamiento de pago de los clientes: mora mxima histrica, mora promedio,
contadores de mora (nmero de veces que ha cado en mora o reincidencia). Este
criterio de seleccin es mucho ms deseable pues asocia el criterio de bondad a una tasa
de rendimiento, decidiendo la eleccin de bueno o malo con base en la mxima prdida
que se est dispuesto a asumir. Es evidente que estas definiciones pasan por un grado de
subjetividad siendo tan conservadoras como lo quiera la entidad o viceversa.
3.1.3 Definicin y seleccin de datos
Como se mencion inicialmente una de las dificultades que puede afrontar un modelo
scoring es la escasez de una buena base de datos o incluso la ausencia de esta.
Es importante, por ende, contar no slo con una base de datos sino con un sistema de
informacin adecuadamente construido con una lgica de almacenamiento de datos que
permita contar con una codificacin o representacin numrica de las caractersticas
cualitativas y cuantitativas que servirn para la aplicacin de tcnicas estadsticas. La
definicin y seleccin de los datos a incluir en el modelo requiere identificar las escalas
de medida que pueden presentarse.
-
42
Existen dos grupos de variables a estudiar: las cualitativas y las cuantitativas.
Las primeras son aquellas que no aparecen en forma numrica, sino como categoras o
atributos (gnero, actividad econmica, vivienda) y slo pueden ser nominales u
ordinales.
Las variables cuantitativas, en cambio son aquellas cuyas categoras pueden expresarse
numricamente. Su naturaleza numrica permite un tratamiento estadstico ms
elaborado debido a las operaciones matemticas que permiten. Estas variables pueden
ser discretas o continuas. Las primeras son aquellas cuyas categoras slo pueden tomar
valores enteros. Por ejemplo la variable nmero de cargas familiares, no existe un
cliente que pueda tener 2,3 cargas familiares. Las segundas son aquellas cuyas
categoras pueden fraccionarse segn cualquier entero, por ejemplo la variable salario.
Una vez definido los tipos de datos con los que se puede trabajar se procede a
seleccionar la informacin en funcin de las caractersticas disponibles.
De lo expuesto se defini que esta tesis por tratarse de un modelo para deudores del
sistema financiero ecuatoriano las variables a utilizar son las de un modelo de
comportamiento, no de originacin por lo tanto se han escogido las siguientes variables
de alta importancia y sus combinaciones que mide el comportamiento de un
determinado sujeto dentro del periodo de performance las cuales se muestran en la tabla
siguiente:
-
43
COD_TIPO_IDCOD_ID_SUJETO
NUM_OPERACION
FEC_OPERACION
FEC_CORTE VAL_SALDO VAL_TOTALVAL_TOTAL_XV
VAL_TOTAL_NDI
VAL_VENCIDO
VAL_DEM_JUDICIAL
VAL_CART_CASTIGADA
COD_CALIFICACION
C 1714738331 0110001700252929/01/2003 30/06/2009 1570,59 1570,59 1570,59 0 0 0 0 AC 1714738331 493849345672401830/06/2009 30/06/2009 16,65 16,65 16,65 0 0 0 0 AC 1714738331 554511900846961030/06/2009 30/06/2009 127,33 127,33 127,33 0 0 0 0 AC 1714738331 554511900846961030/06/2009 30/06/2009 51,42 51,42 51,42 0 0 0 0 AC 1714738331 0110001700252929/01/2003 31/05/2009 1642,37 1642,37 1642,37 0 0 0 0 AC 1714738331 493849345672401831/05/2009 31/05/2009 16,65 16,65 16,65 0 0 0 0 AC 1714738331 493849345672401831/05/2009 31/05/2009 97,09 97,09 97,09 0 0 0 0 A
VAL_VENC_0_1
VAL_VENC_1_2
VAL_VENC_2_3
VAL_VENC_3_6
VAL_VENC_6_9
VAL_VENC_9_12
VAL_VENC_12_24
VAL_VENC_24_36
VAL_VENC_36
VAL_XVENCER
VAL_XVENCER_1_3
VAL_XVENCER_3_6
VAL_XVENCER_6_12
0 0 0 0 0 0 0 0 0 72,39 73 222,73 462,780 0 0 0 0 0 0 0 0 16,65 0 0 00 0 0 0 0 0 0 0 0 17,51 35,68 55,18 18,960 0 0 0 0 0 0 0 0 2,14 4,02 5,43 8,970 0 0 0 0 0 0 0 0 70,17 70,92 217,34 456,050 0 0 0 0 0 0 0 0 16,65 0 0 00 0 0 0 0 0 0 0 0 97,09 0 0 0
VAL_XVENCER_12
VAL_OPE_CUPO
739,69 3359,970 5000 360
30,86 360
Fuente: Datos Central de Riesgo Muestra de Ejemplo Elaborado Por: Daniel Flores
-
44
Las mismas que estn definidas por:
1. Nmero de Operaciones Actuales e Histricas que posee el sujeto a calcular el scoring,
esto es cuantos prestamos un sujeto obtenido a travs de instituciones financieras
dentro de un rango de tiempo.
2. Cantidad de Calificaciones E que de acuerdo a la Superintendencia de Bancos esta se
clasifica de la siguiente manera:
Tabla 3. Periodo Morosidad en Meses
CALIFICACION PERIODO DE MOROSIDAD EN MESES
TIPO DE RIESGO MAYOR A HASTA
Riesgo Normal ---- Uno
Riesgo Potencial Uno Tres
Deficiente Tres Seis
Dudoso Recaudo Seis Nueve
Perdida Nueve En adelante
3. Saldo por vencer de 1 a 30 das.- Es el valor por vencer que consiste en la sumatoria de
todos los dividendos por pagar en el plazo mencionado.
Fuente: Superintendencia de Bancos y Seguros Elaborado Por: Daniel Flores
-
45
4. Saldo por vencer ms de 1 a 3 meses.- Es el valor por vencer que consiste en la
sumatoria de todos los dividendos por pagar en el plazo mencionado
5. Saldo por vencer ms de 3 a 6 meses.- Es el valor por vencer que consiste en la
sumatoria de todos los dividendos por pagar en el plazo mencionado
6. Saldo por vencer ms de 6 a 12 meses.- Es el valor por vencer que consiste en la
sumatoria de todos los dividendos por pagar en el plazo mencionado
7. Saldo por vencer ms de 12 meses.- Es el valor por vencer que consiste en la sumatoria
de todos los dividendos por pagar en el plazo mencionado
8. Valor que no devenga intereses de 1 a 30 das.- Es el valor que no genera inters
cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.
9. Valor que no devenga intereses ms de 1 a 3 meses.- Es el valor que no genera inters
cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.
10. Valor que no devenga intereses ms de 3 a 6 meses.- Es el valor que no genera inters
cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.
11. Valor que no devenga intereses ms de 6 a 12 meses Es el valor que no genera inters
cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.
-
46
12. Valor que no devenga intereses ms de 12 meses.- Es el valor que no genera inters
cuando una operacin crediticia se encuentra vencida en el rango de tiempo indicado.
13. Valor vencido de 1 a 30 das.- Es el valor total vencido que consiste en la sumatoria de
todos los dividendos que estn en mora en el rango de tiempo indicado.
14. Valor vencido ms de 1 a 2 meses.- Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
15. Valor vencido ms de 2 a 3 meses.- Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
16. Valor vencido ms de 3 a 6 meses Es el valor total vencido que consiste en la sumatoria
de todos los dividendos que estn en mora en el rango de tiempo indicado.
17. Valor vencido ms de 6 a 9 meses.- Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
18. Valor vencido ms de 9 a 12 meses.- Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
19. Valor vencido ms de 12 a 24 meses Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
-
47
20. Valor vencido ms de 24 a 36 meses Es el valor total vencido que consiste en la
sumatoria de todos los dividendos que estn en mora en el rango de tiempo indicado.
21. Valor vencido ms de 36 meses.- Es el valor total vencido que consiste en la sumatoria
de todos los dividendos que estn en mora en el rango de tiempo indicado.
22. Valor vencido de comisin Es el valor total vencido que consiste en la sumatoria de
todos los dividendos que estn en mora en el rango de tiempo indicado.
23. Valor en demanda judicial.- Es el valor de una operacin que se encuentra en proceso de
Demanda Judicial por parte de la institucin financiera.
24. Cartera castigada.- Es el valor establecido como dudoso de recaudar por parte de la
Institucin Financiera.
25. Edad.- La edad en aos de la persona a consultar el score, en este caso nos encontramos
con un problema ya que no de todos las personas con crdito en el sistema ecuatoriano
se posee la edad o a su vez depende de la calidad de la informacin que poseamos ya
que esta puede no ser tan confiable y nos encontremos con valores inesperados como se
indica en la ilustracin 8.
-
48
Ilustracin 8. Distribucin de los Sujetos por Rangos de Edad
3.1.4 Anlisis preliminar de la Muestra
En un principio todas las variables existentes en la base de datos deben ser
seleccionadas, e incluso analizadas para que a partir de estas construir nuevas variables
denominadas variables simples o de combinaciones de caractersticas como se describe
en la ilustracin 9.
Fuente: Instituciones Financieras Ecuatorianas Elaborado Por: Daniel Flores
-
49
Ilustracin 9. Transformacin de una variable
Z4 X2
La variable fecha de apertura de la operacin se puede
transformar en la fecha en la que por primera vez fue reportada
en la Central De Riesgo.
As pues la ilustracin 9 explica como una variable de entrada Z4 como por ejemplo la
fecha de nacimiento se puede convertir en la edad siendo esta una variable de salida X2.
Adems en este anlisis es necesario decidir sobre un esquema de segmentacin para
definir si se divide la muestra en subgrupos siempre y cuando estas tengan informacin
especial o distintiva, en el caso de esta tesis no va a ser necesario ya que la muestra que
se posee es homognea.
Elaborado Por: Daniel Flores
-
50
3.1.5 Anlisis Multivariado
En esta etapa se validar la calidad y cantidad de informacin que se posee a travs de
un anlisis exhaustivo de los mismos los cuales se dividen en:
3.1.5.1 Anlisis Univariado
El objetivo de esto es validar la calidad por cada variable en la muestra
seleccionada.
Este estudio cumple con los siguientes propsitos:
Verificar con la integridad de los datos
Deteccin de valores extremos
Tratamiento por datos faltantes
3.1.5.2 Anlisis Bivariado
El objetivo de este anlisis es evaluar la relacin entre las variables
independientes y las variables dependientes por ejemplo
Variable Dependiente: Variable Dicotmica (1 Si es mayor a 60 dias de
vencido en un prstamo otorgado por una institucin financiera o 0 en caso
contrario)
-
51
Variables Independientes Monto del prstamo otorgado, que tipo de crdito
(vivienda, consumo, microcrdito, etc), montos vencidos, etc.
Es as que a modo de ejemplo en las 2 siguientes tablas se puede identificar que
se uso la combinacin de las variables el valor por vencer a las cuales se les
realiz una suma, el valor en mora siempre y cuando sea mayor a 2 meses, y un
conteo de las operaciones las que cumplan con las dos condiciones anteriores.
De los cuales se obtuvo los coeficientes de media y comparacin, permitiendo
analizar el comportamiento actual y pasado, verificando que estos valores se
encuentran dentro de los rangos ptimos definidos para el modelamiento del
score.
As tambin en la segunda tabla se realiza una combinacin de variables como
son los valores de cartera castigada y valores en demanda judicial a los cuales
se les suma dentro de un rango de tiempo de los ltimos 24 meses que se tiene
en la informacin de la Central de Riesgo.
Y de igual manera se obtuvieron los coeficientes y se observ que los ratios o
coeficientes de medida y comparacin se encuentran dentro de los parmetros
aceptables.
-
52
Ejemplo:
Ha tenido una o ms operaciones con mora mayor o igual a 2 meses en los ltimos 24 meses, pero el total de deuda por vencer es
mayor o igual a 0.33333 del deuda total tomando en cuenta los ltimos 3 meses? La variable se denominara rfp3_2_cd_con
rfp3_2_cd_con Bivariada (slo buenos y malos) Poblacin Total
BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total
0 (no) 1.17 0.85 77,123 18,143 23.5% 94.6% 77,123 94.6%
1 (s) 0.09 10.56 4,379 3,469 79.2% 5.4% 4,379 5.4%
Total de deuda en cartera castigada o demanda judicial en los ltimos 24 meses. La variable se denominar deuda_castplus
deuda_castplus Bivariada (slo buenos y malos) Poblacin Total
BMRatio MBRatio Total Malo Tasa de Malos %Total Total %Total
0 1.38 0.73 74,671 15,485 20.7% 91.6% 74,671 91.6%
0
-
53
3.1.6 Diseo del Score Card
Diseo del Score Card se basa en los pesos y signos asignados a las caractersticas
relevantes para identificar comportamiento de pago de un cliente. En su forma ms
simple es una tabla en la que se listan las variables seleccionadas y sus atributos con el
puntaje asignado a cada uno8. Un puntaje negativo indica que la variable estara
premiando al cliente que cumpla con este atributo, mientras que una variable positiva
estara castigando.
Un mayor o menor valor significa cun importante es la variable en la calificacin.
De acuerdo al anlisis realizado para esta tesis el score card que se utilizar ser el
siguiente:
8 Un score card es una tabla donde se presentan las caractersticas (variables) resultantes de la aplicacin del modelo logstico, con el valor respectivo del parmetro ajustado para representar el valor de score con el que aporta cada una de las caractersticas.
-
54
Y como explicacin se indicar la obtencin de una de las variables que se utilizan en el
diseo del score card, las dems se encuentran en el anexo 3
set @n_score = -5.0418819189 + @i_b_avgmo_1_ec * 0.426007907 + @i_b_avgmo_2_ec * 0.615325305 + @i_b_avgmo_3_ec * 0.746487979 + @i_b_avgmo_4_ec * 0.835391271 + @i_b_avgmo_5_ec * 0.940640093 + @i_b_avgmo_6_ec * 1.163488941 + @i_b_avgmo_7_ec * 1.305610914 + @i_b_avgmo_8_ec * 1.525070427 + @i_b_wcurr_1_all * 0.633003213 + @i_c1a10_1_all * 0.527885872 + @n_c12_1a10_1_all * 0.435848447 + @n_c3_2a10_1_all * 0.372657094 + @i_cant_calificacion_e_1_all * 1.584073234 + @i_cant_no_devenga_12_1_pd * 0.169503353 + @i_cant_no_devenga_12_2_all * 0.31779479 + @i_cant_no_devenga_24_1_ec * 0.484176497 + @i_cant_por_vencer_12_1_all * 0.383397711 + @i_cant_tipo_riesgo_titular_1_ec * 0.378465063 + @i_cl1 * 0.687503404 + @i_cl2 * 0.495688296 + @i_cl3 * 0.384044386 + @i_cl4 * 0.187988401 + @i_copen_vig_3_1_all * -0.2652798865 + @i_copen_vig_3_1_ec * -0.1950141455 + @i_mnew_1_pd * 0.959436817 + @i_mold_vig_1_all * 0.639567949 + @n_rdt1s3_2_ec * 0.628773397 + @n_rdt1s3_3_ec * 0.281621939 + @i_rdt24_3a10_1_all * 0.538599523 + @i_rdt3_2a10_1_all * 0.936851865 + @i_rdt6_1a10_1_all * 0.302253614 + @i_rfp12_2_all * 0.18566022 + @i_rfp12_3_all * 0.430115998 + @i_rfp3_2_cd * 0.479899586 set @n_score = round(1000/(1+exp(-@n_score)),0)
Ilustracin 10. Diseo del Score Card Cgido Sql
Fuente: Cdigo Sql Elaborado Por: Daniel Flores
-
55
Desarrollo de la variable @i_rdt24_3a10_1_all
Si el valor de la variable (@n_rdt24_3a10 < .00001) entonces la variable
@i_rdt24_3a10_1_all toma el valor de 1 caso contrario toma el valor de 0
Donde:
La variable @n_rdt24_3a10 toma el valor de 0 si @n_deuda_total_24 es igual a 0
caso contrario la variable se calcula de la siguiente manera @n_rdt24_3a10 =
@n_d24_3a10/@n_deuda_total_24
Para lo que previamente se debe obtener las siguientes variables:
@n_deuda_total_24
@n_d24_3a10
As pues la variable @n_deuda_total_24 se obtiene de la suma total de los valores que
adeuda una persona a las entidades reguladas por la Superintendencia de Bancos en los
24 meses anteriores a la fecha de calculo del credit scoring
Y la variable @n_d24_3a10 se obtiene suma de los valores vencidos o en estado de
mora con las entidades reguladas por la Superintendencia de Bancos en los 24 meses
anteriores a la fecha de calculo del credit scoring
-
56
3.1.7 Validacin del Modelo
Para validar el modelo se realiz pruebas de backtesting o pruebas de pasado que tienen
como fin probar la predictibilidad del modelo con datos del pasado y compararlos con el
score calculado con informacin actual.
As pues la prueba de backtesting realizada se bas en el historial crediticio del sujeto
con la cual se desarrollo una variable de prueba la cual consista en que si el sujeto a
partir de la fecha de calculo del scoring crediticio hasta un ao despus colocaba 1 si
este caa vencido o tenia valores en mora o 0 si este no tenia valores vencidos o en mora
en las instituciones reguladas por la Superintendencia de Bancos (Anexo 2).
-
CAPTULO IV
-
57
CAPTULO IV
4. DESARROLLO
En este captulo se explicar sobre las herramientas utilizadas para el desarrollo de esta
tesis y el sistema diseado para la explicacin del scoring crediticio.
4.1 DISEO Y DESARROLLO
La aplicacin tiene como objetivo ayudar al analista de crdito para que con el historial
crediticio pueda darse cuenta que tan apto es una persona para ser sujeto de crdito ya
que se basa en la probabilidad de mora del mismo.
Adems al ser una aplicacin Web Service ayuda a que cualquier institucin o persona
pueda desarrollar su aplicativo y con la informacin enviada va XML a travs del
internet pueda desarrollar sus propias pantallas de acuerdo a los estndares de la
institucin que desea utilizar.
As tambin los rangos de aprobacin del crdito pueden ser parametrizables de acuerdo
a la institucin que utilice el sistema.
-
58
4.2 HERRAMIENTAS DE DESARROLLO
4.2.1 Microsoft .Net
Es un entorno de desarrollo integrado (IDE, por sus siglas en ingls) para
sistemas operativos Windows. Soporta varios lenguajes de programacin tales
como Visual C++, Visual C#, Visual J#, ASP.NET y Visual Basic .NET, aunque
actualmente se han desarrollado las extensiones necesarias para muchos otros.
Visual Studio permite a los desarrolladores crear aplicaciones, sitios y
aplicaciones web, as como servicios web en cualquier entorno que soporte la
plataforma .NET. As se pueden crear aplicaciones que se intercomuniquen entre
estaciones de trabajo, pginas web y dispositivos mviles.
Microsoft .Net es una herramienta de desarrollo que puede usarse para crear
plataformas independientes y dispositivos independientes del software. Se puede
usar .Net Framework para tener datos disponibles a travs del internet como es
el caso de esta tesis.
Algunas caractersticas principales y que se destacan por su relevancia son:
Es un potente lenguaje orientado al desarrollo basado en objetos.
Permite realizar aplicaciones ms robustas y fciles de depurar.
-
59
Es un lenguaje ms simplificado y uniforme.
El cdigo es reutilizable y fcil de leer.
Ilustracin 11. Caractersticas Herramientas .Net
Fuente: Curso 2310. Developing web Applications Using Microsoft Visual studio 2008 Elaborado Por: Daniel Flores
-
60
4.2.2 SQL Server 2005
Ilustracin 12. Sql Server 2005
Microsoft SQL Server es un sistema de gestin de bases de datos relacionales
(SGBD) basado en el lenguaje Transact-SQL, y especficamente en Sybase IQ,
capaz de poner a disposicin de muchos usuarios grandes cantidades de datos de
manera simultnea, as como las siguientes caractersticas:
Soporte de transacciones.
Escalabilidad, estabilidad y seguridad.
Soporta procedimientos almacenados.
Incluye tambin un potente entorno grfico de administracin, que permite el
uso de comandos DDL y DML grficamente.
Fuente: Sql Server 2005 Elaborado Por: Daniel Flores
-
61
Permite trabajar en modo cliente-servidor, donde la informacin y datos se
alojan en el servidor y las term