Identificación automática mediante redes neuronales de clientes propensos al deterioro de su nivel de riesgo crediticio de una entidad financiera

Chumpitaz Collazos Juan Antonio; Salcedo Hidalgo Martín Jean

Please use this identifier to cite or link to this item: http://hdl.handle.net/20.500.14076/12285

Title:	Identificación automática mediante redes neuronales de clientes propensos al deterioro de su nivel de riesgo crediticio de una entidad financiera
Authors:	Chumpitaz Collazos Juan Antonio Salcedo Hidalgo Martín Jean
Advisors:	Oporto Díaz, Samuel Alonso
Keywords:	Minería de datos;Nivel de riesgo
Issue Date:	2017
Publisher:	Universidad Nacional de Ingeniería
Abstract:	Este proyecto de tesis se centra en la creación de un modelo estadístico basado en redes neuronales que identifique a los clientes cuyo nivel de riesgo este propenso a deteriorase a partir de datos históricos como datos del cliente, datos del cliente en el sistema financiero, datos de las cuentas, datos de la gestión de cobranza de las cuentas y datos de las transacciones del cliente, a este conjunto de datos se le conoce como dataset. Para lograr realizar este proyecto utilizamos una las metodologías CRISP-DM, que es una de las metodologías más utilizadas en proyectos de minería de datos y de data Science. Esta metodología consta de 6 fase las cuales no necesariamente siguen una secuencia rígida; ya que, en muchos casos es posible regresar a fases anteriores. Para alcanzar el modelo de solución propuesto, en primer lugar, se procedió a realizar una exhaustiva revisión de los atributos haciendo uso de estadística univariada y mutivariada. En segundo lugar, se procedió a realizar una limpieza de atributos a través de análisis de valores imprecisos, valores nulos y valores atípicos con el fin de obtener un dataset de alta calidad para el modelo. En tercer lugar, se realizó un proceso de transformación y reducción de atributos con el fin de identificar la transformación con mayor grado de relevancia para el modelo. En cuarto lugar, se plantea la arquitectura de la RNA, parámetros de la RNA y medidas para calcular la performance del modelo. Finalmente, se realizó la experimentación del modelo con el fin de obtener los valores óptimos para los parámetros que serán utilizados en la RNA; para ello, se ejecutaron 9,600 pruebas. En base a estas pruebas, se logró obtener un modelo óptimo con un error promedio de 13.78%. Adicionalmente, se detallan las conclusiones y recomendaciones para proyecto futuros de minerías de datos y redes neuronales.
URI:	http://hdl.handle.net/20.500.14076/12285
Rights:	info:eu-repo/semantics/restrictedAccess
Appears in Collections:	Ingeniería de Sistemas

Files in This Item:

File	Description	Size	Format
chumpitaz_ca.pdf		3,75 MB	Adobe PDF	Acceso Restringido

Show full item record

This item is licensed under a Creative Commons License

Indexado por: