Please use this identifier to cite or link to this item:
http://hdl.handle.net/20.500.14076/12285
Title: | Identificación automática mediante redes neuronales de clientes propensos al deterioro de su nivel de riesgo crediticio de una entidad financiera |
Authors: | Chumpitaz Collazos Juan Antonio Salcedo Hidalgo Martín Jean |
Advisors: | Oporto Díaz, Samuel Alonso |
Keywords: | Minería de datos;Nivel de riesgo |
Issue Date: | 2017 |
Publisher: | Universidad Nacional de Ingeniería |
Abstract: | Este proyecto de tesis se centra en la creación de un modelo estadístico basado en redes neuronales que identifique a los clientes cuyo nivel de riesgo este propenso a deteriorase a partir de datos históricos como datos del cliente, datos del cliente en el sistema financiero, datos de las cuentas, datos de la gestión de cobranza de las cuentas y datos de las transacciones del cliente, a este conjunto de datos se le conoce como dataset. Para lograr realizar este proyecto utilizamos una las metodologías CRISP-DM, que es una de las metodologías más utilizadas en proyectos de minería de datos y de data Science. Esta metodología consta de 6 fase las cuales no necesariamente siguen una secuencia rígida; ya que, en muchos casos es posible regresar a fases anteriores. Para alcanzar el modelo de solución propuesto, en primer lugar, se procedió a realizar una exhaustiva revisión de los atributos haciendo uso de estadística univariada y mutivariada. En segundo lugar, se procedió a realizar una limpieza de atributos a través de análisis de valores imprecisos, valores nulos y valores atípicos con el fin de obtener un dataset de alta calidad para el modelo. En tercer lugar, se realizó un proceso de transformación y reducción de atributos con el fin de identificar la transformación con mayor grado de relevancia para el modelo. En cuarto lugar, se plantea la arquitectura de la RNA, parámetros de la RNA y medidas para calcular la performance del modelo. Finalmente, se realizó la experimentación del modelo con el fin de obtener los valores óptimos para los parámetros que serán utilizados en la RNA; para ello, se ejecutaron 9,600 pruebas. En base a estas pruebas, se logró obtener un modelo óptimo con un error promedio de 13.78%. Adicionalmente, se detallan las conclusiones y recomendaciones para proyecto futuros de minerías de datos y redes neuronales. |
URI: | http://hdl.handle.net/20.500.14076/12285 |
Rights: | info:eu-repo/semantics/restrictedAccess |
Appears in Collections: | Ingeniería de Sistemas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
chumpitaz_ca.pdf | 3,75 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License
Indexado por: