TAZ-TFM-2019-1465


Modelos recientes de la Estadística y el aprendizaje máquina para la valoración del riesgo de incumplimiento crediticio

Pinedo Borobio, Pedro
Alcalá Nalvaiz, José Tomás (dir.) ; Cortés Utrillas, Vanesa (dir.)

Universidad de Zaragoza, CIEN, 2019
Departamento de Métodos Estadísticos, Área de Estadística e Investigación Operativa

Máster Universitario en Modelización e Investigación Matemática, Estadística y Computación

Resumen: El proyecto se centra en analizar los avances más recientes en metodología de aprendizaje máquina (machine learning) aplicados a la estimación del riesgo de crédito bancario, más concretamente a la probabilidad de incumplimiento crediticio (default probability). Especialmente se analizarán propuestas basadas en árboles de clasificación por técnicas de consenso (p.ej. gradient boosted trees). Un elemento a destacar y que supone un tema de investigación abierto es la optimización de los parámetros asociados a estos métodos y la valoración de la importancia de cada característica en la estimación final de la probabilidad asignada.Se compararán algunas de las técnicas más recientes (XGboost y similares) con métodos clásicos como regresión logística. Se utilizarán conjuntos de datos disponibles en los repositorios abiertos, en nuestro caso la página de Lending Club.
La memoria se divide en 4 capítulos, en el primero consta de una introducción, en la que se habla de lo que me ha motivado a elegir este tema, los objetivos y algunos conceptos que serán necesarios a lo largo de la memoria. En el segundo se da una explicación de los modelos de árbol y de distintos metaclasificadores, por ejemplo Bagging, Random Forest y Boosting. En el último vamos a estudiar unos métodos de boosting más avanzados a través del método del gradiente descendiente y el método de Newton. A continuación se va a utilizar dichas técnicas en árboles de decisión, esto hará que se mejoren algunas de las limitaciones que presentan los árboles, en nuestro caso se ha centrado en Newton Boosting Tree. En el tercer capítulo se explican los distintos conceptos financieros teóricos y como se han ido modificando las entidades bancarias a través de los Acuerdos de Basilea. En el cuarto capítulo es un estudio de la base de datos real en la que se ha aplicado ingeniería de características como medida de depuración, se estiman los modelos de regresión logística y los distintos modelos de XGBoost a partir de los parámetros. Para finalizar, se realiza una comparación de los métodos a través de la métrica de evaluación que se ha utilizado, que en nuestro caso es el AUC.


Tipo de Trabajo Académico: Trabajo Fin de Master

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de máster



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)