Divulgação - Defesa Nº 281

Aluno: Armando Pereira Pontes Júnior

Título: "Otimização de Hiperparâmetros de Modelos de Machine Learning para detectar Clientes em Risco de Crédito".

Orientadora: Roberta Andrade de Araújo Fagundes

Examinador Externo: Djalma Silva Guimarães Júnior (UPE)

Examinador Interno: Carlo Marcelo Revoredo (PPGEC)

Data-hora: 29 de Setembro de 2023 às 14:00.
Local: Miniauditório, bloco B, POLI/UPE


Resumo:

         "A avaliação de risco de crédito tem um papel fundamental para as instituições financeiras por estar associada a possíveis perdas que geram fortes impactos nos resultados financeiros. A indústria financeira necessita implementar soluções mais assertivas, rápidas e de menor custo para tarefa de avaliar bons e maus pagadores. Métodos de aprendizado de máquina (machine learning – ML) estão cada vez mais presentes e sendo utilizados por essas instituições. Além disso, o uso de técnicas de otimização de hiperparâmetros tentam melhorar o desempenho das máquinas preditivas. Neste trabalho foram aplicadas duas importantes técnicas de otimização em conjunto com seis classificadores: Regressão Logística (RL), Decision Tree (DT), Random Forest (RF), Multi Layer Perceptron (MLP), eXtreme Gradient Boost (XGBoost) e Light Gradient Boost Machine (LGBM). Os desempenhos dos classificadores foram mensurados a partir das métricas Accuracy, Precison, Recall, F1-Score, Área sobre a Curva ROC (AUC) e tempo de processamento (como uma proxy para o custo computacional). Os modelos foram treinados e testados em duas bases de crédito: German Credit e em um conjunto de dados de uma Cooperativa com atuação no Brasil. Inicialmente, foram utilizadas as configurações padrões dos hiperparâmetros dos modelos escolhidos, para, posteriormente, aplicar as técnicas de otimização Bayesiana e por Particle Swarm Optimization (PSO) com intuito de alcançar as melhores combinações de hiperparâmetros, e incrementar os primeiros resultados observados. A otimização bayesiana apresentou melhorias em todas as métricas dos modelos, com destaque para o Recall, obtendo um resultado de 91,4% no MLP. Por outro lado, a otimização por PSO não apresentou bons resultados quando comparados com os da primeira técnica de otimização. Por fim, foi aplicado um teste estatístico para comparar e validar os resultados obtidos pelos modelos.”

Go to top Menu