Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo
Loading...
Date
Authors
Advisor
Oikawa, Sérgio Minoru 

Coadvisor
Tarumoto, Mário Hissamitsu 

Graduate program
Undergraduate course
Presidente Prudente - FCT - Estatística
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Estadual Paulista (Unesp)
Type
Undergraduate thesis
Access right
Acesso aberto

Abstract
Abstract (portuguese)
Este trabalho tem como objetivo investigar a importância do uso de técnicas de balanceamento em modelos de regressão logística aplicados à detecção de fraudes em bases de dados desbalanceadas. Esta forma de balanceamento dos dados será comparada à proposta apresentada por Assunção, Izbicki e Prates (2024). O estudo utiliza duas bases de dados com diferentes proporções de casos de fraude, buscando analisar como o desequilíbrio afeta a performance dos modelos. O modelo de regressão logística foi escolhido por sua aplicação em problemas de classificação binária e principalmente pela possibilidade de interpretação dos parâmetros do modelo. Serão aplicadas diversas métricas de avaliação para analisar a capacidade dos modelos em identificar corretamente as fraudes. Este trabalho pretende contribuir para a compreensão do impacto das técnicas de balanceamento e avaliação da melhor técnica a ser utilizada na melhoria da detecção de fraudes, destacando a importância da escolha adequada das métricas de desempenho em cenários com dados desbalanceados.
Abstract (english)
This work aims to investigate the importance of applying data balancing techniques to logistic regression models used for fraud detection in imbalanced datasets. These balancing approaches are compared with the strategy proposed by Assunção, Izbicki, and Prates (2024). The study employs two datasets with different proportions of fraudulent cases, in order to analyze how class imbalance affects model performance. Logistic regression was chosen due to its suitability for binary classification problems and, in particular, for the interpretability of its parameters. Several evaluation metrics are applied to assess the ability of the models to correctly identify fraudulent transactions. This work seeks to contribute to a better understanding of the impact of balancing techniques and to evaluate the most effective strategy for improving fraud detection, highlighting the importance of choosing appropriate performance metrics in scenarios with imbalanced data.
Description
Keywords
Regressão logística, Dados desbalanceados, Detecção de fraudes, Logistic regression, Unbalanced data, Fraud detection
Language
Portuguese
Citation
MOTA, Thamires dos Santos. Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo. Orientador: Sérgio Minoru Oikawa. 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente, 2025.


