Repository logo

Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo

Loading...
Thumbnail Image

Advisor

Oikawa, Sérgio Minoru

Coadvisor

Tarumoto, Mário Hissamitsu

Graduate program

Undergraduate course

Presidente Prudente - FCT - Estatística

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Estadual Paulista (Unesp)

Type

Undergraduate thesis

Access right

Acesso abertoAcesso Aberto

Abstract

Abstract (portuguese)

Este trabalho tem como objetivo investigar a importância do uso de técnicas de balanceamento em modelos de regressão logística aplicados à detecção de fraudes em bases de dados desbalanceadas. Esta forma de balanceamento dos dados será comparada à proposta apresentada por Assunção, Izbicki e Prates (2024). O estudo utiliza duas bases de dados com diferentes proporções de casos de fraude, buscando analisar como o desequilíbrio afeta a performance dos modelos. O modelo de regressão logística foi escolhido por sua aplicação em problemas de classificação binária e principalmente pela possibilidade de interpretação dos parâmetros do modelo. Serão aplicadas diversas métricas de avaliação para analisar a capacidade dos modelos em identificar corretamente as fraudes. Este trabalho pretende contribuir para a compreensão do impacto das técnicas de balanceamento e avaliação da melhor técnica a ser utilizada na melhoria da detecção de fraudes, destacando a importância da escolha adequada das métricas de desempenho em cenários com dados desbalanceados.

Abstract (english)

This work aims to investigate the importance of applying data balancing techniques to logistic regression models used for fraud detection in imbalanced datasets. These balancing approaches are compared with the strategy proposed by Assunção, Izbicki, and Prates (2024). The study employs two datasets with different proportions of fraudulent cases, in order to analyze how class imbalance affects model performance. Logistic regression was chosen due to its suitability for binary classification problems and, in particular, for the interpretability of its parameters. Several evaluation metrics are applied to assess the ability of the models to correctly identify fraudulent transactions. This work seeks to contribute to a better understanding of the impact of balancing techniques and to evaluate the most effective strategy for improving fraud detection, highlighting the importance of choosing appropriate performance metrics in scenarios with imbalanced data.

Description

Keywords

Regressão logística, Dados desbalanceados, Detecção de fraudes, Logistic regression, Unbalanced data, Fraud detection

Language

Portuguese

Citation

MOTA, Thamires dos Santos. Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo. Orientador: Sérgio Minoru Oikawa. 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente, 2025.

Related itens

Sponsors

Units

Item type:Unit,
Faculdade de Ciências e Tecnologia
FCT
Campus: Presidente Prudente


Departments

Undergraduate courses

Graduate programs