Atenção!


O atendimento às questões referentes ao Repositório Institucional será interrompido entre os dias 20 de dezembro de 2025 a 4 de janeiro de 2026.

Pedimos a sua compreensão e aproveitamos para desejar boas festas!

Logo do repositório

Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo

Carregando...
Imagem de Miniatura

Orientador

Oikawa, Sérgio Minoru

Coorientador

Tarumoto, Mário Hissamitsu

Pós-graduação

Curso de graduação

Presidente Prudente - FCT - Estatística

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Este trabalho tem como objetivo investigar a importância do uso de técnicas de balanceamento em modelos de regressão logística aplicados à detecção de fraudes em bases de dados desbalanceadas. Esta forma de balanceamento dos dados será comparada à proposta apresentada por Assunção, Izbicki e Prates (2024). O estudo utiliza duas bases de dados com diferentes proporções de casos de fraude, buscando analisar como o desequilíbrio afeta a performance dos modelos. O modelo de regressão logística foi escolhido por sua aplicação em problemas de classificação binária e principalmente pela possibilidade de interpretação dos parâmetros do modelo. Serão aplicadas diversas métricas de avaliação para analisar a capacidade dos modelos em identificar corretamente as fraudes. Este trabalho pretende contribuir para a compreensão do impacto das técnicas de balanceamento e avaliação da melhor técnica a ser utilizada na melhoria da detecção de fraudes, destacando a importância da escolha adequada das métricas de desempenho em cenários com dados desbalanceados.

Resumo (inglês)

This work aims to investigate the importance of applying data balancing techniques to logistic regression models used for fraud detection in imbalanced datasets. These balancing approaches are compared with the strategy proposed by Assunção, Izbicki, and Prates (2024). The study employs two datasets with different proportions of fraudulent cases, in order to analyze how class imbalance affects model performance. Logistic regression was chosen due to its suitability for binary classification problems and, in particular, for the interpretability of its parameters. Several evaluation metrics are applied to assess the ability of the models to correctly identify fraudulent transactions. This work seeks to contribute to a better understanding of the impact of balancing techniques and to evaluate the most effective strategy for improving fraud detection, highlighting the importance of choosing appropriate performance metrics in scenarios with imbalanced data.

Descrição

Palavras-chave

Regressão logística, Dados desbalanceados, Detecção de fraudes, Logistic regression, Unbalanced data, Fraud detection

Idioma

Português

Citação

MOTA, Thamires dos Santos. Aplicação do modelo de regressão logística em situações de dados com desbalanceamento severo. Orientador: Sérgio Minoru Oikawa. 2025. 55 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística) - Faculdade de Ciências e Tecnologia, Universidade Estadual Paulista, Presidente Prudente, 2025.

Itens relacionados

Financiadores

Unidades

Item type:Unidade,
Faculdade de Ciências e Tecnologia
FCT
Campus: Presidente Prudente


Departamentos

Cursos de graduação

Programas de pós-graduação