Atenção!


O atendimento às questões referentes ao Repositório Institucional será interrompido entre os dias 20 de dezembro de 2025 a 4 de janeiro de 2026.

Pedimos a sua compreensão e aproveitamos para desejar boas festas!

Logo do repositório

Detecção de fraudes bancárias: aplicação de Machine Learning e engenharia de características em uma base simulada de transações com cartão de crédito

Carregando...
Imagem de Miniatura

Orientador

Gonçalves, Aparecido Carlos

Coorientador

Pós-graduação

Curso de graduação

Ilha Solteira - FEIS - Engenharia Mecânica

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A detecção de fraudes financeiras tornou-se um dos desafios mais críticos para instituições bancárias e empresas do setor de pagamentos, devido ao crescente volume de transações digitais e à sofisticação dos ataques fraudulentos. Este trabalho foi inspirado no estudo de Le Borgne et al. (Borgne et al., 2022) e apresenta o desenvolvimento de um sistema de detecção de fraudes utilizando técnicas de aprendizado de máquina, com ênfase na transformação de características e análise temporal. Inicialmente, foi realizada uma simulação de dados de transações financeiras, utilizando distribuições estatísticas como normal, Poisson e uniforme para modelar variáveis como valores das transações, frequência de operações e localização de terminais. A partir dessa simulação, foi conduzido um processo de geração e enriquecimento de dados, no qual variáveis adicionais foram criadas para capturar padrões comportamentais e características de risco associadas a clientes e terminais. Os modelos de aprendizado de máquina aplicados incluíram Regressão Logística, Árvores de Decisão, Random Forest e XGBoost, os quais foram treinados e avaliados com base em métricas como AUC-ROC, Average Precision e Precisão do Cartão@100. Os resultados demonstraram que o Random Forest obteve o melhor desempenho no conjunto de teste, atingindo um equilíbrio entre acurácia e eficiência computacional. No entanto, o tempo de treinamento do modelo foi significativamente maior em comparação a técnicas mais simples, como a Regressão Logística. Os experimentos evidenciaram a importância de uma engenharia de dados robusta, destacando que a inclusão de variáveis temporais e agregações comportamentais melhora a performance dos modelos. Além disso, observou-se que modelos mais complexos, como Redes Neurais, podem ser explorados em trabalhos futuros para aprimorar a detecção de fraudes. Conclui-se que a combinação de aprendizado de máquina com uma estrutura de dados bem definida pode fornecer um sistema eficaz para a mitigação de fraudes no setor financeiro.

Resumo (inglês)

The detection of financial fraud has become one of the most critical challenges for banking institutions and payment service providers due to the increasing volume of digital transactions and the growing sophistication of fraudulent schemes. Inspired by the work of Le Borgne et al. (Borgne et al., 2022), this study presents the development of a fraud detection system using machine learning techniques, with a focus on feature engineering and temporal analysis. Initially, a simulation of financial transaction data was conducted, utilizing statistical distributions such as normal, Poisson, and uniform to model transaction values, transaction frequency, and terminal locations. Based on this simulation, a data generation and enrichment process was carried out, creating additional features to capture behavioral patterns and risk characteristics associated with clients and terminals. The applied machine learning models included Logistic Regression, Decision Trees, Random Forest, and XGBoost, which were trained and evaluated using metrics such as AUC-ROC, Average Precision, and Card Precision@100. The results showed that Random Forest achieved the best overallperformance on the test set, balancing accuracy and computational efficiency. However, its training time was significantly longer compared to simpler models, such as Logistic Regression. The experiments highlighted the importance of a robust feature engineering process, demonstrating that incorporating temporal variables and behavioral aggregations improvesmodel performance. Additionally, more complex models such as Deep Learning and Gradient Boosting could be explored in future research to enhance fraud detection. It is concluded that the combination of machine learning with a well-structured data processing pipeline can provide an effective system for mitigating fraud in the financial sector.

Descrição

Palavras-chave

Detecção de fraudes, Aprendizado de máquina, Engenharia de características, Modelagem estatística, Análise temporal

Idioma

Português

Citação

ASSUMPÇÃO, Lucas Costa Ferreira. Detecção de fraudes bancárias: aplicação de Machine Learning e engenharia de características em uma base simulada de transações com cartão de crédito. Orientador: Aparecido Carlos Gonçalves. 2025. 58 f. : il. Trabalho de conclusão de curso (Graduação em Engenharia Mecânica) -Universidade Estadual Paulista (UNESP), Faculdade de Engenharia, Ilha Solteira, 2025

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação