Publication: Detecção de páginas de phishing utilizando aprendizado de máquina
Loading...
Date
Authors
Advisor
Costa, Kelton Augusto Pontara da 

Coadvisor
Graduate program
Undergraduate course
Ciência da Computação - FC
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Estadual Paulista (Unesp)
Type
Undergraduate thesis
Access right
Acesso aberto

Abstract
Abstract (portuguese)
Com o avanço da Internet e o aumento de serviços digitais, tentativas de fraudes online, como o phishing, se tornaram um problema cada vez maior. Devido ao contínuo aumento e evolução desses ataques, há a necessidade do desenvolvimento e aprimoramento de métodos para detecção deles. Neste trabalho, foi criado um sistema de detecção de páginas de phishing, utilizando técnicas de aprendizado de máquina como Árvore de Decisão, Floresta Aleatória, Árvores Extremamente Aleatórias e XGBoost. Os modelos foram desenvolvidos com um conjunto de dados de 88.647 entradas e mediu-se suas efetividades através de métricas já estabelecidas na área de aprendizado de máquina. Os resultados obtidos foram promissores, com o modelo XGBoost apresentando o melhor resultado, mostrando-se eficaz para a detecção de páginas da internet falsas.
Abstract (english)
With the advancement of the Internet and increase use of digital services, online fraud attempts, like phishing, has become an even bigger problem. Because of the ongoing increase and evolution of these attacks, there's a need to develop and improve the methods used to detect them. In this work, a system for detection of phishing pages was developed using machine learning techniques such as Decision Tree, Random Forest, Extremely Randomized Trees and XGBoost. The models were developed using a dataset with 88,647 entries and their effectiveness was measured using metrics already established in the machine learning field. The results were promising, with the XGBoost model presenting the best result, showing to be effective in detecting fake internet pages.
Description
Keywords
Aprendizado de máquina, Inteligência Artificial, Fraude na Internet, Árvores de decisão, Machine learning, Artificial intelligence, Internet fraud, Decision trees
Language
Portuguese