Repository logo
 

Publication:
Detecção de páginas de phishing utilizando aprendizado de máquina

Loading...
Thumbnail Image

Advisor

Costa, Kelton Augusto Pontara da

Coadvisor

Graduate program

Undergraduate course

Ciência da Computação - FC

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Estadual Paulista (Unesp)

Type

Undergraduate thesis

Access right

Acesso abertoAcesso Aberto

Abstract

Abstract (portuguese)

Com o avanço da Internet e o aumento de serviços digitais, tentativas de fraudes online, como o phishing, se tornaram um problema cada vez maior. Devido ao contínuo aumento e evolução desses ataques, há a necessidade do desenvolvimento e aprimoramento de métodos para detecção deles. Neste trabalho, foi criado um sistema de detecção de páginas de phishing, utilizando técnicas de aprendizado de máquina como Árvore de Decisão, Floresta Aleatória, Árvores Extremamente Aleatórias e XGBoost. Os modelos foram desenvolvidos com um conjunto de dados de 88.647 entradas e mediu-se suas efetividades através de métricas já estabelecidas na área de aprendizado de máquina. Os resultados obtidos foram promissores, com o modelo XGBoost apresentando o melhor resultado, mostrando-se eficaz para a detecção de páginas da internet falsas.

Abstract (english)

With the advancement of the Internet and increase use of digital services, online fraud attempts, like phishing, has become an even bigger problem. Because of the ongoing increase and evolution of these attacks, there's a need to develop and improve the methods used to detect them. In this work, a system for detection of phishing pages was developed using machine learning techniques such as Decision Tree, Random Forest, Extremely Randomized Trees and XGBoost. The models were developed using a dataset with 88,647 entries and their effectiveness was measured using metrics already established in the machine learning field. The results were promising, with the XGBoost model presenting the best result, showing to be effective in detecting fake internet pages.

Description

Keywords

Aprendizado de máquina, Inteligência Artificial, Fraude na Internet, Árvores de decisão, Machine learning, Artificial intelligence, Internet fraud, Decision trees

Language

Portuguese

Citation

Related itens

Units

Departments

Undergraduate courses

Graduate programs