Detecção de domínios maliciosos por meio de DNS passivo utilizando XGBoost

Silveira, Marcos Rogério

Detecção de domínios maliciosos por meio de DNS passivo utilizando XGBoost

dc.contributor.advisor	Cansian, Adriano Mauro [UNESP]
dc.contributor.author	Silveira, Marcos Rogério
dc.contributor.institution	Universidade Estadual Paulista (Unesp)
dc.date.accessioned	2021-03-09T18:37:02Z
dc.date.available	2021-03-09T18:37:02Z
dc.date.issued	2021-01-19
dc.description.abstract	Este trabalho apresenta um método para detecção de domínios maliciosos por meio do tráfego de DNS passivo. Para tanto, a abordagem utilizada é um dataset de DNS passivo como fonte de dados para a tarefa de classificação dos domínios entre maliciosos e legítimos. A partir deste dataset, são extraídas doze features exclusivas do tráfego DNS. Os registros presentes no dataset DNS passivo são rotulados utilizando allowlists e blocklists de nomes de domínios e IPs. Para balanceamento das classes, foi utilizado a técnica de Random Undersampling. Na etapa de treinamento, foram utilizados e comparados o desempenho dos três algoritmos de aprendizado de máquina supervisionado baseados em árvores de decisão. Os modelos foram testados considerando suas capacidades de identificar domínios maliciosos, o modelo com melhor desempenho foi o que utilizou o algoritmo XGBoost, com uma AUC média de 0,9776 e sem indicativos de overfitting presente.	pt
dc.description.abstract	This paper presents a method for detecting malicious domains through passive DNS traffic. For this, the approach used is a passive DNS dataset as a data source for the task of classifying the domains between malicious and legitimate. From this dataset, twelve exclusive features of DNS traffic are extracted. The records present in the passive DNS dataset are labeled using allowlists and blocklists of domain names and IPs. To balance the classes, the Random Undersampling technique was used. In the training stage, the performance of the three supervised machine learning algorithms based on decision trees was used and compared. The models were tested considering their ability to identify malicious domains, the model with the best performance was the one that used the XGBoost algorithm, with an average AUC of 0.9776 and with no indications of overfitting present.	en
dc.description.sponsorship	Outra
dc.description.sponsorshipId	NIC.br: 2764/2018
dc.identifier.capes	33004153073P2
dc.identifier.uri	http://hdl.handle.net/11449/202882
dc.language.iso	por
dc.publisher	Universidade Estadual Paulista (Unesp)
dc.rights.accessRights	Acesso aberto
dc.subject	Domain name system	en
dc.subject	Domínios maliciosos	pt
dc.subject	DNS passivo	pt
dc.subject	Machine learning	en
dc.subject	Malicious domain	en
dc.subject	Passive DNS	en
dc.title	Detecção de domínios maliciosos por meio de DNS passivo utilizando XGBoost	pt
dc.title.alternative	Detection of malicious domains using passive DNS using XGBoost	en
dc.type	Dissertação de mestrado
unesp.campus	Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto	pt
unesp.embargo	Online	pt
unesp.examinationboard.type	Banca pública	pt
unesp.graduateProgram	Ciência da Computação - IBILCE	pt
unesp.knowledgeArea	Computação aplicada	pt
unesp.researchArea	Sistemas de computação	pt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: silveira_mr_me_sjrp.pdf
Tamanho:: 2.95 MB
Formato:: Adobe Portable Document Format
Descrição:

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 2.97 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Coleções

Dissertações - Ciência da Computação - IBILCE