Detecção de domínios maliciosos por meio de DNS passivo utilizando XGBoost

dc.contributor.advisorCansian, Adriano Mauro [UNESP]
dc.contributor.authorSilveira, Marcos Rogério
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2021-03-09T18:37:02Z
dc.date.available2021-03-09T18:37:02Z
dc.date.issued2021-01-19
dc.description.abstractEste trabalho apresenta um método para detecção de domínios maliciosos por meio do tráfego de DNS passivo. Para tanto, a abordagem utilizada é um dataset de DNS passivo como fonte de dados para a tarefa de classificação dos domínios entre maliciosos e legítimos. A partir deste dataset, são extraídas doze features exclusivas do tráfego DNS. Os registros presentes no dataset DNS passivo são rotulados utilizando allowlists e blocklists de nomes de domínios e IPs. Para balanceamento das classes, foi utilizado a técnica de Random Undersampling. Na etapa de treinamento, foram utilizados e comparados o desempenho dos três algoritmos de aprendizado de máquina supervisionado baseados em árvores de decisão. Os modelos foram testados considerando suas capacidades de identificar domínios maliciosos, o modelo com melhor desempenho foi o que utilizou o algoritmo XGBoost, com uma AUC média de 0,9776 e sem indicativos de overfitting presente.pt
dc.description.abstractThis paper presents a method for detecting malicious domains through passive DNS traffic. For this, the approach used is a passive DNS dataset as a data source for the task of classifying the domains between malicious and legitimate. From this dataset, twelve exclusive features of DNS traffic are extracted. The records present in the passive DNS dataset are labeled using allowlists and blocklists of domain names and IPs. To balance the classes, the Random Undersampling technique was used. In the training stage, the performance of the three supervised machine learning algorithms based on decision trees was used and compared. The models were tested considering their ability to identify malicious domains, the model with the best performance was the one that used the XGBoost algorithm, with an average AUC of 0.9776 and with no indications of overfitting present.en
dc.description.sponsorshipOutra
dc.description.sponsorshipIdNIC.br: 2764/2018
dc.identifier.capes33004153073P2
dc.identifier.urihttp://hdl.handle.net/11449/202882
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectDomain name systemen
dc.subjectDomínios maliciosospt
dc.subjectDNS passivopt
dc.subjectMachine learningen
dc.subjectMalicious domainen
dc.subjectPassive DNSen
dc.titleDetecção de domínios maliciosos por meio de DNS passivo utilizando XGBoostpt
dc.title.alternativeDetection of malicious domains using passive DNS using XGBoosten
dc.typeDissertação de mestrado
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Pretopt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência da Computação - IBILCEpt
unesp.knowledgeAreaComputação aplicadapt
unesp.researchAreaSistemas de computaçãopt

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
silveira_mr_me_sjrp.pdf
Tamanho:
2.95 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.97 KB
Formato:
Item-specific license agreed upon to submission
Descrição: