Detecção de abuso em dns: verificação de concept drift e automação de retreino utilizando Apache Airflow

dc.contributor.advisorCansian, Adriano Mauro [UNESP]
dc.contributor.authorScavazini, Gabriel Zancheta
dc.date.accessioned2024-01-15T14:29:18Z
dc.date.available2024-01-15T14:29:18Z
dc.date.issued2023-11-14
dc.description.abstractO sistema de DNS é uma estrutura crucial na internet mundial, e são organizados de forma hierárquica a partir de sistemas distribuidos. No Brasil, que conta com mais de 5 milhões de domínios registrados, abusos como DNS Hijacking, Cache Poisoning e amplificação de DNS podem ocorrer diariamente. Para combater tais ações, práticas de coleta de dados passivos são utilizadas, que, por sua vez, são processadas por meio de machine learning para detectar e parar abusos automaticamente. Contudo, o modelo de aprendizado de máquina utilizado atualmente não é incremental e com o passar do tempo gera concept drift. Então, para identificar o concept drift, são utilizados métodos estatísticos ou baseados em janelas. Quando detectados, o controle de fluxo por meio de Apache Airflow, um gerenciador de workflow, aciona o retreinamento de máquina por meio de DAGs (grafo acíclico orientado). Portanto, criando assim um fluxo automatizado de execução tornando o modelo incremental.pt
dc.description.abstractThe DNS system is a crucial structure on the worldwide internet, organized hierarchically through distributed systems. In Brazil, which has over 5 million registered domains, abuses such as DNS hijacking, cache poisoning, and DNS amplification can occur daily. To combat such actions, passive data collection practices are employed, which are then processed through machine learning to automatically detect and stop abuses. However, the current machine learning model is not incremental and over time generates concept drift. Therefore, to identify concept drift, statistical or window-based methods are used. When detected, flow control through Apache Airflow, a workflow manager, triggers machine retraining through DAGs(directed acyclic graph). Thus, creating an automated execution flow, making the model incremental.en
dc.description.sponsorshipFundação para o Desenvolvimento da UNESP (FUNDUNESP)
dc.description.sponsorshipIdFUNDUNESP: 2764/2018
dc.identifier.citationSCAVAZINI, Gabriel Zancheta. Detecção De Abuso Em Dns: Verificação De Concept Drift E Automação De Retreino Utilizando Apache Airflow. (Trabalho de Conclusão – Ciências da Computação). - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2023.
dc.identifier.urihttps://hdl.handle.net/11449/252729
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectApache Airflowpt
dc.subjectNome de domíniopt
dc.subjectRedes de computadorespt
dc.subjectConcept Driften
dc.subjectMachine leaningen
dc.titleDetecção de abuso em dns: verificação de concept drift e automação de retreino utilizando Apache Airflow
dc.title.alternativeAbuse detection in DNS: concept drift verification and retraining automation using Apache Airflowen
dc.typeTrabalho de conclusão de curso
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto
unesp.examinationboard.typeBanca pública
unesp.undergraduateSão José do Rio Preto - IBILCE - Ciência da Computação

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
scavazini_gz_tcc_sjrp.pdf
Tamanho:
605.26 KB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.44 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
scavazini_gz_autorizacao_sjrp.pdf
Tamanho:
132.1 KB
Formato:
Adobe Portable Document Format
Descrição: