Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão
dc.contributor.advisor | Costa, Kelton Augusto Pontara da [UNESP] | |
dc.contributor.author | Tojeiro, Carlos Alexandre Carvalho [UNESP] | |
dc.contributor.coadvisor | Lucas, Thiago José | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2024-09-10T12:57:22Z | |
dc.date.available | 2024-09-10T12:57:22Z | |
dc.date.issued | 2024-07-18 | |
dc.description.abstract | A necessidade de trabalhar com as informações digitais nas empresas gerou um crescimento nos números de ataques cibernéticos em busca de ativos valiosos. Em contraproposta, pesquisadores e administradores de redes vêm buscando uma precisão maior do processo que visa descobrir portas “abertas” em dispositivos de rede, sendo que as “portas” são pontos de acesso pelos quais os dados transitam nos dispositivos. Dentro desta proposta, este trabalho apresenta um estudo da aplicação de combinações de algoritmos de Aprendizado de Máquina (AM) que possam identificar uma maior quantidade de tentativas de “escaneamento de portas”, técnica usada para identificar o estado de uma porta de rede, já que os cibercrimes normalmente iniciam-se com um ataque de Portscan. O trabalho proposto compara dois métodos de seleção de características, aplicando métodos de undersampling e oversampling para o balanceamento das classes “normal” e “ataque”, classificando-os com Rede Neural, Regressão Logística, Máquinas de Vetores de Suporte, Random Forest (RF), Decision Tree (DT) e k-Nearest Neighbors (kNN) no conjunto de dados CICIDS2017. O resultado adquirido com as diferentes combinaçõesde algoritmos de AM demonstrou-se que a combinação dos classificadores RF, DT e kNN juntamente com a técnica de SMOTEENN, obtiveram desempenhos superiores as demais combinações propostas no trabalho. | pt |
dc.description.abstract | The need to work with digital information in companies has led to an increase in the number of cyber attacks in search of valuable assets. In counter-proposal researchers and network administrators have been searching for greater precision of the process of discovering “open ports” on network devices, where “ports” are access points for which information passes through the devices. Within this proposal, this work presents a study of the application of combinations of Machine Learning (ML) algorithms that can identify a greater number of “port scanning” attempts, a technique used to identify the state of a network port, since cybercrime cybercrimes usually begin with a port scanning attack. The proposed work compares two feature selection methods, applying undersampling and oversampling methods to balance the “normal” and “attack” classes, classifying them with using Neural Networks (NN), Logistic Regression (LR), Support Vector Machines (SVM), Random Forest (RF), Decision Tree (DT) and k-Nearest Neighbours (kNN) on the CICIDS2017 dataset. The results obtained with the different combinations of algorithms showed that the combination of the RF, DT and kNN classifiers together with the SMOTEENN technique performed better than the other combinations proposed in the work. | en |
dc.identifier.capes | 33004153073P2 | |
dc.identifier.citation | TOJEIRO, Carlos Alexandre Carvalho. Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão. Orientador: Kelton Augusto Pontara da Costa. 100 f. 2024. Dissertação (Mestrado em Ciência da Computação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024. | |
dc.identifier.uri | https://hdl.handle.net/11449/257359 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | pt |
dc.subject | Aprendizado do computador | pt |
dc.subject | Redes de computadores | pt |
dc.subject | Sistemas de detecção de intrusão (Medidas de segurança) | pt |
dc.subject | Machine learning | en |
dc.subject | Data balancing | en |
dc.subject | Portscan | en |
dc.subject | Intrusion detection systems | en |
dc.subject | Computer networks | en |
dc.title | Identificação de portscan com machine learning: uma análise dos impactos de algoritmos de oversampling e undersampling no desenvolvimento de sistemas de detecção de intrusão | pt |
dc.title.alternative | Portscan identification with machine learning: an analysis of the impacts of oversampling and undersampling algorithms on the development of intrusion detection systems | en |
dc.type | Dissertação de mestrado | pt |
dspace.entity.type | Publication | |
unesp.campus | Universidade Estadual Paulista (UNESP), Faculdade de Ciências, Bauru | pt |
unesp.embargo | Online | pt |
unesp.examinationboard.type | Banca pública | pt |
unesp.graduateProgram | Ciência da Computação - FC/FCT/IBILCE/IGCE | pt |
unesp.knowledgeArea | Computação aplicada | pt |
unesp.researchArea | Sistemas de Computação | pt |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- tojeiro_cac_me_bauru.pdf
- Tamanho:
- 1.79 MB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: