Aplicação do método conjunto Stacking do classificador Floresta de Caminhos Ótimos para o problema de detecção de intrusão.

Carregando...
Imagem de Miniatura

Data

2021-07-02

Orientador

Brega, José Remo Ferreira

Coorientador

Pós-graduação

Ciência da Computação - IBILCE

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Com a expansão tecnológica, a base dos processos de negócios de inúmeras instituições tornouse a informação, causando certa dependência das organizações perante a computação. Em um cenário onde existem praticamente infinitas ameaças às informações das organizações, a área de Segurança da Informação demonstra-se ser essencial. Para garantir a proteção do ambiente organizacional, diversas medidas de segurança são cabíveis, dentre elas a implementação de controles lógicos. Um dos controles lógicos mais conhecidos e amplamente utilizado é o Sistema de Detecção de Intrusão, que, basicamente, pode ter sua metodologia baseada em assinatura ou anomalia. Esta última é capaz de detectar ameaças completamente desconhecidas, e por isso tem sido extensivamente estudada pela comunidade científica. A fim de aprimorar a performance destes sistemas, técnicas de Aprendizado de Máquina são aplicadas, buscando melhorar as taxas de detecção e diminuir os erros dos mesmos. Dentre essas técnicas, ultimamente os métodos conjuntos têm se destacado na área, produzindo resultados promissores em suas implementações. Este trabalho apresenta a aplicação de um método conjunto de Stacking do classificador Optimum-Path Forest para o problema de detecção de intrusão, com o intuito de contribuir para a área de Segurança da Informação. Para tal, dois conjuntos de dados foram empregados, um amplamente utilizado pela comunidade científica, NSL-KDD, e outro novo, uneSPY; ambos foram avaliados através de três experimentos distintos, que implementaram diversos classificadores, como Regressor Logístico, Decision Tree, Support Vector Machine, Random Forest, Optimum-Path Forest, e foram comparados com os modelos conjuntos stack do classificador Optimum-Path Forest. Os resultados experimentais forneceram observações interessantes sobre o conjunto de dados uneSPY e demonstraram aptidão dos modelos conjuntos do Optimum-Path Forest.

Resumo (inglês)

Machine Learning techniques have been extensively researched in the last years, mainly due to their effectiveness when dealing with recognition classification applications. Typically, one can comprehend using a Machine Learning system to autonomously delegate routines, save human efforts, and produce great insights regarding decision-making tasks. This work introduces and validates a stacking-based ensemble approach using Optimum-Path Forest classifiers to the intrusion detection task. Instead of using only the widely adopted NSL-KDD dataset, this work also employs a new one, called uneSPY; which provides valuable insights concerning new intrusion detection datasets. Both datasets were evaluated under three distinct experiments, which implemented several classifiers, including Logistic Regression, Decision Trees, Support Vector Machines, Random Forests, Optimum-Path Forests, and were compared against Optimum-Path Forest stacking-based ensembles. The experimental results showed an Optimum-Path Forest stacking-based ensemble classification suitability, particularly when considering its ability to generalize large volumes of data while sustaining its performance.

Descrição

Idioma

Português

Como citar