Publicação: Aplicação de técnicas de ensemble learning na detecção estática e dinâmica de malwares
Carregando...
Arquivos
Data
Autores
Orientador
Costa, Kelton Augusto Pontara da 

Coorientador
Pós-graduação
Curso de graduação
Ciência da Computação - FC
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Com o constante aumento do uso de tecnologia no dia a dia a importância da segurança da informação cresce drasticamente, levando à existência de malwares ser uma ameaça ao funcionamento de sistemas e dados importantes, requisitando formas de combatê-los. Modelos de ensemble learning são modelos de aprendizado de máquina que utilizam vários algoritmos para chegar a resultados de um determinado problema. Este trabalho propõe um sistema de detecção de malware utilizando modelos ensemble learning dos tipos bagging, boosting e stacking, usando o conjunto de dados Malevis para análise estática e o conjunto de dados Top-1000 PE Imports para análise dinâmica. Os modelos foram treinados e os resultados foram comparados com outro sistema de detecção de malware. Os resultados obtidos foram satisfatórios, especialmente os da análise dinâmica, com modelos do tipo bagging e stacking mostrando maior desempenho em ambos os cenários, enquanto que os modelos do tipo boosting apresentaram maior dificuldade em chegar a resultados mais eficazes com os conjuntos de dados usados.
Resumo (inglês)
With the constant increase of technology use in everyday life the importance of information security drastically rises, leading to the existence of malware being a threat to the operation of systems and important data, requiring ways to combat them. Ensemble learning models are machine learning models that use many algorithms to reach results in a geiven problem. This work proposes a malware detection system using bagging, boosting and stacking ensemble learning models, using the Malevis dataset for static analysis and the Top-1000 PE Imports dataset for dynamic analysis. The models were trained and the results compared with another malware detection system. The obtained results were satisfactory, especially the ones from the dynamic analysis, with bagging and stacking models showing better performance in both scenarios, while the boosting models presented greater difficulty in arriving at more effective results with the datasets used.
Descrição
Palavras-chave
Inteligência artificial, Aprendizado do computador, Malware (Software de computador), Serious games, Urban acessbility, Simulation, Mobile
Idioma
Português