Publicação: Aprendizado de máquina para detecção de spam: um estudo comparativo de algoritmos de mineração de texto e classificadores
dc.contributor.advisor | Breve, Fabricio Aparecido [UNESP] | |
dc.contributor.author | Milani, Thiago Giroto | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2021-03-26T18:33:40Z | |
dc.date.available | 2021-03-26T18:33:40Z | |
dc.date.issued | 2020-01-28 | |
dc.description.abstract | Com o grande crescimento da área de informática e inovação tecnológica (era digital), cresce cada vez mais a necessidade de dispositivos e algoritmos capazes de aprender e reconhecer padrões. A segurança computacional se torna cada vez mais essencial com toda essa evolução, pois os incidentes de segurança estão se tornando cada vez mais comum. Um exemplo são as mensagens de spam, podendo trazer conteúdos impróprios ou indesejados e causando diversos problemas ou até mesmo roubo de informação. Baseado nisso se torna cada vez mais necessário o estudo dessas duas áreas em conjunto. Aprendizado de máquina e segurança computacional, o que possibilita a criação de novos dispositivos e ferramentas capazes de reconhecer padrões de incidentes de segurança através da inteligência computacional. Assim, é proposto neste trabalho efetuar a extração de características (vetorização de texto), que tem a finalidade de efetuar a extração dos termos mais relevantes, e posteriormente combiná-los com algoritmos de aprendizado de máquina semi-supervisionados, como o objetivo de estudar qual combinação é mais viável para a detecção de spam. | pt |
dc.description.abstract | The boom of technological innovation (digital era) has imposed the need for devices and algorithms that learn and recognize patterns. Driven by such evolution, computer security has become an essential, once incidents regarding computer security have been increasing even faster than technology itself. An example are spam messages, which may display inappropriate content, or even cause damage or data theft. Therefore, it is important to integrate both machine learning and computer security to create new devices and tools that are able to recognize patters of computer security incidents by using computer intelligence. To do so, this study aims to carry out a feature extraction process (text vectorization) of features that extract relevant terms and combine them as semi-supervised machine learning algorithms, analyzing which combination is the most viable to detect spam. | en |
dc.identifier.capes | 33004153073P2 | |
dc.identifier.uri | http://hdl.handle.net/11449/204207 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | |
dc.subject | Segurança computacional | pt |
dc.subject | Reconhecimento de padrão | pt |
dc.subject | Extração de características | pt |
dc.subject | Computer security | en |
dc.subject | Pattern recognition | en |
dc.subject | Feature extraction | en |
dc.title | Aprendizado de máquina para detecção de spam: um estudo comparativo de algoritmos de mineração de texto e classificadores | pt |
dc.title.alternative | Machine learning for spam detection: a comparative study of text mining algorithms and classifiers | en |
dc.type | Dissertação de mestrado | pt |
dspace.entity.type | Publication | |
unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Geociências e Ciências Exatas, Rio Claro | pt |
unesp.embargo | Online | pt |
unesp.examinationboard.type | Banca pública | pt |
unesp.graduateProgram | Ciência da Computação - IGCE | pt |
unesp.knowledgeArea | Computação aplicada | pt |
unesp.researchArea | Inteligência artificial | pt |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- milani_tg_me_rcla.pdf
- Tamanho:
- 6.37 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 3.01 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: