Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam

dc.contributor.advisorCosta, Kelton Augusto Pontara da [UNESP]
dc.contributor.authorGrassmann, Ana Clara de Castro
dc.date.accessioned2024-07-12T12:12:18Z
dc.date.available2024-07-12T12:12:18Z
dc.date.issued2024-06-21
dc.description.abstractEste projeto estuda como os LLMs baseados na arquitetura Transformer funcionam e a possibilidade de ajustar estes modelos para que possam utilizar apenas o corpo de mensagens de e-mail para classificá-las entre spam ou ham. Os modelos estudados foram o BERT, Gemma e Phi. Todos passaram pelas etapas de quantização, fine-tuning com um conjunto de dados reais e avaliação com métricas comumente utilizadas em problemas de classificação binária. O modelo Gemma apresenta resultados superiores a 99% de acurácia na detecção de spam, destacando-se como o melhor entre os modelos comparados.pt
dc.description.abstractThis project studies how LLMs based on the transformer architecture operate and the possibility of adjusting these models to use only the body of email messages to classify them as spam or ham. The models studied were BERT, Gemma, and Phi. All of them underwent quantization stages, fine-tuning with a real dataset, and evaluation with metrics commonly used in binary classification problems. The Gemma model achieves over 99% accuracy in detecting spam, standing out as the best among the compared models.en
dc.identifier.citationGRASSMANN, Ana Clara de Castro. Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam. 2024. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024.
dc.identifier.urihttps://hdl.handle.net/11449/256518
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso restrito
dc.subjectSpam (Mensagens eletrônicas)pt
dc.subjectInteligência artificialpt
dc.subjectDetecção de spampt
dc.subjectLLMspt
dc.subjectClassificação bináriapt
dc.subjectSpam detectionen
dc.subjectFine-tuningen
dc.subjectBinary classificationen
dc.titleEstudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam
dc.title.alternativeStudy and comparison of performance of large models language in the spam detection tasken
dc.typeTrabalho de conclusão de cursopt
unesp.campusUniversidade Estadual Paulista (Unesp), Faculdade de Ciências, Baurupt
unesp.examinationboard.typeBanca pública
unesp.undergraduateBauru - FC - Sistemas de Informação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
grassmann_acc_tcc_bauru.pdf
Tamanho:
1.73 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.14 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
grasmann_acc_autorização_bauru.pdf
Tamanho:
159.53 KB
Formato:
Adobe Portable Document Format
Descrição: