Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam
dc.contributor.advisor | Costa, Kelton Augusto Pontara da [UNESP] | |
dc.contributor.author | Grassmann, Ana Clara de Castro | |
dc.date.accessioned | 2024-07-12T12:12:18Z | |
dc.date.available | 2024-07-12T12:12:18Z | |
dc.date.issued | 2024-06-21 | |
dc.description.abstract | Este projeto estuda como os LLMs baseados na arquitetura Transformer funcionam e a possibilidade de ajustar estes modelos para que possam utilizar apenas o corpo de mensagens de e-mail para classificá-las entre spam ou ham. Os modelos estudados foram o BERT, Gemma e Phi. Todos passaram pelas etapas de quantização, fine-tuning com um conjunto de dados reais e avaliação com métricas comumente utilizadas em problemas de classificação binária. O modelo Gemma apresenta resultados superiores a 99% de acurácia na detecção de spam, destacando-se como o melhor entre os modelos comparados. | pt |
dc.description.abstract | This project studies how LLMs based on the transformer architecture operate and the possibility of adjusting these models to use only the body of email messages to classify them as spam or ham. The models studied were BERT, Gemma, and Phi. All of them underwent quantization stages, fine-tuning with a real dataset, and evaluation with metrics commonly used in binary classification problems. The Gemma model achieves over 99% accuracy in detecting spam, standing out as the best among the compared models. | en |
dc.identifier.citation | GRASSMANN, Ana Clara de Castro. Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam. 2024. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Faculdade de Ciências, Universidade Estadual Paulista (UNESP), Bauru, 2024. | |
dc.identifier.uri | https://hdl.handle.net/11449/256518 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso restrito | |
dc.subject | Spam (Mensagens eletrônicas) | pt |
dc.subject | Inteligência artificial | pt |
dc.subject | Detecção de spam | pt |
dc.subject | LLMs | pt |
dc.subject | Classificação binária | pt |
dc.subject | Spam detection | en |
dc.subject | Fine-tuning | en |
dc.subject | Binary classification | en |
dc.title | Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam | |
dc.title.alternative | Study and comparison of performance of large models language in the spam detection task | en |
dc.type | Trabalho de conclusão de curso | pt |
unesp.campus | Universidade Estadual Paulista (Unesp), Faculdade de Ciências, Bauru | pt |
unesp.examinationboard.type | Banca pública | |
unesp.undergraduate | Bauru - FC - Sistemas de Informação |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- grassmann_acc_tcc_bauru.pdf
- Tamanho:
- 1.73 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 2 de 2
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Nenhuma Miniatura disponível
- Nome:
- grasmann_acc_autorização_bauru.pdf
- Tamanho:
- 159.53 KB
- Formato:
- Adobe Portable Document Format
- Descrição: