Logotipo do repositório
 

Publicação:
Uma análise dos tweets de pré-candidatos a presidência do Brasil: aplicação do algoritmo de Latent Dirichlet Allocation (LDA)

dc.contributor.advisorSchlünzen Junior, Klaus [UNESP]
dc.contributor.authorQueiroz, Maria Eduarda do Prado e
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2022-03-31T13:02:13Z
dc.date.available2022-03-31T13:02:13Z
dc.date.issued2022-03-11
dc.description.abstractO Latent Dirichlet Allocation (LDA) é um modelo generativo para grupos de dados discretos como corpus de texto. Modelos generativos são aqueles que aleatoriamente geram os dados a partir das variáveis latentes. Nesse estudo vamos analisar o perfil do Twitter de pré-candidatos a presidência do Brasil no ano de 2021, usando técnicas de mineração de texto como, frequência de termos através de nuvens de palavras, análise de sentimentos, análise de agrupamento e análise da frequência inversa do termo (TF-IDF), além da aplicação do algoritmo LDA para o grupo de perfis. Para a realização das análises foram colhidos oitenta mil tweets de cada pré-candidato no período de 08/09/2021 a 27/10/2021, os dados foram tratados eliminando qualquer caracter que fosse irrelevante para a análise. Os resultados indicaram os termos mais frequentes e relevantes para cada perfil e com a aplicação do algoritmo constatamos que existe um grande número de termos que compõem cada assunto e qual pré-candidato tem a maior probabilidade de ser citado em determinado assunto.pt
dc.description.abstractLatent Dirichlet Allocation (LDA) is a generative model for discrete data groups as a text corpus. Generative models are those that randomly generate data from latent variables. In this study we will analyze the Twitter profile of pre-candidates for the presidency of Brazil in the year 2021, using text mining techniques such as term frequency through word clouds, sentiment analysis, cluster analysis and inverse frequency analysis. of the term (TF-IDF), in addition to the application of the LDA algorithm for the profile group. In order to carry out the analysis, eighty thousand tweets were collected from each pre-candidate in the period from 09/08/2021 to 10/27/2021, the data were processed by eliminating any character that was irrelevant to the analysis. The results indicated the most frequent and relevant terms for each profile and with the application of the algorithm we found that there is a large number of terms that make up each subject and which pre-candidate is most likely to be cited in a given subject.en
dc.description.sponsorshipNão recebi financiamento
dc.identifier.urihttp://hdl.handle.net/11449/217538
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectMineração de textopt
dc.subjectLatent Dirichilet Allocationpt
dc.subjectModelos de tópicospt
dc.subjectTF-IDFpt
dc.subjectAnálise de sentimentospt
dc.subjectText miningen
dc.subjectLatent Dirichlet Allocationen
dc.subjectTopic modelsen
dc.subjectSentiment analysisen
dc.titleUma análise dos tweets de pré-candidatos a presidência do Brasil: aplicação do algoritmo de Latent Dirichlet Allocation (LDA)pt
dc.title.alternativeAn analysis of tweets from pre-candidates for the presidency of the Brazil: application of the Latent Dirichlet Allocation algorithm (LDA)en
dc.typeTrabalho de conclusão de cursopt
dspace.entity.typePublication
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências e Tecnologia, Presidente Prudentept
unesp.undergraduateEstatística - FCTpt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
queiroz_mep_tcc_prud.pdf
Tamanho:
2.16 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.43 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Carregando...
Imagem de Miniatura
Nome:
queiroz_mep_autorizacao_prud.pdf
Tamanho:
149.52 KB
Formato:
Adobe Portable Document Format
Descrição: