Algoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentais

dc.contributor.advisorValêncio, Carlos Roberto [UNESP]
dc.contributor.authorMartins, Victor Hugo Penhalves
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2020-03-18T13:37:13Z
dc.date.available2020-03-18T13:37:13Z
dc.date.issued2020-02-28
dc.description.abstractA quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação.pt
dc.description.abstractThe amount of data has grown significantly in recent years with the effective collaboration of social media. Such platforms can be defined as internet applications that can be web or mobile and allow the creation, access and exchange of user-created content. With this, the data set produced by these media can be called Big Data and are especially important for computational searches of knowledge extraction. The term Big Data can be defined as a large volume of complex data from multiple sources that challenge the storage and processing capacity of computers with today's technologies. In this sense, the techniques of framework Apache Spark and its parallelized implementation have been widely used to return in a timely manner the results of the algorithms of knowledge extraction in social media data. Given the large amount of data generated is social media and the increase of people in the world with problems related to health disorders, tools that analyze these data to find correlations can contribute to the current scenario. Thus, the scientific contribution of this work is in the development of parallel algorithms for prospecting knowledge in textual data, with a focus on social media, which allows the classification of individuals in common classes and considering the inserted context. The performance results indicate that the tool with a parallel approach developed was able to reduce the pre-processing time, extraction of characteristics and classification by approximately 11 times.en
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
dc.description.sponsorshipIdCNPq. Proc. 134172/2017-5
dc.identifier.aleph000929762
dc.identifier.capes33004153073P2
dc.identifier.urihttp://hdl.handle.net/11449/191893
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectCiência da computaçãopt
dc.subjectProcessamento de textos (Computação)pt
dc.subjectProcessamento paralelo (Computadores)pt
dc.subjectBig datapt
dc.subjectComputer scienceen
dc.subjectText miningen
dc.subjectParallel processingen
dc.titleAlgoritmo paralelo para análise comportamental de usuários de mídias sociais na detecção de distúrbios mentaispt
dc.title.alternativeParallel algorithm for behavioral analysis of social media users in detecting mental disordersen
dc.typeDissertação de mestrado
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Pretopt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência da Computação - IBILCEpt
unesp.knowledgeAreaComputação aplicadapt
unesp.researchAreaSistemas de Computaçãopt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
martins_vhp_me_sjrp.pdf
Tamanho:
1.91 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
3.02 KB
Formato:
Item-specific license agreed upon to submission
Descrição: