Logo do repositório

PLN aplicado à saúde mental: explorando abordagens para auxílio na classificação automática de suicídio e depressão em textos

Carregando...
Imagem de Miniatura

Orientador

Breve, Fabricio Aparecido

Coorientador

Pós-graduação

Ciência da Computação - FC/FCT/IBILCE/IGCE

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A depressão é um transtorno mental que afeta o estado emocional e comportamental do indivíduo, impactando em questões como a sua capacidade de realizar tarefas do dia a dia, se relacionar com o outro e, até mesmo, alterando seus processos fisiológicos. Entre os sintomas observados em pacientes diagnosticados com depressão, a perda de peso, do prazer e humor deprimido são alguns que podem ser listados. Já o suicídio, que muitas vezes é associado a depressão, é um ato individual e intencional executado por aquele que deseja tirar sua própria vida, quando, para ele, é a única alternativa para acabar com um sofrimento constante. A identificação de indícios de um comportamento suicida é fundamental para a diminuição do número de indivíduos que de fato realizam tal ato, da mesma forma que a identificação precoce da depressão pode não apenas proporcionar um tratamento efetivo nos primeiros momentos da condição, mas também evitar que os diagnosticados encontrem o suicídio como o último estágio de sua perturbação emocional. Diante disso, formas de auxiliar na detecção automática dos transtornos mentais são cada vez mais exploradas, se beneficiando principalmente da quantidade de dados disponíveis em redes sociais, local onde muitos usuários se expressam e depositam suas emoções. Este trabalho busca aplicar técnicas de Processamento de Linguagem Natural e Aprendizado de Máquina para avaliar modelos supervisionados e semi supervisionados na detecção de potencial depressão e risco de suicídio em textos extraídos de redes sociais. Foram analisados três conjuntos de dados, um para depressão e dois para suicídio. A extração de características se deu com o modelo BERT, sendo feita em dois cenários diferentes: com pré-processamento e sem pré-processamento dos dados. Posteriormente, a classificação ocorreu com os modelos Random Forest, SVM, Logistic Regression, Label Propagation, Competição e Cooperação entre Partículas, Self Training Classifier e Label Spreading. Além disso, os modelos foram testados com a aplicação de redução de dimensionalidade utilizando o algoritmo PCA. Os experimentos foram realizados com 80% dos dados destinados para treinamento e 20% destinados para teste, onde o modelo LR sem redução de dimensionalidade atingiu 92,91% de acurácia no cenário sem pré-processamento, enquanto a adição do pré-processamento resultou em 90,05%.

Resumo (inglês)

Depression is a mental disorder that affects an individual’s emotional and behavioral state, impacting aspects such as their ability to perform daily tasks, relate to others, and even altering physiological processes. Among the symptoms observed in patients diagnosed with depression, weight loss, loss of pleasure, and depressed mood are some that can be listed. Suicide, which is often associated with depression, is an individual and intentional act carried out by someone who wishes to take their own life when, for them, it is the only alternative to end constant suffering. The identification of indications of suicidal behavior is essential to reduce the number of individuals who actually commit such an act, just as the early identification of depression can not only provide effective treatment in the initial stages of the condition, but also prevent those diagnosed from encountering suicide as the final stage of their emotional disturbance. Therefore, methods to assist in the automatic detection of mental disorders have been increasingly explored, mainly benefiting from the large amount of data available on social networks, where many users express themselves and deposit their emotions. This work aims to apply Natural Language Processing and Machine Learning techniques to evaluate supervised and semi-supervised models in the detection of potential depression and suicide risk in texts extracted from social networks. Three datasets were analyzed, one for depression and two for suicide. Feature extraction was performed using the BERT model, considering two different scenarios: with preprocessing and without preprocessing of the data. Subsequently, classification was carried out using the Random Forest, SVM, Logistic Regression, Label Propagation, Particle Competition and Cooperation, Self-Training Classifier, and Label Spreading models. In addition, the models were tested with the application of dimensionality reduction using the PCA algorithm. The experiments were conducted with 80% of the data allocated for training and 20% for testing, in which the LR model without dimensionality reduction achieved 92.91% accuracy in the scenario without preprocessing, while the addition of preprocessing resulted in 90.05%.

Descrição

Palavras-chave

Processamento de linguagem natural, Aprendizado de máquina, Competição e cooperação entre partículas, Depressão, Suicídio, Natural language processing, Machine learning, Particle competition and cooperation, Depression, Suicide

Idioma

Português

Citação

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação