Análise de sentimento contextual em diálogos utilizando aprendizado de máquina

Carregando...
Imagem de Miniatura

Data

2019-04-24

Autores

Ribeiro, Luiz Carlos Felix

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

A disponibilidade cada vez maior de dados em domínio textual tem motivado o desenvolvimento de técnicas baseadas em Processamento de Linguagem Natural para extrair informações estruturadas desse meio. Particularmente ,técnicas de Análise de Sentimento permitem identificar a emoção presente em um fragmento de texto e podem ser utilizadas para diferentes fins, seja priorizar o atendimento de clientes insatisfeitos ou aferir o satisfação do interlocutor durante uma conversa. No que concerne ao uso desse tipo de técnica em diálogos, trabalhos na literatura mostram que considerar informações extraídas de mensagens antecessoras para classificar a atual leva a melhores resultados, seja para a identificação de interlocutores ou intenção das mensagens. Todavia, essa abordagem ainda não tem sido largamente empregada para a Análise de Sentimento e, quando utilizada, a mesma não alia a robustez dos word embeddings, técnica desenvolvida recentemente, com os rótulos preditos no passado, mas considera apenas o histórico de características extraídas anteriormente. O presente trabalho propõe o desenvolvimento de um modelo baseado em aprendizado de máquina para a Análise de Sentimento em conversas no domínio textual ao levar em consideração seu contexto. Essa fonte de informação pode ser explorada ao considerar rótulos de mensagens anteriores, suas características, a identidade dos interlocutores e como as palavras são combinadas em cada mensagem. Resultados experimentais mostram que estes aspectos permitem superar o estado-da-arte em quatro bases de dados diferentes.
The increasing availability of data in the textual domain has motivated the development of techniques based on Natural Language Processing to extract structured information from this domain. More specifically, Sentiment Analysis allows identifying the emotion present in a fragment of text and can be used with different goals, for instance, prioritizing the service of dissatisfied customers and assessing the interlocutor satisfaction in a conversation. Regarding the use of this type of technique in dialogues, works in the literature show that considering information extracted from previous messages when classifying the current sample leads to better results, either for identification of interlocutors or for message intent classification. However, this approach has not been widely adopted on Sentiment Analysis and when used it does not exploit the robustness of there cently developed word embeddings representation along with the labels predicted in the past but only the history of features previously extracted. The present work proposes the development of a machine learning model for Sentiment Analysis on textual conversations that considers their context. This source of information can be exploited by considering labels from previous messages and their features, the identity of the speakers, and how words are combined in each message. Experimental results show that these aspects allow outperforming the current state of the art on four different datasets.

Descrição

Palavras-chave

Aprendizado de máquina, Processamento de linguagem natural, Análise de sentimento em diálogos, Análise de sentimento baseado em contexto, Floresta de caminhos ótimos, Machine learning, Natural language processing, Dialogue sentiment analysis, Context-based sentiment analysis, Optimum-path forest

Como citar