Publication: Identificação de emoções em sinais de voz com base no operador de energia de Teager aprimorado
Loading...
Date
Authors
Advisor
Guido, Rodrigo Capobianco 

Coadvisor
Graduate program
Undergraduate course
Ciência da Computação - IBILCE
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Estadual Paulista (Unesp)
Type
Undergraduate thesis
Access right
Acesso aberto

Abstract
Abstract (portuguese)
Atualmente, as pessoas estão cada vez mais conectadas, seja com seu computador pessoal, seja com seu celular, ou seja com qualquer outro tipo de tecnologia presente no seu dia a dia. A interface humano-computador, apesar de sua evolução, ainda enfrenta desafios e obstáculos em busca de uma experiência mais intuitiva e ubíqua. O estudo e desenvolvimento de aplicações com foco em reconhecimento de emoções em sinais de fala consegue diminuir essa distância entre nós humanos e as máquinas, tornando aquilo algo mais natural. O reconhecimento e classificação de emoções em sinais de voz é possibilitado através da extração de características do sinal de fala e sua respectiva classificação emocional com base nessas características. Neste trabalho é abordado como o aprendizado de máquina possibilita o reconhecimento de emoções na fala, qual é o seu estado atual, e discute trabalhos futuros para o seu aperfeiçoamento. O Operador de Energia de Teager Aprimorado é analisado no contexto de classificação de emoções na fala utilizando uma base de dados com expressões emocionais simuladas e observando qual o seu impacto na extração de características cepstrais por meio dos coeficientes Mel-Cepstrais. O algoritmo de Máquina de Vetores de Suporte foi escolhido para a implementação de um classificador fazendo uso de aprendizado de máquina com base nos dados observados de outros estudos apresentados neste trabalho.
Abstract (english)
Nowadays, people are increasingly connected, either with their personal computer, either with their cell phone, or with any other type of technology present in their daily lives. The human-computer interface, despite its evolution, still faces challenges and obstacles in search of a more intuitive and ubiquitous experience. The study and development of applications focused on recognizing emotions in speech signals manages to reduce this distance between us humans and machines, making it feel more natural. The recognition and classification of emotions in voice signals is made possible by extracting characteristics of the speech signal and their respective emotional classification based on these characteristics. This work discusses how machine learning enables the recognition of emotions in speech, what their current state is, and discusses future work for its improvement. The Enhanced Teager Energy Operator is analyzed in the context of emotion classification on speech by making use of a database with simulated emotional expressions and observing its impact on cepstral feature extraction through Mel-Frequency Cesptral Coefficients. The Support Vector Machine algorithm was chosen for the implementantion of a machine learning classifier based on the data observed from other studies shown in this work.
Description
Keywords
Processamento de sinais, Reconhecimento de emoções, Acústica, Operador de energia de Teager aprimorado, Aprendizado de máquina, Signal processing, Emotion recognition, Acoustics, Enhanced Teager energy operator, Machine learning
Language
Portuguese