Logotipo do repositório
 

Publicação:
Identificação de emoções em sinais de voz com base no operador de energia de Teager aprimorado

Carregando...
Imagem de Miniatura

Orientador

Guido, Rodrigo Capobianco

Coorientador

Pós-graduação

Curso de graduação

Ciência da Computação - IBILCE

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Atualmente, as pessoas estão cada vez mais conectadas, seja com seu computador pessoal, seja com seu celular, ou seja com qualquer outro tipo de tecnologia presente no seu dia a dia. A interface humano-computador, apesar de sua evolução, ainda enfrenta desafios e obstáculos em busca de uma experiência mais intuitiva e ubíqua. O estudo e desenvolvimento de aplicações com foco em reconhecimento de emoções em sinais de fala consegue diminuir essa distância entre nós humanos e as máquinas, tornando aquilo algo mais natural. O reconhecimento e classificação de emoções em sinais de voz é possibilitado através da extração de características do sinal de fala e sua respectiva classificação emocional com base nessas características. Neste trabalho é abordado como o aprendizado de máquina possibilita o reconhecimento de emoções na fala, qual é o seu estado atual, e discute trabalhos futuros para o seu aperfeiçoamento. O Operador de Energia de Teager Aprimorado é analisado no contexto de classificação de emoções na fala utilizando uma base de dados com expressões emocionais simuladas e observando qual o seu impacto na extração de características cepstrais por meio dos coeficientes Mel-Cepstrais. O algoritmo de Máquina de Vetores de Suporte foi escolhido para a implementação de um classificador fazendo uso de aprendizado de máquina com base nos dados observados de outros estudos apresentados neste trabalho.

Resumo (inglês)

Nowadays, people are increasingly connected, either with their personal computer, either with their cell phone, or with any other type of technology present in their daily lives. The human-computer interface, despite its evolution, still faces challenges and obstacles in search of a more intuitive and ubiquitous experience. The study and development of applications focused on recognizing emotions in speech signals manages to reduce this distance between us humans and machines, making it feel more natural. The recognition and classification of emotions in voice signals is made possible by extracting characteristics of the speech signal and their respective emotional classification based on these characteristics. This work discusses how machine learning enables the recognition of emotions in speech, what their current state is, and discusses future work for its improvement. The Enhanced Teager Energy Operator is analyzed in the context of emotion classification on speech by making use of a database with simulated emotional expressions and observing its impact on cepstral feature extraction through Mel-Frequency Cesptral Coefficients. The Support Vector Machine algorithm was chosen for the implementantion of a machine learning classifier based on the data observed from other studies shown in this work.

Descrição

Palavras-chave

Processamento de sinais, Reconhecimento de emoções, Acústica, Operador de energia de Teager aprimorado, Aprendizado de máquina, Signal processing, Emotion recognition, Acoustics, Enhanced Teager energy operator, Machine learning

Idioma

Português

Como citar

Itens relacionados

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação