Logo do repositório

Reconhecimento de emoções na voz humana: uma abordagem computacional

Carregando...
Imagem de Miniatura

Orientador

Guido, Rodrigo Capobianco

Coorientador

Pós-graduação

Curso de graduação

São José do Rio Preto - IBILCE - Ciência da Computação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

O reconhecimento de emoções na fala humana é uma área estratégica dentro da computação afetiva, com aplicações em sistemas de atendimento, assistentes virtuais e monitoramento emocional. Este trabalho desenvolveu um modelo computacional baseado em Máquina de Vetores de Suporte (SVM) para a identificação automática de emoções a partir da voz, avaliando sua eficácia em diferentes cenários linguísticos. Foram realizados experimentos com dados em chinês e inglês, considerando configurações monolíngues, cross-lingual e treinamento bilíngue, com o objetivo de verificar a capacidade de generalização do modelo entre idiomas. Os resultados demonstraram alto desempenho em cenários monolíngues, redução significativa da acurácia em cenários cross-lingual e melhora considerável na robustez do classificador quando treinado com bases multilíngues. A análise detalhada das métricas de desempenho e das matrizes de confusão evidenciou padrões de confusão entre emoções com características acústicas semelhantes e ressaltou a importância da extração de características dinâmicas do sinal. O estudo contribui para o avanço de soluções computacionais multilíngues no reconhecimento de emoções, oferecendo insights para o desenvolvimento de sistemas mais robustos e generalizáveis a contextos globais e multiculturais.

Resumo (inglês)

Speech emotion recognition is a key area within affective computing, with applications in customer service systems, virtual assistants, and emotional monitoring. This study developed a computational model using the Support Vector Machine (SVM) algorithm to automatically identify emotions from human speech and evaluated its performance across different linguistic scenarios. Experiments were conducted using speech datasets in Chinese and English, considering monolingual, cross-lingual, and bilingual training configurations to assess the model’s generalization capabilities. The results showed high performance in monolingual scenarios, a notable decrease in accuracy in cross-lingual tests, and significant improvement in robustness when trained with multilingual datasets. Detailed analysis of performance metrics and confusion matrices revealed common misclassifications between acoustically similar emotions and highlighted the importance of dynamic speech feature extraction. This study advances multilingual computational solutions for speech emotion recognition, providing insights for developing robust and generalizable systems applicable to global and multicultural contexts.

Descrição

Palavras-chave

Reconhecimento automático da voz, Sistemas de reconhecimento de padrões, Cross-language, SVM, Python, Sistemas de processamento da fala, Automatic speech recognition, Speech processing systems, Pattern recognition systems, Perceptrons

Idioma

Português

Citação

SILVA, Diego Lopes da. Reconhecimento de emoções na voz humana: uma abordagem computacional. 2025. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação). - Universidade Estadual Paulista, Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação