Reconhecimento de emoções na voz humana: uma abordagem computacional
Carregando...
Data
Autores
Orientador
Guido, Rodrigo Capobianco 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
O reconhecimento de emoções na fala humana é uma área estratégica dentro da computação afetiva, com aplicações em sistemas de atendimento, assistentes virtuais e monitoramento emocional. Este trabalho desenvolveu um modelo computacional baseado em Máquina de Vetores de Suporte (SVM) para a identificação automática de emoções a partir da voz, avaliando sua eficácia em diferentes cenários linguísticos. Foram realizados experimentos com dados em chinês e inglês, considerando configurações monolíngues, cross-lingual e treinamento bilíngue, com o objetivo de verificar a capacidade de generalização do modelo entre idiomas. Os resultados demonstraram alto desempenho em cenários monolíngues, redução significativa da acurácia em cenários cross-lingual e melhora considerável na robustez do classificador quando treinado com bases multilíngues. A análise detalhada das métricas de desempenho e das matrizes
de confusão evidenciou padrões de confusão entre emoções com características acústicas semelhantes e ressaltou a importância da extração de características dinâmicas do sinal. O estudo contribui para o avanço de soluções computacionais multilíngues no reconhecimento de emoções, oferecendo insights para o desenvolvimento de sistemas mais robustos e generalizáveis a contextos globais e multiculturais.
Resumo (inglês)
Speech emotion recognition is a key area within affective computing, with applications in customer service systems, virtual assistants, and emotional monitoring. This study developed a computational model using the Support Vector Machine (SVM) algorithm to automatically identify emotions from human speech and evaluated its performance across different linguistic scenarios. Experiments were conducted using speech datasets in Chinese and English, considering monolingual, cross-lingual, and bilingual training configurations to assess the model’s generalization capabilities. The results showed high performance in monolingual scenarios, a notable decrease in accuracy in cross-lingual tests, and significant improvement in robustness when trained with multilingual datasets. Detailed analysis of performance metrics and confusion matrices revealed common misclassifications between acoustically similar emotions and
highlighted the importance of dynamic speech feature extraction. This study advances multilingual computational solutions for speech emotion recognition, providing insights for developing robust and generalizable systems applicable to global and multicultural contexts.
Descrição
Palavras-chave
Reconhecimento automático da voz, Sistemas de reconhecimento de padrões, Cross-language, SVM, Python, Sistemas de processamento da fala, Automatic speech recognition, Speech processing systems, Pattern recognition systems, Perceptrons
Idioma
Português
Citação
SILVA, Diego Lopes da. Reconhecimento de emoções na voz humana: uma abordagem computacional. 2025. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação). - Universidade Estadual Paulista, Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto, 2025.


