Análise computacional de disfonias: caracterizando patologias na estrutura vocal humana
Carregando...
Data
Autores
Orientador
Guido, Rodrigo Capobianco 

Coorientador
Pós-graduação
Curso de graduação
São José do Rio Preto - IBILCE - Ciência da Computação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
O processamento digital de sinais de voz tem se tornado uma ferramenta indispensável para o diagnóstico não invasivo de patologias laríngeas. Este trabalho propõe o desenvolvimento de um sistema computacional para a detecção automática de disfonias, utilizando a base de dados Saarbruecken Voice Database (SVD). A metodologia compreendeu o pré-processamento dos sinais acústicos e a extração de características nos domínios do tempo e da frequência, incluindo Energia, Entropia, Taxa de Cruzamento por Zero (ZCR), Frequência Fundamental (F0), Formantes, Jitter e Shimmer. Para avaliar a relevância e a capacidade discriminativa desses atributos, foi realizada uma análise estatística de dispersão por meio de diagramas de caixa (boxplots), permitindo a visualização do comportamento das características entre grupos saudáveis e patológicos. A classificação dos padrões vocais foi realizada utilizando o algoritmo Support Vector Machine (SVM). Os resultados obtidos através das matrizes de confusão e métricas de acurácia demonstraram que a combinação de descritores físicos e estatísticos, aliada a classificadores inteligentes, oferece uma abordagem robusta e eficaz para auxiliar na triagem e diagnóstico clínico de distúrbios vocais.
Resumo (inglês)
Digital voice signal processing has become an indispensable tool for the noninvasive diagnosis of laryngeal pathologies. This study proposes the development of a computational system for automatic dysphonia detection utilizing the Saarbruecken Voice Database (SVD). The methodology encompassed acoustic signal pre-processing and feature extraction in both time and frequency domains, including Signal Energy, Entropy, Zero Crossing Rate (ZCR), Fundamental Frequency (F0), Formants, Jitter, and Shimmer. To evaluate the relevance and discriminative capacity of these attributes, a statistical dispersion analysis was performed using boxplots, allowing for the visualization of feature behavior between healthy and pathological groups. Vocal pattern classification was carried out using the Support Vector Machine (SVM) algorithm. The results obtained through confusion matrices and accuracy metrics demonstrated that the combination of physical and statistical descriptors, coupled with intelligent classifiers, offers a robust and effective approach to aid in the screening and clinical diagnosis of vocal disorders
Descrição
Palavras-chave
Disfonia, Processamento Digital de Sinais, Aprendizado de Máquina, SVM, Análise Acústica, Dysphonia, Digital Signal Processing, Machine Learning, SVM, Acoustic Analysis
Idioma
Português
Citação
SILVA, Caio Sobrinho da. Análise computacional de disfonias: caracterizando patologias na estrutura vocal humana. 2025. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) - Universidade Estadual Paulista, São José do Rio Preto, 2025.


