Reconhecimento de voz de locutor no contexto forense utilizando Mínimos Quadrados Ordinários
Carregando...
Arquivos
Data
2021-08-02
Autores
Orientador
Vieira Filho, Jozue
Coorientador
Pós-graduação
Engenharia Elétrica - FEIS
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Tese de doutorado
Direito de acesso
Acesso aberto
Resumo
Resumo (português)
Neste trabalho tem-se como proposta o uso de uma combinação de codificação preditiva linear (LPC) e mínimos quadrados ordinários (OLS do inglês: Ordinary Least Square) como uma ferramenta de verificação de locutor para análise forense. Além disso, o método desenvolvido extrai um maior número de formantes, indispensáveis para comparações estatísticas via OLS. A estrutura proposta é robusta em certos níveis de ruído, para frases com a supressão de mudanças de palavras, e com qualidade diferente, ou mesmo diferenças significativas de tempo de áudio. A análise comparativa é avaliada pelo tempo decorrido para a obtenção dos resultados, bem como pela qualidade dos resultados. Os resultados mostram que a análise por meio de OLS gera resultados imediatos e efetivos quando comparados aos obtidos com metodologias tradicionais nos processos estudados. Depois de executar sete testes diferentes, este estudo obteve preliminarmente uma taxa de acerto de 100% considerando um conjunto de dados limitado (português do Brasil). A técnica de reconhecimento proposta estabelece confiança e similaridade sobre as quais baseiam-se os relatórios forenses, indicando verificação do locutor do discurso contestado.
Resumo (inglês)
This paper proposes a combination of Linear Predictive Coding (LPC) and ordinary least squares (OLS) as a speaker verification tool for forensic analysis. The proposed recognition technique establishes confidence and similarity to base forensic reports, indicating and verifying the speaker of the contested discourse. Furthermore, the developed method extracts a larger number of formants, which are indispensable for statistical comparisons via OLS. The proposed framework is robust at certain levels of noise, for sentences with the suppression of word changes, and with different quality or even meaningful audio time differences. The comparative analysis is assessed for time elapsed for obtaining results, as well as results quality. Results show that the analysis, by using OLS, generates immediate, effective results when compared to those obtained with traditional methodologies on the studied process. After running seven different tests, this study preliminarily achieved a hit rate of 100% considering a limited dataset (Brazilian Portuguese).
Descrição
Idioma
Português