Reconhecimento de voz de locutor no contexto forense utilizando Mínimos Quadrados Ordinários

Carregando...
Imagem de Miniatura

Data

2021-08-02

Orientador

Vieira Filho, Jozue

Coorientador

Pós-graduação

Engenharia Elétrica - FEIS

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Neste trabalho tem-se como proposta o uso de uma combinação de codificação preditiva linear (LPC) e mínimos quadrados ordinários (OLS do inglês: Ordinary Least Square) como uma ferramenta de verificação de locutor para análise forense. Além disso, o método desenvolvido extrai um maior número de formantes, indispensáveis para comparações estatísticas via OLS. A estrutura proposta é robusta em certos níveis de ruído, para frases com a supressão de mudanças de palavras, e com qualidade diferente, ou mesmo diferenças significativas de tempo de áudio. A análise comparativa é avaliada pelo tempo decorrido para a obtenção dos resultados, bem como pela qualidade dos resultados. Os resultados mostram que a análise por meio de OLS gera resultados imediatos e efetivos quando comparados aos obtidos com metodologias tradicionais nos processos estudados. Depois de executar sete testes diferentes, este estudo obteve preliminarmente uma taxa de acerto de 100% considerando um conjunto de dados limitado (português do Brasil). A técnica de reconhecimento proposta estabelece confiança e similaridade sobre as quais baseiam-se os relatórios forenses, indicando verificação do locutor do discurso contestado.

Resumo (inglês)

This paper proposes a combination of Linear Predictive Coding (LPC) and ordinary least squares (OLS) as a speaker verification tool for forensic analysis. The proposed recognition technique establishes confidence and similarity to base forensic reports, indicating and verifying the speaker of the contested discourse. Furthermore, the developed method extracts a larger number of formants, which are indispensable for statistical comparisons via OLS. The proposed framework is robust at certain levels of noise, for sentences with the suppression of word changes, and with different quality or even meaningful audio time differences. The comparative analysis is assessed for time elapsed for obtaining results, as well as results quality. Results show that the analysis, by using OLS, generates immediate, effective results when compared to those obtained with traditional methodologies on the studied process. After running seven different tests, this study preliminarily achieved a hit rate of 100% considering a limited dataset (Brazilian Portuguese).

Descrição

Idioma

Português

Como citar

Itens relacionados

Financiadores