Elaboração de filtros Wavelets baseada em conhecimento para distinção de locutores autênticos e inautênticos

Carregando...
Imagem de Miniatura

Data

2022-04-01

Autores

Almeida, Alex Marino Goncalves de

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

Os sistemas para autenticação biométrica baseados em voz têm ganhado cada vez mais espaço. Entretanto, a possibilidade de falsificação dos sinais acústicos dos locutores, principalmente utilizando-se de regravações, tem sido um obstáculo para a maior usabilidade dos referidos mecanismos biométricos. Assim, este trabalho de doutorado apresenta uma inovação no sentido de detectar sinais de vozes regravados: a formulação de filtros wavelet dedicados para identificar os replay attacks, com base em conhecimento. A técnica proposta confere conhecimento aos filtros utilizando-se de casos-exemplo autênticos e inautênticos de sinais de voz, o que não possui precedentes na literatura. No bojo dos experimentos elaborados neste trabalho constam o desenvolvimento de filtros baseados em conhecimento abrangendo uma ampla gama de propriedades físicas dos sinais, destacando-se skewness e kustosis, produzindo filtros de resposta ao impulso finita com suportes 6, 8, 12 e 16. Do conjunto de experimentos realizados, pode-se destacar o resultado em taxas de erros iguais (EER) igual a 1,96% para o filtro produzido com a propriedade física skewness e com suporte 12, equiparando-se, numa abordagem regular de decomposição tempo-frequência, ao melhor resultado obtido com a base pública ASVSpoof 2017 e demonstrando, assim, a efetividade da contribuição para o estado-da-arte.
Speech authentication mechanisms have gained more and more space. Nevertheless, the possibility of spoofing speakers’ acoustic signals, mainly by using subsequent recordings, has been an obstacle to the practical application of biometric devices. Thus, this PhD thesis presents an innovation in the sense of detecting replayed speech: wavelet filters, to identify replay attacks, specified based on knowledge. Particularly, knowledge is incorporated to those filters by using original and replayed speech samples, exhibiting no precedents in the literature. In the heart of the experiments elaborated in this one, there was the development of work based on covering a wide range of physical properties of the signals, highlighting skewness and kustosis, producing finite impulse response filters with support-sizes 6, 8, 12 and 16. From the set of experiments, we can highlight the equal error rate (EER) of 1.96% for the filter produced with the physical property skewness and with support-size 12, matching the best result obtained with the public database ASVSpoof 2017, in an ordinary time-frequency decomposition, and demonstrating the effectiveness of the contribution to state-of-the-art.

Descrição

Palavras-chave

Filtros Wavelet, Inteligência artificial, Verificação de locutores, Ataque por reprodução, Wavelet Filter Banks, Artificial intelligence, Speaker verification, Replay attacks

Como citar