Verificação espectral de locutores na modalidade Text-Dependent

Carregando...
Imagem de Miniatura

Data

2022-01-21

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

The main challenge to develop speaker verification systems is to extract robust speech representations, considering the diversity of issues which may affect those signals, such as the presence of ambient noise and possible speaker’s health problems. Thus, by using a branch of TIMIT dataset adapted to speaker verification, the author of this work developed a full-accuracy system to verify speakers, assuming a set of ten voices per speaker, contamined with different levels of noise, for the fourty speakers enrolled. The feature extraction stage was developed based on the concepts of energy and zero crossing rate, in addition to the Bark scale and the Discrete Fourier Transform. In view of the results, it is possible to state that the features adopted in association with the concepts and mathematical tools used allowed for the initial proposal to be successfully completed.
O desafio para o desenvolvimento de sistemas de verificação de locutores é extrair representações de fala robustas, considerando os mais diversos fatores que podem afetar a geração de sinais de fala, tais como a presença de ruído ambiente ou o estado de saúde do locutor. Desse modo, considerando uma parcela da base de dados TIMIT adaptada para fins de verificação de locutores, o autor deste trabalho desenvolveu um sistema capaz de verificar indivíduos pela voz com acurácia plena, considerando um classificador linear e assumindo dez amostras de voz contaminadas por ruído para cada um dos 40 locutores matriculados. A etapa de extração de características foi desenvolvida com base nos conceitos de energia e taxa de cruzamentos por zero, associados ao princípio de funcionamento do ouvido humano modelado pela escala Bark e à Transformada Discreta de Fourier. Em vista dos resultados, foi possível concluir que as características experimentadas em associação com os conceitos e ferramentas matemáticas utilizados permitiram levar a bom termo a proposta inicial.

Descrição

Palavras-chave

Inteligência artificial, Taxa de cruzamentos por zero, Processamento de linguagem natural, Voz

Como citar