Verificação espectral de locutores na modalidade Text-Dependent
Carregando...
Arquivos
Data
2022-01-21
Autores
Orientador
Guido, Rodrigo Capobianco
Coorientador
Pós-graduação
Curso de graduação
Ciência da Computação - IBILCE
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Trabalho de conclusão de curso
Direito de acesso
Acesso aberto
Resumo
Resumo (inglês)
The main challenge to develop speaker verification systems is to extract robust speech representations, considering the diversity of issues which may affect those signals, such as the presence of ambient noise and possible speaker’s health problems. Thus, by using a branch of TIMIT dataset adapted to speaker verification, the author of this work developed a full-accuracy system to verify speakers, assuming a set of ten voices per speaker, contamined with different levels of noise, for the fourty speakers enrolled. The feature extraction stage was developed based on the concepts of energy and zero crossing rate, in addition to the Bark scale and the Discrete Fourier Transform. In view of the results, it is possible to state that the features adopted in association with the concepts and mathematical tools used allowed for the initial proposal to be successfully completed.
Resumo (português)
O desafio para o desenvolvimento de sistemas de verificação de locutores é extrair representações de fala robustas, considerando os mais diversos fatores que podem afetar a geração de sinais de fala, tais como a presença de ruído ambiente ou o estado de saúde do locutor. Desse modo, considerando uma parcela da base de dados TIMIT adaptada para fins de verificação de locutores, o autor deste trabalho desenvolveu um sistema capaz de verificar indivíduos pela voz com acurácia plena, considerando um classificador linear e assumindo dez amostras de voz contaminadas por ruído para cada um dos 40 locutores matriculados. A etapa de extração de características foi desenvolvida com base nos conceitos de energia e taxa de cruzamentos por zero, associados ao princípio de funcionamento do ouvido humano modelado pela escala Bark e à Transformada Discreta de Fourier. Em vista dos resultados, foi possível concluir que as características experimentadas em associação com os conceitos e ferramentas matemáticas utilizados permitiram levar a bom termo a proposta inicial.
Descrição
Idioma
Português