Repository logo
 

Publication:
Verificação espectral de locutores na modalidade Text-Dependent

Loading...
Thumbnail Image

Advisor

Guido, Rodrigo Capobianco

Coadvisor

Graduate program

Undergraduate course

Ciência da Computação - IBILCE

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Estadual Paulista (Unesp)

Type

Undergraduate thesis

Access right

Acesso abertoAcesso Aberto

Abstract

Abstract (english)

The main challenge to develop speaker verification systems is to extract robust speech representations, considering the diversity of issues which may affect those signals, such as the presence of ambient noise and possible speaker’s health problems. Thus, by using a branch of TIMIT dataset adapted to speaker verification, the author of this work developed a full-accuracy system to verify speakers, assuming a set of ten voices per speaker, contamined with different levels of noise, for the fourty speakers enrolled. The feature extraction stage was developed based on the concepts of energy and zero crossing rate, in addition to the Bark scale and the Discrete Fourier Transform. In view of the results, it is possible to state that the features adopted in association with the concepts and mathematical tools used allowed for the initial proposal to be successfully completed.

Abstract (portuguese)

O desafio para o desenvolvimento de sistemas de verificação de locutores é extrair representações de fala robustas, considerando os mais diversos fatores que podem afetar a geração de sinais de fala, tais como a presença de ruído ambiente ou o estado de saúde do locutor. Desse modo, considerando uma parcela da base de dados TIMIT adaptada para fins de verificação de locutores, o autor deste trabalho desenvolveu um sistema capaz de verificar indivíduos pela voz com acurácia plena, considerando um classificador linear e assumindo dez amostras de voz contaminadas por ruído para cada um dos 40 locutores matriculados. A etapa de extração de características foi desenvolvida com base nos conceitos de energia e taxa de cruzamentos por zero, associados ao princípio de funcionamento do ouvido humano modelado pela escala Bark e à Transformada Discreta de Fourier. Em vista dos resultados, foi possível concluir que as características experimentadas em associação com os conceitos e ferramentas matemáticas utilizados permitiram levar a bom termo a proposta inicial.

Description

Keywords

Inteligência artificial, Taxa de cruzamentos por zero, Processamento de linguagem natural, Voz

Language

Portuguese

Citation

Related itens

Sponsors

Units

Departments

Undergraduate courses

Graduate programs