Publicação: Verificação espectral de locutores na modalidade Text-Dependent
dc.contributor.advisor | Guido, Rodrigo Capobianco [UNESP] | |
dc.contributor.author | Ide, Igor Yoshimitsu | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2022-03-07T15:12:28Z | |
dc.date.available | 2022-03-07T15:12:28Z | |
dc.date.issued | 2022-01-21 | |
dc.description.abstract | The main challenge to develop speaker verification systems is to extract robust speech representations, considering the diversity of issues which may affect those signals, such as the presence of ambient noise and possible speaker’s health problems. Thus, by using a branch of TIMIT dataset adapted to speaker verification, the author of this work developed a full-accuracy system to verify speakers, assuming a set of ten voices per speaker, contamined with different levels of noise, for the fourty speakers enrolled. The feature extraction stage was developed based on the concepts of energy and zero crossing rate, in addition to the Bark scale and the Discrete Fourier Transform. In view of the results, it is possible to state that the features adopted in association with the concepts and mathematical tools used allowed for the initial proposal to be successfully completed. | en |
dc.description.abstract | O desafio para o desenvolvimento de sistemas de verificação de locutores é extrair representações de fala robustas, considerando os mais diversos fatores que podem afetar a geração de sinais de fala, tais como a presença de ruído ambiente ou o estado de saúde do locutor. Desse modo, considerando uma parcela da base de dados TIMIT adaptada para fins de verificação de locutores, o autor deste trabalho desenvolveu um sistema capaz de verificar indivíduos pela voz com acurácia plena, considerando um classificador linear e assumindo dez amostras de voz contaminadas por ruído para cada um dos 40 locutores matriculados. A etapa de extração de características foi desenvolvida com base nos conceitos de energia e taxa de cruzamentos por zero, associados ao princípio de funcionamento do ouvido humano modelado pela escala Bark e à Transformada Discreta de Fourier. Em vista dos resultados, foi possível concluir que as características experimentadas em associação com os conceitos e ferramentas matemáticas utilizados permitiram levar a bom termo a proposta inicial. | pt |
dc.identifier.uri | http://hdl.handle.net/11449/217048 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | |
dc.subject | Inteligência artificial | pt |
dc.subject | Taxa de cruzamentos por zero | pt |
dc.subject | Processamento de linguagem natural | pt |
dc.subject | Voz | pt |
dc.title | Verificação espectral de locutores na modalidade Text-Dependent | pt |
dc.title.alternative | Spectral verification of announcers In Text-Dependent mode | en |
dc.type | Trabalho de conclusão de curso | pt |
dspace.entity.type | Publication | |
unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto | pt |
unesp.undergraduate | Ciência da Computação - IBILCE | pt |
Arquivos
Pacote Original
1 - 1 de 1
Licença do Pacote
1 - 2 de 2
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.42 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Nenhuma Miniatura disponível
- Nome:
- ide_iy_autorizacao_sjrp.pdf
- Tamanho:
- 102.93 KB
- Formato:
- Adobe Portable Document Format
- Descrição: