Identificação de pessoas utilizando atributos de líderes wavelet extraídos dos sinais de voz em modelos de aprendizado de máquina
| dc.contributor.advisor | Vieira Filho, Jozue [UNESP] | |
| dc.contributor.author | Vieira, Patrícia Gabriel [UNESP] | |
| dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
| dc.date.accessioned | 2022-01-07T13:39:38Z | |
| dc.date.available | 2022-01-07T13:39:38Z | |
| dc.date.issued | 2021-09-09 | |
| dc.description.abstract | Este trabalho apresenta uma metodologia para identificação de locutores baseada na inserção de um novo atributo de áudio, denominado Média Máxima dos Líderes Wavelet (Maximum Mean Wavelet Leaders – MMWL), extraídos e concatenados com os Coeficientes Mel-Cepstrais (Mel-Frequency Cepstrum Coefficients – MFCC) em modelos de aprendizado de máquina. A extração de características dos sinais de voz é fundamental para o reconhecimento de locutor, tanto para a identificação, como para a verificação. Independentemente da aplicação, é essencial ter um sistema que seja capaz de reunir, distinguir e classificar características extraídas dos sinais de voz com alta taxa de acurácia. Neste sentido, o principal objetivo deste trabalho é propor uma metodologia usando atributos confiáveis de sinais de voz para a identificação. A base do trabalho é a extração dos atributos da MMWL aliada a um processo de aprendizado de máquina. Os resultados indicam que a inserção da MMWL destaca características multifractais dos sinais de voz, aumenta a precisão dos modelos baseados nos MFCC e melhora o percentual de confiança na identificação de locutores. Para validar o método proposto, um estudo detalhado é realizado envolvendo atributos clássicos de sinais de voz para comparação com os resultados obtidos usando MMWL Espectral + MFCC. | pt |
| dc.description.abstract | This work presents a methodology for speaker identification based on the insertion of a new audio attribute, called Maximum Mean Wavelet Leaders (MMWL), extracted and concatenated with Mel-Frequency Cepstrum Coefficients (MFCC) in machine learning models. Feature extraction from speech signals is crucial for speaker recognition, both for identification and verification. Regardless of the application, a speaker identification system must be able to gather, distinguish and classify features extracted from speech signals with a high accuracy rate. Therefore, the main objective of this work is to propose a methodology using reliable attributes of speech signals for identification. The basis of the work is the extraction of MMWL attributes associated to a machine learning process. The results indicate that the insertion of MMWL highlights multifractal features of speech signals, increases the accuracy of MFCC-based models, and improves the percentage of confidence in speaker identification. To validate the proposed method, a detailed study is conducted involving classical attributes of speech signals for comparison with the results obtained using Spectral MMWL + MFCC. | en |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | |
| dc.description.sponsorshipId | CAPES: 001 | |
| dc.identifier.capes | 33004099080P0 | |
| dc.identifier.uri | http://hdl.handle.net/11449/215776 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Estadual Paulista (Unesp) | |
| dc.rights.accessRights | Acesso aberto | pt |
| dc.subject | Reconhecimento de locutor | pt |
| dc.subject | Análise multifractal | pt |
| dc.subject | Wavelet | en |
| dc.subject | Speaker recognition | en |
| dc.subject | Multifractal analysis | en |
| dc.title | Identificação de pessoas utilizando atributos de líderes wavelet extraídos dos sinais de voz em modelos de aprendizado de máquina | pt |
| dc.title.alternative | Identification of persons using wavelet leaders attributes extracted from speech signals in machine learning models | en |
| dc.type | Tese de doutorado | pt |
| dspace.entity.type | Publication | |
| relation.isGradProgramOfPublication | 909f8040-719f-42cf-a550-e298b801fceb | |
| relation.isGradProgramOfPublication.latestForDiscovery | 909f8040-719f-42cf-a550-e298b801fceb | |
| relation.isOrgUnitOfPublication | 85b724f4-c5d4-4984-9caf-8f0f0d076a19 | |
| relation.isOrgUnitOfPublication.latestForDiscovery | 85b724f4-c5d4-4984-9caf-8f0f0d076a19 | |
| unesp.campus | Universidade Estadual Paulista (UNESP), Faculdade de Engenharia, Ilha Solteira | pt |
| unesp.embargo | Online | pt |
| unesp.examinationboard.type | Banca pública | pt |
| unesp.graduateProgram | Engenharia Elétrica - FEIS | pt |
| unesp.knowledgeArea | Automação | pt |
| unesp.researchArea | Processamento Digital de Sinais | pt |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- vieira_pg_dr_ilha.pdf
- Tamanho:
- 2.05 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 3.03 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:

