Logo do repositório
 

Análise de aprendizado adversarial baseado em similaridade na geração de texto

dc.contributor.advisorPapa, João Paulo [UNESP]
dc.contributor.authorRosa, Gustavo Henrique de [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2022-12-06T16:38:14Z
dc.date.available2022-12-06T16:38:14Z
dc.date.issued2022-11-22
dc.description.abstractAlgoritmos de Aprendizado de Máquina têm sido amplamente fomentados nos últimos anos, principalmente devido às suas capacidades discriminativas em problemas de Visão Computacional e Processamento de Linguagem Natural. Ademais, suas capacidades generativas permitiram aplicações em tarefas de natureza discreta (sequências de caracteres e palavras), isto é, geração de texto. Uma arquitetura em específico, denotada por Redes Adversariais Generativas, utiliza uma estrutura composta por discriminador e gerador, os quais procuram obter um equilíbrio entre gerar dados artificiais e classificá-los como dados verdadeiros. Recentemente, vários trabalhos propuseram soluções baseadas em Redes Adversariais Generativas para a geração de texto, porém apenas alguns deles conseguiram gerar textos sem palavras repetidas e com algum significado semântico. Um problema decorrente das Redes Adversariais Generativas consiste na dificuldade em estabelecer um equilíbrio no treinamento e, consequentemente, gerar textos artificiais que assemelham-se aos textos reais. Desta forma, a presente tese aprimora o desenvolvimento de modelos adversariais textuais através de funções de similaridade aprendidas por Redes Siamesas, as quais fornecem recompensas capazes de melhor distinguir entre textos artificiais e reais. Adicionalmente, tais modelos são aperfeiçoados com o uso da otimização meta-heurística, a qual fornece conjuntos de hiperparâmetros específicos para as tarefas em questão. Os resultados experimentais obtidos demonstram a capacidade da arquitetura proposta, denotada por Rede Adversarial Generativa por Similaridade Textual, do inglês Text-Similarity Generative Adversarial Network (TS-GAN), em quatro base de dados da literatura. As TS-GANs atingiram resultados superiores às arquiteturas adversariais estado-da-arte e, em suas versões pós-otimização, foram capazes de aprimorar as métricas de suas versões iniciais (sem otimização) em duas de quatro bases de dados.pt
dc.description.abstractMachine Learning algorithms have been paramount in the latest years, mainly due to their discriminative capacity in Computer Vision and Natural Language Processing tasks. Furthermore, their generative potentials allowed usage in discrete-based (sequences of characters and words) tasks, such as text generation. A specific architecture denoted as Generative Adversarial Networks uses an structure composed of discriminators and generators to establish an equilibrium between artificial data generation and their classification as real data. Several works proposed adversarial-based models to generate text; however, only a few could generate non-repeated text with little semantic significance. Furthermore, a recurring issue regarding Generative Adversarial Networks consists of the difficulty of establishing a training equilibrium and, consequently, generating artificial text that resembles the original ones. Therefore, this thesis enhances the development of text-based adversarial models through similarity functions learned from Siamese Networks, which provides rewards capable of better distinguishing between artificial and original texts. Such models are improved through meta-heuristic optimization, which furnishes specific hyperparameters to the accounted tasks. The experimental results indicate the capacity of the proposed architecture, denoted by Text-Similarity Generative Adversarial Network (TS-GAN), amongst four literature datasets. The TS-GANs obtained state-of-the-art results and, in their post-optimization versions, were able to improve their standard versions (without optimization) in two out of four datasets.en
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdFAPESP: 2019/02205-5
dc.identifier.capes33004153073P2
dc.identifier.urihttp://hdl.handle.net/11449/238053
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso abertopt
dc.subjectAprendizado de máquinapt
dc.subjectAprendizado adversarialpt
dc.subjectProcessamento de linguagem naturalpt
dc.subjectGeração de textopt
dc.subjectRedes siamesaspt
dc.subjectOtimização meta-heurísticapt
dc.subjectMachine learningen
dc.subjectAdversarial learningen
dc.subjectNatural language processingen
dc.subjectText generationen
dc.subjectSiamese networksen
dc.subjectMeta-heuristic optimizationen
dc.titleAnálise de aprendizado adversarial baseado em similaridade na geração de textopt
dc.title.alternativeText generation analysis using similarity-based adversarial learningen
dc.typeTese de doutoradopt
dspace.entity.typePublication
relation.isOrgUnitOfPublicationaef1f5df-a00f-45f4-b366-6926b097829b
relation.isOrgUnitOfPublication.latestForDiscoveryaef1f5df-a00f-45f4-b366-6926b097829b
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências, Baurupt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência da Computação - FCpt
unesp.knowledgeAreaComputação aplicadapt
unesp.researchAreaInteligência Computacionalpt

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
rosa_gh_dr_bauru.pdf
Tamanho:
3.29 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.97 KB
Formato:
Item-specific license agreed upon to submission
Descrição: