Logotipo do repositório
 

Publicação:
Sumarização abstrativa de textos em português utilizando aprendizado de máquina

dc.contributor.advisorPapa, João Paulo [UNESP]
dc.contributor.authorPaiola, Pedro Henrique
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2022-10-06T16:45:52Z
dc.date.available2022-10-06T16:45:52Z
dc.date.issued2022-09-09
dc.description.abstractA sumarização automática consiste no processo de capturar as informações mais relevantes de um texto e condensá-las em um texto compreensível em linguagem natural. Este processo pode ser classificado como sumarização extrativa, quando identifica as sentenças mais importantes do texto de origem para compor o sumário utilizando as mesmas sentenças, ou sumarização abstrativa, quando gera novas sentenças baseadas nas informações mais relevantes do texto de origem. Pesquisas em sumarização automática abstrativa para o português brasileiro ainda são escassas, especialmente para sumarização abstrativa baseada em aprendizado em profundidade. Por este motivo, este consiste no foco desta pesquisa. Nesta dissertação são apresentados experimentos com modelos pré-treinados, ajustados para as bases TeMário, CSTNews e para os textos em português da WikiLingua e XL-Sum. Os resultados apresentados por estes experimentos são relativamente satisfatórios, ainda apresentando problemas, dos quais a maioria são comuns em sumarização abstrativa, mas que podem servir como ponto de partida para futuras pesquisas.pt
dc.description.abstractAutomatic summarization captures the most relevant information in a text and condenses it into an understandable text in natural language. This process can be classified as extractive summarization, which identifies the most important sentences from the source text and composes the summary using that very same sentences, or abstractive summarization, which generates new sentences based on the most relevant information from the source text. Research on Brazilian Portuguese-based abstractive summarization is still scarce, especially for deep learning-based abstractive summarization. For this reason, this is the focus of this research. This master thesis presents experiments with pre-trained models, fine-tuned for the TeMário and CSTNews databases and for the texts in Portuguese from WikiLingua and XL-Sum. The results presented by these experiments are relatively satisfactory, still presenting problems, most of which are common in abstractive summarization, but can serve as a starting point for future research.pt
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipIdCAPES: 88887.487277/2020-00
dc.identifier.capes33004153073P2
dc.identifier.urihttp://hdl.handle.net/11449/236858
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectProcessamento de Linguagem Naturalpt
dc.subjectAprendizado de Máquinapt
dc.subjectSumarizaçãopt
dc.subjectSumarização Abstrativapt
dc.subjectPortuguês Brasileiropt
dc.subjectNatural language processingpt
dc.subjectMachine learningpt
dc.subjectSummarizationpt
dc.subjectAbstractive summarizationpt
dc.subjectBrazilian portuguesept
dc.titleSumarização abstrativa de textos em português utilizando aprendizado de máquinapt
dc.title.alternativeAbstractive summarization for portuguese texts using machine learningpt
dc.typeDissertação de mestrado
dspace.entity.typePublication
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências, Baurupt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência da Computação - FCpt
unesp.knowledgeAreaComputação aplicadapt
unesp.researchAreaInteligência Computacionalpt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
paiola_ph_me_bauru.pdf
Tamanho:
1.34 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.97 KB
Formato:
Item-specific license agreed upon to submission
Descrição: