Qualidade de dados como requisito na comparação de algoritmos de classificação de conteúdo textual

dc.contributor.advisorSantos, Adriana Barbosa [UNESP]
dc.contributor.advisorCruz, Álvaro Magri Nogueira da
dc.contributor.authorRücker, Gabriel
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2022-02-07T19:57:14Z
dc.date.available2022-02-07T19:57:14Z
dc.date.issued2022-01-04
dc.description.abstractData availability is growing in the real world. In order to be able to make inferences that help in decision making, data mining techniques such as the classification algorithms are used. Besides that, data quality is a relevant factor to consider, because it directly impacts results of the decision-making process, especially in the corporative environment. This work aimed to compare algorithms that prioritize data quality dimensions evaluation in the process of classifying textual content from scientific papers for a scientific communication platform. In order to do that, different validation techniques were used to measure the algorithms performance, as well as specific metrics to evaluate the quality dimensions under varied experimental conditions, aiming to evaluate data quality impact on the outcomes of a classification.en
dc.description.abstractA disponibilidade de dados é cada vez maior no mundo atual. Para a realização de inferências que auxiliem nas tomadas de decisão, técnicas de mineração de dados como os algoritmos de classificação são utilizadas. Além disso, a qualidade dos dados é um fator preponderante, pois influencia diretamente nos resultados que embasam o processo decisório, especialmente no ambiente corporativo. Este trabalho objetiva a comparação de algoritmos que priorizem a avaliação de dimensões de qualidade de dados no processo de classificação de conteúdo textual a partir de artigos científicos que compõem o portfólio de informações exibidas em uma plataforma de comunicação científica. Para isso, utilizaram-se diferentes técnicas de validação para aferir o desempenho dos algoritmos, bem como métricas específicas para avaliação das dimensões de qualidade sob diferentes condições experimentais, visando avaliar a influência da qualidade dos dados no processo de classificação.pt
dc.description.sponsorshipNão recebi financiamento
dc.identifier.urihttp://hdl.handle.net/11449/216381
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectBig dataen
dc.subjectData qualityen
dc.subjectData miningen
dc.subjectClassification algorithmsen
dc.subjectCiência da computaçãopt
dc.subjectMineração de dados (Computação)pt
dc.subjectInteligência artificialpt
dc.titleQualidade de dados como requisito na comparação de algoritmos de classificação de conteúdo textualpt
dc.title.alternativeData quality as a requirement in the comparison of text classification algorithmsen
dc.typeTrabalho de conclusão de curso
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Pretopt
unesp.undergraduateCiência da Computação - IBILCEpt

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
rücker_g_tcc_sjrp.pdf
Tamanho:
1.82 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.42 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
rücker_g_autorizacao_sjrp.pdf
Tamanho:
184.94 KB
Formato:
Adobe Portable Document Format
Descrição: