Otimização em algoritmos de extração de bibliométricas de redes de colaboração científica

dc.contributor.advisorValêncio, Carlos Roberto [UNESP]
dc.contributor.authorFreitas, José Carlos de
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2020-08-31T21:16:21Z
dc.date.available2020-08-31T21:16:21Z
dc.date.issued2020-08-28
dc.description.abstractCom o processo natural de evolução da ciência, a produção de informações nesta área passou a ganhar dimensões importantes, como é o caso quanto as produções científicas e as respectivas colaborações dos pesquisadores. Isso deu origem a grandes redes de colaboração científica, as quais podem ser extraídas de plataformas de armazenamento de informações acadêmicas. Nesse contexto, tem-se a bibliometria com o objetivo de extrair conhecimento quantitativo dessas redes de colaboração científica por meio de métricas, denominadas bibliométricas. Entretanto, os algoritmos de extração de bibliométricas não são escaláveis e, portanto, não suportam grandes redes de colaboração. Neste sentido, faz-se necessário o desenvolvimento de algoritmos otimizados por meio de distribuição de dados, que utilizam os recursos de forma mais eficiente. Assim, a contribuição científica desse trabalho é a proposição de algoritmos de extração de bibliométricas com desempenho superior aos semelhantes encontrados na literatura para grandes redes de colaboração. Verificou-se por meio dos testes que o algoritmo de extração da bibliométrica de transitividade desenvolvido tem crescimento de tempo de processamento 12,76 vezes menor que o tempo de processamento do algoritmo paralelo proposto na literatura, quando o número de pesquisadores tende ao infinito. Como subproduto, foi desenvolvida uma Ferramenta de Extração de Indicadores Bibliométricos com o objetivo de facilitar o uso dos algoritmos desenvolvidos para extração de conhecimento de redes de colaboração científica.pt
dc.description.abstractDue to the natural process of science evolution, information production in this area has been reaching important dimensions, such as scientific productions and their respective collaborations of researchers. As a result, large scientific collaboration networks have arisen, which can be extracted from academic information storage platforms. In this context, Bibliometry aims at extracting quantitative knowledge from these scientific collaboration networks through metrics, called bibliometrics. However, the extraction algorithms of bibliometrics are not scalable and, consequently, do not support large collaboration networks. Considering this, the development of an optimized algorithm becomes necessary through data distribution that uses resources more efficiently. Therefore, the scientific contribution of this work is to implement the transitivity algorithm for extracting bibliometrics developed through the Apache Spark framework with superior performance to those found in the literature for large collaboration networks. Tests have revealed that the developed algorithm has a processing time growth 12.76 times smaller than the processing time of the parallel algorithm proposed in the literature, where the number of researchers tends to infinity. As a by-product, a Tool for Extracting Bibliometric Indicators was designed to enable the use of algorithms developed to extract knowledge from scientific collaboration networks.en
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipIdCAPES: 001
dc.identifier.capes33004153073P2
dc.identifier.urihttp://hdl.handle.net/11449/193347
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectBibliometriapt
dc.subjectParalelização e distribuição de algoritmospt
dc.subjectRede de colaboração científicapt
dc.subjectBibliometricen
dc.subjectBig dataen
dc.subjectData miningen
dc.subjectNoSQLen
dc.subjectAlgorithm parallelization and distributionen
dc.subjectCo-authorship networken
dc.titleOtimização em algoritmos de extração de bibliométricas de redes de colaboração científicapt
dc.title.alternativeSpark-based transitivity algorithm for co-authorship network analysisen
dc.typeDissertação de mestrado
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Pretopt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência da Computação - IBILCEpt
unesp.knowledgeAreaComputação aplicadapt
unesp.researchAreaSistemas de informaçãopt

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
freitas_jc_me_sjrp.pdf
Tamanho:
1.48 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.99 KB
Formato:
Item-specific license agreed upon to submission
Descrição: