Publicação:
Otimização de desempenho de algoritmo para detecção de outliers em séries temporais

dc.contributor.advisorValêncio, Carlos Roberto [UNESP]
dc.contributor.authorLima, Beatriz Ferreira de
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2022-01-31T21:02:04Z
dc.date.available2022-01-31T21:02:04Z
dc.date.issued2022-01-21
dc.description.abstractTime series have been present in several areas of great economic value, such as the stock market and industry. In circumstances of Big Data characteristics, data can be processed in real time or near real time, and sources capable of generating high volumes of data, which impose the preparation phase to need to perform cleaning of these data effectively and efficiently when dealing with these requirements. There are several algorithms that can be used to carry out this process, but they may have limitations such as low yield, data distortion, high processing time, among others. One of the problems to be addressed in data preparation is the detection of outliers, data that can reflect distortions and that can imply additional costs in the data cleaning phase. Thus, this work aimed to propose an algorithm that performs the detection of outliers and, subsequently, the cleaning of outliers in an effective and efficient way, which sought to maintain the completeness of the information obtained through time series data. From the tests carried out with the algorithm, it was possible to verify a significant reduction in processing time, up to 70%, without altering the original data.en
dc.description.abstractAs séries temporais têm se mostrado presentes em diversas áreas de grande valor econômico, como o mercado de ações e a indústria. Em circunstância de características Big Data, pode-se ter os dados processados em tempo real (real time) ou quase em tempo real (near real time), e fontes capazes de gerar volumes elevados de dados, o que impõe a fase de preparação a necessidade de execução da limpeza destes dados de forma eficaz e eficiente ao lidar com estes requisitos. Existem diversos algoritmos que podem ser utilizados para realizar esse processo, porém esses podem conter limitações como baixo rendimento, distorção dos dados, tempo elevado de processamento, entre outros. Um dos problemas a ser tratado na preparação dos dados é a detecção de outliers, dados que podem refletir distorções e que podem implicar em custos adicionais na fase de limpeza dos dados. Assim, este trabalho teve como objetivo propor um algoritmo que realize a detecção de outliers e, posteriormente, a limpeza dos dados discrepantes de forma eficaz e eficiente, em que se buscou manter a integralidade da informação obtida através dos dados de séries temporais. A partir dos testes realizados com o algoritmo, foi possível constatar uma redução significativa no tempo de processamento, de até 70%, sem que os dados originais sofressem alterações.pt
dc.description.sponsorshipNão recebi financiamento
dc.identifier.urihttp://hdl.handle.net/11449/216225
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.subjectApache sparken
dc.subjectCiência da computaçãopt
dc.subjectBanco de dadospt
dc.subjectSéries temporaispt
dc.subjectAlgoritmos paralelospt
dc.subjectLimpeza de dadospt
dc.subjectDetecção de outlierspt
dc.titleOtimização de desempenho de algoritmo para detecção de outliers em séries temporaispt
dc.title.alternativeAlgorithm performance optimization for outlier detection in time seriesen
dc.typeTrabalho de conclusão de cursopt
dspace.entity.typePublication
unesp.campusUniversidade Estadual Paulista (UNESP), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Pretopt
unesp.undergraduateCiência da Computação - IBILCEpt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
lima_bf_tcc_sjrp.pdf
Tamanho:
758.22 KB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.43 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
lima_bf_autorizacao_sjrp.pdf
Tamanho:
133.44 KB
Formato:
Adobe Portable Document Format
Descrição: