Publicação:
Arquitetura para a extração, transformação e armazenamento em Data Warehouse ativo

dc.contributor.advisorValêncio, Carlos Roberto [UNESP]
dc.contributor.authorFrança, Vitor Pelicer de Mesquita [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2024-12-19T12:24:11Z
dc.date.available2024-12-19T12:24:11Z
dc.date.issued2024-11-25
dc.description.abstractAs arquiteturas de Data Warehouse convencionais fazem uso de Extração Transformação Armazenamento - ETA e com o propósito de trazer os dados de um sistema fonte para o Data Warehouse. Normalmente os dados são integrados por ETA em intervalos longos, geralmente de um dia e em momentos que os sistemas estão com pouca demanda de consumo. As demandas de mercado por análise de dados evoluíram significativamente e atualmente existem aplicações que requisitam por análises com alto grau de atualização, e para suportar essa demanda, passou a ser utilizadas arquiteturas de Data Warehouse Ativo. Nessa arquitetura o dado é constantemente atualizado, e o processo de ETA é normalmente realizado por streaming de dados ou o envio constante de micro lotes, mas devido ao alto grau de atualização, isso demanda que sejam feitas consultas e inserções ao banco de dados de maneira exaustiva, o que pode acarretar uma sobrecarga dos sistemas envolvidos. Então, este trabalho tem o objetivo de propor uma melhoria a arquitetura de integração de dados com uma estratégia para definir quando é interessante realizar as inserções dos dados no sistema, e toma a escolha baseada na relevância dos dados alterados e no seu volume. Com isto, este trabalho contribui com a redução de atualizações por meio de recurso de inteligência artificial para inferir os valores de relevância e volume necessários para acionar o processo de ETA.pt
dc.description.abstractConventional Data Warehouse architectures utilize Extract, Transform, and Load (ETL) with the purpose of transferring data from a source system to the Data Warehouse. Typically, data integration via ETL occurs in long intervals, often daily, during periods of low system demand. However, market demands for data analysis have evolved significantly, and there are now applications requiring analyses with a high degree of real-time updates. To meet this demand, Active Data Warehouse architectures have emerged. In these architectures, data is continuously updated, and the ETL process is usually performed through data streaming or the constant delivery of micro-batches. However, this high level of updates necessitates frequent queries and inserts into the database, which can lead to system overload. This work aims to propose an improvement to the data integration architecture by introducing a strategy to determine when it is optimal to insert data into the system. The decision is based on the relevance of the modified data and its volume. This contribution reduces the number of updates through the use of artificial intelligence to infer the relevance and volume thresholds required to trigger the ETL process.en
dc.identifier.citationFRANÇA, Vitor Pelicer de Mesquita. Arquitetura para a extração, transformação e armazenamento em Data Warehouse ativo. 2024. 33 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto, 2024.
dc.identifier.urihttps://hdl.handle.net/11449/259284
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso abertopt
dc.subjectData Warehouse Ativopt
dc.subjectETApt
dc.subjectAprendizado por reforçopt
dc.subjectInteligência artificialpt
dc.subjectReinforcement learningen
dc.subjectArtificial inteligenceen
dc.titleArquitetura para a extração, transformação e armazenamento em Data Warehouse ativopt
dc.title.alternativeArchitecture for extraction, transformation and storage in active Data Warehouseen
dc.typeTrabalho de conclusão de cursopt
dspace.entity.typePublication
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Pretopt
unesp.examinationboard.typeBanca públicapt
unesp.undergraduateSão José do Rio Preto - IBILCE - Ciência da Computaçãopt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
franca_vpm_tcc_sjrp.pdf
Tamanho:
1.12 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
2.14 KB
Formato:
Item-specific license agreed upon to submission
Descrição:
Nenhuma Miniatura disponível
Nome:
franca_vpm_autorizacao_sjrp.pdf
Tamanho:
166.34 KB
Formato:
Adobe Portable Document Format
Descrição: