Publicação: Arquitetura para a extração, transformação e armazenamento em Data Warehouse ativo
dc.contributor.advisor | Valêncio, Carlos Roberto [UNESP] | |
dc.contributor.author | França, Vitor Pelicer de Mesquita [UNESP] | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2024-12-19T12:24:11Z | |
dc.date.available | 2024-12-19T12:24:11Z | |
dc.date.issued | 2024-11-25 | |
dc.description.abstract | As arquiteturas de Data Warehouse convencionais fazem uso de Extração Transformação Armazenamento - ETA e com o propósito de trazer os dados de um sistema fonte para o Data Warehouse. Normalmente os dados são integrados por ETA em intervalos longos, geralmente de um dia e em momentos que os sistemas estão com pouca demanda de consumo. As demandas de mercado por análise de dados evoluíram significativamente e atualmente existem aplicações que requisitam por análises com alto grau de atualização, e para suportar essa demanda, passou a ser utilizadas arquiteturas de Data Warehouse Ativo. Nessa arquitetura o dado é constantemente atualizado, e o processo de ETA é normalmente realizado por streaming de dados ou o envio constante de micro lotes, mas devido ao alto grau de atualização, isso demanda que sejam feitas consultas e inserções ao banco de dados de maneira exaustiva, o que pode acarretar uma sobrecarga dos sistemas envolvidos. Então, este trabalho tem o objetivo de propor uma melhoria a arquitetura de integração de dados com uma estratégia para definir quando é interessante realizar as inserções dos dados no sistema, e toma a escolha baseada na relevância dos dados alterados e no seu volume. Com isto, este trabalho contribui com a redução de atualizações por meio de recurso de inteligência artificial para inferir os valores de relevância e volume necessários para acionar o processo de ETA. | pt |
dc.description.abstract | Conventional Data Warehouse architectures utilize Extract, Transform, and Load (ETL) with the purpose of transferring data from a source system to the Data Warehouse. Typically, data integration via ETL occurs in long intervals, often daily, during periods of low system demand. However, market demands for data analysis have evolved significantly, and there are now applications requiring analyses with a high degree of real-time updates. To meet this demand, Active Data Warehouse architectures have emerged. In these architectures, data is continuously updated, and the ETL process is usually performed through data streaming or the constant delivery of micro-batches. However, this high level of updates necessitates frequent queries and inserts into the database, which can lead to system overload. This work aims to propose an improvement to the data integration architecture by introducing a strategy to determine when it is optimal to insert data into the system. The decision is based on the relevance of the modified data and its volume. This contribution reduces the number of updates through the use of artificial intelligence to infer the relevance and volume thresholds required to trigger the ETL process. | en |
dc.identifier.citation | FRANÇA, Vitor Pelicer de Mesquita. Arquitetura para a extração, transformação e armazenamento em Data Warehouse ativo. 2024. 33 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto, 2024. | |
dc.identifier.uri | https://hdl.handle.net/11449/259284 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | pt |
dc.subject | Data Warehouse Ativo | pt |
dc.subject | ETA | pt |
dc.subject | Aprendizado por reforço | pt |
dc.subject | Inteligência artificial | pt |
dc.subject | Reinforcement learning | en |
dc.subject | Artificial inteligence | en |
dc.title | Arquitetura para a extração, transformação e armazenamento em Data Warehouse ativo | pt |
dc.title.alternative | Architecture for extraction, transformation and storage in active Data Warehouse | en |
dc.type | Trabalho de conclusão de curso | pt |
dspace.entity.type | Publication | |
unesp.campus | Universidade Estadual Paulista (Unesp), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto | pt |
unesp.examinationboard.type | Banca pública | pt |
unesp.undergraduate | São José do Rio Preto - IBILCE - Ciência da Computação | pt |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- franca_vpm_tcc_sjrp.pdf
- Tamanho:
- 1.12 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 2 de 2
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
Nenhuma Miniatura disponível
- Nome:
- franca_vpm_autorizacao_sjrp.pdf
- Tamanho:
- 166.34 KB
- Formato:
- Adobe Portable Document Format
- Descrição: