BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro
Carregando...
Data
Autores
Orientador
Carvalho, Veronica Oliveira de 

Coorientador
Pós-graduação
Ciência da Computação - FC/FCT/IBILCE/IGCE
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Dissertação de mestrado
Direito de acesso
Acesso restrito
Resumo
Resumo (português)
Esta dissertação teve como objetivo investigar o uso de técnicas de mineração de dados como instrumento de apoio à tomada de decisão na alocação de recursos públicos, com foco na função alocativa do orçamento. Para isso, realizou-se inicialmente um mapeamento sistemático da literatura, a fim de identificar aplicações existentes de mineração de dados no contexto orçamentário. O estudo constatou que, embora a área de orçamento público represente um campo estratégico para a aplicação de soluções inteligentes, sua exploração ainda é incipiente, especialmente no que diz respeito à função alocativa. Dentre as soluções encontradas, destaca-se o Pipe-VC, um pipeline que relaciona gastos públicos a variáveis macroeconômicas como PIB, inflação e índice de Gini. No entanto, o Pipe-VC apresenta limitações, entre elas o tratamento inadequado dos dados temporais, a ausência de técnicas de feature engineering e a baixa capacidade de generalização. Diante dessas e outras limitações, este trabalho apresenta o BupFlow (Budget public Flow), um pipeline alternativo, mais flexível e interpretável, que incorpora pré-processamento adequado, seleção de atributos e modelos mais simples, porém com maior capacidade de generalização, visando um domínio caracterizado por conjuntos de dados de pequena escala e alta dimensão. O BupFlow foi avaliado empiricamente por meio de sua aplicação a dados do orçamento federal brasileiro, sendo comparado ao Pipe-VC. Os resultados indicam que o BupFlow se apresenta como uma alterativa viável ao Pipe-VC, constituindo uma contribuição relevante ao estado da arte. Conclui-se que a proposta oferece uma abordagem metodológica promissora para apoiar decisões públicas orientadas por dados, contribuindo para uma alocação mais eficiente, transparente e socialmente orientada dos recursos públicos.
Resumo (inglês)
This dissertation sought to explore the application of data mining techniques as a means to facilitate decision-making in the allocation of public resources, with a particular focus on the budget’s allocative function. To achieve this, we initially conducted a systematic literature review to identify existing applications of data mining within the budgetary context. The findings revealed that, while the public budget represents a strategic area for the implementation of intelligent solutions, its exploration remains nascent, particularly concerning the allocativefunction. Among the solutions identified, Pipe-VC stands out as a pipeline that correlates public spending with macroeconomic variables such as GDP, inflation, and the Gini index. Nonetheless, Pipe-VC exhibits certain limitations, including inadequate handling of temporal data, a lack of feature engineering techniques, and limited generalizability. In light of these issues, this paper introduces BupFlow (Budget public Flow), a more flexible and interpretable pipeline that integrates appropriate preprocessing, feature selection, and simpler models, all while exhibiting enhanced generalization capacity, particularly suited for small-scale, high-dimensional datasets. BupFlow was empirically assessed through its application to Brazilian federal budget data and was compared with Pipe-VC. The results indicate that BupFlow serves as a viable alternative to Pipe-VC, making a significant contribution to the current state of the art. This proposal offers a promising methodological framework to support data-driven public decision-making, ultimately contributing to a more efficient, transparent, and socially responsible allocation of public resources.
Descrição
Palavras-chave
Mineração de dados (Computação), Orçamento, Alocação de recursos, Otimização matemática, Data mining, Public budget, Allocation, Optimization, Pipeline
Idioma
Português
Citação
NEVES, José Cláudio Guedes das. BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro. 2025. Dissertação (Mestrado em Ciência da Computação) – Instituto de Geociências e Ciências Exatas, Universidade Estadual Paulista (UNESP), Rio Claro, 2025.

