Logo do repositório

BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro

Carregando...
Imagem de Miniatura

Orientador

Carvalho, Veronica Oliveira de

Coorientador

Pós-graduação

Ciência da Computação - FC/FCT/IBILCE/IGCE

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

Esta dissertação teve como objetivo investigar o uso de técnicas de mineração de dados como instrumento de apoio à tomada de decisão na alocação de recursos públicos, com foco na função alocativa do orçamento. Para isso, realizou-se inicialmente um mapeamento sistemático da literatura, a fim de identificar aplicações existentes de mineração de dados no contexto orçamentário. O estudo constatou que, embora a área de orçamento público represente um campo estratégico para a aplicação de soluções inteligentes, sua exploração ainda é incipiente, especialmente no que diz respeito à função alocativa. Dentre as soluções encontradas, destaca-se o Pipe-VC, um pipeline que relaciona gastos públicos a variáveis macroeconômicas como PIB, inflação e índice de Gini. No entanto, o Pipe-VC apresenta limitações, entre elas o tratamento inadequado dos dados temporais, a ausência de técnicas de feature engineering e a baixa capacidade de generalização. Diante dessas e outras limitações, este trabalho apresenta o BupFlow (Budget public Flow), um pipeline alternativo, mais flexível e interpretável, que incorpora pré-processamento adequado, seleção de atributos e modelos mais simples, porém com maior capacidade de generalização, visando um domínio caracterizado por conjuntos de dados de pequena escala e alta dimensão. O BupFlow foi avaliado empiricamente por meio de sua aplicação a dados do orçamento federal brasileiro, sendo comparado ao Pipe-VC. Os resultados indicam que o BupFlow se apresenta como uma alterativa viável ao Pipe-VC, constituindo uma contribuição relevante ao estado da arte. Conclui-se que a proposta oferece uma abordagem metodológica promissora para apoiar decisões públicas orientadas por dados, contribuindo para uma alocação mais eficiente, transparente e socialmente orientada dos recursos públicos.

Resumo (inglês)

This dissertation sought to explore the application of data mining techniques as a means to facilitate decision-making in the allocation of public resources, with a particular focus on the budget’s allocative function. To achieve this, we initially conducted a systematic literature review to identify existing applications of data mining within the budgetary context. The findings revealed that, while the public budget represents a strategic area for the implementation of intelligent solutions, its exploration remains nascent, particularly concerning the allocativefunction. Among the solutions identified, Pipe-VC stands out as a pipeline that correlates public spending with macroeconomic variables such as GDP, inflation, and the Gini index. Nonetheless, Pipe-VC exhibits certain limitations, including inadequate handling of temporal data, a lack of feature engineering techniques, and limited generalizability. In light of these issues, this paper introduces BupFlow (Budget public Flow), a more flexible and interpretable pipeline that integrates appropriate preprocessing, feature selection, and simpler models, all while exhibiting enhanced generalization capacity, particularly suited for small-scale, high-dimensional datasets. BupFlow was empirically assessed through its application to Brazilian federal budget data and was compared with Pipe-VC. The results indicate that BupFlow serves as a viable alternative to Pipe-VC, making a significant contribution to the current state of the art. This proposal offers a promising methodological framework to support data-driven public decision-making, ultimately contributing to a more efficient, transparent, and socially responsible allocation of public resources.

Descrição

Palavras-chave

Mineração de dados (Computação), Orçamento, Alocação de recursos, Otimização matemática, Data mining, Public budget, Allocation, Optimization, Pipeline

Idioma

Português

Citação

NEVES, José Cláudio Guedes das. BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro. 2025. Dissertação (Mestrado em Ciência da Computação) – Instituto de Geociências e Ciências Exatas, Universidade Estadual Paulista (UNESP), Rio Claro, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação