BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro
| dc.contributor.advisor | Carvalho, Veronica Oliveira de [UNESP] | |
| dc.contributor.author | Neves, José Cláudio Guedes das [UNESP] | |
| dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
| dc.date.accessioned | 2025-09-18T12:04:28Z | |
| dc.date.issued | 2025-08-27 | |
| dc.description.abstract | Esta dissertação teve como objetivo investigar o uso de técnicas de mineração de dados como instrumento de apoio à tomada de decisão na alocação de recursos públicos, com foco na função alocativa do orçamento. Para isso, realizou-se inicialmente um mapeamento sistemático da literatura, a fim de identificar aplicações existentes de mineração de dados no contexto orçamentário. O estudo constatou que, embora a área de orçamento público represente um campo estratégico para a aplicação de soluções inteligentes, sua exploração ainda é incipiente, especialmente no que diz respeito à função alocativa. Dentre as soluções encontradas, destaca-se o Pipe-VC, um pipeline que relaciona gastos públicos a variáveis macroeconômicas como PIB, inflação e índice de Gini. No entanto, o Pipe-VC apresenta limitações, entre elas o tratamento inadequado dos dados temporais, a ausência de técnicas de feature engineering e a baixa capacidade de generalização. Diante dessas e outras limitações, este trabalho apresenta o BupFlow (Budget public Flow), um pipeline alternativo, mais flexível e interpretável, que incorpora pré-processamento adequado, seleção de atributos e modelos mais simples, porém com maior capacidade de generalização, visando um domínio caracterizado por conjuntos de dados de pequena escala e alta dimensão. O BupFlow foi avaliado empiricamente por meio de sua aplicação a dados do orçamento federal brasileiro, sendo comparado ao Pipe-VC. Os resultados indicam que o BupFlow se apresenta como uma alterativa viável ao Pipe-VC, constituindo uma contribuição relevante ao estado da arte. Conclui-se que a proposta oferece uma abordagem metodológica promissora para apoiar decisões públicas orientadas por dados, contribuindo para uma alocação mais eficiente, transparente e socialmente orientada dos recursos públicos. | pt |
| dc.description.abstract | This dissertation sought to explore the application of data mining techniques as a means to facilitate decision-making in the allocation of public resources, with a particular focus on the budget’s allocative function. To achieve this, we initially conducted a systematic literature review to identify existing applications of data mining within the budgetary context. The findings revealed that, while the public budget represents a strategic area for the implementation of intelligent solutions, its exploration remains nascent, particularly concerning the allocativefunction. Among the solutions identified, Pipe-VC stands out as a pipeline that correlates public spending with macroeconomic variables such as GDP, inflation, and the Gini index. Nonetheless, Pipe-VC exhibits certain limitations, including inadequate handling of temporal data, a lack of feature engineering techniques, and limited generalizability. In light of these issues, this paper introduces BupFlow (Budget public Flow), a more flexible and interpretable pipeline that integrates appropriate preprocessing, feature selection, and simpler models, all while exhibiting enhanced generalization capacity, particularly suited for small-scale, high-dimensional datasets. BupFlow was empirically assessed through its application to Brazilian federal budget data and was compared with Pipe-VC. The results indicate that BupFlow serves as a viable alternative to Pipe-VC, making a significant contribution to the current state of the art. This proposal offers a promising methodological framework to support data-driven public decision-making, ultimately contributing to a more efficient, transparent, and socially responsible allocation of public resources. | en |
| dc.identifier.capes | 33004153073P2 | |
| dc.identifier.citation | NEVES, José Cláudio Guedes das. BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro. 2025. Dissertação (Mestrado em Ciência da Computação) – Instituto de Geociências e Ciências Exatas, Universidade Estadual Paulista (UNESP), Rio Claro, 2025. | |
| dc.identifier.lattes | 4212965309582606 | |
| dc.identifier.orcid | 0000-0003-3966-8297 | |
| dc.identifier.uri | https://hdl.handle.net/11449/313723 | |
| dc.language.iso | por | |
| dc.publisher | Universidade Estadual Paulista (Unesp) | |
| dc.rights.accessRights | Acesso restrito | pt |
| dc.subject | Mineração de dados (Computação) | pt |
| dc.subject | Orçamento | pt |
| dc.subject | Alocação de recursos | pt |
| dc.subject | Otimização matemática | pt |
| dc.subject | Data mining | en |
| dc.subject | Public budget | en |
| dc.subject | Allocation | en |
| dc.subject | Optimization | en |
| dc.subject | Pipeline | en |
| dc.title | BupFlow: um pipeline de mineração de dados para alocação orçamentária pública: do mapeamento sistemático à aplicação no sistema orçamentário brasileiro | pt |
| dc.title.alternative | BupFlow: a data mining pipeline for public budget allocation: from systematic mapping to application in the Brazilian budgeting system | en |
| dc.type | Dissertação de mestrado | pt |
| dcterms.impact | Essa pesquisa procurou gerar impacto positivo ao contribuir diretamente para diversos Objetivos de Desenvolvimento Sustentável (ODS) como a erradicação da pobreza (1), saúde e bem-estar (3), trabalho descente e crescimento econômico (8), indústria, inovação e infraestrutura (9), redução das desigualdades (10), entre outros. Buscou ainda promover novos conhecimentos aplicáveis ao avanço científico por meio do mapeamento sistemático da literatura do uso de técnicas de inteligência artificial no contexto dos processos de planejamento e orçamento públicos. Contribuiu também com a análise crítica do estado da arte nesse segmento, além de disponibilizar um pipeline aplicável com o objetivo de promover a cultura de valorização do uso estratégico de mineração de dados para a melhoria da governança orçamentária, modernização do ciclo orçamentário e otimização da alocação de recursos públicos. | pt |
| dcterms.impact | This research sought to generate a positive impact by directly contributing to several Sustainable Development Goals (SDGs), such as no poverty (1), good health and well-being (3), decent work and economic growth (8), industry, innovation, and infrastructure (9), and reduced inequalities (10), among others. It also sought to promote new knowledge applicable to scientific advancement through systematically mapping the literature on the use of artificial intelligence techniques in the context of public planning and budgeting processes. It also contributed to a critical analysis of the state of the art in this segment, in addition to providing an applicable pipeline aimed at promoting a culture of valuing the strategic use of data mining to improve budgetary governance, modernize the budget cycle, and optimize the allocation of public resources. | en |
| dspace.entity.type | Publication | |
| relation.isAuthorOfPublication | d087e521-db49-429d-91f4-02d40074759d | |
| relation.isAuthorOfPublication.latestForDiscovery | d087e521-db49-429d-91f4-02d40074759d | |
| unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Geociências e Ciências Exatas, Rio Claro | pt |
| unesp.embargo | 24 meses após a data da defesa | pt |
| unesp.examinationboard.type | Banca pública | pt |
| unesp.graduateProgram | Ciência da Computação - FC/FCT/IBILCE/IGCE | pt |
| unesp.knowledgeArea | Computação aplicada | pt |
| unesp.researchArea | Inteligência computacional | pt |
Arquivos
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:

