Logo do repositório

Documentos presidenciais da Biblioteca da Presidência da República: base de metadados (versão 1)

Carregando...
Imagem de Miniatura

Orientador

Coorientador

Pós-graduação

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (UNESP)

Tipo

Dado de pesquisa

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Descrição

Planilha contendo metadados estruturados de 8.606 documentos oficiais publicados na Biblioteca da Presidência da República, abrangendo discursos, entrevistas, pronunciamentos, mensagens oficiais e outros tipos de documentos produzidos por presidentes brasileiros. Esta versão inclui apenas metadados — não contém o texto completo dos documentos. Descrição detalhada: Este conjunto de dados reúne metadados extraídos por raspagem automatizada da Biblioteca da Presidência da República, abrangendo 8.606 documentos oficiais publicados entre diferentes governos, de 1985 (governo Sarney), até 2022 (governo Bolsonaro). Os metadados incluem: identificador único (document_id), nome do presidente, tipo de documento (em sua forma original), data (ISO, quando disponível), ano e mês, título conforme publicado, URL original do documento na Biblioteca da Presidência da República, nome de arquivo, idioma (pt-BR), fonte e notas de processamento. Esta versão disponibiliza apenas os metadados para fins de reprodutibilidade, rastreamento e uso em pesquisas sobre comunicação governamental, agenda presidencial, prioridades governamentais e estudos de políticas públicas. O texto integral dos documentos não está incluído nesta versão. A base foi organizada a partir de raspagem sistemática, com limpeza, padronização leve, conversão de datas e unificação de colunas essenciais. As categorias originais provenientes da própria Biblioteca da Presidência foram preservadas, sem recodificação temática.
This dataset compiles structured metadata for 8,606 official documents published in the Library of the Presidency of the Republic, encompassing speeches, interviews, statements, official messages, and other types of documents produced by Brazilian presidents from 1985 (Sarney administration) to 2022 (Bolsonaro administration). The metadata include: unique identifier (document_id), president’s name, original document type, date (ISO format, when available), year and month, title as published, original URL in the Library of the Presidency of the Republic, file name, language (pt-BR), source, and processing notes. This version provides metadata only, for purposes of reproducibility, traceability, and use in research on presidential agendas, government priorities, public policy studies, and governmental communication. The full text of the documents is not included in this release. The dataset was constructed through systematic web scraping, followed by cleaning, standardization, date conversion, and consolidation of essential fields. The original categories assigned by the Library of the Presidency were preserved, with no thematic recoding.

Palavras-chave

Políticas públicas, Governo federal, Presidência da República, Documentos oficiais, Dados de pesquisa

Idioma

Português

Citação

Itens relacionados

Unidades

Item type:Unidade,
Faculdade de Ciências e Letras
FCLAR
Campus: Araraquara


Cursos de graduação

Programas de pós-graduação