Documentos presidenciais da Biblioteca da Presidência da República: base de metadados (versão 1)
Carregando...
Data
Autores
Orientador
Coorientador
Pós-graduação
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (UNESP)
Tipo
Dado de pesquisa
Direito de acesso
Acesso aberto

Resumo
Descrição
Planilha contendo metadados estruturados de 8.606 documentos oficiais publicados na Biblioteca da Presidência da República, abrangendo discursos, entrevistas, pronunciamentos, mensagens oficiais e outros tipos de documentos produzidos por presidentes brasileiros. Esta versão inclui apenas metadados — não contém o texto completo dos documentos.
Descrição detalhada:
Este conjunto de dados reúne metadados extraídos por raspagem automatizada da Biblioteca da Presidência da República, abrangendo 8.606 documentos oficiais publicados entre diferentes governos, de 1985 (governo Sarney), até 2022 (governo Bolsonaro). Os metadados incluem: identificador único (document_id), nome do presidente, tipo de documento (em sua forma original), data (ISO, quando disponível), ano e mês, título conforme publicado, URL original do documento na Biblioteca da Presidência da República, nome de arquivo, idioma (pt-BR), fonte e notas de processamento.
Esta versão disponibiliza apenas os metadados para fins de reprodutibilidade, rastreamento e uso em pesquisas sobre comunicação governamental, agenda presidencial, prioridades governamentais e estudos de políticas públicas. O texto integral dos documentos não está incluído nesta versão.
A base foi organizada a partir de raspagem sistemática, com limpeza, padronização leve, conversão de datas e unificação de colunas essenciais. As categorias originais provenientes da própria Biblioteca da Presidência foram preservadas, sem recodificação temática.
This dataset compiles structured metadata for 8,606 official documents published in the Library of the Presidency of the Republic, encompassing speeches, interviews, statements, official messages, and other types of documents produced by Brazilian presidents from 1985 (Sarney administration) to 2022 (Bolsonaro administration). The metadata include: unique identifier (document_id), president’s name, original document type, date (ISO format, when available), year and month, title as published, original URL in the Library of the Presidency of the Republic, file name, language (pt-BR), source, and processing notes. This version provides metadata only, for purposes of reproducibility, traceability, and use in research on presidential agendas, government priorities, public policy studies, and governmental communication. The full text of the documents is not included in this release. The dataset was constructed through systematic web scraping, followed by cleaning, standardization, date conversion, and consolidation of essential fields. The original categories assigned by the Library of the Presidency were preserved, with no thematic recoding.
This dataset compiles structured metadata for 8,606 official documents published in the Library of the Presidency of the Republic, encompassing speeches, interviews, statements, official messages, and other types of documents produced by Brazilian presidents from 1985 (Sarney administration) to 2022 (Bolsonaro administration). The metadata include: unique identifier (document_id), president’s name, original document type, date (ISO format, when available), year and month, title as published, original URL in the Library of the Presidency of the Republic, file name, language (pt-BR), source, and processing notes. This version provides metadata only, for purposes of reproducibility, traceability, and use in research on presidential agendas, government priorities, public policy studies, and governmental communication. The full text of the documents is not included in this release. The dataset was constructed through systematic web scraping, followed by cleaning, standardization, date conversion, and consolidation of essential fields. The original categories assigned by the Library of the Presidency were preserved, with no thematic recoding.
Palavras-chave
Políticas públicas, Governo federal, Presidência da República, Documentos oficiais, Dados de pesquisa
Idioma
Português



