Metadados administrativos e a proveniência dos dados: modelo baseado na família PROV

Carregando...
Imagem de Miniatura

Data

2019-01-11

Autores

Arakaki, Felipe Augusto [UNESP]

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

O catálogo é um ambiente pelo qual os usuários podem encontrar, identificar, selecionar e navegar para obter um recurso informacional. Seu desenvolvimento sempre esteve atrelado ao uso das tecnologias disponíveis, com o objetivo de aperfeiçoar e agilizar o processo de busca, localização, acesso e de recuperação. A base para esse instrumento é a construção de formas de representação realizadas por meio dos metadados. Entretanto, com a expansão e popularização da publicação de dados na Web, são necessários sistemas cada vez mais interoperáveis e alguns problemas ainda não foram solucionados como a identificação da origem, registros de ações, entre outras informações no domínio bibliográfico, principalmente no que diz respeito aos padrões de metadados, a abertura dos catálogos e repositórios digitais para o reaproveitamento de dados de bibliográficos. Nesse contexto a questão central desta pesquisa foi: qual a função dos metadados de proveniência nos registros bibliográficos em ambientes digitais? A partir da questão norteadora desta tese, considera-se que a catalogação pode auxiliar na construção de representações a partir dos metadados administrativos e de proveniência para permitir a confiabilidade e integridade dos dados de bibliotecas, e principalmente, a catalogação influencia diretamente na construção de descrições dos recursos informacionais em catálogos e repositórios digitais persistindo as informações nos registros bibliográficos. Nesse contexto, a hipótese da tese configura-se que o modelo PROV-O, modelo baseado na família PROV, pode ser aplicado ao domínio bibliográfico para a representação da proveniência em registros bibliográficos, permitindo a descrição da origem, das ações e dos envolvidos na construção e alteração de registros em ambientes digitais. Dessa forma, a tese consiste em que os registros bibliográficos necessitam de metadados referentes à proveniência dos dados para a preservação da integridade e da persistência, como forma na garantia da confiabilidade das informações em ambientes digitais. A presente proposta parte da necessidade de reutilizar dados em catálogos de bibliotecas e repositórios digitais, independentemente do padrão de metadados utilizado. Destaca-se a importância da proveniência dos dados na perspectiva do reuso dos dados em catálogos e repositórios digitais por meio de um modelo de dados que seja interoperável. Para tanto, o objetivo geral é analisar a viabilidade da aplicação do modelo PROV-O para a representação da proveniência em registros bibliográficos de ambientes digitais. Caracteriza-se por uma pesquisa qualitativa, em razão da análise que busca entender o relacionamento entre os metadados administrativos, a proveniência dos dados no domínio bibliográfico. Como resultados apresentou o crosswalk entre o PROV-O, MARC21, Dublin Core, PREMIS, BIBFRAME e Schema.org para verificar a compatibilidade dos padrões com a questão da proveniência. O estudo sobre a proveniência revelou que a temática no Brasil é incipiente e carece de pesquisas teóricas e iniciativas de cunho prático/profissional. Tal conclusão, revela a necessidade de um cuidado especial no planejamento do sistema, na definição dos metadados que irão compor o registro bibliográfico do recurso informacional. Isso irá refletir na definição de quais informações são necessárias aos usuários, para o acesso e a visualização e, por último, e não menos importante, na definição de quais são informações necessárias para gestão e curadoria do sistema.
The catalog is an environment by which users can find, identify, select and navigate to obtain an informational resource. Its development has always been linked to the use of available technologies, with the objective of improving and streamlining the search, localization, access and retrieval process. The basis for this instrument is the construction of forms of representation performed through the metadata. However, with the expansion and popularization of data publication on the Web, increasingly interoperable systems are needed and some problems have not yet been solved, such as origin identification, action records, among other information in the bibliographic domain, especially with respect to to the metadata standards, the opening of catalogs and digital repositories for the reuse of bibliographic data. In this context the central question of this research was: what is the function of provenance metadata in bibliographic records in digital environments? From the guiding question of this thesis, it is considered that the cataloging can help in the construction of representations from the administrative and provenance metadata to allow the reliability and integrity of the data of libraries, and mainly, the cataloging directly influences the construction of descriptions of the information resources in catalogs and digital repositories, persisting the information in the bibliographic records. In this context, the hypothesis of the thesis is that the PROV-O model, based on the PROV family, can be applied to the bibliographic domain for the representation of provenance in bibliographic records, allowing the description of origin, actions and involved in the construction and alteration of records in digital environments. Thus, the thesis consists in that the bibliographic records need metadata referring to the provenience of the data for the preservation of the integrity and the persistence, as a way to guarantee the reliability of the information in digital environments. The present proposal starts from the need to reuse data in catalogs of libraries and digital repositories, regardless of the metadata standard used. The importance of the provenance of the data from the perspective of the reuse of the data in catalogs and digital repositories through an interoperable data model is highlighted. For this, the general objective is to analyze the feasibility of the application of the PROV-O model for the representation of provenance in bibliographic records of digital environments. It is characterized by a qualitative research, due to the analysis that seeks to understand the relationship between administrative metadata, the provenience of the data in the bibliographic domain. As results presented the crosswalk between PROV-O, MARC21, Dublin Core, PREMIS, BIBFRAME and Schema.org to check the compatibility of standards with the question of provenance. The study on provenance revealed that the thematic in Brazil is incipient and lacks theoretical research and initiatives of a practical / professional nature. This conclusion reveals the need for special care in the planning of the system, in the definition of the metadata that will compose the bibliographic record of the information resource. This will reflect in defining what information is required for users, for access and viewing and, last but not least, in defining what information is needed for system management and curation.

Descrição

Palavras-chave

Proveniência dos dados, Família PROV, Metadados, Catalogação, Crosswalk, Domínio bibliográfico, Data provenance, PROV family, Metadata, Cataloguing, Bibliographic domain

Como citar