Publicação: Framework para publicação de dados com ênfase em enriquecimento e mapeamento semântico
Carregando...
Arquivos
Data
Autores
Orientador
Santarem Segundo, José Eduardo 

Coorientador
Pós-graduação
Ciência da Informação - FFC
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Tese de doutorado
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Em um ambiente de dados como a Web a publicação de dados ainda é vista como um contexto de processo de descrição sem padronização, uma vez que, para cada domínio, criam-se diferentes formatos e modelos de dados. Para melhorar a interoperabilidade semântica sobre esses datasets ou repositórios heterogêneos, a Web Semântica tem sido adotada, permitindo, assim, a troca reuso ou a coleta de recursos digitais. O objetivo desse trabalho é propor um Framework com a finalidade de guiar, por meio de diretrizes e recomendações, o processo que gera todo o contexto necessário ao processo de extração, limpeza, enriquecimento e mapeamento de dados, descrevendo seus passos de forma organizada e sequencial, com o objetivo de seguir as melhores práticas de publicação de dados na Web. A metodologia define-se como pesquisa descritiva e técnica de análise dos dados e de conteúdo, em que foram aplicados métodos como revisão bibliográfica - definido para o desenvolvimento da investigação -, bem como os resultados de uma revisão sistemática da literatura, que evidencia a singularidade da proposta. Este trabalho determinou cinco diretrizes que geram o estado em questão, analisando alguns projetos correlatos e todo o contexto envolvido para que se chegue ao processo de enriquecimento e mapeamento, dando ênfase aos processos necessários que intervêm durante a proposta da tese, com o objetivo de estabeler diretrizes generalizadas. Para testar o Framework proposto foi realizada uma prova de conceito com as diretrizes identificadas em conjunto de dados do Metrô de São Paulo enriquecidos com outros conjuntos de dados disponíveis. Esta prova de conceito proporcionou o desenvolvimento de uma aplicação, com o propósito de conhecer todo o processo relacionado com enriquecimento e mapeamento de dados vinculados às boas práticas para publicação.
Resumo (inglês)
In a data environment such as the web, data publication is still seen as a context of a non-standardized description process, since for each domain different data formats and models are created. To improve semantic interoperability over these datasets or heterogeneous repositories, the Semantic Web has been adopted, thus allowing the exchange, reuse, or collection of digital resources. This work aims to propose a Framework to guide through orientations and recommendations the process needed to manage all the necessary context in some concerns in the process of extraction, cleaning, enrichment, and mapping of data, describing its steps in an organized and sequential manner, with the objective of following the best practices of data publishing on the web. The methodology is defined as a descriptive research with data and content analysis technique, with application of methods, such as bibliographic review during the development of the investigation, as well as the results of a systematic literature review, highlighting the uniqueness of the proposal. This work determined five guidelines that generate the state in question, analyzing some related projects, and the whole context that it involves in order to achieve the enrichment and mapping process, emphasizing the necessary processes that intervene during the thesis proposal, establishing generalized guidelines, and carrying out a proof of concept, using these guidelines, and map data from the São Paulo subway into linked data, enriching them through other data sets and making them available to all. Thus, a proof of concept was applied, creating an application that is based on the proposed guidelines of the Framework to know the whole process that applies when talking about data enrichment and mapping, linked to the good practices for publishing it.
Descrição
Palavras-chave
Mapeamento semântico, Enriquecimento de dados conectados, Framework de dados conectados, Abordagem de dados conectados, Framework, Web semântica, Web de dados, Semantic mapping, Linked data enrichment, Linked data framework, Linked data approach, Semantic web framework, Web of data
Idioma
Português