Sistematização semântico-ontológica computacional do vocabulário técnico da indústria de artefatos de borracha

Carregando...
Imagem de Miniatura

Data

2012-08-07

Autores

Batista, Abner Maicon Fortunato [UNESP]

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

Ontologies have several applications on Natural Language Processing (NLP) such as machine translators and retrieval and extraction information systems. Ontologies are also the foundation of the so-called Semantic Web, a new concept of the Web that allows interoperability among resources, providing meaning to systems that operate with a large number of data on the Web. Gruber (1993) defines ontology as a formal specification of a conceptualization, i.e., a formal description of concepts and the relationships among these concepts in a given field of knowledge. In the case of a linguistic ontology, only lexicalized concepts in a natural language are approached. Thus, the structuring of a domain in a linguistic ontology focuses on a semantic-conceptual dimension. This research proposes the construction of a linguistically motivated ontology for the domain of Rubber Artifacts Industry (RAI), an area of great interest to industry and research in Brazil, but little explored with regard to the information resources that this industry demands. In order to structure knowledge of the field of RAI, establishing relationships among concepts, a Portuguese corpus was used for that domain from which the terms are extracted and analyzed. The analysis of the terms and their semantic relationships was based on the Generative Lexicon Theory by Pustejovsky (1995), mainly with the use of the Qualia Structure, which specifies four essential aspects of word meaning, namely, constitutive, formal, telic and agentive. Then, the conceptual model obtained was implemented in OWL (Ontology Web Language), a Semantic Web-oriented computer language. The results obtained from this research were a computational semanticontological systematization of the technical vocabulary of Rubber Artifacts Industry (including translations of technical terms in English and French) that can generate a number of useful ...
Résumé: Les ontologies ont plusieurs applications sur le traitement automatique du langage naturel (TALN) tels que les traducteurs automatiques et des systèmes d'information et de récupération d'extraction. Les ontologies sont aussi à la base de la Web Sémantique que l'on appelle, un nouveau concept du Web qui permet l'interopérabilité entre les ressources, donner un sens à des systèmes qui fonctionnent avec un grand nombre de données sur le Web. Gruber (1993) définit l'ontologie comme une spécification formelle d'une conceptualisation, c'est à dire, une description formelle des concepts et des relations entre ces concepts dans un certain domaine de la connaissance. Dans le cas d'une ontologie linguistique, seulement les concepts lexicalisés dans une langue naturelle sont abordés. Ainsi, la structuration d'un domaine dans une ontologie linguistique met l'accent sur une dimension sémantique et conceptuelle. Cette recherche propose la construction d'une ontologie linguistique motivée pour le domaine de l'industrie d'artifacts de caoutchouc (IAC), une zone d'un grand intérêt pour l'industrie et la recherche au Brésil, mais peu explorée en ce qui concerne les sources d'information que ce secteur exige. Afin de structurer les connaissances du domaine de la IAC, l'établissement de relations entre les concepts, un corpus portugais a été utilisé pour ce domaine à partir duquel les termes sont extraits et analysés. L'analyse des termes et leurs relations sémantiques a été basée sur la Théorie Du Lexique Génératif de Pustejovsky (1995), principalement avec l'utilisation de la structure Qualia, qui spécifie quatre aspects essentiels du sens des mots, à savoir, constitutifs, formel, télique et agentif. Ensuite, le modèle conceptuel obtenu a été mis en œuvre dans le langage OWL (Ontology Web Language), un langage informatique orienté à Web ...
Ontologias têm diversas aplicações em sistemas de Processamento Automático de Línguas Naturais (PLN), tais como tradutores automáticos e sistemas de recuperação e de extração de informação. Ontologias são também o alicerce da chamada Web Semântica, um novo conceito de Web que permite a interoperabilidade entre recursos, fornecendo significado aos sistemas que operam com grandes contingentes de dados na Web, a rede mundial de computadores. Gruber (1993) define ontologia como uma especificação formal de uma conceitualização, ou seja, uma descrição formal dos conceitos e das relações existentes entre esses conceitos em um determinado domínio do conhecimento. No caso de uma ontologia linguística, abordam-se apenas os conceitos lexicalizados em uma língua. Desse modo, a estruturação de um domínio em uma ontologia linguística se concentra em uma dimensão semântico-conceitual. Este trabalho propõe a construção de ontologia linguisticamente motivada para o domínio da Indústria de Artefatos de Borracha (IAB), uma área de grande interesse à indústria e à pesquisa no Brasil, porém pouco explorada quanto aos recursos informacionais que esse setor demanda. Para estruturar o conhecimento do domínio da IAB, estabelecendo as relações entre os conceitos, lançou-se mão de um córpus em língua portuguesa para o referido domínio de onde são extraídos e analisados os termos. A análise dos termos e de suas relações de sentido foi fundamentada a partir da Teoria do Léxico Gerativo de Pustejovsky (1995), valendo-se, sobretudo, da Estrutura Qualia, que especifica quatro aspectos essenciais do sentido de uma palavra, a saber: constitutivo, formal, télico e agentivo. Em seguida, o modelo conceito obtido foi implementado em OWL (Ontology Web Language), uma linguagem computacional voltada para a Web Semântica. O resultado obtido com essa pesquisa foi uma...

Descrição

Palavras-chave

Applied linguistics, Linguistica aplicada, Lexicografia, Borracha - Industria - Terminologia, Linguistica - Processamento de dados, Ontologias (Recuperação da informação), Web semântica

Como citar

BATISTA, Abner Maicon Fortunato. Sistematização semântico-ontológica computacional do vocabulário técnico da indústria de artefatos de borracha. 2012. 246 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2012.