Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro

Di Felippo, Ariani [UNESP]

Publicação:
Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro

Arquivos

difelippo_a_dr_arafcl.pdf (1.87 MB)

Data

2008-08-01

Autores

Di Felippo, Ariani

Orientador

Silva, Bento Carlos Dias da

Pós-graduação

Linguística e Língua Portuguesa - FCLAR

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso aberto

Resumo

Resumo (português)

Devido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto “uma engenharia da linguagem humana”, utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional...

Resumo (inglês)

Because of several factors, including, for instance, perceptual salience and semiotic relevance, languages have different inventories of lexicalized concepts (i.e. concepts expressed by lexical units). The lexical-conceptual divergences are a hindrance to computational treatment of natural languages in tasks such as machine translation and cross-language information retrieval. Therefore, the construction of bilingual and multilingual lexical databases, in which the lexical units of different languages are aligned by their underlying concepts, has become a very important research topic in Natural Language Processing (NLP). For Brazilian Portuguese (BP), in particular, the construction of such resources is urgent. In this scenario, this thesis aims to investigate lexicalization patterns of BP and to develop a lexical-conceptual resource for the automatic processing of written BP language. Assuming a compromise between NLP and Linguistics, this work follows a three-domain approach methodology, which claims that the research activities should be divided into the linguistic, linguisticcomputational, and computational domains. In particular, this research does not perform the last step, since it is not in the scope of this work. Accordingly, in the linguistic domain, a set of lexicalized concepts of North-American English (AmE) extracted from Princeton WordNet (WN.Pr) was selected through manual analysis of the structured (lexical databases and standard dictionaries) and unstructured resources (textual corpora). Given those concepts, their lexical and phrasal expressions in BP were manually compiled from bilingual dictionaries, with the help of standard monolingual dictionaries, thesauri, and textual corpora. In the linguistic-computational domain, the lexicalized concepts of AmE and BP previously identified were aligned by means of a semantic structured interlingua (or ontology)... (Complete abstract click electronic access below)

Palavras-chave

Linguística, Semantica, Português - Lexicografia, Concepts, Lexical units, Semantics

Idioma

Português

Como citar

DI FELIPPO, Ariani. Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro. 2008. 237 f. Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, 2008.

URI

http://hdl.handle.net/11449/103583

Financiadores

Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Coleções

Araraquara - FCLAR - Faculdade de Ciências e Letras

Unidades

Unidade

Faculdade de Ciências e Letras

FCLAR

Campus: Araraquara

Página do item completo

Publicação:
Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro

Arquivos

Data

Autores

Orientador

Coorientador

Pós-graduação

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Tipo

Direito de acesso

Resumo

Resumo (português)

Resumo (inglês)

Descrição

Palavras-chave

Idioma

Como citar

URI

Itens relacionados

Financiadores

Coleções

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação

Publicação: Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro

Arquivos

Data

Autores

Orientador

Coorientador

Pós-graduação

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Tipo

Direito de acesso

Resumo

Resumo (português)

Resumo (inglês)

Descrição

Palavras-chave

Idioma

Como citar

URI

Itens relacionados

Financiadores

Coleções

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação

Publicação:
Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro