Show simple item record

dc.contributor.advisorSilva, Bento Carlos Dias da [UNESP]
dc.contributor.authorDi Felippo, Ariani [UNESP]
dc.date.accessioned2014-06-11T19:32:47Z
dc.date.available2014-06-11T19:32:47Z
dc.date.issued2008-08-01
dc.identifier.citationDI FELIPPO, Ariani. Delimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiro. 2008. 237 f. Tese (doutorado) - Universidade Estadual Paulista, Faculdade de Ciências e Letras de Araraquara, 2008.
dc.identifier.urihttp://hdl.handle.net/11449/103583
dc.description.abstractDevido a vários fatores, como saliência perceptual e relevância semiótica, as línguas apresentam repertórios diferentes de conceitos lexicalizados (isto é, conceitos expressos por unidades lexicais). As divergências léxico-conceituais dificultam o tratamento computacional das línguas naturais em tarefas como tradução automática e recuperação de informação multilíngüe. Assim, a construção de base de dados lexicais bilíngües e multilíngües em que as unidades de línguas distintas estão inter-relacionadas por meio do conceito a elas subjacente tem recebido muita atenção no Processamento Automático das Línguas Naturais (PLN). Para o português brasileiro (PB), faz-se urgente a construção desse tipo de recurso. Nesse cenário, esta tese visa a investigar os padrões de lexicalização do PB e a construir um recurso léxicoconceitual, ainda que de extensões reduzidas, que possa auxiliar o processamento automático dessa língua em meio escrito. Assumindo-se a concepção de PLN enquanto “uma engenharia da linguagem humana”, utilizou-se uma metodologia tripartida que divide as atividades nos domínios: lingüístico, lingüístico-computacional e computacional. Este trabalho, em especial, não realizou as atividades previstas no terceiro domínio, pois estas não fazem parte do escopo desta pesquisa. No domínio lingüístico, um conjunto de conceitos lexicalizados no inglês norte-americano (AmE), extraído da WordNet de Princeton (WN.Pr), foi delimitado por meio da análise manual de recursos estruturados (base de dados e dicionários) e não-estruturados (corpora textuais). Na seqüência, as expressões do PB (em especial, as unidades lexicais) que materializam tais conceitos foram manualmente extraídas de dicionários bilíngües (AmE-PB), dicionários monolíngües e thesaurus e de corpora textuais do PB. No domínio lingüístico-computacional...pt
dc.description.abstractBecause of several factors, including, for instance, perceptual salience and semiotic relevance, languages have different inventories of lexicalized concepts (i.e. concepts expressed by lexical units). The lexical-conceptual divergences are a hindrance to computational treatment of natural languages in tasks such as machine translation and cross-language information retrieval. Therefore, the construction of bilingual and multilingual lexical databases, in which the lexical units of different languages are aligned by their underlying concepts, has become a very important research topic in Natural Language Processing (NLP). For Brazilian Portuguese (BP), in particular, the construction of such resources is urgent. In this scenario, this thesis aims to investigate lexicalization patterns of BP and to develop a lexical-conceptual resource for the automatic processing of written BP language. Assuming a compromise between NLP and Linguistics, this work follows a three-domain approach methodology, which claims that the research activities should be divided into the linguistic, linguisticcomputational, and computational domains. In particular, this research does not perform the last step, since it is not in the scope of this work. Accordingly, in the linguistic domain, a set of lexicalized concepts of North-American English (AmE) extracted from Princeton WordNet (WN.Pr) was selected through manual analysis of the structured (lexical databases and standard dictionaries) and unstructured resources (textual corpora). Given those concepts, their lexical and phrasal expressions in BP were manually compiled from bilingual dictionaries, with the help of standard monolingual dictionaries, thesauri, and textual corpora. In the linguistic-computational domain, the lexicalized concepts of AmE and BP previously identified were aligned by means of a semantic structured interlingua (or ontology)... (Complete abstract click electronic access below)en
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.format.extent237 f. : il.
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (UNESP)
dc.sourceAleph
dc.subjectLinguísticapt
dc.subjectSemanticapt
dc.subjectPortuguês - Lexicografiapt
dc.subjectConceptsen
dc.subjectLexical unitsen
dc.subjectSemanticsen
dc.titleDelimitação e alinhamento de conceitos lexicalizados no inglês norte-americano e no português brasileiropt
dc.typeTese de doutorado
dc.contributor.institutionUniversidade Estadual Paulista (UNESP)
dc.rights.accessRightsAcesso aberto
unesp.graduateProgramLinguística e Língua Portuguesa - FCLARpt
unesp.knowledgeAreaLinguística e língua portuguesapt
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências e Letras, Araraquarapt
dc.identifier.aleph000563326
dc.identifier.filedifelippo_a_dr_arafcl.pdf
dc.identifier.capes33004030009P4
dc.identifier.lattes2202787473720818
unesp.author.lattes2202787473720818
Localize o texto completo

Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record