Linguística de corpus e língua espanhola: testando o Unitex com fins lexicográficos

Carregando...
Imagem de Miniatura

Data

2017

Autores

Dias, Fernanda Scheluchuak [UNESP]

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

La presente monografía tiene por objetivo describir el proceso de etiquetado de los textos seleccionados para la organización del corpus GPEL, de la inserción de ellos en el software Unitex@ y de la verificación a partir de la selección y análisis de las muestras de los contextos de uso, auxiliando, a través del etiquetado, en la elaboración de un prototipo de diccionario pedagógico bilingüe para estudiantes de Español de la enseñanza media. El corpus es compuesto por textos utilizados en materiales didácticos de español para aprendices brasileños de la enseñanza media, publicados entre 1999 y 2010, y por variados géneros textuales de dominio periodístico, transmitidos en periódicos de siete países hispánicos (España, Argentina, Paraguay, Uruguay, Chile, México y Venezuela), totalizando aproximadamente dos millones de ocurrencias. Con la organización del corpus textual citado, se elaboró una etiqueta cuya función es la de servir a la identificación de cada texto y a la posterior recuperación de las informaciones bibliográficas en el momento de la colecta de los contextos para análisis. Después del etiquetado, fue realizado la inserción de los textos en el software Unitex@, que auxilió en el proceso de la colecta de los contextos a fin de desarrollar los testes necesarios, tanto sobre el funcionamiento del programa cuanto para la recuperación de las informaciones bibliográficas. El uso del software citado, también como las etiquetas utilizadas, demostraron ser útiles, no solo para la colecta de los contextos para ese proyecto específico, sino por la forma como los contextos y sus respectivas informaciones son recuperadas, mostrándose eficientes para otras pesquisas referentes al léxico y a la lengua española. La selección de contextos siguió un patrón de extensión, nivel de vocabulario y coherencia de contexto, cuestionando la relevancia de tal oración, pues hay la posibilidad de más de una acepción...
A presente monografia tem por objetivo descrever o processo de etiquetagem dos textos selecionados para a organização do corpus GPEL, da inserção deles no software Unitex@ e da testagem de seu funcionamento a partir da seleção e análise de amostras de contextos de uso, auxiliando, por meio da etiquetagem, na elaboração de um protótipo de dicionário pedagógico bilíngue para estudantes de Espanhol do Ensino Médio. O corpus é composto por textos utilizados em materiais didáticos de espanhol para aprendizes brasileiros do ensino médio, publicados entre 1999 e 2010, e por variados gêneros textuais de domínio jornalístico, veiculados em jornais de sete países hispânicos (Espanha, Argentina, Paraguai, Uruguai, Chile, México e Venezuela), totalizando aproximadamente dois milhões de ocorrências. Com a organização do corpus textual supracitado, elaborou-se uma etiqueta cuja função é a de servir à identificação de cada texto e à posterior recuperação das informações bibliográficas no momento da coleta dos contextos para análise. Após a etiquetagem, foi realizada a inserção dos textos no software Unitex@, que auxiliou no processo de coleta de contextos a fim de desenvolver os testes necessários, tanto sobre o funcionamento do programa quanto para a recuperação das informações bibliográficas. O uso do software citado, bem como as etiquetas utilizadas, demonstraram-se úteis não só para a coleta dos contextos para esse projeto específico, mas também pela forma como os contextos e suas respectivas informações são recuperadas, mostrando-se eficientes para outras pesquisas referentes ao léxico e à língua espanhola. A seleção de contextos seguiu o padrão de extensão, nível de vocabulário e coerência de contexto, questionando a relevância de tal sentença, pois há a possibilidade de mais de uma acepção para um lema. Com a presente monografia, esperamos motivar novos estudos para a área da...

Descrição

Palavras-chave

Linguística, Linguística de corpus, Lingua espanhola, Lexicografia, Lexicography

Como citar

DIAS, Fernanda Scheluchuak. Linguística de corpus e língua espanhola: testando o Unitex com fins lexicográficos. 2017. 1 CD-ROM. Trabalho de conclusão de curso (bacharelado - Letras) - Universidade Estadual Paulista Júlio de Mesquita Filho, Faculdade de Ciências e Letras (Campus de Araraquara), 2017.