Linguística de corpus e língua espanhola: testando o Unitex com fins lexicográficos

dc.contributor.advisorSilva, Odair Luiz Nadin da [UNESP]
dc.contributor.authorDias, Fernanda Scheluchuak [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2018-09-19T17:27:42Z
dc.date.available2018-09-19T17:27:42Z
dc.date.issued2017
dc.description.abstractLa presente monografía tiene por objetivo describir el proceso de etiquetado de los textos seleccionados para la organización del corpus GPEL, de la inserción de ellos en el software Unitex@ y de la verificación a partir de la selección y análisis de las muestras de los contextos de uso, auxiliando, a través del etiquetado, en la elaboración de un prototipo de diccionario pedagógico bilingüe para estudiantes de Español de la enseñanza media. El corpus es compuesto por textos utilizados en materiales didácticos de español para aprendices brasileños de la enseñanza media, publicados entre 1999 y 2010, y por variados géneros textuales de dominio periodístico, transmitidos en periódicos de siete países hispánicos (España, Argentina, Paraguay, Uruguay, Chile, México y Venezuela), totalizando aproximadamente dos millones de ocurrencias. Con la organización del corpus textual citado, se elaboró una etiqueta cuya función es la de servir a la identificación de cada texto y a la posterior recuperación de las informaciones bibliográficas en el momento de la colecta de los contextos para análisis. Después del etiquetado, fue realizado la inserción de los textos en el software Unitex@, que auxilió en el proceso de la colecta de los contextos a fin de desarrollar los testes necesarios, tanto sobre el funcionamiento del programa cuanto para la recuperación de las informaciones bibliográficas. El uso del software citado, también como las etiquetas utilizadas, demostraron ser útiles, no solo para la colecta de los contextos para ese proyecto específico, sino por la forma como los contextos y sus respectivas informaciones son recuperadas, mostrándose eficientes para otras pesquisas referentes al léxico y a la lengua española. La selección de contextos siguió un patrón de extensión, nivel de vocabulario y coherencia de contexto, cuestionando la relevancia de tal oración, pues hay la posibilidad de más de una acepción...es
dc.description.abstractA presente monografia tem por objetivo descrever o processo de etiquetagem dos textos selecionados para a organização do corpus GPEL, da inserção deles no software Unitex@ e da testagem de seu funcionamento a partir da seleção e análise de amostras de contextos de uso, auxiliando, por meio da etiquetagem, na elaboração de um protótipo de dicionário pedagógico bilíngue para estudantes de Espanhol do Ensino Médio. O corpus é composto por textos utilizados em materiais didáticos de espanhol para aprendizes brasileiros do ensino médio, publicados entre 1999 e 2010, e por variados gêneros textuais de domínio jornalístico, veiculados em jornais de sete países hispânicos (Espanha, Argentina, Paraguai, Uruguai, Chile, México e Venezuela), totalizando aproximadamente dois milhões de ocorrências. Com a organização do corpus textual supracitado, elaborou-se uma etiqueta cuja função é a de servir à identificação de cada texto e à posterior recuperação das informações bibliográficas no momento da coleta dos contextos para análise. Após a etiquetagem, foi realizada a inserção dos textos no software Unitex@, que auxiliou no processo de coleta de contextos a fim de desenvolver os testes necessários, tanto sobre o funcionamento do programa quanto para a recuperação das informações bibliográficas. O uso do software citado, bem como as etiquetas utilizadas, demonstraram-se úteis não só para a coleta dos contextos para esse projeto específico, mas também pela forma como os contextos e suas respectivas informações são recuperadas, mostrando-se eficientes para outras pesquisas referentes ao léxico e à língua espanhola. A seleção de contextos seguiu o padrão de extensão, nível de vocabulário e coerência de contexto, questionando a relevância de tal sentença, pois há a possibilidade de mais de uma acepção para um lema. Com a presente monografia, esperamos motivar novos estudos para a área da...pt
dc.format.extent48 f.
dc.identifier.aleph000899038
dc.identifier.citationDIAS, Fernanda Scheluchuak. Linguística de corpus e língua espanhola: testando o Unitex com fins lexicográficos. 2017. 1 CD-ROM. Trabalho de conclusão de curso (bacharelado - Letras) - Universidade Estadual Paulista Júlio de Mesquita Filho, Faculdade de Ciências e Letras (Campus de Araraquara), 2017.
dc.identifier.filehttp://www.athena.biblioteca.unesp.br/exlibris/bd/capelo/2018-04-26/000899038.pdf
dc.identifier.lattes8469314873958494
dc.identifier.orcid0000-0002-4655-0724
dc.identifier.urihttp://hdl.handle.net/11449/156529
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.sourceAleph
dc.subjectLinguísticapt
dc.subjectLinguística de corpuspt
dc.subjectLingua espanholapt
dc.subjectLexicografiapt
dc.subjectLexicographypt
dc.titleLinguística de corpus e língua espanhola: testando o Unitex com fins lexicográficospt
dc.typeTrabalho de conclusão de curso
unesp.advisor.lattes8469314873958494
unesp.advisor.orcid0000-0002-4655-0724
unesp.campusUniversidade Estadual Paulista (Unesp), Faculdade de Ciências e Letras, Araraquarapt
unesp.undergraduateLetras - FCLARpt

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
000899038.pdf
Tamanho:
1.15 MB
Formato:
Adobe Portable Document Format