Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro

Carregando...
Imagem de Miniatura

Data

2021-05-24

Orientador

Germano, Giseli Donadon

Coorientador

Pós-graduação

Fonoaudiologia - FFC

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa.

Resumo (inglês)

The production of writing occurs from the interaction between central processes (cognitive-linguistic processes) and peripheral processes (motor act of writing), which can be affected by the coding rules and frequency of words. The objective of this study was to prepare a list of words according to the frequency coding criteria of the Portuguese language in order to assist future measures of interaction between central and peripheral processes during the production of writing. As a method, words were taken from a database and subjected to the criteria were used: a) inclusion and exclusion of Portuguese words; b) Criteria related to Brazilian Portuguese coding rules; c) Submission to Judges; d) Criteria for the frequency of occurrence of words; e) Bigram criteria. As results, 102 words were selected from a total of 3,400 words. Regarding the coding criterion, 414 words were classified, 41 as natural (N), 104 dependents on context (A1), 269 competitive alternatives (A2). Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. As for the analysis of the judges, there was an agreement of 0.952 (Kappa index) between the pairs of judges for the rules of trail by syllables and for the classification of words. For the establishment of the word comparison pairs for Bigram, it was also necessary to insert as medium frequency words, totalling 74 words pairs, being in the Natural comparison (N) - 10 pairs Arbitrary coding (A1) - 9 pairs; Arbitrary coding (A2) - 55 pairs. After analysing the results, it was found that there were few words of high frequency and more words of medium and low frequency, and that it was possible to create a list that could later assist in analyses that verify the interaction between the central and peripheral process. It was concluded that it was possible to draw up a list, being of high, medium and low frequency and according to the linguistic criteria of preference and frequency of the Portuguese language.

Descrição

Idioma

Português

Como citar

Itens relacionados