UNIVERSIDADE ESTADUAL PAULISTA FACULDADE DE FILOSOFIA E CIÊNCIAS PROGRAMA DE PÓS-GRADUAÇÃO EM FONOAUDIOLOGIA ISABELA TIEZI ROMBOLA ELABORAÇÃO DE LISTA DE PALAVRAS DE ACORDO COM REGRAS DE CODIFICAÇÃO E FREQUÊNCIA DO PORTUGUÊS BRASILEIRO. Marília 2021 ISABELA TIEZI ROMBOLA ELABORAÇÃO DE LISTA DE PALAVRAS DE ACORDO COM REGRAS DE CODIFICAÇÃO E FREQUÊNCIA DO PORTUGUÊS BRASILEIRO. Dissertação apresentada ao Programa de Pós-graduação em Fonoaudiologia da Faculdade de Filosofia e Ciências – Universidade Estadual Paulista “Júlio de Mesquita Filho” - UNESP, Campus de Marília, como requisito para obtenção do título de Mestre em Fonoaudiologia. Área de Concentração: Distúrbios da Comunicação Humana. Orientadora: Dra Giseli Donadon Germano. Marília 2021 Dissertação apresentada ao Programa de Pós-Graduação em Fonoaudiologia para defesa do mestrado em Fonoaudiologia, da Faculdade de Filosofia e Ciências, da Universidade Estadual Paulista - UNESP - Campus de Marília, na área de concentração: Distúrbio da Comunicação Humana. BANCA EXAMINADORA Orientadora: __________________________________________________ Dra. Giseli Donadon Germano Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP – Marília, SP 2º Examinador: __________________________________________________ Profa. Dra. Simone Aparecida Capellini Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP – Marília, SP 3º Examinador: __________________________________________________ Dra. Luciana Mendonça Alves Universidade Federal de Minas Gerais – UFMG – Belo Horizonte, MG MARILIA 2021 DEDICATÓRIA Aos meus pais, Aparecida Paula e Paulo Sérgio, e à minha irmã Letícia, que sempre estiveram ao meu lado e me fizeram acreditar ser possível concretizar esta fase. Chegamos lá! Obrigada! AGRADECIMENTOS A Deus, por ter me concedido coragem para enfrentar todas as minhas batalhas, tanto pessoais quanto profissionais. Aos meus queridos pais, Aparecida Paula e Paulo Sérgio, por terem me incentivado a seguir em frente, na conquista de cada objetivo. À minha irmã Letícia, que dedicou horas à leitura deste projeto e sempre me encorajou a prosseguir. Ao meu namorado Lucas Augusto, que me deu forças, carinho e apoio diário para continuar. Obrigada pela presença e paciência constantes. À minha orientadora Dra. Giseli Donadon Germano, sempre presente, me norteando e incentivando a melhorar a cada dia, como pessoa e como profissional. Obrigada pela paciência e gentileza, por me ouvir e me acolher. À Profa. Dra. Simone Aparecida Capellini, por estar sempre pronta a me auxiliar e orientar com seus conhecimentos, desde a minha graduação, e pela disponibilidade e participação na banca do Exame Geral de Qualificação e Banca de Defesa. À Dra. Luciana Mendonça Alves, por seus conhecimentos compartilhados e pela disponibilidade e participação na banca do Exame Geral de Qualificação e Banca de Defesa. Às minhas queridas amigas de mestrado, Sarah Pereira Alonso e Ana Luiza de Faria Luiz, e tantas outras que estiveram ao meu lado durante esta jornada. Além de dividirmos conhecimentos, compartilhamos bons momentos. Estou muito feliz em concluir esta etapa ao lado de pessoas tão promissoras e cheias de paixão pelo que escolheram trilhar. Ao Programa de Pós-Graduação em Fonoaudiologia da UNESP – Marília, por toda a base de ensino. A todos os funcionários do CER II (Centro Especializado em Reabilitação) - CEES (Centro de Estudos da Educação e da Saúde), que sempre foram proativos e solícitos. Aos docentes do curso de Fonoaudiologia e do Programa de Pós-Graduação, pela rica abordagem de conteúdos de forma didática, desde a graduação. Por fim, a todos os que de alguma forma participaram e auxiliaram nesse processo, vocês foram fundamentais para que meu sonho se tornasse realidade. RESUMO A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo- linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa. Palavras-chaves: Lista de palavras. Palavras. Ortografia. Aprendizagem. ABSTRACT The production of writing occurs from the interaction between central processes (cognitive- linguistic processes) and peripheral processes (motor act of writing), which can be affected by the coding rules and frequency of words. The objective of this study was to prepare a list of words according to the frequency coding criteria of the Portuguese language in order to assist future measures of interaction between central and peripheral processes during the production of writing. As a method, words were taken from a database and subjected to the criteria were used: a) inclusion and exclusion of Portuguese words; b) Criteria related to Brazilian Portuguese coding rules; c) Submission to Judges; d) Criteria for the frequency of occurrence of words; e) Bigram criteria. As results, 102 words were selected from a total of 3,400 words. Regarding the coding criterion, 414 words were classified, 41 as natural (N), 104 dependents on context (A1), 269 competitive alternatives (A2). Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. Regarding frequency, 12 high frequency words, 30 medium frequency words and 60 low frequency words were selected. As for the analysis of the judges, there was an agreement of 0.952 (Kappa index) between the pairs of judges for the rules of trail by syllables and for the classification of words. For the establishment of the word comparison pairs for Bigram, it was also necessary to insert as medium frequency words, totalling 74 words pairs, being in the Natural comparison (N) - 10 pairs Arbitrary coding (A1) - 9 pairs; Arbitrary coding (A2) - 55 pairs. After analysing the results, it was found that there were few words of high frequency and more words of medium and low frequency, and that it was possible to create a list that could later assist in analyses that verify the interaction between the central and peripheral process. It was concluded that it was possible to draw up a list, being of high, medium and low frequency and according to the linguistic criteria of preference and frequency of the Portuguese language. Keywords: List of words. Words. Orthography. Learning. SUMÁRIO 1 INTRODUÇÃO .......................................................................................................................... 13 2 REVISÃO DE LITERATURA .................................................................................................. 17 2.1 Processos centrais e periféricos em relação à escrita .............................................................. 18 2.1.2 Escrita ortográfica................................................................................................................. 22 2.1.3 O processo central e periférico, a escrita ortográfica ........................................................... 25 2.1.4 O Bigrama e o software Ductus ............................................................................................ 27 3 DELINEAMENTO METODOLÓGICO ................................................................................... 29 3.1 Procedimentos Metodológicos ................................................................................................ 30 A) Critérios utilizados na inclusão e de exclusão de palavras do português ........................... 31 B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003a, 2003b) e de classificação da palavra, por Batista (2011). ................................................. 32 C) Submissão a Juízes .................................................................................................................. 34 D) Critérios de Frequência de Ocorrência de palavras .................................................................. 35 E) Critério do Bigrama .................................................................................................................. 36 4 RESULTADOS .......................................................................................................................... 37 A) Em relação aos critérios utilizados na inclusão e de exclusão de palavras do português... 39 B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003). .............................................................................................................................................40 C) Submissão a Juízes ................................................................................................................... 41 D) Em relação aos critérios de Frequência de Ocorrência de palavras ......................................... 45 E) Em relação ao critério do Bigrama ........................................................................................... 47 5 DISCUSSÃO .............................................................................................................................. 50 6 CONCLUSÃO ............................................................................................................................ 54 REFERÊNCIAS ............................................................................................................................ 56 ANEXOS ....................................................................................................................................... 65 ÍNDICE DE ILUSTRAÇÕES Figura 1 - Fluxograma do número de palavras a partir da submissão de cada critério deste estudo ....................................................................................................................................................... 38 Figura 2 - Fluxograma realizado a partir de cada critério proposto neste estudo................ ........ 30 ÍNDICE DE TABELAS Tabela 1- Exemplos de classificação das sílabas das palavras em relação às regras de codificação ....................................................................................................................................................... 40 Tabela 2 - Exemplos de palavras excluídas do estudo e justificativa dos Juízes ......................... 42 Tabela 3: Distribuição da Classificação por Juiz ......................................................................... 42 Tabela 4: Distribuição da Sílaba 1 por Juiz .................................................................................. 43 Tabela 5: Distribuição da Sílaba 2 por Juiz .................................................................................. 43 Tabela 6: Concordância entre Juízes ............................................................................................ 44 Tabela 7 – Índice Kappa ............................................................................................................... 45 Tabela 8- Distribuição das palavras de alta, média e baixa frequência após a aplicação dos critérios “a” e “b” .......................................................................................................................... 46 Tabela 9- Exemplos de palavras quanto à classificação da codificação Natural (N) e quanto às regras e frequência para as palavras .............................................................................................. 47 Tabela 10- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A1) e quanto às regras e frequência para as palavras .............................................................................. 47 Tabela 11- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A2) e quanto às regras e frequência para as palavras. ............................................................................. 48 Tabela 12 – Lista de palavras de acordo com a classificação e codificação das palavras ............ 49 LISTA DE ABREVIATURAS E SIGLAS N Ortografia Natural A Ortografia Arbitrária A1 Palavras regulares regradas A2 Palavras totalmente irregulares 13 1 INTRODUÇÃO 14 Atualmente, poucos estudos destinam-se a investigar como ocorre a produção da escrita manual para além do ato motor, ou seja, desde sua intenção de produção (escolha das ideias) até a sua programação e execução motora (THIBON; GERBER; KANDEL, 2017). A produção da escrita manual pode ser iniciada a partir de estímulo auditivo ou visual, acessando os processos sintáticos e semânticos, servindo como base para posterior recuperação ou composição de grafias (THIBON; GERBER; KANDEL, 2017). Os estudos têm destacado a necessidade de instrumentos mais refinados, que possam captar mudanças destes parâmetros com maior precisão, como o uso de softwares e tablet (GERMANO; CAPELLINI, 2019; KANDEL; PERRET, 2015a, 2015b; ROUX et al., 2013), que permitem analisar a produção da escrita enquanto o escolar a realiza, ou seja, durante a produção do movimento, que pode ser influenciado e modificado de acordo com sua experiência ortográfica e caligráfica. Entretanto, a escolha do estímulo linguístico influencia o uso daqueles instrumentos. Escolares entre cinco e oito anos de idade iniciam a produção de letras partindo do princípio grafomotor. As letras são produzidas por traço (ou “strokes”) e apresentam várias pausas dentro e entre os traços. Geralmente, esses escolares produzem os movimentos de escrita de forma mais lenta, devido à necessidade de maior controle motor manual e da orientação sensorial ao produzir os movimentos. Dessa forma, o escolar direciona sua atenção à produção das formas de letra corretamente e elabora mapas sensórios-motores para cada letra produzida. Com o passar do tempo, estes mapas motores tornam-se mais estáveis e são base para os programas motores que contêm informações sobre a forma das letras, ordem dos traços e direção. Progressivamente, por volta de 10 a 11 anos de idade, os escolares consolidam os programas motores com a prática escolar, a qual facilita seu acesso e ativação, passando a produzir letras com a diminuição do feedback visual e cinestésico. Neste período, o movimento será evidenciado por uma produção rápida (maior velocidade de escrita). Vale ressaltar que, durante o processo de aquisição das habilidades grafo-motoras, a velocidade de produção de escrita dos escolares é extremamente variável. Com a maturação neuromotora, esta variabilidade diminui e as habilidades grafo-motoras tornam-se automáticas, indicando a ocorrência da interação entre os processos centrais e periféricos. Os escolares podem, portanto, usar seus recursos cognitivos para outros componentes da escrita, ou seja, aspectos ortográficos, 15 construção de sentenças e elaboração de textos (KANDEL; PERRET, 2015a, 2015b; VAN GALEN, 1991). Quanto aos aspectos ortográficos, destaca-se que a construção do sistema ortográfico pelo escolar não é linear, pois várias características da aquisição, tal como a frequência de aparecimento, são superadas ao longo da escolarização, começando com um conhecimento mais superficial sobre as relações som-letra, até o momento de poder ortografar as irregularidades da língua escrita (BATISTA, 2011). Os modelos de dupla-rota, de modo geral, propõem que pode haver a escrita com mediação fonológica e com acesso direto ao léxico. Na mediação fonológica, os sons das palavras são convertidos em grafemas (conversão fonema-grafema), sendo essa rota utilizada, preferencialmente, para a escrita de palavras não familiares, de baixa frequência e pseudopalavras. A rota lexical é utilizada para a escrita de palavras familiares, frequentes e irregulares. Os estímulos são armazenados na memória ortográfica lexical e, portanto, recordados (ELLIS; MORRISON, 1995; RODRIGUES; SALLES, 2013) A regularidade e a frequência das palavras são características psicolinguísticas que demonstram se há uma deficiência no processamento ortográfico, pois interferem no aprendizado e no processo ortográfico, o que desencadeia, consequentemente, uma dificuldade na composição do léxico mental ortográfico. Entretanto, ainda são escassos os estudos que buscam investigar a relação entre os processos centrais e periféricos nos processos de produção de escrita. Assim, este estudo parte da seguinte hipótese: a possibilidade da criação de listas de palavras baseadas nos critérios de codificação da Língua Portuguesa e, de acordo com o Bigrama, de medidas de interação entre os processos centrais e periféricos a partir de medidas de interação do software Ductus, durante a produção da escrita. Deste modo, torna-se importante a elaboração de listas de palavras, baseadas nos critérios de codificação da Língua Portuguesa, baseadas nas regras de Scliar-Cabral (2003) e de Batista (2011), que poderão auxiliar futuras medidas de interação entre processos centrais e periféricos e duração da produção da escrita. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos e duração da produção da escrita. 16 Para tal, apresentar-se-ão: no capítulo 2, uma revisão de literatura, contendo estudos referentes aos processos centrais e periféricos em relação à escrita; no capítulo 3, o delineamento metodológico com os critérios estudados; no capítulo 4, os resultados dos critérios adotados e estudados; no capítulo 5, a discussão. No capítulo 6, encontra-se a conclusão. 17 2 REVISÃO DE LITERATURA 18 Esta revisão abordará os processos de escrita e os principais achados nos estudos nacionais e internacionais sobre os processos centrais e periféricos relacionados à escrita. 2.1 Processos centrais e periféricos em relação à escrita O ato de escrever é uma atividade motora linguística que tem diferentes estágios de processamento envolvidos. A ortografia refere-se ao processamento central. De acordo com os autores, as pesquisas tendem a focar na ortografia ou na produção motora, e não na relação de ambos (KANDEL; PERRET, 2015). A elaboração da escrita (grafia) pode ser gerada internamente, por meio de pensamentos originados por palavras com algum significado, ou iniciada com a leitura ou o som de palavras (ouvir uma palestra, uma ligação, etc.), ou seja, um estímulo visual ou auditivo. Esse processo não apenas é relativo à escrita, mas também a base para a recuperação ou formação de grafias, um processo semântico e mecanismo de compreensão visual ou auditiva. O ato de escrever exige processos “centrais” (cognitivos ou linguísticos) e processos “periféricos” (motores). Os processos centrais podem ser descritos como memória a longo prazo ortográfica (léxico ortográfico), conversão fonema-grafema e memória operacional ortográfica (graphemic buffer, cujo termo buffer em computação significa área da memória que foi alocada para armazenamento temporário de dados). Os processos periféricos comandam as ações motoras utilizadas para a produção de palavras escritas, tais como manuscrito, digitação, soletração, etc. (AMORIM et al., 2016). O modelo cognitivo hierárquico proposto por Van Galen (1991) mostra que a produção de escrita manual exige a ativação dos chamados processos centrais, os quais incluem processos cognitivo-linguísticos (como a atenção, memória operacional e codificação ortográfica) e os processos periféricos (elaboração e ao planejamento do ato motor da escrita). Assim, Van Galen (1991) afirma que a produção da escrita seria desencadeada de modo hierárquico, partindo do processo central ao periférico. Segundo o autor, os processos centrais iniciam-se a partir da intenção para a escrita (plano das ideias), passando pela recuperação semântica e construção sintática. Em seguida, ocorre a ativação do módulo léxico ortográfico, responsável pela seleção e ativação de representações ortográficas. Isso permite a recordação dos componentes das letras que formam as palavras e sua organização (CARAMAZZA; MICELI, 1990). 19 Van Galen (1991) inclui o chamado módulo "ortografia", relacionado aos componentes ortográficos das palavras, envolvendo dois aspectos importantes: a escolha da produção letra por letra (representações abstratas de letras); e a produção grafema por grafema, cuja representação é influenciada pela correspondência fonema-grafema. Assim, a produção da escrita de uma palavra é ativada, podendo seus componentes (letras e grafemas) ser manipulados, recuperados e armazenados temporariamente no chamado "Buffer Ortográfico" (memória operacional ortográfica). De acordo com o modelo de Van Galen (1991), para escrever uma palavra, ativa-se sua representação ortográfica no módulo de grafia. A representação consiste em uma sequência linear de letras que codifica a identidade e a ordem da letra (por exemplo, S1A2P3A4T5O6). Ela é armazenada no buffer ortográfico até que possa ser ‘‘desembrulhada’’ para a produção em série. Constitui a entrada para os módulos periféricos (ou seja, alógrafos, controle de tamanho e ajuste muscular) (KANDEL et al., 2011). Em sequência, passa a entrar em ação o processo periférico (VAN GALEN, 1991). Após a seleção da letra e grafema no processo central, há ativação do módulo "seleção de alográfos", que se referem às formas das letras (maiúsculas, minúsculas, cursiva, bastão) e outros ajustes do movimento necessários, como o planejamento do tamanho da letra, a amplitude e a pressão do movimento. Assim, os programas motores são formados e contêm informações sobre a forma de letra, sequência de traçado e direção, que comporão a memória de longo prazo para a produção da escrita. Posteriormente, o módulo "controle de tamanho" processará uma série de parâmetros locais específicos, como planejamento dos traços de cada letra e velocidade de escrita, de modo que a escrita possa ser produzida de modo fluente e eficiente. Uma vez que toda essa informação esteja configurada, o módulo "ajuste muscular" envia os comandos aos músculos responsáveis para a execução do movimento (KANDEL et al., 2011). Conforme referido por Van Galen (1991) e Kandel et al. (2017), a produção da escrita ocorre a partir da interação de processos centrais e periféricos, em milésimos de segundos. De acordo com os autores, a escrita realizada pelo escolar em um papel é o produto final, derivado de vários processos ocorridos anteriormente. Ao contrário do proposto por Van Galen (1991), outros estudos (KANDEL et al., 2006; KANDEL; SPINELLI, 2010; KANDEL et al., 2011) indicam que escrever uma palavra não é 20 apenas produzir uma letra após a outra como se fosse uma mera sequência linear de letras. Os autores apontam uma tendência de agrupar as letras de uma palavra em blocos para otimizar a recuperação da grafia. Esse procedimento de agrupamento (“chunking” ou bigram) influencia a forma como o sistema de escrita programa os movimentos para produzir as letras de uma palavra, sendo que esses pedaços de letras regulam os aspectos espaço-temporais do movimento. Desta forma, além da identidade e da ordem das letras, as representações ortográficas codificam informações de vários níveis de processamento sublexical, como morfêmico, silábico e estrutura grafêmica. Essa estrutura “multidimensional” de representações ortográficas (CARAMAZZA; MICELI, 1990) regula o tempo de programação da escrita (KANDEL et al., 2017). Kandel et al. (2006) forneceram evidências indicando que a estrutura da sílaba regula o tempo de programação da escrita manual. Em seu estudo, os adultos franceses copiaram palavras apresentadas visualmente em um digitalizador. As palavras compartilhavam as letras iniciais, mas tinham limites de sílaba diferentes (por exemplo, “tra.ceur” [tracer] e “trac.tus” [trato] – o ponto indica o limite da sílaba). Os participantes tiveram que escrever as palavras em letras maiúsculas e levantar a caneta entre as letras. O pressuposto subjacente a essa tarefa era que a duração dos intervalos entre as letras forneceria informações sobre o tempo de programação do motor. Os resultados revelaram que os intervalos de duração entre letras e dentro das sílabas (entre a e c em “tra.ceur”) eram mais longos do que os intervalos entre letras e dentro das sílabas (entre a e c em “trac.tus”). Sua concepção “antecipatória” da produção de motores ainda é a forma mais eficiente de entender o processo de escrita. Para Kandel et al. (2011), os módulos de processamento estão ativos simultaneamente. Os módulos de ordem superior (processos centrais) estão ativos porque antecipam e processam informações relacionadas às próximas partes da palavra, enquanto os módulos de ordem inferior estão envolvidos no processamento dos parâmetros locais. Como vários módulos de diferentes níveis representacionais estão ativos simultaneamente e as capacidades de processamento são limitadas, há uma carga cognitiva suplementar que resulta em um aumento na duração do movimento. O aumento da duração observado nos limites das sílabas traduz o processamento paralelo da grafia da sílaba seguinte e os parâmetros locais da sequência motora atual. Em outras palavras, um aumento significativo 21 da duração na fronteira da sílaba indica que o sistema de escrita programa o movimento para executar a sílaba seguinte online, simultaneamente com o processamento dos parâmetros locais (KANDEL et al., 2011). O estoque de grafias das palavras é conhecido como memória de longo prazo ortográfica (léxico ortográfico), e suas informações são resgatadas pelo significado da palavra ou representação do seu som. As palavras são montadas a partir do processo de conversão fonema- grafema que vem do estímulo fonológico, é dele que as informações aprendidas (como sons, letras e outras unidades sublexicais) são convertidas em grafias para as cadeias sonoras. Para exemplificar, o som da palavra “maçã” deverá ser recuperado da informação auditiva de “MAÇA” na memória de longo prazo ortográfica. Como houve um conflito ortográfico para o som de /s/, pode ocorrer uma grafia aproximada, como, por exemplo, “MASSAN”, que acontece pelo sistema de conversão fonema-grafema (AMORIM et al., 2016; PURCELL et al., 2011; PURCELL; RAPP, 2013). No que se refere ao processamento periférico, há várias etapas envolvidas, desde a correta ordenação e execução dos movimentos específicos dos efetores musculares necessários para expressar as letras até a representação abstrata das letras na memória de operacional ortográfica. Esses processos periféricos concretizam a linguagem escrita nas modalidades como soletração, escrita manual e digitação. Os planos motores são realizados para a produção das formas das letras pelos processos de planejamento motor da grafia, definindo as características, como o tamanho e a sequência dos traços. Logo após a realização dos planos motores, a programação dos efetores motores específicos compila as instruções para o membro que será utilizado na realização das ações motoras. A programação e a execução das ações dos efetores específicos é subordinada ao feedback multimodal durante a execução (tátil, visual, etc.) (AMORIM et al., 2016). O movimento para escrever relacionado ao processamento periférico, que o distingue do processamento central, vem de estudos neuropsicológicos, como, por exemplo, os estudos de Baxter e Warrington (1986). O estudo de Kandel e Perret (2015) exemplifica sobre a regularidade e irregularidade no processo central e periférico. A palavra francesa "Pardon" é ortograficamente regular, pois apresenta correspondência fonema-grafema de alta frequência. Em contraste, a palavra "Parfum" é ortograficamente irregular. Após um ditado realizado com escolares para escreverem as 22 palavras em um digitalizador, percebeu-se que as latências eram mais longas para palavras irregulares que para palavras regulares, mas apenas quando não eram frequentes, isso indica que os processos ortográficos foram modulados por regularidade ortográfica e frequência das palavras (KANDEL; PERRET; 2015). Para os autores, o processo central foi ativado antes de os escolares começarem a escrever. A duração da escrita é um indicador do processamento motor e descrita como tempo que a caneta estava no digitalizador, do início ao final da palavra. As durações eram mais longas para as palavras irregulares que para as regulares (KANDEL; PERRET; 2015). Essas variáveis sugerem que a elaboração de listas que considerem este critério de regularidade e frequência de palavras da língua pode impactar o desempenho da escrita manual. Este estudo foca sobre o processo central para o desempenho da escrita manual. É no processo central que as palavras ficam armazenadas na memória operacional ortográfica e na memória a longo prazo ortográfica, fazendo com que as palavras sejam convertidas de fonemas para grafemas, assim que o escolar vê ou escuta uma palavra. O desempenho da escrita manual representa a última e mais complexa habilidade adquirida do desenvolvimento por estar envolvida com múltiplos mecanismos cerebrais, requerendo integração simultânea e sequencial de funções, como a atenção, memória, habilidade motora, linguagem e cognição para o seu estabelecimento, havendo, portanto, uma acomodação dos processos funcionais e organizacionais em sua aquisição (BATISTA, 2011; LI et al., 2007). 2.1.2 Escrita ortográfica Escrever ortograficamente significa entender que um fonema pode ser escrito por grafemas diferentes, assim como um grafema pode representar fonemas diferentes. Este entendimento coloca o escolar diante das situações de irregularidade e regra no processo de compreensão do sistema ortográfico de sua língua (BATISTA, 2011; MAREC-BRETON; GOMBERT, 2004; ZORZI, 2008). Vários autores enfatizam o uso de diversas informações linguísticas para aperfeiçoar a escrita alfabética, concluindo que as grafias são geradas por uma sequência fonêmica e necessitam de informações sintáticas e morfológicas para chegar à escrita correta (BATISTA, 2011; KYTE; JOHNSON, 2008; MOTA et al., 2008; ZUANETTI et al., 2008). As conversões 23 dos grafemas em fonemas (letra-som) e dos fonemas em grafemas (som-letra) referem-se ao princípio fonográfico e essas correspondências mais ou menos regulares, dependendo do referencial a ser analisado: se o referencial é da escrita ou é da leitura. (MOUSINHO; CORREA, 2009). Escrever é bem mais difícil que ler (DIAS; ÁVILA, 2008), já que é necessária maior reflexão do escritor iniciante, que tem de superar o obstáculo de separar uma sílaba em nível consciente (CORREA et al., 2007) e depois transformar a forma de falar em escrita, com palavras e regras dentro das normas ortográficas de decodificação e codificação, influenciando diretamente a forma de aquisição destas habilidades (BATISTA, 2011). A leitura e a escrita apresentam palavras regulares e irregulares, o sistema da escrita brasileira tem como característica sua bidirecionalidade (ALÉGRIA et al., 1997; OLIVEIRA; GERMANO; CAPELLINI, 2016; SCLIAR-CABRAL, 2003). A escrita ortográfica pode gerar mais erros, pois apresenta maior opacidade para a conversão fonema-grafema. Por exemplo: o fonema mais complexo a ser codificado é o /s/, e pode ter dez variações, como sapato, experiência, criança, crescer, exceto, cebola, paz, pássaro, nasça, exsudar; enquanto na leitura caracterizada por maior transparência em relação à conversão grafema-fonema, o grafema mais complexo [x] pode ter quatro variações: xale, experiência, taxi e exato (CHIARAMONTE; CAPELLINI, 2019). O sistema de conversão da escrita pode ser explicado por duas possibilidades: a primeira, com mecanismos fonológicos de conversão fonema-grafema, por meio da via sublexical; a segunda, pela via lexical, por meio da ativação da representação semântica, isto é, uma representação fonológico-lexical que permite a recordação da escrita da palavra (AMORIM et al., 2016; ELLIS, 1982; HILLIS, 2001; MARGOLIN; GOODMAN-SCHULMAN, 1992; TAINTURIER; RAPP, 2001). Esse sistema de “duas vias” explica como se pode escrever as palavras consideradas familiares, como também para escrever palavras novas ou não familiares de forma aceitável. A habilidade de produzir uma escrita plausível para uma palavra que nunca tenha sido vista ou escutada anteriormente depende do sistema de “conversão fonologia para ortografia”, também conhecido como rota não lexical ou sublexical da escrita (AMORIM et al. 2016; ELLIS, 1982; HILLIS, 2001; TAINTURIER; RAPP, 2001). O processo de “conversão fonologia para ortografia”, ou conversão fonema-grafema, é um processo que busca o conhecimento sobre a correspondência fonema-grafema de uma língua estocada no cérebro (por ex: /s/ → SS ou C), frequência de uso (por ex: /s/ é mais escrito com SS 24 do que com C) e o contexto que é utilizado (ex: uma palavra que inicia com /s/ não pode ser escrita com SS). A maneira como funciona essa via é avaliada por meio do ditado de pseudopalavras como “flope” (AMORIM et al., 2016; ELLIS, 1982; HILLIS, 2001; MARGOLIN; GOODMAN-SCHULMAN, 1992; TAINTURIER; RAPP, 2001). Pinheiro e Rothe-Neves (2001) e Pinheiro (2006), ao estudarem a variável psicolinguística “regularidade”, diferenciaram as relações entre os grafemas na escrita em três categorias: a categoria regra, na qual se apresentam as situações de regularidade dependentes de contexto, quando há a necessidade de se aplicar regras de contexto ortográfico para se obter uma relação unívoca entre os sons e as letras; a categoria regular, que apresenta uma relação unívoca entre as letras e os sons; e a categoria irregular, quando as relações entre fonema-grafema e grafema-fonema são específicas de uma determinada palavra (BATISTA, 2011). Os escolares têm maior capacidade na escrita ortográfica de palavras regulares e de alta frequência do que palavras de baixa frequência ou pseudopalavras. Isso ocorre por causa da maior exposição auditiva, visual e perceptiva de determinada palavra com o escolar, o que a torna mais familiar e facilita a recuperação lexical ortográfica no momento da codificação (ALGOZZINE et al., 2008; CAPELLINI; LANZA, 2010; SAMPAIO et al., 2017). Representações pouco específicas ou imprecisões das representações fonológicas podem acarretar déficit e afetar o processamento fonológico e a recuperação lexical da palavra (CHIARAMONTE; CAPELLINI, 2019; GERMANO; CAPELLINI, 2015; NICOLIELO; HAGE, 2014; SANTOS; FERRAZ, 2017; TORPPA et al., 2017). Para que seja hábil ao produzir a grafia de forma correta, o escolar deve inteirar-se das condições regulares e irregulares socialmente convencionadas, pois terá peculiaridades mesmo no princípio fonográfico, em que necessitará se atentar para a posição do segmento sonoro dentro da palavra e observar a tonicidade do segmento sonoro. Deve também ser apto a refletir sobre a categoria gramatical da palavra, dentro do princípio semiográfico. Já nas peculiaridades irregulares, poderá ter de recorrer ao dicionário (BATISTA, 2011; MORAIS, 2009; REGO; BUARQUE, 2007). A aprendizagem da escrita ocorre através de um ensino explícito aos escolares, principalmente da ortografia, já que se apresenta mais opaca quando comparada à leitura, no sistema de escrita alfabética do português brasileiro (ALÉGRIA et al., 1997; ANGELELLI et al., 2016; SCLIAR-CABRAL, 2003). Por isso, os escolares com dislexia realizam a leitura e a 25 escrita de forma mais precisa, utilizando a rota sublexical, pois as letras são retomadas fonologicamente (MARTENS; DE JONG, 2006). 2.1.3 O processo central e periférico, a escrita ortográfica Aprender a escrever requer o domínio de habilidades linguísticas e motoras (GERMANO; CAPELLINI, 2019; KANDEL; PERRET, 2015), porém é importante dizer que os estudos brasileiros que investigam a interação entre aspectos ortográficos e motores ainda são poucos. Modelos recentes de produção de caligrafia sugerem que os processos de grafia modulam o tempo dos processos motores (KANDEL et al., 2015; ROUX et al., 2013). Por isso, os autores demonstraram que os processos centrais e periféricos interagem durante a produção da escrita, ou seja, há uma interação dinâmica entre os processos, e a produção do movimento pode ser afetada por variáveis que regulam o processo ortográfico, como a lexicalidade e a frequência (ROUX et al., 2013). A latência é uma das medidas que podem ser utilizadas como indicador para verificar a interação entre os processos motores e ortográficos, já que permite observar como a produção da escrita ocorre a partir do acesso ao léxico para a recuperação de programas motores e a preparação do movimento (KANDEL et al., 2015; ROUX et al., 2013; VAN GALEN, 1991). O estudo de Delattre, Bonin e Barry (2006) identificou que, na língua francesa, as latências durante a escrita eram mais longas para palavras irregulares que para palavras regulares. A diferença nas latências - que é utilizada para indexar os processos ortográficos centrais - mostra que palavras irregulares requerem maior tempo de latência entre as informações de grafia lexical e sublexical, antes que uma resposta escrita seja iniciada. A diferença nas durações - que se refere aos processos de escrita periféricos - sugere que o conflito ortográfico gerado para palavras irregulares não é totalmente realizado antes que uma resposta escrita seja executada. Assim, a latência que existe para iniciar o movimento de escrita reflete os processos de ortografia centrais, enquanto a duração da escrita das palavras reflete os processos periféricos subsequentes que controlam a execução da escrita (DELATTRE; BONIN; BARRY, 2006). Kandel e Perret (2015) analisaram como a interação entre a ortografia e o processamento motor se acumula durante a aquisição da escrita manual. Palavras foram selecionadas e divididas 26 entre irregulares e regulares da língua francesa, sendo 28 palavras de alta frequência e 34 palavras de baixa frequência de comprimento equivalente para que, posteriormente, fossem comparadas entre si. Os resultados obtidos para a variável latência mostram-se significativos, sendo que palavras irregulares produziram latências mais longas que as regulares. Para a variável de duração do movimento, as durações foram mais longas para baixa frequência do que para palavras de alta frequência. Além disso, crianças de oito anos demoraram mais para escrever as palavras do que as de nove e dez anos. E por fim, na variável fluência de movimento, as crianças com oito anos de idade foram menos fluentes do que as de nove anos de idade, e as crianças de nove e dez anos foram mais disfluentes para palavras irregulares do que para as regulares. Para concluir, os dados revelam que a regularidade ortográfica teve um impacto muito maior sobre a escrita das crianças do que as frequências das palavras. Além disso, a irregularidade ortográfica produziu um conflito em nível sublexical que gerou uma carga cognitiva mais importante que a frequência de palavras no nível lexical. Esse estudo realizado por Kandel e Perret (2015) envolveu crianças francesas, demonstrando que há poucos estudos realizados sobre a ortografia, na língua portuguesa. Outro estudo de Afonso e colaboradores (2018) foi realizado com escolares espanhóis com o objetivo de comparar a relação entre o processo central e o periférico e o desenvolvimento da escrita. Os resultados indicaram que os escolares tiveram desempenho diferente na escrita de palavras em mesa digitalizadora quanto à frequência. Palavras de alta frequência foram escritas mais rapidamente que palavras de baixa frequência, por escolares do 2º ano. Os autores concluíram que a frequência das palavras afetaria a duração da escrita manual. Pinheiro (1995), em estudo sobre a regularidade e irregularidade das palavras no inglês e no português, enfatiza a falta de estudos relacionados à ortografia, no Brasil. Em outro estudo realizado por Pinheiro (1994), a variável regularidade apresentou um efeito significativo para as palavras reais. Em cada série, os escolares apresentaram maior dificuldade quanto às palavras irregulares quando comparados às palavras regra, e estas, por sua vez, em relação às palavras regulares, em ambos os níveis de frequência. Esse efeito foi significativo tanto na análise de sujeito como na de itens em cada série, separadamente, e aplicou- se tanto às palavras de alta frequência como às de baixa frequência. Um efeito geral de regularidade foi também encontrado para as não palavras. Ainda, Pinheiro (2001) afirma que, na 27 escrita, há mais irregularidades que na leitura, no Português, e que, para resolver esse impasse, seria interessante a construção de listas de palavras regulares e irregulares na escrita, uma vez que são poucos os estudos relacionados a essa questão. Assim, observa-se uma carência de listas elaboradas com critérios de codificação que possibilitem avaliar a possível interação entre os processos centrais e periféricos da escrita, pois, atualmente, têm-se listas de leitura e listas de escrita, porém com banco de palavras já existentes em dicionários. 2.1.4 O Bigrama e o software Ductus Para esta pesquisa, a lista de palavras foi elaborada a partir do Bigrama, que é caracterizado como pares ordenados de letras que coocorrem em determinadas posições nas palavras de uma língua (JUSTI; JUSTI, 2009). O critério do bigrama surgiu para solucionar um problema de representação abstrata das letras em como codificá-las em relação a suas posições em uma palavra. Carreiras e Grainger (2004), Granger e Whitney (2004) e Justi e Justi (2009) afirmam que a solução para tal problema é postular um nível representacional sublexical, para que codifique pares ordenados de bigramas ou letras, como, por exemplo, a palavra toca, que seria codificada pelos bigramas ‘to’,’oc’ e ‘ca’ (JUSTI; JUSTI, 2009). Segundo Cassar e Treiman (1997), Justi, Justi (2009), Pacton et al. (2001) e Treiman (1993), os escolares acabam desenvolvendo gradualmente uma sensibilidade às restrições ortográficas da língua, mesmo depois de poucos meses de exposição à língua escrita. Tais restrições são baseadas na frequência das unidades sublexicais presentes nas palavras em que foram expostas, a frequência das unidades sublexicais é indexada pela frequência de ocorrência dos bigramas, onde este passa a ser uma variável considerada nos estudos sobre escrita e/ou leitura (JUSTI; JUSTI, 2009). Justi e Justi (2009) e Rastle, Davis e New (2004) sugerem que alguns dos efeitos encontrados pelos pesquisadores ao investigarem o processamento morfológico podem ser, na realidade, efeitos da frequência de ocorrência dos bigramas que compõem as palavras. De acordo com tais pesquisadores, enquanto as raízes e os afixos têm, tipicamente, bigramas de alta frequência de ocorrência, a frequência dos bigramas que se localizam entre os morfemas é menor (JUSTI; JUSTI, 2009). 28 O critério do bigrama foi escolhido, pois poderá ser utilizado com softwares que medem a escrita, como o software Ductus, que é uma ferramenta projetada para analisar e auxiliar na compreensão dos processos subjacentes à produção da escrita manual (GUINET; KANDEL, 2010). O software é utilizado por meio de um notebook e uma mesa digitalizadora (Wacom Intuos 5): começa com um estímulo informando ao escolar que uma palavra será apresentada, então, um ponto de fixação no centro da tela indica o local onde o estímulo irá aparecer. O tempo de apresentação do ponto de fixação pode ser manipulado pelo pesquisador (em milissegundos) (GUINET; KANDEL, 2010). Após a palavra apresentada, o escolar é instruído a copiar os itens como faz em sala de aula, utilizando letra Bastão (letra maiúscula), sendo que, deste modo, é possível a caracterização de cada letra em relação ao pico cursivo. O procedimento é composto por quatro tarefas, com tempo aproximado de 30 a 50 minutos de aplicação por tarefa, aplicadas individualmente (GERMANO, 2018). 29 3 DELINEAMENTO METODOLÓGICO 30 Este projeto de pesquisa foi submetido ao Comitê de Ética em Pesquisa da Faculdade de Filosofia e Ciências – CEP/FFC/UNESP e realizado após a aprovação do mesmo, sob o nº 1.841.638. 3.1 Procedimentos Metodológicos Elaboraram-se listas de palavras, baseadas nos critérios de codificação da Língua Portuguesa e outros critérios que mediram parâmetros da possibilidade de interação entre os processos centrais e periféricos da produção da escrita. O Fluxograma 1 descreve cada critério proposto para a elaboração da lista de palavras. Figura 1 - Fluxograma realizado a partir de cada critério proposto deste estudo. Fonte: Elaborada pela autora. Legenda: Regras |C1| - Conversão dos fonemas aos grafemas independente de contexto; Regras |C2| - Conversão dos fonemas aos grafemas dependente da posição e/ou do contexto fonético; |C3| - Alternativas competitivas. a) Inclusão e exclusão de palavras do português b) Regras de codificação segundo Scliar - Cabral e Batista. c) Submissão a juízes d) Frequência de ocorrência das palavras e) Bigrama 31 O fluxograma 1 (anterior) apresenta os critérios propostos para este estudo, que serão descritos na sequência. A) Critérios utilizados na inclusão e de exclusão de palavras do português Para a adaptação do Português Brasileiro, as palavras foram extraídas do vocabulário escolar que consta do banco do Laboratório de Investigações dos Desvios da Aprendizagem (LIDA) / Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP) – Marília/SP, composto por palavras extraídas dos livros de Língua Portuguesa de 1º a 4ª séries do ensino fundamental, utilizados na Rede Municipal de Ensino (GERMANO, CAPELLINI, 2008; OLIVEIRA, 2017). Este banco foi atualizado e composto por palavras extraídas dos livros de língua portuguesa do 1º ao 6º ano do Ensino Fundamental I, utilizados na Rede Municipal de Ensino da cidade de Marília/SP e região (GERMANO, CAPELLINI, 2008; GERMANO 2011; OLIVEIRA, 2017). Este banco contém 3.450 palavras de várias classes gramaticais - pronomes, preposições, adjetivos, advérbios, verbos e substantivos - divididas de acordo com a extensão (monossilábicas, dissilábicas, trissilábicas e polissilábicas), complexidade silábica entre as vogais (v) e consoantes (c): v, vv, vc, cv, ccv, cvc, vcc, cvv, ccvc, cvcc, ccvcc. Todas as palavras dos textos integrantes dos materiais didáticos foram digitadas em uma única coluna de planilha Excel, selecionadas de acordo com critérios descritos por Oliveira e Capellini (2016), sendo incluídos apenas substantivos, dissílabos, por ser uma classe frequente em qualquer texto, visto que exerce funções sintáticas importantes na frase. Foram excluídas as palavras escritas em outros idiomas, advérbios, locuções adverbiais, locuções prepositivas, adjetivos, meses do ano, numerais, palavras no aumentativo ou diminutivo, gírias, palavras compostas por justaposição (OLIVEIRA; CAPELLINI, 2016). Além disso, foram aplicados os critérios de exclusão das palavras, de acordo com Germano (2018): 1. Palavras monossilábicas, trissilábicas e polissilábicas, que não permitiriam a comparação para o mesmo número de letras. 32 2. Palavras diacríticas, ou seja, que apresentam algum sinal gráfico que se coloca sobre, sob ou através de uma letra para alterar a sua realização fonética, isto é, o som, ou para marcar qualquer outra característica linguística. Foram considerados sinais diacríticos: acento agudo, acento grave, acento circunflexo, trema e til e palavras com “ç”. Este critério também foi utilizado, considerando-se o número fixo de strokes (picos cursivos) para cada letra. B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003a, 2003b) e de classificação da palavra, por Batista (2011). Para este estudo, as palavras foram classificadas de acordo com as regras de codificação de Scliar-Cabral (2003), tendo como base os princípios alfabéticos do Português do Brasil. No que tange à notação, estes princípios definem as letras ou grafemas permitidos em determinadas circunstâncias, ou seja, as combinações possíveis para a notação (ordem e quantidade autorizada), produzindo os valores sonoros que as letras ou os grafemas podem assumir, dentro dos contextos específicos em que as sequências fonêmicas da linguagem oral exigem. As palavras foram classificadas de acordo com as sílabas, segundo as regras de codificação do Português Brasileiro, descritas por Scliar-Cabral (2003), que realizou a formulação das regras de codificação para a notação ortográfica baseadas nos princípios alfabéticos do Português do Brasil. Outro ponto importante relacionado a esse critério deve-se ao estudo de Kandel e Perret (2015), indicando que o modo como se codifica ortograficamente cada sílaba pode afetar o tempo de produção e velocidade de escrita da palavra. As sílabas de cada palavra foram selecionadas quanto ao critério de inclusão, sendo descrita em sequência: - Regra |C1| Conversão dos fonemas aos grafemas independente de contexto: a conversão fonografêmica não está determinada pela posição ou pelo contexto fonético, ou seja, não há restrição quanto à atribuição do grafema em 12 fonemas. É composto pelas relações entre /p/ e P; /b/ e B; /t/ e T; /d/ e D; /f/ e F; /v/ e V; /m/ e M; /n/ e N; e NH; /λ/ e LH. Neste grupo, as relações que se apresentam são unívocas entre fonema e grafema, em que um fonema se relaciona a um grafema e somente a ele, numa relação de constância. 33 - Regra |C2| Conversão dos fonemas aos grafemas dependente da posição e/ou do contexto fonético: a conversão fonografêmica fica na dependência da pronúncia dos fonemas para a escolha das letras ou grafemas que irão representá-los. Entende-se que uma letra representa diferentes fonemas, assim com um fonema pode ser representado por diferentes grafemas, conforme a posição em que se encontrem na palavra. Neste grupo, as relações são dependentes de regras determinadas pelo contexto fonético ou posição em que os sons ocupam na sílaba. Há uma relação de inconstância, porém de previsibilidade. As principais ocorrências de previsibilidade deste grupo compõem as situações de /k/ e C/QU; /g/ e G/GU; e JA/JO/JU; /s/ e SA/SO/SU em início de palavra; /z/ e Z em início de palavra; R/RR e /R//ɾ//r/; M/N e /aN//eN//iN//oN//uN/; O/U e /u//U/; E/I e /i//I/. - Regra |C3| Alternativas competitivas: este terceiro grupo apresenta uma situação de concorrência, já que uma letra pode representar vários fonemas e um fonema pode ser representado por diferentes letras com uma relação dependente de regras complexas, por isto com menor previsibilidade. As seguintes representações figuram neste grupo: situações do H inicial; /"/ e JE/JI/GE/JI; /ʃ/ e X/CH; /z/ e S/Z em posição não inicial; /s/ e S/C/SS/SC/Ç/SÇ/XC; /i/ e E/I em sílabas átonas não finais de vocábulo; /u/ e O/U em sílabas átonas não finais de vocábulo; /j/ e E/I; /w/ e L/U/O; /S/ e Z/S/X; /λ//l%/ e LH/L; /k/ e CU/QU; /kiS/ e X/QUES; /k(i)+s/ e X/CÇ/CC. Foram excluídas as regras Regra |C4| (Conversão dos fonemas ao grafema dependente da morfossintaxe e do contexto fonético) e Regra |C5| (Derivação morfológica), as quais envolvem o conhecimento e uso de acentuação e de conjugação verbal. Tais regras foram excluídas em virtude de dois aspectos importantes na criação desta lista. Primeiro: para analisar as palavras quanto às regras C4 e C5, há necessidade de investigar aspectos linguísticos morfológicos, como radical, tema (simples ou derivado), vogal temática (VT) ou índice temático, marcador de classe, morfema de tempo-aspecto- -modo, morfema pessoa-numeral, afixo, base genolexical. Estes aspectos interfeririam na escolha de palavras que respeitam o critério Bigrama. Em segundo lugar: a presença de acentuação não poderia ser computada por meio de softwares que analisam a escrita, por isso tais regras foram desconsideradas neste estudo, já que não contemplam seu objetivo. A classificação das palavras foi realizada e denominada em Ortografia Natural (N) e Ortografia Arbitrária (A), sendo que esta foi dividida em: A1 para correspondência fonema- 34 grafema dependente de regras (regular regradas); e A2 para correspondência fonema-grafema independente de regras (totalmente irregulares), de acordo com Batista (2011). A autora cita uma classificação adaptada ao Português Brasileiro baseada nos estudos de Cervera-Mérida e Ygual- Fernández (2006). Estes autores consideram dois tipos originais de ortografia, divididos em duas classes gerais de erros: os erros de Ortografia Natural e os de Ortografia Arbitrária, o que proporciona um caráter não só descritivo dos erros ortográficos, mas alia o caráter evolutivo a eles, à medida que considera a ordem de aquisição ortográfica em sua natureza, permitindo a compreensão de cada tipo e os fatores cognitivo-linguísticos implicados (BATISTA, 2011; BATISTA; CAPELLINI, 2011; YGUAL-FERNÁNDEZ et al., 2010). O critério adotado para classificar as palavras de acordo com as regras N, A1 e A2 seguiu a ordem de maior imprevisibilidade para menor previsibilidade da correspondência fonema-grafema, sendo A2>A1>N (BATISTA, 2011), conforme exemplos a seguir: - Para as regras A2>A1: /senhor/: a primeira sílaba /se/ é referente à regra C3.3.1 (A2), ou seja, alternativas competitivas independentes de regras, trata-se de /s/ em início de vocábulo antes de vogal oral ou nasalizada não posterior. Na sílaba /nho/, a regra utilizada foi a C1 (N), conversão dos fonemas aos grafemas independente de contexto. Na letra /r/ (referente à sílaba /nhor/), a regra utilizada foi a C2.11 (A1), conversão dos fonemas aos grafemas dependente da posição e/ou do contexto fonético, referente ao arquifonema /R/ em final de sílaba interna e em final de vocábulo (SCLIAR-CABRAL, 2003). - Para as regras A1>N: /peru/: a primeira sílaba /pe/ é referente à regra C1 (N), ou seja, conversão dos fonemas aos grafemas independente de contexto. Na segunda sílaba /ru/, a regra utilizada foi a C2.10 (A1), referente ao flepe alveolar /r/ entre vogal oral ou semivogal em final de sílaba e vogal oral (SCLIAR-CABRAL, 2003). - Para as regras A2>N: /senha/: a primeira sílaba /se/ é referente à regra C3.3.1 (A2), trata-se de /s/ em início de vocábulo antes de vogal oral ou nasalizada não posterior. Na segunda sílaba /nha/, a regra utilizada foi a C1 (N) (SCLIAR-CABRAL, 2003). C) Submissão a Juízes Após a classificação das palavras, solicitou-se a análise por dois juízes especialistas na área de ortografia, a fim de verificar a concordância entre as regras gramaticais empregadas. Os 35 juízes escolhidos são Fonoaudiólogas, sendo uma com formação em Psicopedagogia e a outra, em Neuropsicopedagogia, com ampla atuação na Educação e na avaliação e intervenção de leitura e escrita. Cada juiz recebeu e assinou o termo de concordância para participar do estudo e instrução para o julgamento, e foi orientado a realizar a classificação em relação a cada sílaba que compunha cada palavra, de acordo com a regra de codificação de Scliar-Cabral (2003a,2003b); em seguida, procedeu à classificação como Ortografia Natural (N), Ortografia Arbitrária (A), com a divisão A1 para correspondência fonema-grafema dependente de regras (regular regradas) e A2 para correspondência fonema-grafema independente de regras (totalmente irregulares), conforme proposto por Batista(2011) e descrito no critério b deste estudo. Os juízes receberam pouca instrução e menor interferência desta pesquisadora, já que ambos são especialistas na nova proposta de Batista (2011). Essas palavras foram distribuídas em alta, média e baixa frequência por meio da classificação das palavras, conforme descrita no critério b. D) Critérios de Frequência de Ocorrência de palavras Após a aplicação dos critérios de inclusão e de exclusão das palavras, e de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003), as palavras foram contabilizadas, a fim de levantar a frequência de ocorrência das palavras em cada ano escolar. Para tal, foi realizada uma análise estatística para caracterizar as palavras de alta, média e baixa frequência em relação ao ano escolar e em relação ao banco completo de palavras, segundo Oliveira e Capellini (2016). As palavras de média frequência seriam excluídas desta pesquisa, segundo Kandel e Perret (2015), que propuseram o uso de palavras de baixa frequência por ter maior inconsistência ortográfica. Entretanto, após a realização dos critérios, as palavras de média frequência foram incluídas no estudo, já que houve pouco número de palavras de alta frequência. Para classificar como alta, média e baixa frequência, foi realizada uma análise estatística da distribuição das palavras. Considerou-se a distribuição por tercis, sendo classificadas em alta, média e baixa frequência, caso os valores se encontrem próximos ao centro. De acordo com Oliveira e Capellini (2016), a classificação das palavras de modo dicotômico (alta e baixa frequência) não foi suficiente para o objetivo proposto, pois uma frequência de 48%, por 36 exemplo, seria classificada como baixa, e uma de 52%, como alta, apesar de os valores serem próximos. E) Critério do Bigrama O Bigrama é caracterizado como pares ordenados de letras que coocorrem em determinadas posições nas palavras de uma língua (JUSTI; JUSTI, 2009). Alguns estudos (KANDEL et al., 2006; KANDEL; SPINELLI, 2010; KANDEL et al., 2011) indicam que, ao escrever, o escolar tende a agrupar as letras de uma palavra em blocos para otimizar a recuperação da grafia. Este procedimento de agrupamento (“chunking” ou bigrama) influencia a forma como o sistema de escrita programa os movimentos para produzir as letras de uma palavra, sendo que esses pedaços de letras regulam os aspectos espaço-temporais do movimento. Kandel e colaboradores (2011) destacam que a estratégia de escrita orientada para a sílaba apoia a ideia de que as sílabas são um componente essencial da estrutura ortográfica mentalmente representada. Estudos apontam para a existência de uma fronteira silábica que permite a avaliação de critérios de velocidade e duração intersílabas dentro de uma palavra, mas também em palavras de diferentes frequências. Assim, o critério utilizado teve a influência do "efeito de sílaba" que, conforme indicado nos estudos internacionais, pode ser causada pela presença de baixas frequências e regularidade de bigrama no limite da sílaba da palavra, exigindo a segmentação da palavra em blocos de sílaba e possibilitando avaliar a integração entre os processos centrais e periféricos da escrita. (KANDEL et al., 2006; KANDEL; SPINELLI, 2010; KANDEL et al., 2011). Seguindo o critério do Bigrama, elaborou-se uma lista de palavras dissilábicas nas sílabas de posição inicial das palavras, possibilitando observar a integração entre os processos centrais e periféricos da escrita, a partir de medidas como velocidade, duração e a pausa que existem em cada sílaba. 37 4 RESULTADOS 38 O Fluxograma 2 descreve cada etapa deste estudo a partir de cada critério realizado. Figura 2 - Fluxograma do número de palavras a partir da submissão de cada critério deste estudo Fonte: Elaborada pela autora. Legenda: N= natural; A1= dependente de regras; A2= independente de regras; AF= palavras de alta frequência; BF= palavras de baixa frequência; MF= palavras de média frequência. 3450 640 palavras JUÍZ 1 414 palavras selecionadas Selecionadas em alta, média e baixa frequência N 19 palavras AF/ BF= 1 AF/MF= 1 MF/BF= 8 A1 85 palavras AF/ BF= 26 AF/MF= 5 MF/BF= 29 A2 12 palavras AF/ BF= 4 MF/BF= 5 JUÍZ 2 39 O Fluxograma 2 apresenta o número de palavras a partir da submissão de cada critério deste estudo, os quais serão descritos na sequência. Os resultados seguem a sequência dos critérios descritos anteriormente no item de procedimentos metodológicos. A) Em relação aos critérios utilizados na inclusão e de exclusão de palavras do português Nesta primeira etapa, as palavras extraídas do banco do Laboratório de Investigações dos Desvios da Aprendizagem (LIDA) / Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP) – Marília/SP (OLIVEIRA; CAPELLINI, 2016) totalizaram 3.450 e foram distribuídas em planilha de Excel. Inicialmente, as palavras eram compostas de várias classes gramaticais (pronomes, preposições, adjetivos, advérbios, verbos e substantivos), porém foram incluídos, por meio de uma planilha Excel, apenas substantivos, dissílabos, por constituírem uma classe frequente em qualquer texto, visto que exercem funções sintáticas importantes na frase. Ainda, excluíram-se: as palavras escritas em outros idiomas, advérbios, locuções adverbiais, locuções prepositivas, adjetivos, meses do ano, numerais, palavras no aumentativo ou diminutivo, gírias, palavras compostas por justaposição (OLIVEIRA; CAPELLINI, 2016); as palavras monossilábicas, trissilábicas e polissilábicas, que não permitiriam a comparação para o mesmo número de letras; palavras diacríticas, ou seja, palavras que apresentam algum sinal gráfico que se coloca sobre, sob ou através de uma letra para alterar a sua realização fonética, isto é, o som, ou para marcar qualquer outra característica linguística. Foram considerados sinais diacríticos: acento agudo, acento grave, acento circunflexo, trema e til e palavras com “ç”. Esse critério também foi utilizado considerando-se o número fixo de “strokes” (picos cursivos) para cada letra (GERMANO; 2018; KANDEL et al., 2015). A partir desta etapa, restaram cerca de 640 palavras. 40 B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003). Nesta etapa, analisaram-se 640 palavras, classificadas de acordo com as regras de codificação de Scliar-Cabral (2003), tendo como base os princípios alfabéticos do Português do Brasil. Este critério foi adotado devido à influência da codificação com os parâmetros de escrita manual (KANDEL; PERRET (2015). Inicialmente, a classificação foi realizada por esta pesquisadora, utilizando os critérios de codificação (Regra |C1|; Regra |C2| e Regra |C3|). A Tabela 1 apresenta exemplos destas classificações conforme a sílaba. Tabela 1- Exemplos de classificação das sílabas das palavras em relação às regras de codificação Palavras Sílaba 1 Sílaba 2 Classificação Bife C1 C1 N Duna C1 C1 N Fama C1 C1 N Feto C1 C1 N Mapa C1 C1 N Sangue C2.4 C2.16.2 C2.2 A1 Suco C2.4 C2.1 A1 Carta C2.1 C2.11 C1 A1 Gago C2.2 C2.2 A1 Carta C2.1 C2.11 C1 A1 Jegue C3.7 C2.2 A2 Senso C3.3.1 C2.16.2 C3.3.5 A2 Germe C3.7 C2.11 C1 A2 Seta C3.3.1 C1 A2 Xale C3.6 C2.12 A2 Fonte: Elaborada pela autora. 41 Na Tabela 1, podem-se observar sílabas que apresentam mais de uma regra, devido à complexidade silábica. Por exemplo: a palavra /carta/, em que a primeira sílaba /ca/ corresponde à regra C2.1 (A1) (conversão dos fonemas aos grafemas dependente da posição e/ou do contexto fonético), que é a realização da consoante /k/ em início de sílaba. A letra /r/ correspondente à sílaba /car/ C2.11 (A1) refere-se ao arquifonema /R/ em final de sílaba interna e em final de vocábulo. A sílaba /ta/ é referente à regra C1 (N), ou seja, conversão dos fonemas aos grafemas independente de contexto (SCLIAR-CABRAL, 2003). C) Submissão a Juízes Após a classificação das palavras, os dois juízes especialistas na área de ortografia analisaram a concordância entre as regras gramaticais empregadas. Cada juiz recebeu o termo de concordância para participar do estudo e instrução para o julgamento, ou seja, o juiz verificou se a classificação das sílabas foi realizada de acordo com as regras C.1, C.2 e C.3, regras de codificação do Português Brasileiro, descritas por Scliar-Cabral (2003a, p. 124-180; 2003b, p. 77-96). Essas palavras foram distribuídas em alta, média e baixa frequência por meio da classificação das mesmas como Ortografia Natural (N), Ortografia Arbitrária (A), com a divisão A1 para correspondência fonema-grafema dependente de regras (regular regradas) e A2 para correspondência fonema-grafema independente de regras (totalmente irregulares). Nesta etapa, foram excluídas as palavras classificadas de acordo com as regras de codificação de Scliar-Cabral (2003) pelos juízes, e que houve discordância entre a classificação dos mesmos, por sugestão do estatístico, já que o número de discordância foi extremamente baixo (menor que 5%). Além disso, por consenso entre os julgadores, foram excluídas: as palavras iniciadas por vogais orais, já que no sistema ortográfico brasileiro não há conversões fonografêmicas regulares (BATISTA, 2011; SCLIAR-CABRAL, 2003); as palavras que não foram encontradas no dicionário; e as que figuravam com H inicial, já que, no início ou no fim das palavras, o /H/ não tem valor fonético, conserva-se apenas como símbolo por força da etimologia e tradição (BATISTA, 2011; SCLIAR-CABRAL, 2003). Nesta etapa, havia 414 palavras. 42 A seguir, um quadro que contém exemplos de palavras excluídas deste estudo por sugestão dos juízes. Tabela 2 - Exemplos de palavras excluídas do estudo e justificativa dos Juízes Palavras Justificativa Aba Vogais orais Aipim Vogais orais Haste Sem valor fonético (H) Hena Sem valor fonético (H) Bite Não foi encontrada no dicionário Cripto Não foi encontrada no dicionário Fonte: Elabora pela autora. Analisaram-se, pois, os resultados para verificar aqueles estatisticamente significantes e com a menor diferença entre os juízes. Antes da avaliação, definiu-se um nível de significância (quanto se admite errar nas conclusões estatísticas, ou seja, o erro estatístico que se comete nas análises) de 0,05 (5%). Ressalta-se também que todos os intervalos de confiança foram construídos com 95% de confiança estatística. Na Tabela 3, analisa-se a distribuição dos resultados de Classificação, sílaba 1 e sílaba 2 para cada um dos juízes, utilizando-se o teste de Igualdade de Duas Proporções e calculando-se os percentuais para o total de 414 casos. Tabela 3: Distribuição da Classificação por Juiz Classificação Juiz 1 Juiz 2 N % Valor de P N % Valor de P A1 (Dependente de regras) 269 65,0% Ref. 269 65,0% Ref. A2 (Independente de regras) 104 25,1% <0,001* 104 25,1% <0,001* Natural 41 9,9% <0,001* 41 9,9% <0,001* Fonte: Estatística própria para o estudo. Legenda: N= número; %= porcentagem; Ref.= referência. Teste de Igualdade de Duas Proporções. Como a classificação tem mais de dois níveis de resposta, a última coluna mostra os valores da comparação de cada nível de resposta sempre em relação ao mais prevalente que está como Referência (Ref.). 43 Para ambos os juízes, a mais prevalente foi a classificação de A1 (dependente de regras), com 65,0% para ambos, sendo este um percentual estatisticamente significante; em segundo lugar, a classificação de A2 (independente de regras), com 25,1% para ambos os juízes. A seguir, observa-se a caracterização da distribuição da frequência relativa do resultado de Sílaba 1 (posição inicial) e 2 (posição final), em cada um dos juízes, conforme as Tabelas 4 e 5, respectivamente. Tabela 4: Distribuição da Sílaba 1 por Juiz Sílaba 1 Juiz 1 Juiz 2 N % Valor de P N % Valor de P C1 224 54,1% Ref. 224 54,1% Ref. C1/C2.10 3 0,7% <0,001* 3 0,7% <0,001* C2 1 0,2% <0,001* 1 0,2% <0,001* C2.1 48 11,6% <0,001* 46 11,1% <0,001* C2.11 18 4,3% <0,001* 18 4,3% <0,001* C2.12 28 6,8% <0,001* 28 6,8% <0,001* C2.16.2 3 0,7% <0,001* 3 0,7% <0,001* C2.2 15 3,6% <0,001* 15 3,6% <0,001* C2.4 14 3,4% <0,001* 14 3,4% <0,001* C2.5 3 0,7% <0,001* 3 0,7% <0,001* C2.6 0 0,0% <0,001* 2 0,5% <0,001* C2.8 9 2,2% <0,001* 9 2,2% <0,001* C3.2 0 0,0% <0,001* 2 0,5% <0,001* C3.3.1 8 1,9% <0,001* 21 5,1% <0,001* C3.3.6 13 3,1% <0,001* 0 0,0% <0,001* C3.4.1 0 0,0% <0,001* 1 0,2% <0,001* C3.4.2 1 0,2% <0,001* 0 0,0% <0,001* C3.5 1 0,2% <0,001* 0 0,0% <0,001* C3.6 16 3,9% <0,001* 15 3,6% <0,001* C3.7 9 2,2% <0,001* 9 2,2% <0,001* Fonte: Estatística própria para o estudo. Legenda: N= número; %= porcentagem; Ref.= referência. Teste de Igualdade de Duas Proporções. Tabela 5: Distribuição da Sílaba 2 por Juiz Sílaba 2 Juiz 1 Juiz 2 N % Valor de P N % Valor de P C1 242 58,5% Ref. 243 58,7% Ref. C1/C2.10 2 0,5% <0,001* 2 0,5% <0,001* 44 C2.1 37 8,9% <0,001* 36 8,7% <0,001* C2.10 13 3,1% <0,001* 14 3,4% <0,001* C2.11 3 0,7% <0,001* 3 0,7% <0,001* C2.12 15 3,6% <0,001* 15 3,6% <0,001* C2.16.2 7 1,7% <0,001* 7 1,7% <0,001* C2.2 26 6,3% <0,001* 26 6,3% <0,001* C2.5 6 1,4% <0,001* 4 1,0% <0,001* C2.8 8 1,9% <0,001* 8 1,9% <0,001* C2.9 8 1,9% <0,001* 7 1,7% <0,001* C3.1 2 0,5% <0,001* 2 0,5% <0,001* C3.2 1 0,2% <0,001* 2 0,5% <0,001* C3.3.2 1 0,2% <0,001* 0 0,0% <0,001* C3.3.3 2 0,5% <0,001* 3 0,7% <0,001* C3.3.4 1 0,2% <0,001* 2 0,5% <0,001* C3.3.5 3 0,7% <0,001* 2 0,5% <0,001* C3.3.6 4 1,0% <0,001* 4 1,0% <0,001* C3.4.1 0 0,0% <0,001* 1 0,2% <0,001* C3.4.2 1 0,2% <0,001* 1 0,2% <0,001* C3.5 17 4,1% <0,001* 17 4,1% <0,001* C3.6 10 2,4% <0,001* 10 2,4% <0,001* C3.7 5 1,2% <0,001* 5 1,2% <0,001* Fonte: Estatística própria para o estudo. Legenda: N= número; %= porcentagem; Ref.= referência. Teste de Igualdade de Duas Proporções. No resultado da Sílaba 1, constatou-se diferença significante para a classificação da sílaba 1 para todas as regras, indicando concordância entre os juízes na distribuição das regras ortográficas, com maior frequência da regra C1: 54,1% para ambos os juízes. Na Sílaba 2, a resposta mais recorrente também foi o C1, com 58,5% para o Juiz 1 e 58,7% para o Juiz 2. Por fim, realizou-se a análise de concordância entre os juízes, feita para os resultados de Sílaba 1, Sílaba 2 e na classificação. Foi utilizado o índice de Kappa, proposto por Cohen (1960), que é o coeficiente mais utilizado quando se classificam dados em categorias nominais (CHEN; KRAUSS, 2004). Cohen desenvolveu o índice de Kappa como um coeficiente de concordância dos julgamentos de dois juízes para dados nominais, em alternativa aos coeficientes de fidelidade existentes para os dados em escalas de magnitude. Atualmente, o coeficiente de Kappa continua sendo amplamente utilizado (FONSECA; SILVA; SILVA, 2007). Tabela 6: Concordância entre Juízes Kappa Valor de P 45 Silaba 1 0,943 <0,001* Silaba 2 0,970 <0,001* Classificação 0,952 <0,001* Fonte: Estatística própria para o estudo. Índice de Concordância de Kappa. Na tabela anterior, verificou- se concordância estatisticamente significante para as três análises, em que em Sílaba 2 tem-se o maior resultado, com Kappa: 0,970; em classificação, o Kappa ficou em 0,952, todos considerados ótimos. Para entender melhor os resultados, é necessário observar como funciona o índice Kappa: se este for igual a 0, indica concordância nula; se for maior que zero, concordância acima do esperado pelo simples acaso (para um teste monocaudal, tem-se, então: H0: K=0; H1: K>0). Aclare-se, nesse momento, que um Kappa com valor negativo, que não tem interpretação possível, pode resultar em um nível crítico igualmente impossível em termos estatísticos e, com isso, apontar um valor de p maior do que um. No caso de a hipótese de nulidade (Kappa=0) ser rejeitada, a medida de concordância observada é significantemente maior do que zero, indicando, assim, a existência de concordância entre os juízes (PAES, 2008). A seguir, a Tabela 7 explica o índice Kappa em dados observados na literatura. Landis e Koch (1977) sugerem a seguinte interpretação: Tabela 7 – Valores de Kappa e sua interpretação Valores de Kappa Interpretação <0 Ausência de concordância 0-0, 19 Concordância pobre 0, 20-0, 39 Concordância leve 0, 40-0, 59 Concordância moderada 0, 60-0, 79 Concordância substantiva 0, 80-1, 00 Concordância quase perfeita Fonte: Adaptado de Landis e Koch (1977). D) Em relação aos critérios de Frequência de Ocorrência de palavras Após a aplicação dos critérios de inclusão e de exclusão das palavras, e de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003), as palavras foram contabilizadas, e restaram 414 palavras selecionadas para levantar a frequência de ocorrência. 46 Conforme o banco de palavras utilizado (OLIVEIRA; CAPELLINI, 2016), elas foram distribuídas em palavras de alta, média e baixa frequência. Foi utilizado o banco completo. As palavras de média frequência seriam excluídas desta pesquisa, seguindo o proposto por Kandel e Perret (2015), isto é, para verificar a diferença dos parâmetros de escrita manual, o ideal seria comparar palavras de alta com as de baixa frequência, pois as palavras de baixa frequência têm maior inconsistência ortográfica. Entretanto, após a realização do critério “d” (descrito na sequência), verificou-se um número reduzido de palavras de alta frequência. Deste modo, foi necessária a utilização de palavras de média frequência. Portanto, para esta pesquisa, foi adotado o proposto por Oliveira e Capellini (2016). De acordo com Oliveira e Capellini (2016), a classificação das palavras de modo dicotômico (alta e baixa frequência) não foi suficiente para o objetivo proposto, pois uma frequência de 48%, por exemplo, seria classificada como baixa, e uma de 52%, como alta, apesar de os valores serem próximos. Portanto, das 414 palavras selecionadas, restaram 102 palavras que foram combinadas entre si pelo critério do bigrama. A Tabela 8 apresenta o número de palavras de alta, média e baixa frequência após a aplicação dos critérios anteriores. Tabela 8- Distribuição das palavras de alta, média e baixa frequência após a aplicação dos critérios “a” e “b” Palavras de alta frequência Palavras de média frequência Palavras de baixa frequência 12 30 60 Fonte: Elaborada pela autora. Na Tabela 8, observa-se uma distribuição irregular da quantidade de palavras de acordo com o número de palavras. Esta tabela explica a ocorrência de palavras de média frequência para este estudo, já que houve poucas palavras de alta frequência para a realização da lista, de acordo com o bigrama. 47 E) Em relação ao critério do Bigrama Segundo Kandel e Perret (2015), a programação motora acontece de forma “on-line”: primeiro, o escolar programa a primeira sílaba; logo após, o escolar recupera novamente a informação da palavra; e depois, recupera a segunda sílaba ao escrever, em tempos diferentes. Esse critério de comparação é realizado por meio do bigrama. O bigrama foi realizado considerando, inicialmente, as regras ortográficas citadas anteriormente (N, A1, A2), e posteriormente, foram consideradas as frequências das palavras analisadas (alta, média e baixa frequência). A Tabela 9 apresenta exemplos quanto à classificação da codificação Natural (N) e quanto às regras e frequência para as palavras, para a formação dos pares de comparação com o critério do Bigrama. Foram formados dez pares. Tabela 9- Exemplos de palavras quanto à classificação da codificação Natural (N) e quanto às regras e frequência para as palavras Classificação Natural - N Palavras de Alta frequência Palavras de média frequência Palavras de baixa frequência Vida -- Vinho -- Povo Pote Fonte: Elaborada pela autora. A Tabela 10 apresenta exemplos quanto à classificação da codificação Arbitrária (subtipo A1) e quanto às regras e frequência para as palavras, para a formação dos pares de comparação com o critério do Bigrama. Foram formados nove pares. Tabela 10- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A1) e quanto às regras e frequência para as palavras Classificação Arbitrária – A1 Palavras de Alta frequência Palavras de média frequência Palavras de baixa frequência 48 Rato -- Ramo -- Sopa Soro Fonte: Elaborada pela autora. A Tabela 11 apresenta exemplos quanto à classificação da codificação Arbitrária (subtipo A2) e quanto às regras e frequência para as palavras, para a formação dos pares de comparação com o critério do Bigrama. Foram formados 55 pares. Tabela 11- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A2) e quanto às regras e frequência para as palavras. Classificação Arbitrária – A2 Palavras de Alta frequência Palavras de média frequência Palavras de baixa frequência Senhor -- Seta -- Chave Chapa Fonte: Elaborada pela autora. Ao todo, foram formados 74 pares de bigramas. Algumas palavras foram repetidas, como, por exemplo, as palavras de média frequência, para que os pares de Bigrama pudessem ser comparados de acordo com as frequências (alta e baixa), já que não houve palavras de alta frequência suficientes para o estudo. Nos exemplos, percebe-se a coocorrência de pares ordenados de letras nas sílabas iniciais de cada palavra. As palavras presentes neste estudo foram utilizadas em dissílabas e submetidas ao critério do bigrama, para observar a velocidade e a pausa que existem em cada sílaba. A velocidade no ato da escrita e a pausa ocorrem na quebra de uma sílaba a outra, já que a programação motora de cada sílaba é diferente, existindo pausas entre as sílabas. 49 Finalmente, a Tabela 12 apresenta a lista com os exemplos de palavras elaboradas para este estudo. Tabela 12 – Lista de palavras de acordo com a classificação e codificação das palavras Classificação Natural – N Palavras de alta Frequência Palavras de Média frequência Palavras de Baixa frequência -- Fome Fone Pato -- Palha -- Tipo Time Vida -- Vinho Classificação Arbitrária (regular regradas) – A1 -- Anta Anjo Cara -- Cabo Cara -- Caco Cara -- Caju Pedra Peru Penhor Classificação Arbitrária (totalmente irregular) – A2 -- Base Bazar Senhor -- Senha Senhor -- Seta -- Massa Matriz -- Massa Macho Fonte: Elaborada pela autora. 50 5 DISCUSSÃO 51 A partir dos resultados deste estudo, conclui-se que foi possível a criação de lista de palavras baseadas nos critérios de codificação de Scliar-Cabral (2003), em que se têm diferentes complexidades silábicas. Durante a elaboração desta pesquisa, foram considerados os seguintes critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 2003); c) submissão a juízes; d) frequência de ocorrência de palavras; e) bigrama. A partir destes critérios, o número de palavras foi se afunilando. De 3.450 palavras, restaram 640, que foram submetidas à classificação por dois juízes especialistas, restando apenas 414 palavras; estas, após a classificação, foram submetidas aos critérios do bigrama, formando pares a partir de 102 palavras. Utilizando o critério do bigrama, classificaram-se os pares de palavras em alta, média e baixa frequência, de acordo com a regularidade e irregularidade das palavras. Ao observar esta classificação, registrou-se que palavras de alta frequência foram minoria (apenas 12), enquanto palavras de média e baixa frequência foram a maioria deste estudo (30 e 60 palavras, respectivamente). Como demonstrado na Tabela 12, a lista final de palavras contém pares formados em alta frequência/baixa frequência; alta frequência/média frequência; média frequência/baixa frequência; e foram separados em Ortografia Natural (N); Ortografia Arbitrária (A1) – dependente de regras e Ortografia Arbitrária (A2) – independente de regras (BATISTA, 2011). Alguns dos pares foram exemplificados nas tabelas: Ortografia natural: Alta frequência/baixa frequência: Pato – Palha; Média frequência/baixa frequência: Fome – Fone; Ortografia Arbitrária (A1): Alta frequência/baixa frequência: Cara – Cabo; Média frequência/baixa frequência: Peru – Penhor; Alta frequência/média frequência: Pedra – Peru; Ortografia Arbitrária (A2): Alta frequência/baixa frequência: Senhor – Senha; Média frequência/baixa frequência: Base – Bazar. Este estudo corrobora Afonso, Suárez-coalla e Cuetos (2015), que também elaboraram uma lista de palavras para a produção da escrita, com frequências diferentes, com escolares espanhóis. Entretanto, os pesquisadores espanhóis buscaram as palavras de um banco frequência de palavras de um programa já existente, o “BuscaPalabras” (DAVIS; PEREA, 2005), em que o usuário do programa acessa palavras com frequências diferentes, frequência de sílabas, frequência de bigramas e bifones, semelhança ortográfica, estrutura ortográfica e fonológica. 52 Kandel e Perret (2015a; 2015b), em pesquisa com escolares franceses, também elaboraram uma lista de palavras, utilizando um banco existente de palavras de alta e baixa frequência, regulares e irregulares para a escrita, de um dicionário francês (PEEREMAN; LÉTÉ; SPRENGER-CHAROLLES, 2007). No Brasil, não há muitos estudos sobre listas de palavras de acordo com todos os critérios adotados, assim como neste estudo. Destaca-se a disponibilidade do banco de palavras por frequência, de Oliveira e Capellini “E-leitura I”, “E-leitura II” e “E-leitura III” (OLIVEIRA, CAPELLINI, 2016; OLIVEIRA et al., 2020), com o levantamento de palavras de livros de leitura do Ensino Fundamental I, II e Ensino Médio, respectivamente. Entretanto, tais bancos, utilizados neste estudo, não contemplam os critérios de codificação ortográfica e especificamente o Bigrama para a criação de listas de palavras. Os estudos de Pinheiro e Rothe-Neves (2001) afirmam que o efeito de variações nos níveis de familiaridade de palavras - fator frequência de ocorrência de palavras - tem recebido influência nas funções da rota léxico-fonêmica, que pode ocorrer em nível de reconhecimento (no léxico visual de entrada) ou na operação de recuperação lexical da pronúncia (léxico fonêmico de saída), na leitura, ou no nível de produção (léxico grafêmico de saída), na escrita. De acordo com os autores, as palavras de alta frequência, por requererem menor ativação, tendem a ser reconhecidas/produzidas mais rapidamente e/ou mais corretamente do que aquelas com baixa ocorrência - palavras de baixa frequência. Essa vantagem em termos de processamento, para o primeiro tipo de palavras, é conhecida como efeito de frequência. No estudo, foi possível observar menor quantidade de palavras de alta frequência, o que pode influenciar a escrita das palavras, ou seja, palavras de alta frequência podem ser escritas mais rapidamente pelos escolares, já que o acesso à entrada do léxico ortográfico é mais rápido para estas palavras (que são familiares) do que para as de baixa frequência. Palavras regulares e de alta frequência são palavras familiares e, de acordo com os estudos de Ávila, Paolucci (2009) e Capovilla, Macedo (2001), a frequência do aparecimento da palavra na língua está relacionada à familiaridade com ela, e as representações ortográficas são construídas a partir de metanálises realizadas pelo escolar e das repetidas exposições às palavras escritas. No entanto, as palavras de baixa frequência podem não possuir representações ortográficas no léxico mental e, portanto, serem lidas ou escritas pela rota fonológica (CAPOVILLA; CAPOVILLA; MACEDO, 2001; PAOLUCCI, ÁVILA, 2009). Tais informações corroboram este estudo, em que a lista apresenta maior número de palavras de média e baixa frequência, exigindo maior memória visual para o acesso lexical, ou 53 seja, o escolar precisará utilizar a rota lexical mais a memória fonológica para codificar o som/letra nas palavras de média e baixa frequência. As palavras de baixa frequência são relacionadas ao processo de conversão fonema- grafema que vem do estímulo fonológico, é dele que as informações apreendidas (como sons, letras e outras unidades sublexicais) são convertidas em grafias para as cadeias sonoras. A rota lexical é necessária para realizar a escrita de vocábulos conhecidos já armazenados na memória ortográfica, em função de práticas repetidas de escrita. Esse movimento é chamado de sistema de reconhecimento visual das palavras. Na rota lexical, palavras que ocorrem com frequência são reconhecidas automaticamente, diferentemente de palavras que ocorrem com menor frequência, fenômeno este denominado efeito de frequência. Isso explica o fato de palavras conhecidas possuírem unidades de reconhecimento no léxico de entrada visual (CARDOSO; FREITAS, 2019). Para a escrita de novos vocábulos, usa-se a rota fonológica. Após a exposição da palavra, é feita a verificação dos grafemas, fragmentando-os em microunidades (grafemas e morfemas), unindo-os aos seus sons correspondentes. As palavras em que as transformações de fonemas em grafemas não seguem as regras dificultam a escrita precisa, isso recebe o nome de efeito de regularidade e explica a transformação de fonemas em grafemas em palavras regulares, que seguem regras, o mesmo não acontece com palavras irregulares (CARDOSO; FREITAS, 2019; ELLIS, 2001). O estudo de Pinheiro (1995, 2006) investigou as habilidades de escrita e de leitura de palavras reais e de não palavras isoladas, entre crianças da 1ª à 4ª série de uma escola particular. Em relação à escrita e leitura de palavras reais, os resultados mostraram que: tanto em termos de precisão quanto de tempo de processamento, houve um efeito da frequência e da escolarização na escrita e na leitura, tendo ocorrido também uma interação entre estes fatores; respectivamente, houve influência lexical na escrita e na leitura, além de ganho em proficiência e rapidez na leitura com a escolarização; a frequência das palavras afetou de forma diferente a escrita das crianças das séries iniciais e das finais. Isto mostra que a regularidade, a irregularidade e a frequência das palavras influenciam nas habilidades de escrita e leitura. A ideia da criação destas listas de palavras deste estudo é que possam ser utilizadas posteriormente para auxiliar futuras medidas de interação entre processos centrais e periféricos na duração da produção da escrita, já que, no Brasil, há poucos estudos que relacionem estes processos e a escrita manual, e que tenham uma lista de palavras para auxiliar neste processo. A lista de palavras deste estudo faz referência aos aspectos do processamento central, que podem ser descritos como uma memória operacional a longo prazo (léxico ortográfico), 54 conversão fonema-grafema e memória de trabalho ortográfica (graphemic buffer), já que as palavras de alta frequência estão no estoque de grafias das palavras familiares, que é conhecido como memória de longo prazo ortográfica (léxico ortográfico). Para o escolar, as palavras de baixa frequência são realizadas no processo de conversão fonema-grafema a partir do estímulo fonológico de palavras não familiares. Dessa forma, os processos centrais ficam ativos, pois antecipam e processam as informações das sílabas e palavras. 6 CONCLUSÃO 55 Aprender a escrever envolve um trabalho árduo. Escrever exige aptidão linguística, que engloba particularidades do processamento central e periférico. Portanto, foi possível a criação de uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos e duração da produção da escrita. Atualmente, não são muitos os estudos brasileiros que se concentram em criar listas de palavras que possam auxiliar em medidas que analisem a interação de aspectos centrais e periféricos na escrita manual. Desse modo, a lista elaborada neste estudo foi composta por 9 palavras consideradas naturais (N); 85 palavras dependentes de regras (A1); e 12 palavras independentes de regras (A2). Essas palavras foram divididas em 12 palavras de alta frequência, 30 de média frequência e 60 palavras de baixa frequência, que podem afetar a produção das palavras no ato da escrita em softwares. Para a escrita de palavras dependentes de regras, torna-se necessário um maior ensino sistemático de regras, do que para aquelas independentes de regras. As palavras de alta frequência tendem a ser produzidas mais rapidamente do que palavras de baixa frequência devido a ocorrência no cotidiano. Portanto, esta lista poderá contribuir para a realização de medidas de escrita manual a partir do uso de instrumentos sensíveis à avaliação deste parâmetro, como softwares ou outros parâmetros escolhidos por profissionais da área, como fonoaudiólogos ou professores. 56 REFERÊNCIAS 57 AFONSO, O. et al. The impact of word frequency on peripheral process during handwriting. A matter of age. Quartely Journal of Experimental Psychology, v.71, n. 3, p. 695-703, 2018. Disponivel em: https://doi.org/10.1080/17470218.2016.1275713. Acesso em: 11 abr. 2021. AFONSO, O.; SUÁREZ-COALLA, P.; CUETOS, F. Spelling impairments in Spanish dyslexic adults. Frontiers in psychology, v. 6, p. 466, 2015. Disponivel em: https://doi.org/10.3389/fpsyg.2015.00466. Acesso em: 26 abr.2021. ALÉGRIA, J.; LEYBAERT, J.; MOUSTY, P. Aquisição da leitura distúrbios associados: avaliação, tratamento e teoria. Avaliação dos problemas de leitura: Os novos modelos teóricos e suas implicações diagnósticas, p. 105-124, 1997. ALGOZZINE, B. et al. Improving phonological awareness and decoding skills of high school students from diverse backgrounds. Preventing School Failure: Alternative Education for Children and Youth, v. 52, n. 2, p. 67-72, 2008. Disponivel em: https://doi.org/10.3200/PSFL.52.2.67-72. Acesso em: 13 abr.2021. AMORIM, W. et al. Neurofisiologia da escrita: O que acontece no cérebro humano quando escrevemos?. Neuropsicologia Latinoamericana, v. 8, n. 1, 2016. Disponivel em: DOI: 10.5579/rnl.2016.0260. Acesso em: 26 abr.2021. ANGELELLI, P. et al. Spelling impairments in Italian dyslexic children with and without a history of early language delay. Are there any differences? Frontiers in psychology, v. 7, p. 527, 2016. Disponivel em: https://doi.org/10.3389/fpsyg.2016.00527. Acesso em: 26 abr.2021. BATISTA, A. Desempenho ortográfico de escolares do 2º ao 5º ano: proposta de elaboração de um protocolo de avaliação da ortografia. Dissertação (mestrado – Educação) – Universidade Estadual Paulista, Faculdade de Filosofia e Ciencias, 2011. BAXTER, D.; WARRINGTON, E. Ideational agraphia: a single case study. Journal of Neurology, Neurosurgery & Psychiatry, v. 49, n. 4, p. 369-374, 1986.Disponivel em: doi: 10.1136/jnnp.49.4.369. Acesso em: 28 abr.2021. CAPELLINI, S.; BATISTA, A. Subsídios da fonologia e ortografia para a compreensão da disortografia. Ferreira-Gonçalves G, Keske-Soares M, Brum de Paula M, organizadores. Estudos em aquisição fonológica. No prelo, 2011. CAPELLINI, S. et al. Desempenho de escolares em consciência fonológica, nomeação rápida, leitura e escrita. Pró-Fono Revista de Atualização Científica, v. 22, n. 3, p. 239-44, 2010. Disponivel em: http://dx.doi.org/10.1590/S0104-56872010000300014. Acesso em: 16 abr.2021. CAPELLINI, S. et al. Desempenho ortográfico de escolares do 2º ao 5º ano do ensino público. J Soc Bras Fonoaudiol, v. 23, n. 3, p. 227-36, 2011.Disponivel em: http://dx.doi.org/10.1590/S2179-64912011000300008. Acesso em: 03 maio 2021. https://doi.org/10.1080/17470218.2016.1275713 https://doi.org/10.3389/fpsyg.2015.00466 https://doi.org/10.3200/PSFL.52.2.67-72 https://doi.org/10.3389/fpsyg.2016.00527 https://dx.doi.org/10.1136%2Fjnnp.49.4.369 http://dx.doi.org/10.1590/S0104-56872010000300014 http://dx.doi.org/10.1590/S2179-64912011000300008 58 CAPOVILLA, F.; CAPOVILLA, A.; MACEDO, E. Rota perilexical na leitura em voz alta: Tempo de reação, duração e segmentação na pronúncia. Psicologia: reflexão e crítica, v. 14, n. 2, p. 409-427, 2001.Disponivel em: http://dx.doi.org/10.1590/S0102- 79722001000200015.Acesso em: 28 abr.2021. CARAMAZZA, A.; MICELI, G. The structure of graphemic representations. Cognition, v. 37, p. 243–297, 1990. Disponivel em: https://doi.org/10.1016/0010-0277(90)90047-N. Acesso em: 15 abr.2021. CARREIRAS, M.; GRAINGER, J. Sublexical representations and the ‘front end’of visual word recognition. Language and Cognitive Processes, v. 19, n. 3, p. 321-331, 2004.Disponivel em: DOI: 10.1080/01690960344000288. Acesso em: 07 maio 2021. CASSAR, M.; TREIMAN, R. The beginnings of orthographic knowledge: Children's knowledge of double letters in words. Journal of educational psychology, v. 89, n. 4, p. 631, 1997. Disponivel em: https://doi.org/10.1037/0022-0663.89.4.631. Acesso em: 28 abr.2021. CHEN, P.; KRAUSS, A. Interrater agreement. The sage encyclopedia of social science research methods, v. 2, p. 511-513, 2004. CHIARAMONTE, T.; CAPELLINI, S. Relação do perfil de erros de leitura e escrita na dislexia e dificuldades de aprendizagem. Revista Teias, v. 20, n. 58, p. 319-329, 2019.Disponivel em: doi: https://doi.org/10.12957/teias.2019.40287. Acesso em; 04 maio. 2021. COHEN, J. A coefficient of agreement for nominal scales. Educational and psychological measurement, v. 20, n. 1, p. 37-46, 1960.Disponivel em: https://doi.org/10.1177/001316446002000104. Acesso em: 06 maio. 2021. CORREA, J. et al. Using spelling skills in Brazilian Portuguese and English. Journal of Portuguese Linguistics, Lisboa, v. 6, n. 2, p. 61-82. 2007.Disponivel em: https://doi.org/10.1590/1981-5794-1709-8 . Acesso em: 28 abr 2021. DAVIS, C.; PEREA, M. BuscaPalabras: A program for deriving orthographic and phonological neighborhood statistics and other psycholinguistic indices in Spanish. Behavior Research Methods, v. 37, n. 4, p. 665-671, 2005.Disponivel em: doi: 10.3758/bf03192738. Acesso em: 04 maio. 2021. DE CARVALHO RODRIGUES, J.; DE SALLES, J. Tarefa de escrita de palav