UNIVERSIDADE ESTADUAL PAULISTA FACULDADE DE FILOSOFIA E CIÊNCIAS 

PROGRAMA DE PÓS-GRADUAÇÃO EM FONOAUDIOLOGIA 

 
ISABELA TIEZI ROMBOLA 

 
ELABORAÇÃO DE LISTA DE PALAVRAS DE ACORDO COM REGRAS DE 

CODIFICAÇÃO E FREQUÊNCIA DO PORTUGUÊS BRASILEIRO. 

 
Marília 2021 

 
ISABELA TIEZI ROMBOLA 

 
ELABORAÇÃO DE LISTA DE PALAVRAS DE ACORDO COM REGRAS DE CODIFICAÇÃO E 

FREQUÊNCIA DO PORTUGUÊS BRASILEIRO. 

  
Dissertação apresentada ao Programa de                                        

Pós-graduação em Fonoaudiologia da Faculdade 

de Filosofia e Ciências – Universidade Estadual 

Paulista “Júlio de Mesquita Filho” - UNESP, 

Campus de Marília, como requisito para obtenção 

do título de Mestre em Fonoaudiologia.  

 
Área de Concentração: Distúrbios da Comunicação 

Humana. 

 
Orientadora: Dra Giseli Donadon Germano. 

 
Marília 2021 

 
Dissertação apresentada ao Programa de Pós-Graduação em Fonoaudiologia para defesa 

do mestrado em Fonoaudiologia, da Faculdade de Filosofia e Ciências, da Universidade Estadual 

Paulista - UNESP - Campus de Marília, na área de concentração: Distúrbio da Comunicação 

Humana.  

 
BANCA EXAMINADORA 

 
Orientadora: __________________________________________________ 

Dra. Giseli Donadon Germano 

Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP – Marília, SP 

 
2º Examinador: __________________________________________________ 

Profa. Dra. Simone Aparecida Capellini 

Universidade Estadual Paulista “Júlio de Mesquita Filho” – UNESP – Marília, SP 

 
3º Examinador: __________________________________________________ 

Dra. Luciana Mendonça Alves 

Universidade Federal de Minas Gerais – UFMG – Belo Horizonte, MG 

 
MARILIA 

2021 

 
DEDICATÓRIA 

 
Aos meus pais, Aparecida Paula e Paulo Sérgio, e à minha irmã Letícia, que sempre 

estiveram ao meu lado e me fizeram acreditar ser possível concretizar esta fase. Chegamos lá!  

Obrigada! 

 
AGRADECIMENTOS 

 A Deus, por ter me concedido coragem para enfrentar todas as minhas batalhas, 

tanto pessoais quanto profissionais. 

                       Aos meus queridos pais, Aparecida Paula e Paulo Sérgio, por terem me incentivado 

a seguir em frente, na conquista de cada objetivo.  

                       À minha irmã Letícia, que dedicou horas à leitura deste projeto e sempre me 

encorajou a prosseguir.  

                      Ao meu namorado Lucas Augusto, que me deu forças, carinho e apoio diário para 

continuar. Obrigada pela presença e paciência constantes. 

       À minha orientadora Dra. Giseli Donadon Germano, sempre presente, me norteando 

e incentivando a melhorar a cada dia, como pessoa e como profissional. Obrigada pela paciência e 

gentileza, por me ouvir e me acolher.   

       À Profa. Dra. Simone Aparecida Capellini, por estar sempre pronta a me auxiliar e 

orientar com seus conhecimentos, desde a minha graduação, e pela disponibilidade e participação 

na banca do Exame Geral de Qualificação e Banca de Defesa. 

       À Dra. Luciana Mendonça Alves, por seus conhecimentos compartilhados e pela 

disponibilidade e participação na banca do Exame Geral de Qualificação e Banca de Defesa. 

       Às minhas queridas amigas de mestrado, Sarah Pereira Alonso e Ana Luiza de Faria 

Luiz, e tantas outras que estiveram ao meu lado durante esta jornada. Além de dividirmos 

conhecimentos, compartilhamos bons momentos. Estou muito feliz em concluir esta etapa ao lado 

de pessoas tão promissoras e cheias de paixão pelo que escolheram trilhar.  

       Ao Programa de Pós-Graduação em Fonoaudiologia da UNESP – Marília, por toda a 

base de ensino.  

      A todos os funcionários do CER II (Centro Especializado em Reabilitação) - CEES 

(Centro de Estudos da Educação e da Saúde), que sempre foram proativos e solícitos.  

      Aos docentes do curso de Fonoaudiologia e do Programa de Pós-Graduação, pela rica 

abordagem de conteúdos de forma didática, desde a graduação.  

       Por fim, a todos os que de alguma forma participaram e auxiliaram nesse processo, 

vocês foram fundamentais para que meu sonho se tornasse realidade.  

 
RESUMO 

 
A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-

linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas 

regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de 

palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de 

auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da 

escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos 

critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de 

codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência 

de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total 

de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 

41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em 

relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média 

frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se 

concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por 

sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de 

palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, 

totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação 

arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, 

registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e 

constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em 

análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi 

possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios 

linguísticos de codificação e frequência da Língua Portuguesa.        

 
Palavras-chaves: Lista de palavras. Palavras. Ortografia. Aprendizagem.  

 
ABSTRACT 

 
The production of writing occurs from the interaction between central processes (cognitive-

linguistic processes) and peripheral processes (motor act of writing), which can be affected by the 

coding rules and frequency of words. The objective of this study was to prepare a list of words 

according to the frequency coding criteria of the Portuguese language in order to assist future 

measures of interaction between central and peripheral processes during the production of writing. 

As a method, words were taken from a database and subjected to the criteria were used: a) inclusion 

and exclusion of Portuguese words; b) Criteria related to Brazilian Portuguese coding rules; c) 

Submission to Judges; d) Criteria for the frequency of occurrence of words; e) Bigram criteria. As 

results, 102 words were selected from a total of 3,400 words. Regarding the coding criterion, 414 

words were classified, 41 as natural (N), 104 dependents on context (A1), 269 competitive 

alternatives (A2). Regarding frequency, 12 high frequency words, 30 medium frequency words 

and 60 low frequency words were selected. Regarding frequency, 12 high frequency words, 30 

medium frequency words and 60 low frequency words were selected. As for the analysis of the 

judges, there was an agreement of 0.952 (Kappa index) between the pairs of judges for the rules of 

trail by syllables and for the classification of words. For the establishment of the word comparison 

pairs for Bigram, it was also necessary to insert as medium frequency words, totalling 74 words 

pairs, being in the Natural comparison (N) - 10 pairs Arbitrary coding (A1) - 9 pairs; Arbitrary 

coding (A2) - 55 pairs. After analysing the results, it was found that there were few words of high 

frequency and more words of medium and low frequency, and that it was possible to create a list 

that could later assist in analyses that verify the interaction between the central and peripheral 

process. It was concluded that it was possible to draw up a list, being of high, medium and low 

frequency and according to the linguistic criteria of preference and frequency of the Portuguese 

language. 

 
Keywords: List of words. Words. Orthography. Learning. 

 
SUMÁRIO 

1 INTRODUÇÃO .......................................................................................................................... 13 

2 REVISÃO DE LITERATURA .................................................................................................. 17 

2.1 Processos centrais e periféricos em relação à escrita .............................................................. 18 

2.1.2 Escrita ortográfica................................................................................................................. 22 

2.1.3 O processo central e periférico, a escrita ortográfica ........................................................... 25 

2.1.4 O Bigrama e o software Ductus ............................................................................................ 27 

3 DELINEAMENTO METODOLÓGICO ................................................................................... 29 

3.1 Procedimentos Metodológicos ................................................................................................ 30 

A) Critérios utilizados na inclusão e de exclusão de palavras do português ........................... 31 

B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 

2003a, 2003b) e de classificação da palavra, por Batista (2011). ................................................. 32 

C)  Submissão a Juízes .................................................................................................................. 34 

D) Critérios de Frequência de Ocorrência de palavras .................................................................. 35 

E) Critério do Bigrama .................................................................................................................. 36 

4 RESULTADOS .......................................................................................................................... 37 

A) Em relação aos critérios utilizados na inclusão e de exclusão de palavras do português... 39 

B) Critérios relacionados às regras de codificação do Português Brasileiro (SCLIAR-CABRAL, 

2003). .............................................................................................................................................40 

C) Submissão a Juízes ................................................................................................................... 41 

D) Em relação aos critérios de Frequência de Ocorrência de palavras ......................................... 45 

E) Em relação ao critério do Bigrama ........................................................................................... 47 

5 DISCUSSÃO .............................................................................................................................. 50 

6 CONCLUSÃO ............................................................................................................................ 54 

REFERÊNCIAS ............................................................................................................................ 56 

ANEXOS ....................................................................................................................................... 65 


ÍNDICE DE ILUSTRAÇÕES 

 
Figura 1 - Fluxograma do número de palavras a partir da submissão de cada critério deste estudo

 ....................................................................................................................................................... 38 

Figura 2 - Fluxograma realizado a partir de cada critério proposto neste estudo................ ........ 30 

 
ÍNDICE DE TABELAS 

 
Tabela 1- Exemplos de classificação das sílabas das palavras em relação às regras de codificação

 ....................................................................................................................................................... 40 

Tabela 2 - Exemplos de palavras excluídas do estudo e justificativa dos Juízes ......................... 42 

Tabela 3: Distribuição da Classificação por Juiz ......................................................................... 42 

Tabela 4: Distribuição da Sílaba 1 por Juiz .................................................................................. 43 

Tabela 5: Distribuição da Sílaba 2 por Juiz .................................................................................. 43 

Tabela 6: Concordância entre Juízes ............................................................................................ 44 

Tabela 7 – Índice Kappa ............................................................................................................... 45 

Tabela 8- Distribuição das palavras de alta, média e baixa frequência após a aplicação dos 

critérios “a” e “b” .......................................................................................................................... 46 

Tabela 9- Exemplos de palavras quanto à classificação da codificação Natural (N) e quanto às 

regras e frequência para as palavras .............................................................................................. 47 

Tabela 10- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A1) e 

quanto às regras e frequência para as palavras .............................................................................. 47 

Tabela 11- Exemplos de palavras quanto à classificação da codificação Arbitrária (subtipo A2) e 

quanto às regras e frequência para as palavras. ............................................................................. 48 

Tabela 12 – Lista de palavras de acordo com a classificação e codificação das palavras ............ 49 

  
LISTA DE ABREVIATURAS E SIGLAS 

 
N                      Ortografia Natural 

A                      Ortografia Arbitrária 

A1                    Palavras regulares regradas 

A2                   Palavras totalmente irregulares 

 
13 

 
1 INTRODUÇÃO


14 

 
Atualmente, poucos estudos destinam-se a investigar como ocorre a produção da escrita 

manual para além do ato motor, ou seja, desde sua intenção de produção (escolha das ideias) até 

a sua programação e execução motora (THIBON; GERBER; KANDEL, 2017). A produção da 

escrita manual pode ser iniciada a partir de estímulo auditivo ou visual, acessando os processos 

sintáticos e semânticos, servindo como base para posterior recuperação ou composição de grafias 

(THIBON; GERBER; KANDEL, 2017). 

Os estudos têm destacado a necessidade de instrumentos mais refinados, que possam 

captar mudanças destes parâmetros com maior precisão, como o uso de softwares e tablet 

(GERMANO; CAPELLINI, 2019; KANDEL; PERRET, 2015a, 2015b; ROUX et al., 2013), que 

permitem analisar a produção da escrita enquanto o escolar a realiza, ou seja, durante a produção 

do movimento, que pode ser influenciado e modificado de acordo com sua experiência 

ortográfica e caligráfica. Entretanto, a escolha do estímulo linguístico influencia o uso daqueles 

instrumentos. 

Escolares entre cinco e oito anos de idade iniciam a produção de letras partindo do 

princípio grafomotor. As letras são produzidas por traço (ou “strokes”) e apresentam várias 

pausas dentro e entre os traços. Geralmente, esses escolares produzem os movimentos de escrita 

de forma mais lenta, devido à necessidade de maior controle motor manual e da orientação 

sensorial ao produzir os movimentos. Dessa forma, o escolar direciona sua atenção à produção 

das formas de letra corretamente e elabora mapas sensórios-motores para cada letra produzida. 

Com o passar do tempo, estes mapas motores tornam-se mais estáveis e são base para os 

programas motores que contêm informações sobre a forma das letras, ordem dos traços e direção. 

Progressivamente, por volta de 10 a 11 anos de idade, os escolares consolidam os 

programas motores com a prática escolar, a qual facilita seu acesso e ativação, passando a 

produzir letras com a diminuição do feedback visual e cinestésico. Neste período, o movimento 

será evidenciado por uma produção rápida (maior velocidade de escrita). Vale ressaltar que, 

durante o processo de aquisição das habilidades grafo-motoras, a velocidade de produção de 

escrita dos escolares é extremamente variável. Com a maturação neuromotora, esta variabilidade 

diminui e as habilidades grafo-motoras tornam-se automáticas, indicando a ocorrência da 

interação entre os processos centrais e periféricos. Os escolares podem, portanto, usar seus 

recursos cognitivos para outros componentes da escrita, ou seja, aspectos ortográficos, 


15 

 
construção de sentenças e elaboração de textos (KANDEL; PERRET, 2015a, 2015b; VAN 

GALEN, 1991).  

Quanto aos aspectos ortográficos, destaca-se que a construção do sistema ortográfico 

pelo escolar não é linear, pois várias características da aquisição, tal como a frequência de 

aparecimento, são superadas ao longo da escolarização, começando com um conhecimento mais 

superficial sobre as relações som-letra, até o momento de poder ortografar as irregularidades da 

língua escrita (BATISTA, 2011). Os modelos de dupla-rota, de modo geral, propõem que pode 

haver a escrita com mediação fonológica e com acesso direto ao léxico. Na mediação fonológica, 

os sons das palavras são convertidos em grafemas (conversão fonema-grafema), sendo essa rota 

utilizada, preferencialmente, para a escrita de palavras não familiares, de baixa frequência e 

pseudopalavras. A rota lexical é utilizada para a escrita de palavras familiares, frequentes e 

irregulares. Os estímulos são armazenados na memória ortográfica lexical e, portanto, recordados 

(ELLIS; MORRISON, 1995; RODRIGUES; SALLES, 2013) 

A regularidade e a frequência das palavras são características psicolinguísticas que 

demonstram se há uma deficiência no processamento ortográfico, pois interferem no aprendizado 

e no processo ortográfico, o que desencadeia, consequentemente, uma dificuldade na composição 

do léxico mental ortográfico.  

Entretanto, ainda são escassos os estudos que buscam investigar a relação entre os 

processos centrais e periféricos nos processos de produção de escrita.  

Assim, este estudo parte da seguinte hipótese: a possibilidade da criação de listas de 

palavras baseadas nos critérios de codificação da Língua Portuguesa e, de acordo com o Bigrama, 

de medidas de interação entre os processos centrais e periféricos a partir de medidas de interação 

do software Ductus, durante a produção da escrita. 

Deste modo, torna-se importante a elaboração de listas de palavras, baseadas nos 

critérios de codificação da Língua Portuguesa, baseadas nas regras de Scliar-Cabral (2003) e de 

Batista (2011), que poderão auxiliar futuras medidas de interação entre processos centrais e 

periféricos e duração da produção da escrita.  

O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de 

codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação 

entre processos centrais e periféricos e duração da produção da escrita. 


16 

 
Para tal, apresentar-se-ão: no capítulo 2, uma revisão de literatura, contendo estudos 

referentes aos processos centrais e periféricos em relação à escrita; no capítulo 3, o delineamento 

metodológico com os critérios estudados; no capítulo 4, os resultados dos critérios adotados e 

estudados; no capítulo 5, a discussão. No capítulo 6, encontra-se a conclusão.  

 
17 

 
2 REVISÃO DE LITERATURA 

 
18 

 
Esta revisão abordará os processos de escrita e os principais achados nos estudos 

nacionais e internacionais sobre os processos centrais e periféricos relacionados à escrita. 

 
2.1 Processos centrais e periféricos em relação à escrita  

 
O ato de escrever é uma atividade motora linguística que tem diferentes estágios de 

processamento envolvidos. A ortografia refere-se ao processamento central. De acordo com os 

autores, as pesquisas tendem a focar na ortografia ou na produção motora, e não na relação de 

ambos (KANDEL; PERRET, 2015). 

A elaboração da escrita (grafia) pode ser gerada internamente, por meio de pensamentos 

originados por palavras com algum significado, ou iniciada com a leitura ou o som de palavras 

(ouvir uma palestra, uma ligação, etc.), ou seja, um estímulo visual ou auditivo. Esse processo 

não apenas é relativo à escrita, mas também a base para a recuperação ou formação de grafias, 

um processo semântico e mecanismo de compreensão visual ou auditiva.  

O ato de escrever exige processos “centrais” (cognitivos ou linguísticos) e processos 

“periféricos” (motores). Os processos centrais podem ser descritos como memória a longo prazo 

ortográfica (léxico ortográfico), conversão fonema-grafema e memória operacional ortográfica 

(graphemic buffer, cujo termo buffer em computação significa área da memória que foi alocada 

para armazenamento temporário de dados). Os processos periféricos comandam as ações motoras 

utilizadas para a produção de palavras escritas, tais como manuscrito, digitação, soletração, etc. 

(AMORIM et al., 2016). 

O modelo cognitivo hierárquico proposto por Van Galen (1991) mostra que a produção 

de escrita manual exige a ativação dos chamados processos centrais, os quais incluem processos 

cognitivo-linguísticos (como a atenção, memória operacional e codificação ortográfica) e os 

processos periféricos (elaboração e ao planejamento do ato motor da escrita). 

Assim, Van Galen (1991) afirma que a produção da escrita seria desencadeada de modo 

hierárquico, partindo do processo central ao periférico. Segundo o autor, os processos centrais 

iniciam-se a partir da intenção para a escrita (plano das ideias), passando pela recuperação 

semântica e construção sintática. Em seguida, ocorre a ativação do módulo léxico ortográfico, 

responsável pela seleção e ativação de representações ortográficas. Isso permite a recordação dos 

componentes das letras que formam as palavras e sua organização (CARAMAZZA; MICELI, 

1990).  


19 

 
Van Galen (1991) inclui o chamado módulo "ortografia", relacionado aos componentes 

ortográficos das palavras, envolvendo dois aspectos importantes: a escolha da produção letra por 

letra (representações abstratas de letras); e a produção grafema por grafema, cuja representação 

é influenciada pela correspondência fonema-grafema. Assim, a produção da escrita de uma 

palavra é ativada, podendo seus componentes (letras e grafemas) ser manipulados, recuperados 

e armazenados temporariamente no chamado "Buffer Ortográfico" (memória operacional 

ortográfica). 

De acordo com o modelo de Van Galen (1991), para escrever uma palavra, ativa-se sua 

representação ortográfica no módulo de grafia. A representação consiste em uma sequência linear 

de letras que codifica a identidade e a ordem da letra (por exemplo, S1A2P3A4T5O6). Ela é 

armazenada no buffer ortográfico até que possa ser ‘‘desembrulhada’’ para a produção em série. 

Constitui a entrada para os módulos periféricos (ou seja, alógrafos, controle de tamanho e ajuste 

muscular) (KANDEL et al., 2011). 

Em sequência, passa a entrar em ação o processo periférico (VAN GALEN, 1991). Após 

a seleção da letra e grafema no processo central, há ativação do módulo "seleção de alográfos", 

que se referem às formas das letras (maiúsculas, minúsculas, cursiva, bastão) e outros ajustes do 

movimento necessários, como o planejamento do tamanho da letra, a amplitude e a pressão do 

movimento.  

Assim, os programas motores são formados e contêm informações sobre a forma de 

letra, sequência de traçado e direção, que comporão a memória de longo prazo para a produção 

da escrita. Posteriormente, o módulo "controle de tamanho" processará uma série de parâmetros 

locais específicos, como planejamento dos traços de cada letra e velocidade de escrita, de modo 

que a escrita possa ser produzida de modo fluente e eficiente. Uma vez que toda essa informação 

esteja configurada, o módulo "ajuste muscular" envia os comandos aos músculos responsáveis 

para a execução do movimento (KANDEL et al., 2011). 

Conforme referido por Van Galen (1991) e Kandel et al. (2017), a produção da escrita 

ocorre a partir da interação de processos centrais e periféricos, em milésimos de segundos. De 

acordo com os autores, a escrita realizada pelo escolar em um papel é o produto final, derivado 

de vários processos ocorridos anteriormente.  

Ao contrário do proposto por Van Galen (1991), outros estudos (KANDEL et al., 2006; 

KANDEL; SPINELLI, 2010; KANDEL et al., 2011) indicam que escrever uma palavra não é 


20 

 
apenas produzir uma letra após a outra como se fosse uma mera sequência linear de letras. Os 

autores apontam uma tendência de agrupar as letras de uma palavra em blocos para otimizar a 

recuperação da grafia. Esse procedimento de agrupamento (“chunking” ou bigram) influencia a 

forma como o sistema de escrita programa os movimentos para produzir as letras de uma palavra, 

sendo que esses pedaços de letras regulam os aspectos espaço-temporais do movimento. 

Desta forma, além da identidade e da ordem das letras, as representações ortográficas 

codificam informações de vários níveis de processamento sublexical, como morfêmico, silábico 

e estrutura grafêmica. Essa estrutura “multidimensional” de representações ortográficas 

(CARAMAZZA; MICELI, 1990) regula o tempo de programação da escrita (KANDEL et al., 

2017). 

Kandel et al. (2006) forneceram evidências indicando que a estrutura da sílaba regula o 

tempo de programação da escrita manual. Em seu estudo, os adultos franceses copiaram palavras 

apresentadas visualmente em um digitalizador. As palavras compartilhavam as letras iniciais, 

mas tinham limites de sílaba diferentes (por exemplo, “tra.ceur” [tracer] e “trac.tus” [trato] – o 

ponto indica o limite da sílaba). Os participantes tiveram que escrever as palavras em letras 

maiúsculas e levantar a caneta entre as letras.  

O pressuposto subjacente a essa tarefa era que a duração dos intervalos entre as letras 

forneceria informações sobre o tempo de programação do motor. Os resultados revelaram que os 

intervalos de duração entre letras e dentro das sílabas (entre a e c em “tra.ceur”) eram mais 

longos do que os intervalos entre letras e dentro das sílabas (entre a e c em “trac.tus”). Sua 

concepção “antecipatória” da produção de motores ainda é a forma mais eficiente de entender o 

processo de escrita. 

Para Kandel et al. (2011), os módulos de processamento estão ativos simultaneamente. 

Os módulos de ordem superior (processos centrais) estão ativos porque antecipam e processam 

informações relacionadas às próximas partes da palavra, enquanto os módulos de ordem inferior 

estão envolvidos no processamento dos parâmetros locais.  

Como vários módulos de diferentes níveis representacionais estão ativos 

simultaneamente e as capacidades de processamento são limitadas, há uma carga cognitiva 

suplementar que resulta em um aumento na duração do movimento. O aumento da duração 

observado nos limites das sílabas traduz o processamento paralelo da grafia da sílaba seguinte e 

os parâmetros locais da sequência motora atual. Em outras palavras, um aumento significativo 


21 

 
da duração na fronteira da sílaba indica que o sistema de escrita programa o movimento para 

executar a sílaba seguinte online, simultaneamente com o processamento dos parâmetros locais 

(KANDEL et al., 2011). 

O estoque de grafias das palavras é conhecido como memória de longo prazo ortográfica 

(léxico ortográfico), e suas informações são resgatadas pelo significado da palavra ou 

representação do seu som. As palavras são montadas a partir do processo de conversão fonema-

grafema que vem do estímulo fonológico, é dele que as informações aprendidas (como sons, 

letras e outras unidades sublexicais) são convertidas em grafias para as cadeias sonoras.  

Para exemplificar, o som da palavra “maçã” deverá ser recuperado da informação 

auditiva de “MAÇA” na memória de longo prazo ortográfica. Como houve um conflito 

ortográfico para o som de /s/, pode ocorrer uma grafia aproximada, como, por exemplo, 

“MASSAN”, que acontece pelo sistema de conversão fonema-grafema (AMORIM et al., 2016; 

PURCELL et al., 2011; PURCELL; RAPP, 2013). 

No que se refere ao processamento periférico, há várias etapas envolvidas, desde a 

correta ordenação e execução dos movimentos específicos dos efetores musculares necessários 

para expressar as letras até a representação abstrata das letras na memória de operacional 

ortográfica. Esses processos periféricos concretizam a linguagem escrita nas modalidades como 

soletração, escrita manual e digitação. 

Os planos motores são realizados para a produção das formas das letras pelos processos 

de planejamento motor da grafia, definindo as características, como o tamanho e a sequência dos 

traços. Logo após a realização dos planos motores, a programação dos efetores motores 

específicos compila as instruções para o membro que será utilizado na realização das ações 

motoras. A programação e a execução das ações dos efetores específicos é subordinada ao 

feedback multimodal durante a execução (tátil, visual, etc.) (AMORIM et al., 2016). 

O movimento para escrever relacionado ao processamento periférico, que o distingue 

do processamento central, vem de estudos neuropsicológicos, como, por exemplo, os estudos de 

Baxter e Warrington (1986). 

O estudo de Kandel e Perret (2015) exemplifica sobre a regularidade e irregularidade 

no processo central e periférico. A palavra francesa "Pardon" é ortograficamente regular, pois 

apresenta correspondência fonema-grafema de alta frequência. Em contraste, a palavra "Parfum" 

é ortograficamente irregular. Após um ditado realizado com escolares para escreverem as 


22 

 
palavras em um digitalizador, percebeu-se que as latências eram mais longas para palavras 

irregulares que para palavras regulares, mas apenas quando não eram frequentes, isso indica que 

os processos ortográficos foram modulados por regularidade ortográfica e frequência das 

palavras (KANDEL; PERRET; 2015). 

Para os autores, o processo central foi ativado antes de os escolares começarem a 

escrever. A duração da escrita é um indicador do processamento motor e descrita como tempo 

que a caneta estava no digitalizador, do início ao final da palavra. As durações eram mais longas 

para as palavras irregulares que para as regulares (KANDEL; PERRET; 2015). Essas variáveis 

sugerem que a elaboração de listas que considerem este critério de regularidade e frequência de 

palavras da língua pode impactar o desempenho da escrita manual.   

Este estudo foca sobre o processo central para o desempenho da escrita manual. É no 

processo central que as palavras ficam armazenadas na memória operacional ortográfica e na 

memória a longo prazo ortográfica, fazendo com que as palavras sejam convertidas de fonemas 

para grafemas, assim que o escolar vê ou escuta uma palavra.  

O desempenho da escrita manual representa a última e mais complexa habilidade 

adquirida do desenvolvimento por estar envolvida com múltiplos mecanismos cerebrais, 

requerendo integração simultânea e sequencial de funções, como a atenção, memória, habilidade 

motora, linguagem e cognição para o seu estabelecimento, havendo, portanto, uma acomodação 

dos processos funcionais e organizacionais em sua aquisição (BATISTA, 2011; LI et al., 2007). 

 
2.1.2 Escrita ortográfica 

 
Escrever ortograficamente significa entender que um fonema pode ser escrito por 

grafemas diferentes, assim como um grafema pode representar fonemas diferentes. Este 

entendimento coloca o escolar diante das situações de irregularidade e regra no processo de 

compreensão do sistema ortográfico de sua língua (BATISTA, 2011; MAREC-BRETON; 

GOMBERT, 2004; ZORZI, 2008).  

Vários autores enfatizam o uso de diversas informações linguísticas para aperfeiçoar a 

escrita alfabética, concluindo que as grafias são geradas por uma sequência fonêmica e  

necessitam de informações sintáticas e morfológicas para chegar à escrita correta (BATISTA, 

2011; KYTE; JOHNSON, 2008; MOTA et al., 2008; ZUANETTI et al., 2008). As conversões 


23 

 
dos grafemas em fonemas (letra-som) e dos fonemas em grafemas (som-letra) referem-se ao 

princípio fonográfico e essas correspondências mais ou menos regulares, dependendo do 

referencial a ser analisado: se o referencial é da escrita ou é da leitura. (MOUSINHO; CORREA, 

2009). Escrever é bem mais difícil que ler (DIAS; ÁVILA, 2008), já que é necessária maior 

reflexão do escritor iniciante, que tem de superar o obstáculo de separar uma sílaba em nível 

consciente (CORREA et al., 2007) e depois transformar a forma de falar em escrita, com palavras 

e regras dentro das normas ortográficas de decodificação e codificação, influenciando 

diretamente a forma de aquisição destas habilidades (BATISTA, 2011). 

A leitura e a escrita apresentam palavras regulares e irregulares, o sistema da escrita 

brasileira tem como característica sua bidirecionalidade (ALÉGRIA et al., 1997; OLIVEIRA; 

GERMANO; CAPELLINI, 2016; SCLIAR-CABRAL, 2003). A escrita ortográfica pode gerar 

mais erros, pois apresenta maior opacidade para a conversão fonema-grafema. Por exemplo: o 

fonema mais complexo a ser codificado é o /s/, e pode ter dez variações, como sapato, 

experiência, criança, crescer, exceto, cebola, paz, pássaro, nasça, exsudar; enquanto na leitura 

caracterizada por maior transparência em relação à conversão grafema-fonema, o grafema mais 

complexo [x] pode ter quatro variações: xale, experiência, taxi e exato (CHIARAMONTE; 

CAPELLINI, 2019). 

O sistema de conversão da escrita pode ser explicado por duas possibilidades: a 

primeira, com mecanismos fonológicos de conversão fonema-grafema, por meio da via 

sublexical; a segunda, pela via lexical, por meio da ativação da representação semântica, isto  é, 

uma representação fonológico-lexical que permite a recordação da escrita da palavra (AMORIM 

et al., 2016; ELLIS, 1982; HILLIS, 2001; MARGOLIN; GOODMAN-SCHULMAN, 1992; 

TAINTURIER; RAPP, 2001). Esse sistema de “duas vias” explica como se pode escrever as 

palavras consideradas familiares, como também para escrever palavras novas ou não familiares 

de forma aceitável. A habilidade de produzir uma escrita plausível para uma palavra que nunca 

tenha sido vista ou escutada anteriormente depende do sistema de “conversão fonologia para 

ortografia”, também conhecido como rota não lexical ou sublexical da escrita (AMORIM et al. 

2016; ELLIS, 1982; HILLIS, 2001; TAINTURIER; RAPP, 2001).  

O processo de “conversão fonologia para ortografia”, ou conversão fonema-grafema, é 

um processo que busca o conhecimento sobre a correspondência fonema-grafema de uma língua 

estocada no cérebro (por ex: /s/ → SS ou C), frequência de uso (por ex: /s/ é mais escrito com SS 


24 

 
do que com C) e o contexto que é utilizado (ex: uma palavra que inicia com /s/ não pode ser 

escrita com SS). A maneira como funciona essa via é avaliada por meio do ditado de 

pseudopalavras como “flope” (AMORIM et al., 2016; ELLIS, 1982; HILLIS, 2001; 

MARGOLIN; GOODMAN-SCHULMAN, 1992; TAINTURIER; RAPP, 2001).  

Pinheiro e Rothe-Neves (2001) e Pinheiro (2006), ao estudarem a variável 

psicolinguística “regularidade”, diferenciaram as relações entre os grafemas na escrita em três 

categorias: a  categoria regra, na qual se apresentam as situações de regularidade dependentes de 

contexto, quando há a necessidade de se aplicar regras de contexto ortográfico para se obter uma 

relação unívoca entre os sons e as letras; a categoria regular, que apresenta uma relação unívoca 

entre as letras e os sons; e a categoria  irregular, quando as relações entre fonema-grafema e 

grafema-fonema são específicas de uma determinada palavra (BATISTA, 2011). 

Os escolares têm maior capacidade na escrita ortográfica de palavras regulares e de alta 

frequência do que palavras de baixa frequência ou pseudopalavras. Isso ocorre por causa da maior 

exposição auditiva, visual e perceptiva de determinada palavra com o escolar, o que a torna mais 

familiar e facilita a recuperação lexical ortográfica no momento da codificação (ALGOZZINE 

et al., 2008; CAPELLINI; LANZA, 2010; SAMPAIO et al., 2017). Representações pouco 

específicas ou imprecisões das representações fonológicas podem acarretar déficit e afetar o 

processamento fonológico e a recuperação lexical da palavra (CHIARAMONTE; CAPELLINI, 

2019; GERMANO; CAPELLINI, 2015; NICOLIELO; HAGE, 2014; SANTOS; FERRAZ, 

2017; TORPPA et al., 2017).  

Para que seja hábil ao produzir a grafia de forma correta, o escolar deve inteirar-se das 

condições regulares e irregulares socialmente convencionadas, pois terá peculiaridades mesmo 

no princípio fonográfico, em que necessitará se atentar para a posição do segmento sonoro dentro 

da palavra e observar a tonicidade do segmento sonoro. Deve também ser apto a refletir sobre a 

categoria gramatical da palavra, dentro do princípio semiográfico. Já nas peculiaridades 

irregulares, poderá ter de recorrer ao dicionário (BATISTA, 2011; MORAIS, 2009; REGO; 

BUARQUE, 2007). 

A aprendizagem da escrita ocorre através de um ensino explícito aos escolares, 

principalmente da ortografia, já que se apresenta mais opaca quando comparada à leitura, no 

sistema de escrita alfabética do português brasileiro (ALÉGRIA et al., 1997; ANGELELLI et 

al., 2016; SCLIAR-CABRAL, 2003). Por isso, os escolares com dislexia realizam a leitura e a 


25 

 
escrita de forma mais precisa, utilizando a rota sublexical, pois as letras são retomadas 

fonologicamente (MARTENS; DE JONG, 2006).  

 
2.1.3 O processo central e periférico, a escrita ortográfica 

 
Aprender a escrever requer o domínio de habilidades linguísticas e motoras 

(GERMANO; CAPELLINI, 2019; KANDEL; PERRET, 2015), porém é importante dizer que os 

estudos brasileiros que investigam a interação entre aspectos ortográficos e motores ainda são 

poucos. Modelos recentes de produção de caligrafia sugerem que os processos de grafia modulam 

o tempo dos processos motores (KANDEL et al., 2015; ROUX et al., 2013).  

Por isso, os autores demonstraram que os processos centrais e periféricos interagem 

durante a produção da escrita, ou seja, há uma interação dinâmica entre os processos, e a 

produção do movimento pode ser afetada por variáveis que regulam o processo ortográfico, como 

a lexicalidade e a frequência (ROUX et al., 2013). A latência é uma das medidas que podem ser 

utilizadas como indicador para verificar a interação entre os processos motores e ortográficos, já 

que permite observar como a produção da escrita ocorre a partir do acesso ao léxico para a 

recuperação de programas motores e a preparação do movimento (KANDEL et al., 2015; ROUX 

et al., 2013; VAN GALEN, 1991). 

O estudo de Delattre, Bonin e Barry (2006) identificou que, na língua francesa, as 

latências durante a escrita eram mais longas para palavras irregulares que para palavras 

regulares. A diferença nas latências - que é utilizada para indexar os processos ortográficos 

centrais - mostra que palavras irregulares requerem maior tempo de latência entre as informações 

de grafia lexical e sublexical, antes que uma resposta escrita seja iniciada. A diferença nas 

durações - que se refere aos processos de escrita periféricos - sugere que o conflito ortográfico 

gerado para palavras irregulares não é totalmente realizado antes que uma resposta escrita seja 

executada.  

Assim, a latência que existe para iniciar o movimento de escrita reflete os processos de 

ortografia centrais, enquanto a duração da escrita das palavras reflete os processos periféricos 

subsequentes que controlam a execução da escrita (DELATTRE; BONIN; BARRY, 2006).  

Kandel e Perret (2015) analisaram como a interação entre a ortografia e o processamento 

motor se acumula durante a aquisição da escrita manual. Palavras foram selecionadas e divididas 


26 

 
entre irregulares e regulares da língua francesa, sendo 28 palavras de alta frequência e 34 palavras 

de baixa frequência de comprimento equivalente para que, posteriormente, fossem comparadas 

entre si.  

Os resultados obtidos para a variável latência mostram-se significativos, sendo que 

palavras irregulares produziram latências mais longas que as regulares. Para a variável de 

duração do movimento, as durações foram mais longas para baixa frequência do que para 

palavras de alta frequência. Além disso, crianças de oito anos demoraram mais para escrever as 

palavras do que as de nove e dez anos. E por fim, na variável fluência de movimento, as crianças 

com oito anos de idade foram menos fluentes do que as de nove anos de idade, e as crianças de 

nove e dez anos foram mais disfluentes para palavras irregulares do que para as regulares.  

Para concluir, os dados revelam que a regularidade ortográfica teve um impacto muito 

maior sobre a escrita das crianças do que as frequências das palavras. Além disso, a irregularidade 

ortográfica produziu um conflito em nível sublexical que gerou uma carga cognitiva mais 

importante que a frequência de palavras no nível lexical.  

Esse estudo realizado por Kandel e Perret (2015) envolveu crianças francesas, 

demonstrando que há poucos estudos realizados sobre a ortografia, na língua portuguesa.  

Outro estudo de Afonso e colaboradores (2018) foi realizado com escolares espanhóis 

com o objetivo de comparar a relação entre o processo central e o periférico e o desenvolvimento 

da escrita. Os resultados indicaram que os escolares tiveram desempenho diferente na escrita de 

palavras em mesa digitalizadora quanto à frequência. Palavras de alta frequência foram escritas 

mais rapidamente que palavras de baixa frequência, por escolares do 2º ano.  Os autores 

concluíram que a frequência das palavras afetaria a duração da escrita manual.   

Pinheiro (1995), em estudo sobre a regularidade e irregularidade das palavras no inglês 

e no português, enfatiza a falta de estudos relacionados à ortografia, no Brasil. 

Em outro estudo realizado por Pinheiro (1994), a variável regularidade apresentou um 

efeito significativo para as palavras reais. Em cada série, os escolares apresentaram maior 

dificuldade quanto às palavras irregulares quando comparados às palavras regra, e estas, por sua 

vez, em relação às palavras regulares, em ambos os níveis de frequência. Esse efeito foi 

significativo tanto na análise de sujeito como na de itens em cada série, separadamente, e aplicou-

se tanto às palavras de alta frequência como às de baixa frequência. Um efeito geral de 

regularidade foi também encontrado para as não palavras. Ainda, Pinheiro (2001) afirma que, na 


27 

 
escrita, há mais irregularidades que na leitura, no Português, e que, para resolver esse impasse, 

seria interessante a construção de listas de palavras regulares e irregulares na escrita, uma vez 

que são poucos os estudos relacionados a essa questão.  

Assim, observa-se uma carência de listas elaboradas com critérios de codificação que 

possibilitem avaliar a possível interação entre os processos centrais e periféricos da escrita, pois, 

atualmente, têm-se listas de leitura e listas de escrita, porém com banco de palavras já existentes 

em dicionários.  

 
2.1.4 O Bigrama e o software Ductus 

 
Para esta pesquisa, a lista de palavras foi elaborada a partir do Bigrama, que é 

caracterizado como pares ordenados de letras que coocorrem em determinadas posições nas 

palavras de uma língua (JUSTI; JUSTI, 2009). O critério do bigrama surgiu para solucionar um 

problema de representação abstrata das letras em como codificá-las em relação a suas posições 

em uma palavra. Carreiras e Grainger (2004), Granger e Whitney (2004) e Justi e Justi (2009) 

afirmam que a solução para tal problema é postular um nível representacional sublexical, para 

que codifique pares ordenados de bigramas ou letras, como, por exemplo, a palavra toca, que 

seria codificada pelos bigramas ‘to’,’oc’ e ‘ca’ (JUSTI; JUSTI, 2009). 

Segundo Cassar e Treiman (1997), Justi, Justi (2009), Pacton et al. (2001) e Treiman 

(1993), os escolares acabam desenvolvendo gradualmente uma sensibilidade às restrições 

ortográficas da língua, mesmo depois de poucos meses de exposição à língua escrita. Tais 

restrições são baseadas na frequência das unidades sublexicais presentes nas palavras em que 

foram expostas, a frequência das unidades sublexicais é indexada pela frequência de ocorrência 

dos bigramas, onde este passa a ser uma variável considerada nos estudos sobre escrita e/ou 

leitura (JUSTI; JUSTI, 2009). 

Justi e Justi (2009) e Rastle, Davis e New (2004) sugerem que alguns dos efeitos 

encontrados pelos pesquisadores ao investigarem o processamento morfológico podem ser, na 

realidade, efeitos da frequência de ocorrência dos bigramas que compõem as palavras. De acordo 

com tais pesquisadores, enquanto as raízes e os afixos têm, tipicamente, bigramas de alta 

frequência de ocorrência, a frequência dos bigramas que se localizam entre os morfemas é menor 

(JUSTI; JUSTI, 2009). 


28 

 
O critério do bigrama foi escolhido, pois poderá ser utilizado com softwares que medem 

a escrita, como o software Ductus, que é uma ferramenta projetada para analisar e auxiliar na 

compreensão dos processos subjacentes à produção da escrita manual (GUINET; KANDEL, 

2010).  

O software é utilizado por meio de um notebook e uma mesa digitalizadora (Wacom 

Intuos 5): começa com um estímulo informando ao escolar que uma palavra será apresentada, 

então, um ponto de fixação no centro da tela indica o local onde o estímulo irá aparecer. O tempo 

de apresentação do ponto de fixação pode ser manipulado pelo pesquisador (em milissegundos) 

(GUINET; KANDEL, 2010). Após a palavra apresentada, o escolar é instruído a copiar os itens 

como faz em sala de aula, utilizando letra Bastão (letra maiúscula), sendo que, deste modo, é 

possível a caracterização de cada letra em relação ao pico cursivo. O procedimento é composto 

por quatro tarefas, com tempo aproximado de 30 a 50 minutos de aplicação por tarefa, aplicadas 

individualmente (GERMANO, 2018). 

 
29 

 
3 DELINEAMENTO METODOLÓGICO  

 
30 

 
Este projeto de pesquisa foi submetido ao Comitê de Ética em Pesquisa da Faculdade 

de Filosofia e Ciências – CEP/FFC/UNESP e realizado após a aprovação do mesmo, sob o nº 

1.841.638. 

 
3.1 Procedimentos Metodológicos 

 
Elaboraram-se listas de palavras, baseadas nos critérios de codificação da Língua 

Portuguesa e outros critérios que mediram parâmetros da possibilidade de interação entre os 

processos centrais e periféricos da produção da escrita.  

O Fluxograma 1 descreve cada critério proposto para a elaboração da lista de palavras. 

 
Figura 1 - Fluxograma realizado a partir de cada critério proposto deste estudo. 

 
Fonte: Elaborada pela autora. 

Legenda: Regras |C1| - Conversão dos fonemas aos grafemas independente de contexto; Regras |C2| - 

Conversão dos fonemas aos grafemas dependente da posição e/ou do contexto fonético; |C3| - Alternativas 

competitivas. 

 
a) Inclusão e exclusão de 
palavras do português

b) Regras de codificação 
segundo Scliar - Cabral e 

Batista.

c) Submissão a juízes

d) Frequência de ocorrência 
das palavras

e) Bigrama


31 

 
O fluxograma 1 (anterior) apresenta os critérios propostos para este estudo, que serão 

descritos na sequência.   

 
A)  Critérios utilizados na inclusão e de exclusão de palavras do português 

 
Para a adaptação do Português Brasileiro, as palavras foram extraídas do vocabulário 

escolar que consta do banco do Laboratório de Investigações dos Desvios da Aprendizagem 

(LIDA) / Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP) – Marília/SP, 

composto por palavras extraídas dos livros de Língua Portuguesa de 1º a 4ª séries do ensino 

fundamental, utilizados na Rede Municipal de Ensino (GERMANO, CAPELLINI, 2008; 

OLIVEIRA, 2017). Este banco foi atualizado e composto por palavras extraídas dos livros de 

língua portuguesa do 1º ao 6º ano do Ensino Fundamental I, utilizados na Rede Municipal de 

Ensino da cidade de Marília/SP e região (GERMANO, CAPELLINI, 2008; GERMANO 2011; 

OLIVEIRA, 2017). 

Este banco contém 3.450 palavras de várias classes gramaticais - pronomes, 

preposições, adjetivos, advérbios, verbos e substantivos - divididas de acordo com a extensão 

(monossilábicas, dissilábicas, trissilábicas e polissilábicas), complexidade silábica entre as 

vogais (v) e consoantes (c): v, vv, vc, cv, ccv, cvc, vcc, cvv, ccvc, cvcc, ccvcc. 

Todas as palavras dos textos integrantes dos materiais didáticos foram digitadas em uma 

única coluna de planilha Excel, selecionadas de acordo com critérios descritos por Oliveira e 

Capellini (2016), sendo incluídos apenas substantivos, dissílabos, por ser uma classe frequente 

em qualquer texto, visto que exerce funções sintáticas importantes na frase.  

Foram excluídas as palavras escritas em outros idiomas, advérbios, locuções adverbiais, 

locuções prepositivas, adjetivos, meses do ano, numerais, palavras no aumentativo ou 

diminutivo, gírias, palavras compostas por justaposição (OLIVEIRA; CAPELLINI, 2016). 

Além disso, foram aplicados os critérios de exclusão das palavras, de acordo com 

Germano (2018): 

1. Palavras monossilábicas, trissilábicas e polissilábicas, que não permitiriam a 

comparação para o mesmo número de letras. 


32 

 
2. Palavras diacríticas, ou seja, que apresentam algum sinal gráfico que se coloca sobre, 

sob ou através de uma letra para alterar a sua realização fonética, isto é, o som, ou para marcar 

qualquer outra característica linguística. Foram considerados sinais diacríticos: acento agudo, 

acento grave, acento circunflexo, trema e til e palavras com “ç”. Este critério também foi 

utilizado, considerando-se o número fixo de strokes (picos cursivos) para cada letra.  

 
B) Critérios relacionados às regras de codificação do Português Brasileiro 

(SCLIAR-CABRAL, 2003a, 2003b) e de classificação da palavra, por Batista (2011). 

 
Para este estudo, as palavras foram classificadas de acordo com as regras de codificação 

de Scliar-Cabral (2003), tendo como base os princípios alfabéticos do Português do Brasil. No 

que tange à notação, estes princípios definem as letras ou grafemas  permitidos em 

determinadas circunstâncias, ou seja, as combinações possíveis para a notação (ordem e 

quantidade autorizada), produzindo os valores sonoros que as letras ou os grafemas podem 

assumir, dentro dos contextos específicos em que as sequências fonêmicas da linguagem oral 

exigem. 

As palavras foram classificadas de acordo com as sílabas, segundo as regras de 

codificação do Português Brasileiro, descritas por Scliar-Cabral (2003), que realizou a 

formulação das regras de codificação para a notação ortográfica baseadas nos princípios 

alfabéticos do Português do Brasil.  

Outro ponto importante relacionado a esse critério deve-se ao estudo de Kandel e Perret 

(2015), indicando que o modo como se codifica ortograficamente cada sílaba pode afetar o tempo 

de produção e velocidade de escrita da palavra. As sílabas de cada palavra foram selecionadas 

quanto ao critério de inclusão, sendo descrita em sequência: 

- Regra |C1| Conversão dos fonemas aos grafemas independente de contexto: a 

conversão fonografêmica não está determinada pela posição ou pelo contexto fonético, ou seja, 

não há restrição quanto à atribuição do grafema em 12 fonemas. É composto pelas relações entre 

/p/ e P; /b/ e B; /t/ e T; /d/ e D; /f/ e F; /v/ e V; /m/ e M; /n/ e N; e NH; /λ/ e LH.  Neste grupo, as 

relações que se apresentam são unívocas entre fonema e grafema, em que um fonema se relaciona 

a um grafema e somente a ele, numa relação de constância. 


33 

 
-  Regra |C2| Conversão dos fonemas aos grafemas dependente da posição e/ou do 

contexto fonético: a conversão fonografêmica fica na dependência da pronúncia dos fonemas  

para a escolha das letras ou grafemas que irão representá-los. Entende-se que uma letra representa 

diferentes fonemas, assim com um fonema pode ser representado por diferentes grafemas, 

conforme a posição em que se encontrem na palavra. Neste grupo, as relações são dependentes 

de regras determinadas pelo contexto fonético ou posição em que os sons ocupam na sílaba. Há 

uma relação de inconstância, porém de previsibilidade. As principais ocorrências de 

previsibilidade deste grupo compõem as situações de /k/ e C/QU; /g/ e G/GU; e JA/JO/JU; /s/ e 

SA/SO/SU em início de palavra; /z/ e Z em início de palavra; R/RR e /R//ɾ//r/; M/N e 

/aN//eN//iN//oN//uN/; O/U e /u//U/; E/I e /i//I/. 

 -  Regra |C3| Alternativas competitivas: este terceiro grupo apresenta uma situação de 

concorrência, já que uma letra pode representar vários fonemas e um fonema pode ser 

representado por diferentes letras com uma relação dependente de regras complexas, por isto 

com menor previsibilidade.  As seguintes representações figuram neste grupo: situações do H 

inicial; /"/ e JE/JI/GE/JI; /ʃ/ e X/CH; /z/ e S/Z em posição não inicial; /s/ e S/C/SS/SC/Ç/SÇ/XC; 

/i/ e E/I em sílabas átonas não finais de vocábulo; /u/ e O/U em sílabas átonas não finais de 

vocábulo; /j/ e E/I; /w/ e L/U/O; /S/ e Z/S/X; /λ//l%/ e LH/L; /k/ e CU/QU; /kiS/ e X/QUES; 

/k(i)+s/ e X/CÇ/CC. 

Foram excluídas as regras Regra |C4| (Conversão dos fonemas ao grafema dependente 

da morfossintaxe e do contexto fonético) e Regra |C5| (Derivação morfológica), as quais 

envolvem o conhecimento e uso de acentuação e de conjugação verbal. Tais regras foram 

excluídas em virtude de dois aspectos importantes na criação desta lista. Primeiro: para analisar 

as palavras quanto às regras C4 e C5, há necessidade de investigar aspectos linguísticos 

morfológicos, como radical, tema (simples ou derivado), vogal temática (VT) ou índice temático, 

marcador de classe, morfema de tempo-aspecto- -modo, morfema pessoa-numeral, afixo, base 

genolexical. Estes aspectos interfeririam na escolha de palavras que respeitam o critério Bigrama. 

Em segundo lugar: a presença de acentuação não poderia ser computada por meio de softwares 

que analisam a escrita, por isso tais regras foram desconsideradas neste estudo, já que não 

contemplam seu objetivo.  

A classificação das palavras foi realizada e denominada em Ortografia Natural (N) e 

Ortografia Arbitrária (A), sendo que esta foi dividida em: A1 para correspondência fonema-


34 

 
grafema dependente de regras (regular regradas); e A2 para correspondência fonema-grafema 

independente de regras (totalmente irregulares), de acordo com Batista (2011). A autora cita uma 

classificação adaptada ao Português Brasileiro baseada nos estudos de Cervera-Mérida e Ygual-

Fernández (2006). Estes autores consideram dois tipos originais de ortografia, divididos em duas 

classes gerais de erros: os erros de Ortografia Natural e os de Ortografia Arbitrária, o que 

proporciona um caráter não só descritivo dos erros ortográficos, mas alia o caráter evolutivo a 

eles, à medida que considera a ordem de aquisição ortográfica em sua natureza, permitindo a 

compreensão de cada tipo e os fatores cognitivo-linguísticos implicados (BATISTA, 2011; 

BATISTA; CAPELLINI, 2011; YGUAL-FERNÁNDEZ et al., 2010). 

O critério adotado para classificar as palavras de acordo com as regras N, A1 e A2 

seguiu a ordem de maior imprevisibilidade para menor previsibilidade da correspondência 

fonema-grafema, sendo A2>A1>N (BATISTA, 2011), conforme exemplos a seguir: 

- Para as regras A2>A1: /senhor/: a primeira sílaba /se/ é referente à regra C3.3.1 (A2), 

ou seja, alternativas competitivas independentes de regras, trata-se de /s/ em início de vocábulo 

antes de vogal oral ou nasalizada não posterior. Na sílaba /nho/, a regra utilizada foi a C1 (N), 

conversão dos fonemas aos grafemas independente de contexto. Na letra /r/ (referente à sílaba 

/nhor/), a regra utilizada foi a C2.11 (A1), conversão dos fonemas aos grafemas dependente da 

posição e/ou do contexto fonético, referente ao arquifonema /R/ em final de sílaba interna e em 

final de vocábulo (SCLIAR-CABRAL, 2003). 

- Para as regras A1>N: /peru/: a primeira sílaba /pe/ é referente à regra C1 (N), ou seja, 

conversão dos fonemas aos grafemas independente de contexto. Na segunda sílaba /ru/, a regra 

utilizada foi a C2.10 (A1), referente ao flepe alveolar /r/ entre vogal oral ou semivogal em final 

de sílaba e vogal oral (SCLIAR-CABRAL, 2003). 

- Para as regras A2>N: /senha/:  a primeira sílaba /se/ é referente à regra C3.3.1 (A2),  

trata-se de /s/ em início de vocábulo antes de vogal oral ou nasalizada não posterior. Na segunda 

sílaba /nha/, a regra utilizada foi a C1 (N) (SCLIAR-CABRAL, 2003). 

 
C)  Submissão a Juízes  

 
Após a classificação das palavras, solicitou-se a análise por dois juízes especialistas na 

área de ortografia, a fim de verificar a concordância entre as regras gramaticais empregadas. Os  


35 

 
juízes escolhidos são Fonoaudiólogas, sendo uma com formação em Psicopedagogia e a outra, 

em Neuropsicopedagogia, com ampla atuação na Educação e na avaliação e intervenção de 

leitura e escrita.   

Cada juiz recebeu e assinou o termo de concordância para  participar do estudo e 

instrução para o julgamento, e foi orientado a realizar a classificação em relação a cada sílaba 

que compunha cada palavra, de acordo com a regra de codificação de Scliar-Cabral 

(2003a,2003b); em seguida, procedeu à classificação como Ortografia Natural (N), Ortografia 

Arbitrária (A), com a divisão A1 para correspondência fonema-grafema dependente de regras 

(regular regradas) e A2 para correspondência fonema-grafema independente de regras 

(totalmente irregulares), conforme proposto por Batista(2011) e descrito no critério b deste 

estudo. Os juízes receberam pouca instrução e menor interferência desta pesquisadora, já que 

ambos são especialistas na nova proposta de Batista (2011).  

Essas palavras foram distribuídas em alta, média e baixa frequência por meio da 

classificação das palavras, conforme descrita no critério b.  

 
D) Critérios de Frequência de Ocorrência de palavras  

 
Após a aplicação dos critérios de inclusão e de exclusão das palavras, e de codificação 

do Português Brasileiro (SCLIAR-CABRAL, 2003), as palavras foram contabilizadas, a fim de 

levantar a frequência de ocorrência das palavras em cada ano escolar. Para tal, foi realizada uma 

análise estatística para caracterizar as palavras de alta, média e baixa frequência em relação ao 

ano escolar e em relação ao banco completo de palavras, segundo Oliveira e Capellini (2016).  

As palavras de média frequência seriam excluídas desta pesquisa, segundo Kandel e 

Perret (2015), que propuseram o uso de palavras de baixa frequência por ter maior inconsistência 

ortográfica. Entretanto, após a realização dos critérios, as palavras de média frequência foram 

incluídas no estudo, já que houve pouco número de palavras de alta frequência. 

Para classificar como alta, média e baixa frequência, foi realizada uma análise estatística 

da distribuição das palavras. Considerou-se a distribuição por tercis, sendo classificadas em alta, 

média e baixa frequência, caso os valores se encontrem próximos ao centro. De acordo com 

Oliveira e Capellini (2016), a classificação das palavras de modo dicotômico (alta e baixa 

frequência) não foi suficiente para o objetivo proposto, pois uma frequência de 48%, por 


36 

 
exemplo, seria classificada como baixa, e uma de 52%, como alta, apesar de os valores serem 

próximos. 

 
E) Critério do Bigrama  

 
O Bigrama é caracterizado como pares ordenados de letras que coocorrem em 

determinadas posições nas palavras de uma língua (JUSTI; JUSTI, 2009). 

Alguns estudos (KANDEL et al., 2006; KANDEL; SPINELLI, 2010; KANDEL et al., 

2011) indicam que, ao escrever, o escolar tende a agrupar as letras de uma palavra em blocos 

para otimizar a recuperação da grafia. Este procedimento de agrupamento (“chunking” ou 

bigrama) influencia a forma como o sistema de escrita programa os movimentos para produzir 

as letras de uma palavra, sendo que esses pedaços de letras regulam os aspectos espaço-temporais 

do movimento.  

Kandel e colaboradores (2011) destacam que a estratégia de escrita orientada para a 

sílaba apoia a ideia de que as sílabas são um componente essencial da estrutura ortográfica 

mentalmente representada. Estudos apontam para a existência de uma fronteira silábica que 

permite a avaliação de critérios de velocidade e duração intersílabas dentro de uma palavra, mas 

também em palavras de diferentes frequências.  

Assim, o critério utilizado teve a influência do "efeito de sílaba" que, conforme indicado 

nos estudos internacionais, pode ser causada pela presença de baixas frequências e regularidade 

de bigrama no limite da sílaba da palavra, exigindo a segmentação da palavra em blocos de sílaba 

e possibilitando avaliar a integração entre os processos centrais e periféricos da escrita. 

(KANDEL et al., 2006; KANDEL; SPINELLI, 2010; KANDEL et al., 2011). 

Seguindo o critério do Bigrama, elaborou-se uma lista de palavras dissilábicas nas 

sílabas de posição inicial das palavras, possibilitando observar a integração entre os processos 

centrais e periféricos da escrita, a partir de medidas como velocidade, duração e a pausa que 

existem em cada sílaba.  

 
37 

 
4 RESULTADOS 

 
38 

 
O Fluxograma 2 descreve cada etapa deste estudo a partir de cada critério realizado. 

 
Figura 2 - Fluxograma do número de palavras a partir da submissão de cada critério 

deste estudo 

 
Fonte: Elaborada pela autora.  

Legenda: N= natural; A1= dependente de regras; A2= independente de regras; AF= palavras de alta 

frequência; BF= palavras de baixa frequência; MF= palavras de média frequência. 

 
3450

640 palavras

JUÍZ 1

414 palavras 
selecionadas

Selecionadas em 
alta, média e 

baixa frequência

N

19 palavras

AF/ BF= 1

AF/MF= 1

MF/BF= 8

A1

85 palavras

AF/ BF= 26

AF/MF= 5

MF/BF= 29

A2

12 palavras

AF/ BF= 4

MF/BF= 5

JUÍZ 2


39 

 
O Fluxograma 2 apresenta o número de palavras a partir da submissão de cada critério 

deste estudo, os quais serão descritos na sequência.   

 
Os resultados seguem a sequência dos critérios descritos anteriormente no item de 

procedimentos metodológicos. 

 
A) Em relação aos critérios utilizados na inclusão e de exclusão de palavras do 

português 

 
Nesta primeira etapa, as palavras extraídas do banco do Laboratório de Investigações dos 

Desvios da Aprendizagem (LIDA) / Universidade Estadual Paulista Júlio de Mesquita Filho 

(UNESP) – Marília/SP (OLIVEIRA; CAPELLINI, 2016) totalizaram 3.450 e foram distribuídas 

em planilha de Excel.  

Inicialmente, as palavras eram compostas de várias classes gramaticais (pronomes, 

preposições, adjetivos, advérbios, verbos e substantivos), porém foram incluídos, por meio de 

uma planilha Excel, apenas substantivos, dissílabos, por constituírem uma classe frequente em 

qualquer texto, visto que exercem funções sintáticas importantes na frase.  

Ainda, excluíram-se: as palavras escritas em outros idiomas, advérbios, locuções 

adverbiais, locuções prepositivas, adjetivos, meses do ano, numerais, palavras no aumentativo 

ou diminutivo, gírias, palavras compostas por justaposição (OLIVEIRA; CAPELLINI, 2016); as 

palavras monossilábicas, trissilábicas e polissilábicas, que não permitiriam a comparação para o 

mesmo número de letras; palavras diacríticas, ou seja, palavras que apresentam algum sinal 

gráfico que se coloca sobre, sob ou através de uma letra para alterar a sua realização fonética, 

isto é, o som, ou para marcar qualquer outra característica linguística. Foram considerados sinais 

diacríticos: acento agudo, acento grave, acento circunflexo, trema e til e palavras com “ç”. Esse 

critério também foi utilizado considerando-se o número fixo de “strokes” (picos cursivos) para 

cada letra (GERMANO; 2018; KANDEL et al., 2015). A partir desta etapa, restaram cerca de 

640 palavras.  

 
40 

 
B) Critérios relacionados às regras de codificação do Português Brasileiro 

(SCLIAR-CABRAL, 2003). 

Nesta etapa, analisaram-se 640 palavras, classificadas de acordo com as regras de 

codificação de Scliar-Cabral (2003), tendo como base os princípios alfabéticos do Português do 

Brasil.  

Este critério foi adotado devido à influência da codificação com os parâmetros de escrita 

manual (KANDEL; PERRET (2015). Inicialmente, a classificação foi realizada por esta 

pesquisadora, utilizando os critérios de codificação (Regra |C1|; Regra |C2| e Regra |C3|).  

A Tabela 1 apresenta exemplos destas classificações conforme a sílaba.    

 
Tabela 1- Exemplos de classificação das sílabas das palavras em relação às regras de 

codificação  

 
Palavras Sílaba 1 Sílaba 2 Classificação 

Bife C1   C1         N 

Duna C1   C1         N 

Fama C1   C1         N 

Feto C1   C1         N 

Mapa C1   C1         N 

Sangue C2.4 C2.16.2 C2.2         A1 

Suco C2.4   C2.1         A1 

Carta C2.1 C2.11 C1         A1 

Gago C2.2   C2.2         A1 

Carta   C2.1 C2.11 C1         A1 

Jegue C3.7   C2.2         A2 

Senso C3.3.1 C2.16.2 C3.3.5         A2 

Germe C3.7 C2.11 C1         A2 

Seta C3.3.1   C1         A2 

Xale C3.6   C2.12         A2 

Fonte: Elaborada pela autora.  

 
41 

 
Na Tabela 1, podem-se observar sílabas que apresentam mais de uma regra, devido à 

complexidade silábica. Por exemplo: a palavra /carta/, em que a primeira sílaba /ca/ corresponde 

à regra C2.1 (A1) (conversão dos fonemas aos grafemas dependente da posição e/ou do contexto 

fonético), que é a realização da consoante /k/ em início de sílaba. A letra /r/ correspondente à 

sílaba /car/ C2.11 (A1) refere-se ao arquifonema /R/ em final de sílaba interna e em final de 

vocábulo. A sílaba /ta/ é referente à regra C1 (N), ou seja, conversão dos fonemas aos grafemas 

independente de contexto (SCLIAR-CABRAL, 2003). 

 
C) Submissão a Juízes  

 
Após a classificação das palavras, os dois juízes especialistas na área de ortografia 

analisaram a concordância entre as regras gramaticais empregadas. Cada juiz recebeu o termo de 

concordância para participar do estudo e instrução para o julgamento, ou seja, o juiz verificou se 

a classificação das sílabas foi realizada de acordo com as regras C.1, C.2 e C.3, regras de 

codificação do Português Brasileiro, descritas por Scliar-Cabral (2003a, p. 124-180; 2003b, p. 

77-96). Essas palavras foram distribuídas em alta, média e baixa frequência por meio da 

classificação das mesmas como Ortografia Natural (N), Ortografia Arbitrária (A), com a divisão 

A1 para correspondência fonema-grafema dependente de regras (regular regradas) e A2 para 

correspondência fonema-grafema independente de regras (totalmente irregulares). 

Nesta etapa, foram excluídas as palavras classificadas de acordo com as regras de 

codificação de Scliar-Cabral (2003) pelos juízes, e que houve discordância entre a classificação 

dos mesmos, por sugestão do estatístico, já que o número de discordância foi extremamente baixo 

(menor que 5%).  

Além disso, por consenso entre os julgadores, foram excluídas: as palavras iniciadas por 

vogais orais, já que no sistema ortográfico brasileiro não há conversões fonografêmicas regulares 

(BATISTA, 2011; SCLIAR-CABRAL, 2003); as palavras que não foram encontradas no 

dicionário; e as que figuravam   com H inicial, já que, no início ou no fim das palavras, o /H/ não 

tem valor fonético, conserva-se apenas como símbolo por força da etimologia e tradição 

(BATISTA, 2011; SCLIAR-CABRAL, 2003). Nesta etapa, havia 414 palavras.  


42 

 
A seguir, um quadro que contém exemplos de palavras excluídas deste estudo por 

sugestão dos juízes. 

 
Tabela 2 - Exemplos de palavras excluídas do estudo e justificativa dos Juízes 

 
Palavras Justificativa 

Aba Vogais orais 

Aipim Vogais orais 

Haste Sem valor fonético (H) 

Hena Sem valor fonético (H) 

Bite Não foi encontrada no dicionário 

Cripto Não foi encontrada no dicionário 
Fonte: Elabora pela autora.  

 
Analisaram-se, pois, os resultados para verificar aqueles estatisticamente significantes e 

com a menor diferença entre os juízes.  

Antes da avaliação, definiu-se um nível de significância (quanto se admite errar nas 

conclusões estatísticas, ou seja, o erro estatístico que se comete nas análises) de 0,05 (5%). 

Ressalta-se também que todos os intervalos de confiança foram construídos com 95% de 

confiança estatística.  

Na Tabela 3, analisa-se a distribuição dos resultados de Classificação, sílaba 1 e sílaba 2 

para cada um dos juízes, utilizando-se o teste de Igualdade de Duas Proporções e calculando-se 

os percentuais para o total de 414 casos.  

 
Tabela 3: Distribuição da Classificação por Juiz 

 
Classificação 

Juiz 1 Juiz 2 

N % 
Valor de 

P 
N % 

Valor de 

P 

A1 (Dependente de regras) 269 65,0% Ref. 269 65,0% Ref. 

A2 (Independente de regras) 104 25,1% <0,001* 104 25,1% <0,001* 

Natural 41 9,9% <0,001* 41 9,9% <0,001* 
Fonte: Estatística própria para o estudo. 

Legenda: N= número; %= porcentagem; Ref.= referência.  

Teste de Igualdade de Duas Proporções.  

 
Como a classificação tem mais de dois níveis de resposta, a última coluna mostra os 

valores da comparação de cada nível de resposta sempre em relação ao mais prevalente que está 

como Referência (Ref.).  


43 

 
Para ambos os juízes, a mais prevalente foi a classificação de A1 (dependente de regras), 

com 65,0% para ambos, sendo este um percentual estatisticamente significante; em segundo 

lugar, a classificação de A2 (independente de regras), com 25,1% para ambos os juízes.  

A seguir, observa-se a caracterização da distribuição da frequência relativa do resultado 

de Sílaba 1 (posição inicial) e 2 (posição final), em cada um dos juízes, conforme as Tabelas 4 e 

5, respectivamente.  

 
Tabela 4: Distribuição da Sílaba 1 por Juiz 

Sílaba 1 
Juiz 1 Juiz 2 

N % Valor de P N % Valor de P 

C1 224 54,1% Ref. 224 54,1% Ref. 

C1/C2.10 3 0,7% <0,001* 3 0,7% <0,001* 

C2 1 0,2% <0,001* 1 0,2% <0,001* 

C2.1 48 11,6% <0,001* 46 11,1% <0,001* 

C2.11 18 4,3% <0,001* 18 4,3% <0,001* 

C2.12 28 6,8% <0,001* 28 6,8% <0,001* 

C2.16.2 3 0,7% <0,001* 3 0,7% <0,001* 

C2.2 15 3,6% <0,001* 15 3,6% <0,001* 

C2.4 14 3,4% <0,001* 14 3,4% <0,001* 

C2.5 3 0,7% <0,001* 3 0,7% <0,001* 

C2.6 0 0,0% <0,001* 2 0,5% <0,001* 

C2.8 9 2,2% <0,001* 9 2,2% <0,001* 

C3.2 0 0,0% <0,001* 2 0,5% <0,001* 

C3.3.1 8 1,9% <0,001* 21 5,1% <0,001* 

C3.3.6 13 3,1% <0,001* 0 0,0% <0,001* 

C3.4.1 0 0,0% <0,001* 1 0,2% <0,001* 

C3.4.2 1 0,2% <0,001* 0 0,0% <0,001* 

C3.5 1 0,2% <0,001* 0 0,0% <0,001* 

C3.6 16 3,9% <0,001* 15 3,6% <0,001* 

C3.7 9 2,2% <0,001* 9 2,2% <0,001* 
Fonte: Estatística própria para o estudo. 

Legenda: N= número; %= porcentagem; Ref.= referência. 

Teste de Igualdade de Duas Proporções. 

 
Tabela 5: Distribuição da Sílaba 2 por Juiz 

Sílaba 2 

Juiz 1 Juiz 2 

N % 
Valor 

de P 
N % 

Valor 

de P 

C1 242 58,5% Ref. 243 58,7% Ref. 

C1/C2.10 2 0,5% <0,001* 2 0,5% <0,001* 


44 

 
C2.1 37 8,9% <0,001* 36 8,7% <0,001* 

C2.10 13 3,1% <0,001* 14 3,4% <0,001* 

C2.11 3 0,7% <0,001* 3 0,7% <0,001* 

C2.12 15 3,6% <0,001* 15 3,6% <0,001* 

C2.16.2 7 1,7% <0,001* 7 1,7% <0,001* 

C2.2 26 6,3% <0,001* 26 6,3% <0,001* 

C2.5 6 1,4% <0,001* 4 1,0% <0,001* 

C2.8 8 1,9% <0,001* 8 1,9% <0,001* 

C2.9 8 1,9% <0,001* 7 1,7% <0,001* 

C3.1 2 0,5% <0,001* 2 0,5% <0,001* 

C3.2 1 0,2% <0,001* 2 0,5% <0,001* 

C3.3.2 1 0,2% <0,001* 0 0,0% <0,001* 

C3.3.3 2 0,5% <0,001* 3 0,7% <0,001* 

C3.3.4 1 0,2% <0,001* 2 0,5% <0,001* 

C3.3.5 3 0,7% <0,001* 2 0,5% <0,001* 

C3.3.6 4 1,0% <0,001* 4 1,0% <0,001* 

C3.4.1 0 0,0% <0,001* 1 0,2% <0,001* 

C3.4.2 1 0,2% <0,001* 1 0,2% <0,001* 

C3.5 17 4,1% <0,001* 17 4,1% <0,001* 

C3.6 10 2,4% <0,001* 10 2,4% <0,001* 

C3.7 5 1,2% <0,001* 5 1,2% <0,001* 
Fonte: Estatística própria para o estudo. 

Legenda: N= número; %= porcentagem; Ref.= referência. 

Teste de Igualdade de Duas Proporções. 

 
No resultado da Sílaba 1, constatou-se diferença significante para a classificação da 

sílaba 1 para todas as regras, indicando concordância entre os juízes na distribuição das regras 

ortográficas, com maior frequência da regra C1: 54,1% para ambos os juízes. 

Na Sílaba 2, a resposta mais recorrente também foi o C1, com 58,5% para o Juiz 1 e 

58,7% para o Juiz 2. 

Por fim, realizou-se a análise de concordância entre os juízes, feita para os resultados de 

Sílaba 1, Sílaba 2 e na classificação. Foi utilizado o índice de Kappa, proposto por Cohen (1960), 

que é o coeficiente mais utilizado quando se classificam dados em categorias nominais (CHEN; 

KRAUSS, 2004). Cohen desenvolveu o índice de Kappa como um coeficiente de concordância 

dos julgamentos de dois juízes para dados nominais, em alternativa aos coeficientes de fidelidade 

existentes para os dados em escalas de magnitude. Atualmente, o coeficiente de Kappa continua 

sendo amplamente utilizado (FONSECA; SILVA; SILVA, 2007). 

 
Tabela 6: Concordância entre Juízes 

 Kappa 
Valor 

de P 


45 

 
Silaba 1 0,943 <0,001* 

Silaba 2 0,970 <0,001* 

Classificação 0,952 <0,001* 
Fonte: Estatística própria para o estudo. 

Índice de Concordância de Kappa. 

 
 Na tabela anterior, verificou- se concordância estatisticamente significante para as três 

análises, em que  em Sílaba 2 tem-se o maior resultado, com Kappa: 0,970; em classificação, o 

Kappa ficou em 0,952, todos considerados ótimos.  

Para entender melhor os resultados, é necessário observar como funciona o índice Kappa: 

se este for igual a 0, indica concordância nula; se for maior que zero, concordância acima do 

esperado pelo simples acaso (para um teste monocaudal, tem-se, então: H0: K=0; H1: K>0). 

Aclare-se, nesse momento, que um Kappa com valor negativo, que não tem interpretação 

possível, pode resultar em um nível crítico igualmente impossível em termos estatísticos e, com 

isso, apontar um valor de p maior do que um. No caso de a hipótese de nulidade (Kappa=0) ser 

rejeitada, a medida de concordância observada é significantemente maior do que zero, indicando, 

assim, a existência de concordância entre os juízes (PAES, 2008).  

A seguir, a Tabela 7 explica o índice Kappa em dados observados na literatura. Landis 

e Koch (1977) sugerem a seguinte interpretação: 

Tabela 7 – Valores de Kappa e sua interpretação 
Valores de Kappa Interpretação 

<0 Ausência de concordância 

0-0, 19 Concordância pobre 

0, 20-0, 39 Concordância leve 

0, 40-0, 59 Concordância moderada 

0, 60-0, 79 Concordância substantiva 

0, 80-1, 00 Concordância quase perfeita 

Fonte: Adaptado de Landis e Koch (1977).  

 
D) Em relação aos critérios de Frequência de Ocorrência de palavras 

 
Após a aplicação dos critérios de inclusão e de exclusão das palavras, e de codificação 

do Português Brasileiro (SCLIAR-CABRAL, 2003), as palavras foram contabilizadas, e restaram 

414 palavras selecionadas para levantar a frequência de ocorrência. 


46 

 
  Conforme o banco de palavras utilizado (OLIVEIRA; CAPELLINI, 2016), elas foram 

distribuídas em palavras de alta, média e baixa frequência. Foi utilizado o banco completo.   

As palavras de média frequência seriam excluídas desta pesquisa, seguindo o proposto 

por Kandel e Perret (2015), isto é, para verificar a diferença dos parâmetros de escrita manual, o 

ideal seria comparar palavras de alta com as de baixa frequência, pois as palavras de baixa 

frequência têm maior inconsistência ortográfica. Entretanto, após a realização do critério “d” 

(descrito na sequência), verificou-se um número reduzido de palavras de alta frequência. Deste 

modo, foi necessária a utilização de palavras de média frequência. Portanto, para esta pesquisa, 

foi adotado o proposto por Oliveira e Capellini (2016). 

De acordo com Oliveira e Capellini (2016), a classificação das palavras de modo 

dicotômico (alta e baixa frequência) não foi suficiente para o objetivo proposto, pois uma 

frequência de 48%, por exemplo, seria classificada como baixa, e uma de 52%, como alta, apesar 

de os valores serem próximos.  

Portanto, das 414 palavras selecionadas, restaram 102 palavras que foram combinadas 

entre si pelo critério do bigrama. 

A Tabela 8 apresenta o número de palavras de alta, média e baixa frequência após a 

aplicação dos critérios anteriores. 

 
Tabela 8- Distribuição das palavras de alta, média e baixa frequência após a aplicação dos 

critérios “a” e “b” 

 
Palavras de  

alta frequência 

Palavras de  

média frequência 

Palavras de  

baixa frequência 

12 30 
 

60 

 
   Fonte: Elaborada pela autora.  

 
Na Tabela 8, observa-se uma distribuição irregular da quantidade de palavras de acordo 

com o número de palavras. Esta tabela explica a ocorrência de palavras de média frequência para 

este estudo, já que houve poucas palavras de alta frequência para a realização da lista, de acordo 

com o bigrama. 

 
47 

 
E) Em relação ao critério do Bigrama 

 
Segundo Kandel e Perret (2015), a programação motora acontece de forma “on-line”: 

primeiro, o escolar programa a primeira sílaba; logo após, o escolar recupera novamente a 

informação da palavra; e depois, recupera a segunda sílaba ao escrever, em tempos diferentes. 

Esse critério de comparação é realizado por meio do bigrama.  

O bigrama foi realizado considerando, inicialmente, as regras ortográficas citadas 

anteriormente (N, A1, A2), e posteriormente, foram consideradas as frequências das palavras 

analisadas (alta, média e baixa frequência).  

A Tabela 9 apresenta exemplos quanto à classificação da codificação Natural (N) e 

quanto às regras e frequência para as palavras, para a formação dos pares de comparação com o 

critério do Bigrama. Foram formados dez pares. 

 
Tabela 9- Exemplos de palavras quanto à classificação da codificação Natural (N) e 

quanto às regras e frequência para as palavras  

 
Classificação Natural - N 

Palavras de  

Alta frequência 

Palavras de  

média frequência 

Palavras de  

baixa frequência 

Vida -- Vinho 

-- Povo Pote 

Fonte: Elaborada pela autora.  

 
A Tabela 10 apresenta exemplos quanto à classificação da codificação Arbitrária 

(subtipo A1) e quanto às regras e frequência para as palavras, para a formação dos pares de 

comparação com o critério do Bigrama. Foram formados nove pares. 

 
Tabela 10- Exemplos de palavras quanto à classificação da codificação Arbitrária 

(subtipo A1) e quanto às regras e frequência para as palavras 

  
Classificação Arbitrária – A1 

Palavras de  

Alta frequência 

Palavras de  

média frequência 

Palavras de  

baixa frequência 


48 

 
Rato -- Ramo 

-- Sopa Soro 

Fonte: Elaborada pela autora.  

 
A Tabela 11 apresenta exemplos quanto à classificação da codificação Arbitrária (subtipo 

A2) e quanto às regras e frequência para as palavras, para a formação dos pares de comparação 

com o critério do Bigrama. Foram formados 55 pares. 

 
Tabela 11- Exemplos de palavras quanto à classificação da codificação Arbitrária 

(subtipo A2) e quanto às regras e frequência para as palavras. 

Classificação Arbitrária – A2 

Palavras de  

Alta frequência 

Palavras de  

média frequência 

Palavras de  

baixa frequência 

Senhor -- Seta 

-- Chave Chapa 

Fonte: Elaborada pela autora.  

 
Ao todo, foram formados 74 pares de bigramas. Algumas palavras foram repetidas, 

como, por exemplo, as palavras de média frequência, para que os pares de Bigrama pudessem 

ser comparados de acordo com as frequências (alta e baixa), já que não houve palavras de alta 

frequência suficientes para o estudo. 

Nos exemplos, percebe-se a coocorrência de pares ordenados de letras nas sílabas 

iniciais de cada palavra. As palavras presentes neste estudo foram utilizadas em dissílabas e 

submetidas ao critério do bigrama, para observar a velocidade e a pausa que existem em cada 

sílaba. A velocidade no ato da escrita e a pausa ocorrem na quebra de uma sílaba a outra, já que 

a programação motora de cada sílaba é diferente, existindo pausas entre as sílabas.


49 

 
Finalmente, a Tabela 12 apresenta a lista com os exemplos de palavras elaboradas para 

este estudo. 

 
Tabela 12 – Lista de palavras de acordo com a classificação e codificação das palavras 

Classificação Natural – N 

Palavras de alta 

Frequência 

Palavras de 

Média frequência 

Palavras de 

Baixa frequência 

-- Fome Fone 

Pato -- Palha 

-- Tipo Time 

   
Vida -- Vinho 

Classificação Arbitrária (regular regradas) – A1 

-- Anta Anjo 

Cara -- Cabo 

Cara -- Caco 

Cara -- Caju 

Pedra Peru Penhor 

Classificação Arbitrária (totalmente irregular) – A2 

-- Base Bazar 

Senhor -- Senha 

Senhor -- Seta 

-- Massa Matriz 

-- Massa Macho 

Fonte: Elaborada pela autora.  

 
50 

 
5 DISCUSSÃO 

 
51 

 
A partir dos resultados deste estudo, conclui-se que foi possível a criação de lista de 

palavras baseadas nos critérios de codificação de Scliar-Cabral (2003), em que se têm diferentes 

complexidades silábicas. Durante a elaboração desta pesquisa, foram considerados os seguintes 

critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de 

codificação do Português Brasileiro (SCLIAR-CABRAL, 2003); c) submissão a juízes; d) 

frequência de ocorrência de palavras; e) bigrama. A partir destes critérios, o número de palavras 

foi se afunilando. De 3.450 palavras, restaram 640, que foram submetidas à classificação por 

dois juízes especialistas, restando apenas 414 palavras; estas, após a classificação, foram 

submetidas aos critérios do bigrama, formando pares a partir de 102 palavras. 

Utilizando o critério do bigrama, classificaram-se os pares de palavras em alta, média e 

baixa frequência, de acordo com a regularidade e irregularidade das palavras. Ao observar esta 

classificação, registrou-se que palavras de alta frequência foram minoria (apenas 12), enquanto 

palavras de média e baixa frequência foram a maioria deste estudo (30 e 60 palavras, 

respectivamente).  

Como demonstrado na Tabela 12, a lista final de palavras contém pares formados em 

alta frequência/baixa frequência; alta frequência/média frequência; média frequência/baixa 

frequência; e foram separados em Ortografia Natural (N); Ortografia Arbitrária (A1) – 

dependente de regras e Ortografia Arbitrária (A2) – independente de regras (BATISTA, 2011). 

Alguns dos pares foram exemplificados nas tabelas: Ortografia natural: Alta frequência/baixa 

frequência: Pato – Palha; Média frequência/baixa frequência: Fome – Fone; Ortografia 

Arbitrária (A1): Alta frequência/baixa frequência: Cara – Cabo; Média frequência/baixa 

frequência: Peru – Penhor; Alta frequência/média frequência: Pedra – Peru; Ortografia 

Arbitrária (A2): Alta frequência/baixa frequência: Senhor – Senha; Média frequência/baixa 

frequência: Base – Bazar. 

Este estudo corrobora Afonso, Suárez-coalla e Cuetos (2015), que também elaboraram 

uma lista de palavras para a produção da escrita, com frequências diferentes, com escolares 

espanhóis. Entretanto, os pesquisadores espanhóis buscaram as palavras de um banco 

frequência de palavras de um programa já existente, o “BuscaPalabras” (DAVIS; PEREA, 

2005), em que o usuário do programa acessa palavras com frequências diferentes, frequência 

de sílabas, frequência de bigramas e bifones, semelhança ortográfica, estrutura ortográfica e 

fonológica.  

 
52 

 
             Kandel e Perret (2015a; 2015b), em pesquisa com escolares franceses, também 

elaboraram uma lista de palavras, utilizando um banco existente de palavras de alta e baixa 

frequência, regulares e irregulares para a escrita, de um dicionário francês (PEEREMAN; 

LÉTÉ; SPRENGER-CHAROLLES, 2007). 

 No Brasil, não há muitos estudos sobre listas de palavras de acordo com todos os 

critérios adotados, assim como neste estudo. Destaca-se a disponibilidade do banco de palavras 

por frequência, de Oliveira e Capellini “E-leitura I”, “E-leitura II” e “E-leitura III” (OLIVEIRA, 

CAPELLINI, 2016; OLIVEIRA et al., 2020), com o levantamento de palavras de livros de 

leitura do Ensino Fundamental I, II e Ensino Médio, respectivamente. Entretanto, tais bancos, 

utilizados neste estudo, não contemplam os critérios de codificação ortográfica e 

especificamente o Bigrama para a criação de listas de palavras. 

Os estudos de Pinheiro e Rothe-Neves (2001) afirmam que o efeito de variações nos 

níveis de familiaridade de palavras - fator frequência de ocorrência de palavras - tem recebido 

influência nas funções da rota léxico-fonêmica, que pode ocorrer em nível de reconhecimento 

(no léxico visual de entrada) ou na operação de recuperação lexical da pronúncia (léxico 

fonêmico de saída), na leitura, ou no nível de produção (léxico grafêmico de saída), na escrita.  

De acordo com os autores, as palavras de alta frequência, por requererem menor 

ativação, tendem a ser reconhecidas/produzidas mais rapidamente e/ou mais corretamente do 

que aquelas com baixa ocorrência - palavras de baixa frequência. Essa vantagem em termos de 

processamento, para o primeiro tipo de palavras, é conhecida como efeito de frequência.  

No estudo, foi possível observar menor quantidade de palavras de alta frequência, o 

que pode influenciar a escrita das palavras, ou seja, palavras de alta frequência podem ser 

escritas mais rapidamente pelos escolares, já que o acesso à entrada do léxico ortográfico é mais 

rápido para estas palavras (que são familiares) do que para as de baixa frequência.  

Palavras regulares e de alta frequência são palavras familiares e, de acordo com os 

estudos de Ávila, Paolucci (2009) e Capovilla, Macedo (2001), a frequência do aparecimento 

da palavra na língua está relacionada à familiaridade com ela, e as representações ortográficas 

são construídas a partir de metanálises realizadas pelo escolar e das repetidas exposições às 

palavras escritas.  

No entanto, as palavras de baixa frequência podem não possuir representações 

ortográficas no léxico mental e, portanto, serem lidas ou escritas pela rota fonológica 

(CAPOVILLA; CAPOVILLA; MACEDO, 2001; PAOLUCCI, ÁVILA, 2009).  

Tais informações corroboram este estudo, em que a lista apresenta maior número de 

palavras de média e baixa frequência, exigindo maior memória visual para o acesso lexical, ou 


53 

 
seja, o escolar precisará utilizar a rota lexical mais a memória fonológica para codificar o 

som/letra nas palavras de média e baixa frequência. 

As palavras de baixa frequência são relacionadas ao processo de conversão fonema-

grafema que vem do estímulo fonológico, é dele que as informações apreendidas (como sons, 

letras e outras unidades sublexicais) são convertidas em grafias para as cadeias sonoras. 

A rota lexical é necessária para realizar a escrita de vocábulos conhecidos já 

armazenados na memória ortográfica, em função de práticas repetidas de escrita. Esse 

movimento é chamado de sistema de reconhecimento visual das palavras. Na rota lexical, 

palavras que ocorrem com frequência são reconhecidas automaticamente, diferentemente de 

palavras que ocorrem com menor frequência, fenômeno este denominado efeito de frequência. 

Isso explica o fato de palavras conhecidas possuírem unidades de reconhecimento no léxico de 

entrada visual (CARDOSO; FREITAS, 2019). 

Para a escrita de novos vocábulos, usa-se a rota fonológica. Após a exposição da palavra, 

é feita a verificação dos grafemas, fragmentando-os em microunidades (grafemas e morfemas), 

unindo-os aos seus sons correspondentes. As palavras em que as transformações de fonemas 

em grafemas não seguem as regras dificultam a escrita precisa, isso recebe o nome de efeito de 

regularidade e explica a transformação de fonemas em grafemas em palavras regulares, que 

seguem regras, o mesmo não acontece com palavras irregulares (CARDOSO; FREITAS, 2019; 

ELLIS, 2001). 

O estudo de Pinheiro (1995, 2006) investigou as habilidades de escrita e de leitura de 

palavras reais e de não palavras isoladas, entre crianças da 1ª à 4ª série de uma escola particular. 

Em relação à escrita e leitura de palavras reais, os resultados mostraram que: tanto em termos 

de precisão quanto de tempo de processamento, houve um efeito da frequência e da 

escolarização na escrita e na leitura, tendo ocorrido também uma interação entre estes fatores; 

respectivamente, houve influência lexical na escrita e na leitura, além de ganho em proficiência 

e rapidez na leitura com a escolarização; a frequência das palavras afetou de forma diferente a 

escrita das crianças das séries iniciais e das finais. Isto mostra que a regularidade, a 

irregularidade e a frequência das palavras influenciam nas habilidades de escrita e leitura.  

A ideia da criação destas listas de palavras deste estudo é que possam ser utilizadas 

posteriormente para auxiliar futuras medidas de interação entre processos centrais e periféricos 

na duração da produção da escrita, já que, no Brasil, há poucos estudos que relacionem estes 

processos e a escrita manual, e que tenham uma lista de palavras para auxiliar neste processo. 

A lista de palavras deste estudo faz referência aos aspectos do processamento central, 

que podem ser descritos como uma memória operacional a longo prazo (léxico ortográfico), 


54 

 
conversão fonema-grafema e memória de trabalho ortográfica (graphemic buffer), já que as 

palavras de alta frequência estão no estoque de grafias das palavras familiares, que é conhecido 

como memória de longo prazo ortográfica (léxico ortográfico). Para o escolar, as palavras de 

baixa frequência são realizadas no processo de conversão fonema-grafema a partir do estímulo 

fonológico de palavras não familiares. Dessa forma, os processos centrais ficam ativos, pois 

antecipam e processam as informações das sílabas e palavras. 

 
6 CONCLUSÃO 

 
55 

 
Aprender a escrever envolve um trabalho árduo. Escrever exige aptidão linguística, 

que engloba particularidades do processamento central e periférico. Portanto, foi possível a 

criação de uma lista de palavras de acordo com os critérios de codificação de frequência da 

Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e 

periféricos e duração da produção da escrita. 

Atualmente, não são muitos os estudos brasileiros que se concentram em criar listas de 

palavras que possam auxiliar em medidas que analisem a interação de aspectos centrais e 

periféricos na escrita manual.  

Desse modo, a lista elaborada neste estudo foi composta por 9 palavras consideradas 

naturais (N); 85 palavras dependentes de regras (A1); e 12 palavras independentes de regras 

(A2).  Essas palavras foram divididas em 12 palavras de alta frequência, 30 de média frequência 

e 60 palavras de baixa frequência, que podem afetar a produção das palavras no ato da escrita 

em softwares. Para a escrita de palavras dependentes de regras, torna-se necessário um maior 

ensino sistemático de regras, do que para aquelas independentes de regras. As palavras de alta 

frequência tendem a ser produzidas mais rapidamente do que palavras de baixa frequência 

devido a ocorrência no cotidiano. 

Portanto, esta lista poderá contribuir para a realização de medidas de escrita manual a 

partir do uso de instrumentos sensíveis à avaliação deste parâmetro, como softwares ou outros 

parâmetros escolhidos por profissionais da área, como fonoaudiólogos ou professores. 

 
56 

 
REFERÊNCIAS 

 
57 

 
AFONSO, O. et al. The impact of word frequency on peripheral process during handwriting. 

A matter of age. Quartely Journal of Experimental Psychology, v.71, n. 3, p. 695-703, 

2018. Disponivel em:  https://doi.org/10.1080/17470218.2016.1275713. Acesso em: 11 abr. 

2021.   

 
AFONSO, O.; SUÁREZ-COALLA, P.; CUETOS, F. Spelling impairments in Spanish 

dyslexic adults. Frontiers in psychology, v. 6, p. 466, 2015. Disponivel em: 

https://doi.org/10.3389/fpsyg.2015.00466. Acesso em: 26 abr.2021. 

 
ALÉGRIA, J.; LEYBAERT, J.; MOUSTY, P. Aquisição da leitura distúrbios associados: 

avaliação, tratamento e teoria. Avaliação dos problemas de leitura: Os novos modelos 

teóricos e suas implicações diagnósticas, p. 105-124, 1997. 

ALGOZZINE, B. et al. Improving phonological awareness and decoding skills of high school 

students from diverse backgrounds. Preventing School Failure: Alternative Education for 

Children and Youth, v. 52, n. 2, p. 67-72, 2008. Disponivel em: 

https://doi.org/10.3200/PSFL.52.2.67-72. Acesso em: 13 abr.2021.  

AMORIM, W. et al. Neurofisiologia da escrita: O que acontece no cérebro humano quando 

escrevemos?. Neuropsicologia Latinoamericana, v. 8, n. 1, 2016. Disponivel em:  

DOI: 10.5579/rnl.2016.0260. Acesso em: 26 abr.2021.  

 
ANGELELLI, P. et al. Spelling impairments in Italian dyslexic children with and without a 

history of early language delay. Are there any differences? Frontiers in psychology, v. 7, p. 

527, 2016. Disponivel em: https://doi.org/10.3389/fpsyg.2016.00527. Acesso em: 26 

abr.2021.  

 
BATISTA, A. Desempenho ortográfico de escolares do 2º ao 5º ano: proposta de 

elaboração de um protocolo de avaliação da ortografia. Dissertação (mestrado – 

Educação) – Universidade Estadual Paulista, Faculdade de Filosofia e Ciencias, 2011. 

 
BAXTER, D.; WARRINGTON, E. Ideational agraphia: a single case study. Journal of 

Neurology, Neurosurgery & Psychiatry, v. 49, n. 4, p. 369-374, 1986.Disponivel em:  

doi: 10.1136/jnnp.49.4.369. Acesso em: 28 abr.2021. 

 
CAPELLINI, S.; BATISTA, A. Subsídios da fonologia e ortografia para a compreensão 

da disortografia. Ferreira-Gonçalves G, Keske-Soares M, Brum de Paula M, organizadores. 

Estudos em aquisição fonológica. No prelo, 2011. 

 
CAPELLINI, S. et al. Desempenho de escolares em consciência fonológica, nomeação rápida, 

leitura e escrita. Pró-Fono Revista de Atualização Científica, v. 22, n. 3, p. 239-44, 2010. 

Disponivel em:  http://dx.doi.org/10.1590/S0104-56872010000300014. Acesso em: 16 

abr.2021.  

 
CAPELLINI, S. et al. Desempenho ortográfico de escolares do 2º ao 5º ano do ensino 

público. J Soc Bras Fonoaudiol, v. 23, n. 3, p. 227-36, 2011.Disponivel em: 

http://dx.doi.org/10.1590/S2179-64912011000300008. Acesso em: 03 maio 2021.  

 
https://doi.org/10.1080/17470218.2016.1275713
https://doi.org/10.3389/fpsyg.2015.00466
https://doi.org/10.3200/PSFL.52.2.67-72
https://doi.org/10.3389/fpsyg.2016.00527
https://dx.doi.org/10.1136%2Fjnnp.49.4.369
http://dx.doi.org/10.1590/S0104-56872010000300014
http://dx.doi.org/10.1590/S2179-64912011000300008


58 

 
CAPOVILLA, F.; CAPOVILLA, A.; MACEDO, E. Rota perilexical na leitura em voz alta: 

Tempo de reação, duração e segmentação na pronúncia. Psicologia: reflexão e crítica, v. 14, 

n. 2, p. 409-427, 2001.Disponivel em:  http://dx.doi.org/10.1590/S0102-

79722001000200015.Acesso em: 28 abr.2021.  

 
CARAMAZZA, A.; MICELI, G. The structure of graphemic representations. Cognition, v. 

37, p. 243–297, 1990. Disponivel em: https://doi.org/10.1016/0010-0277(90)90047-N. Acesso 

em: 15 abr.2021.  

CARREIRAS, M.; GRAINGER, J. Sublexical representations and the ‘front end’of visual 

word recognition. Language and Cognitive Processes, v. 19, n. 3, p. 321-331, 

2004.Disponivel em: DOI: 10.1080/01690960344000288. Acesso em: 07 maio 2021.  

 
CASSAR, M.; TREIMAN, R. The beginnings of orthographic knowledge: Children's 

knowledge of double letters in words. Journal of educational psychology, v. 89, n. 4, p. 631, 

1997. Disponivel em: https://doi.org/10.1037/0022-0663.89.4.631. Acesso em: 28 abr.2021.  

 
CHEN, P.; KRAUSS, A. Interrater agreement. The sage encyclopedia of social science 

research methods, v. 2, p. 511-513, 2004.  

 
CHIARAMONTE, T.; CAPELLINI, S. Relação do perfil de erros de leitura e escrita na 

dislexia e dificuldades de aprendizagem. Revista Teias, v. 20, n. 58, p. 319-329, 

2019.Disponivel em: doi: https://doi.org/10.12957/teias.2019.40287. Acesso em; 04 maio. 

2021. 

 
COHEN, J. A coefficient of agreement for nominal scales. Educational and psychological 

measurement, v. 20, n. 1, p. 37-46, 1960.Disponivel em: 

https://doi.org/10.1177/001316446002000104. Acesso em: 06 maio. 2021. 

 
CORREA, J. et al. Using spelling skills in Brazilian Portuguese and English. Journal of 

Portuguese Linguistics, Lisboa, v. 6, n. 2, p. 61-82. 2007.Disponivel em:   

https://doi.org/10.1590/1981-5794-1709-8 . Acesso em: 28 abr 2021.  

 
DAVIS, C.; PEREA, M. BuscaPalabras: A program for deriving orthographic and 

phonological neighborhood statistics and other psycholinguistic indices in Spanish. Behavior 

Research Methods, v. 37, n. 4, p. 665-671, 2005.Disponivel em:  doi: 10.3758/bf03192738. 

Acesso em: 04 maio. 2021.  

 
DE CARVALHO RODRIGUES, J.; DE SALLES, J. Tarefa de escrita de 

palav