unesp UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” Faculdade de Ciências e Letras Campus de Araraquara - SP MURILO GOUVEA ALVES Anotando em treebank e traduzindo com alinhamento na leitura e tradução de Epicteto, I,1-5 ARARAQUARA – S.P. 2023 MURILO GOUVEA ALVES Anotando em treebank e traduzindo com alinhamento na leitura e tradução de Epicteto, I,1-5 Dissertação de Mestrado, apresentado ao Conselho, Programa Linguística e Língua Portuguesa da Faculdade de Ciências e Letras – Unesp/Araraquara, como requisito para obtenção do título de Mestre em Linguística e Língua Portuguesa. Linha de pesquisa: Ensino/Aprendizagem de Línguas Orientador: Anise de Abreu Gonçalves D'Orange Ferreira Bolsa: CNPq Processo nº131938/2021-5 ARARAQUARA – S.P. 2023 A474a Alves, Murilo Gouvea Anotando em treebank e traduzindo com alinhamento na leitura e tradução de Epicteto, I,1-5 / Murilo Gouvea Alves. -- Araraquara, 2023 88 p. Dissertação (mestrado) - Universidade Estadual Paulista (Unesp), Faculdade de Ciências e Letras, Araraquara Orientadora: Anise de Abreu Gonçalves D'Orange Ferreira 1. Epicteto. 2. Tradução alinhada. 3. Treebanking. 4. Classicismo Digital. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca da Faculdade de Ciências e Letras, Araraquara. Dados fornecidos pelo autor(a). Essa ficha não pode ser modificada. MURILO GOUVEA ALVES ALINHAMENTO NA LEITURA E TRADUÇÃO DE Dissertação de Mestrado, apresentada ao Conselho, Programa de Pós em Linguística e Língua Portuguesa da Faculdade de Ciências e Letras – UNESP/Araraquara, como requisito para obtenção do título de Mestre em Linguística e Língua Portuguesa. Linha de pesquisa: Ensino/Aprendizagem de Línguas Orientador: Anise de Abreu Gonçalves D'Orange Ferreira Bolsa: CNPq Processo nº131938/2021-5 Data da defesa: 15/05/2023 MEMBROS COMPONENTES DA BANCA EXAMINADORA: Presidente e Orientador: Profa. Dra. Anise de Abreu Gonçalves D'Orange Ferreira UNESP/FCLAr Membro Titular: Profa. Dra. Maria Celeste Consolin Dezotti UNESP/FCLAr Membro Titular: Prof. Dr. MICHEL FERREIRA DOS REIS UNEMAT Local: Universidade Estadual Paulista Faculdade de Ciências e Letras UNESP – Campus de Araraquara AGRADECIMENTOS Agradeço a UNESP-Fclar pela oportunidade de estudar em uma faculdade com um grande rigor acadêmico e ao CNPq pela concessão da bolsa (processo nº131938/2021-5). Agradeço à minha orientadora Anise A. G. D. Ferreira, por ser uma verdadeira mestra em minha vida acadêmica, por corrigir, instruir, aconselhar e conduzir meus passos desde a graduação. Agradeço à minha família por todo apoio desde sempre - pai, mãe e irmãos – sem os quais seria impossível concluir este mestrado. Agradeço à minha esposa Débora por me sustentar, cuidar, amar e ter paciência, eu te amo muito; e ao meu filho, Luís Filipe, que tem me feito entender o que é amor de uma maneira diferente. E, por último e mais importante, agradeço a Deus pelos inúmeros benefícios sobre minha vida: amor, cuidado, perseverança, direção, salvação, provação e tudo mais. RESUMO Este trabalho tem o objetivo de analisar alguns aspectos do processo tradutológico do qual fizeram parte os estudos filológicos tradicionais, uma abordagem teórica e recursos digitais, tendo por corpus os cinco capítulos iniciais dos Discursos, de Epicteto, registrados por Arriano. Como pressuposto teórico e metodológico, a pesquisa se inspirou em orientações tradutológicas de M. Baker (2018) para a escolha de equivalentes entre as línguas, relativas à identificação dos problemas de não equivalência e às estratégias a serem seguidas para a escolha dos equivalentes, e em premissas do Classicismo Digital concernentes a leitura, análise e tradução de textos clássicos por meio de alinhamento de tradução, anotação em treebank e levantamento quantitativo. O alinhamento da tradução foi realizado por meio dos editores Alpheios e Ugarit- iAligner, que indicam as escolhas lexicais e a relação de pareamento entre as línguas. A anotação sintática em treebank foi realizada por meio do editor Arethusa, que registra a leitura do texto grego de maneira dinâmica. A partir das discussões, concluiu-se que o uso de recursos digitais foi essencial para a compreensão dos mecanismos linguísticos envolvidos na tradução. Palavras – chave: Epicteto; Tradução alinhada; Treebanking; Classicismo Digital. ABSTRACT This paper aims to analyze some aspects of the translation process of which were part traditional philological studies, a theoretical approach, and digital resources, having as corpus the five initial chapters of the Discourses, by Epictetus, recorded by Arrian. As a theoretical and methodological assumption, the research was inspired by M. Baker's (2018) translation guidelines for the choice of equivalents between languages, concerning the identification of problems of non-equivalence and the strategies to be followed for the choice of equivalents, and in premises of Digital Classicism concerning the reading, analysis, and translation of classical texts through translation alignment, treebank annotation, and quantitative survey. Translation alignment was performed using the Alpheios and Ugarit-iAligner editors, which indicate the lexical choices and the pairing relationship between the languages. Syntax annotation in treebank was performed using the Arethusa editor, which records the reading of the Greek text dynamically. From the discussions, it was concluded that the use of digital resources was essential for the understanding of the linguistic mechanisms involved in translation. Keywords: Epictetus; Translation alignment; treebank; digital classicism. LISTA DE FIGURA Figura 1 Interface da ferramenta VoyanT 22 Figura 2 Interface da ferramenta VocabT 22 Figura 3 Busca por Termo Chave na VocbT, Epic 1.1 23 Figura 4 Interface DS 24 Figura 5 Interface DDGP 27 Figura 6 Resultador da busca por μουσική 28 Figura 7 Exibição da análise morfológica de μουσική 29 Figura 8 Interface editor de alinhamento Alpheios 29 Figura 9 Alinhamento de Epic. 1.1.1 no editor Alpheios 30 Figura 10 Alinhamento de Epic. 1.1.1 no editor Ugarit 31 Figura 11 Interface do editor Arethusa 31 Figura 12 Anotação em treebank de Epic 1.1.1 32 Figura 13 Arquivo da tradução no Google Docs, Epic 1.1.1-2 35 Figura 14 Análise do corpus no VT 42 Figura 15 Diferentes anotações de μόνη em 1.1.4e 47 Figura 16 Registros de 1.4.16c em treebank 49 Figura 17 Resultado da busca por fantasia em DS 50 Figura 18 AnTrb de 1.4.18b 53 Figura 19 AnTrb de 1.4.19 54 Figura 20 AnTrb de 1.4.32 55 Figura 21 Alinhamento de 1.4.32 56 LISTA DE TABELAS Tabela 1 Etiquetas e suas aplicações de acordo com AGDT 2.0. 36 LISTA DE ABREVIATURAS E SIGLAS VoyanT Voyant Tools VocabT Greek Vocabulary Tools PDL Perseus Digital Library DS Diorisis Search ARE Alpheios Reading Environment sing. Singular pl. Plural acus. Acusativo dat. Dativo nom. Nominativo gen. Genitivo neut. Neutro masc. Masculino fem. Feminino voc. Vocativo at. Ativo mp. Médio-passivo ind. Indicativo subj. Subjuntivo part. Particípio subst. Substantivo adj. Adjetivo adv. Advérbio pres. Presente aor. Aoristo perf. Perfeito imperf. Imperfeito TC Tradução do corpus ATrd Alinhamento de tradução AnTrb Anotação em treebank SG Smyth Grammar LSJ Versão on-line do léxico Grego-Inglês Liddel, Scott e Jones DDGP Dicionário Digital Grego-Português DGE Diccionario Griego-Español CamG The Cambridge Grammar of Classical Greek aT Artificial Token PRED Etiqueta atribuída ao verbo principal de uma oração SBJ Etiqueta atribuída a cada sujeito em uma sentença OBJ Etiqueta atribuída a cada objeto de um verbo ATR Etiqueta atribuída a qualquer dependente de um substantivo ADV Etiqueta para modificadores opcionais de verbo, adjetivo ou advérbio PNOM Etiqueta para complementos dos verbo de ligação OCOMP Etiqueta atribuída ao complemento predicativo acusativo que não concorda com o sujeito e particípios suplementares de verbos de percepção e opinião COORD Etiqueta atribuída a elementos coordenadores APOS Etiqueta utilizada para apostos AuxC Etiqueta atribuída a conjunções su AuxP Etiqueta atribuída a preposições AuxY Etiqueta usada para marcar nós técnicos e advérbios oracionais AuxZ Etiqueta para partículas de negação e intensificadores ExD Etiqueta atribuída a constituintes que não pertencem à sentença SUMÁRIO 1 INTRODUÇÃO 13 2 PRESSUPOSTOS TEÓRICOS 18 3 METODOLOGIA 21 3.1 Corpus 21 3.2 Descrição do ferramental 21 3.2.1 Ferramentas para análises quantitativas e data-mining do corpus 21 3.2.2 Ferramentas para auxílio da tradução, alinhamento e anotação em treebank 27 3.3 Procedimentos 32 3.3.1 Procedimentos de análise quantitativa 32 3.3.2 Procedimentos de tradução, alinhamento e anotação em treebank 35 4 RESULTADOS DAS ANÁLISES 39 4.1 Contextualização do autor e obra 39 4.2 Análise quantitativa de texto auxiliada por computador 41 4.3 Análise do procedimento tradutológico 45 4.3.1 Ordem das etapas 45 4.3.2 Tradução do corpus 47 4.3.3 Anotação em treebank e alinhamento do corpus 52 5 TRADUÇÃO DO CORPUS E LINKS DE ALINHAMENTOS E TREEBANKS 52 6 CONSIDERAÇÕES FINAIS 74 REFERÊNCIAS 76 ANEXOS 83 ANEXO A – PALAVRAS SELECIONADAS COM MAIOR PONTUAÇÃO NA VOCABT 84 ANEXO B – FREQUÊNCIA DAS PALAVRAS SELECIONADAS EM VOCABT E DS 87 12 1 INTRODUÇÃO A revolução digital trouxe valiosas contribuições para a filologia não apenas em termos de preservação de antigos textos herdados, mas também para o entendimento deles, revitalizando a disciplina e trazendo ênfase a seu escopo original, que é extrair sentido de textos e línguas (BERTI, 2019, p. 1). Enquanto seria necessário circundar-se de vários livros para análise de um texto antigo antes da era digital, como léxicos, gramáticas, traduções etc., hoje, como estudante de letras clássicas, sou beneficiado por ter à disposição de um click os mais robustos recursos para sua leitura e análise. E mais, a tecnologia digital tem facilitado a transmissão dos resultados de pesquisas linguísticas envolvendo línguas clássicas, assim como seu ensino e aprendizagem (CRANE et al., 2012, p. 1; FERREIRA, 2017; FERREIRA, BLACKWELL, PALLADINO, 2020; PALLADINO; FORADI; YOUSEF, 2021). O acesso a essa herança, em diversos casos irrestrito e gratuito, é possível tanto pelo pesquisador ou estudante, como pelo leigo interessado na área, pois o que se tem em vista não é apenas a digitalização dos textos antigos, mas o acesso aos facilitadores de seu entendimento. Melhor dizendo, a questão não é somente viabilizar o acesso a textos digitalizados em formato PDF1, por exemplo, mas a “uma base universal de dados abertos, sem restrições de uso” (FERREIRA, 2015a, p. 7). Ferreira aponta três necessidades supridas por essa união dos recursos digitais com o conteúdo da área: (1) as didático-pedagógicas, pois a leitura do texto antigo pelos estudantes em formação é auxiliada e aprimorada por meio dos recursos digitais e da produção de dados; (2) as acadêmicas de alunos e pesquisadores, que podem se tornar contribuintes com o aumento do acervo de dados eletrônicos para estudo e pesquisa; e (3) as sociais, porque resultaria na ampliação de acesso aos textos gregos e suas traduções (FERREIRA, 2017, p. 2). A era digital é realidade há algum tempo e os estudos clássicos estão inseridos nela por meio de um movimento de âmbito internacional denominado Classicismo Digital, cuja finalidade é o desenvolvimento de uma ciberestrutura propagadora de acesso a textos clássicos digitais, para leitura e para atender diversas necessidades de pesquisa da área, como registros de dados histórico-linguísticos de línguas antigas e o 1 Portable Documento Format. 13 desenvolvimento de serviços em web (CRANE et al., 2012, p. 1; FERREIRA, 2017, p. 2- 3). Segundo Crane et al. (2012, p. 1), uma mudança nas disciplinas tradicionais já foi iniciada, passando de uma infraestrutura baseada primeiramente em livros e artefatos escritos para outra em que inclua as palavras preservadas desses escritos. Cada palavra preservada de manuscritos, inscrições, edições e papiros herdados é, agora, alvo de análise e anotação linguística, pois possuem identificadores únicos, individuais, que podem designar a morfologia, a forma de entrada no dicionário, dentre outras características. Como consequência dessa mudança de infraestrutura, a cultura de produção acadêmica também é alterada, pois estudantes e pesquisadores com diferentes níveis de conhecimento podem contribuir para produzir dados. Universidades também podem desenvolver “novos modelos colaborativos e participativos de educação, em que estudantes contribuem com novo conhecimento enquanto aprendem e aprendem para contribuir com novo conhecimento” (CRANE et al., 2012, p. 1). Esse é o chamado Ciclo Virtuoso de Aprendizagem e Contribuição. O foco dessa contribuição é a produção de dados, “colaborações específicas de edições digitais” (FERREIRA, 2017, p. 3), e anotações que fazem parte de uma base universal de dados abertos: Para que a interação entre dados possa ocorrer, formatos universais e abertos devem ser usados, tal como o padrão TEI-XML, permitindo, assim, a distribuição da informação e a consulta por meio de serviços diversificados de data-mining, ou mineração de dados, sob variadas interfaces (FERREIRA, 2017, p. 3) Ferreira indica a necessidade de pesquisadores contribuírem com a produção de conhecimento através de um sistema mais amplo e dinâmico em vez de unidades isoladas e estáticas (2015a, p. 7). A decisão é do pesquisador “se vai gerar um estudo monolítico que será lido por poucos, ou se vai produzir um estudo dinâmico, i.e., uma edição integrada em sistemas de conhecimento abertos, sem, contudo, desprezar o rigor e os procedimentos filológicos” (FERREIRA, 2015a, p. 8). E quanto ao estudante? A autora afirma que das diversas formas de contribuição, a maioria significaria realizar “um tipo de anotação manual de corpus e de alinhamento de dados que depende do uso de plataformas e serviços desenvolvidos por classicistas digitais em parceria com cientistas da computação” (FERREIRA, 2017, p. 4). Muitos esforços têm sido feitos pelo desenvolvimento de websites e ferramentas para análise morfossintática, anotação sintática manual ou automática, alinhamentos de 14 dados, prosopografia, epigrafia digital, dentre muitos outros. Dignos de destaque, os esforços de Crane e equipe somam mais de 30 anos de atuação, resultando em diversos projetos, como a Perseus Digital Library2, em que há acesso gratuito a textos de grego antigo, latim, árabe, germânico e outras línguas, dicionários, traduções, ferramentas de pesquisa e vários outros recursos. Na plataforma Perseids3, que consiste em uma plataforma colaborativa, desenvolvida pelo projeto Perseu (Perseus Project, Tufts University, ALMAS e BEAULIEU, 2013; ALMAS, 2014), e “que reúne ferramentas e serviços abertos que existiam em separado para dar suporte ao trabalho de anotação e edição de documentos no formato TEI XML” (FERREIRA, 2017, p.5), é possível encontrar os editores de alinhamento e anotação sintática da Alpheios Project. Outro editor de alinhamento é o Ugarit-iAligner4, cujo diferencial é a possibilidade de alinhamento entre três línguas diferentes. A partir de 2017, o dicionário Grego-Português publicado em cinco volumes pela editora Ateliê (MALHADAS, D; DEZOTTI, C.; NEVES, M. H. (coords), 2006-2010) recebeu uma versão on-line, o Dicionário Digital Grego-Português (FERREIRA, A.; RODRIGUES, R, 2019)5. Outros recursos, plataformas e ferramentas são Stanza6, Pedalion7 e Diorisis8. Esta pesquisa se inspira em premissas do Classicismo Digital concernentes a leitura, análise e tradução de textos clássicos, e em orientações tradutológicas de M. Baker (2018), tendo como corpus os cinco capítulos iniciais do livro I dos Discursos, de Epicteto, registrados por Arriano, com o objetivo geral de analisar alguns aspectos do processo tradutológico resultantes da articulação de recursos digitais com uma abordagem teórica de tradução e estudos filológicos tradicionais. Para alcançar esse objetivo geral, os objetivos específicos foram: 1) traduzir o corpus; (2) anotar o corpus em treebank; (3) alinhar a tradução com o corpus; (4) analisar o corpus quantitativamente com auxílio de ferramentas de ferramentas de busca por palavras-chaves; (5) contextualizar o autor e a obra de onde foi extraído o corpus. Em relação ao autor e contexto da obra, foram consideras, especialmente, as obras de Hadot (2014), Adamson (2015), Long (2002), Gill (2008) e Xenakis (1969). Em 2 http://www.perseus.tufts.edu. 3 http://alpheios.net/pages/tools. São elas: Alpheios Reading Tool, o editor de alinhamento Alpheios e Arethusa, anotação sintática em treebank. 4 http://ugarit.ialigner.com. 5 http://perseidas.fclar.unesp.br/2x. 6 https://stanfordnlp.github.io/stanza. 7 https://www.relicta.org/pedalion/index.html. 8 https://www.crs.rm.it/diorisissearch. 15 relação à tradução, foram considerados, principalmente, os trabalhos de Hard (2014), Souilhé (1975), García (1993) e Dinucci (2020). A partir das premissas do classicismo digital, foram realizadas análises quantitativas e de palavras-chaves auxiliadas por computador, alinhamento do texto grego com a tradução realizada em língua portuguesa e anotação morfossintática do texto grego em treebank. De acordo com Palladino, Foradi e Yousef (2021), o alinhamento de um texto com sua tradução por meio de ferramentas digitais é um tipo de anotação que consiste em “analiticamente parear uma palavra ou expressão em um texto com o correspondente em outro texto, geralmente em uma língua diferente, em ambientes criados para juntar pares de palavras alinhadas” (p. 1). De forma complementar, a anotação morfossintática de dependência em treebank é “um corpus contendo uma representação simbólica da sintaxe de um ou mais textos. Isso pode ser definido como uma série de sentenças analisadas de acordo com o formalismo linguístico de gramática de dependência” (CELANO, 2019, p. 1). No editor, uma sentença é disposta de maneira dinâmica de acordo com as relações de dependência que as palavras possuem entre si, seguindo diretrizes (AGDT 2.0) e recebendo etiquetas de indicadores sintáticos. A tradução alinhada de um texto e sua anotação de dependência sintática em treebank registram objetivamente as escolhas lexicais e de leitura do tradutor e revelam as estratégias usadas para a tradução (FERREIRA, 2015b, p. 241). Por isso, a anotação do corpus por meio de ferramentas digitais é um procedimento essencial para compreender os mecanismos linguísticos envolvidos na tradução (YOUSEF et al. 2022a). Paralelamente, as orientações tradutológicas de Baker (2018) inspiram as estratégias usadas para as escolhas lexicais. Segundo a autora, no processo tradutológico de línguas modernas, existem diferentes níveis de equivalência entre línguas e a escolha de um equivalente adequado depende de diversos fatores. Quando não é possível encontrar um equivalente adequado, no nível da palavra, estratégias podem ser seguidas de acordo com o tipo de não-equivalência. Essas estratégias contribuíram para a escolha dos equivalentes entre o grego antigo, dialeto koinê, e a língua portuguesa, que possuem fortes distanciamentos cultural, temporal e linguístico. Ao final, foi feita uma análise do procedimento tradutológico, calcado nos estudos filológicos tradicionais aliados à uma abordagem teórica e ao uso de ferramentas digitais na análise e tradução do corpus, que não possui ainda dados registrados de tradução alinhada grego-português ou de anotação sintática manual em treebank e cuja importância 16 histórica é singular pois, segundo Hard (2014), os Discursos de Epicteto “foram os mais amplamente lidos e influentes de todos os escritos Estoicos, desde a antiguidade" (p. 9). 17 2 PRESSUPOSTOS TEÓRICOS Esta pesquisa tem adotado duas bases como suporte teórico-metodológico: (1) as orientações tradutológicas de M. Baker; e (2) as premissas provenientes do Classicismo Digital. As percepções tradutológicas de M. Baker (2018), em especial a categorização de problemas de não equivalência no nível da palavra e suas estratégias para escolhas lexicais, orientaram algumas decisões tradutológicas, enquanto as premissas do Classicismo Digital, que estão presentes nos métodos de tradução alinhada, anotação sintática em treebank e levantamento quantitativo, a serem expostos adiante, contribuíram com o processo tradutológico. Segundo M. Baker (2018), a primeira preocupação do tradutor, comunicar o sentido geral de um trecho de uma língua, é alcançada "ao decodificar as unidades e estruturas que carregam o significado" (p. 10). Palavras e morfemas são unidades de significado, sendo a última o menor elemento formal de significado em uma língua, e a diferença entre ambas residindo no fato de que enquanto o morfema apenas contém um único elemento de significado, a palavra pode ter um ou vários (M. BAKER, 2018, p. 11). As estruturas são de ordens variadas, como gramaticais, textuais, coesivas, semióticas, dentre outras. Assim, M. Baker propõe que existem diferentes níveis de equivalência entre línguas e a escolha de um equivalente adequado depende de fatores linguísticos e extralinguísticos. Ao lidar com situações em que não existe um equivalente apropriado, a autora afirma que estratégias devem ser traçadas: A escolha de um equivalente adequado sempre dependerá não apenas do sistema linguístico ou dos sistemas que o tradutor lida, mas também da maneira em que ambos, o autor do texto fonte e o produtor do texto alvo, que é o tradutor, escolhem manipular o sistema linguístico em questão; das expectativas, conhecimento do contexto e preconceitos dos leitores dentro de uma localização temporal e espacial específicas; do entendimento do próprio tradutor de sua tarefa, incluindo sua avaliação do que é apropriado em uma determinada situação; e de uma variação de restrições que podem operar em um determinado ambiente de um determinado ponto no tempo, incluindo censura e vários tipos de intervenção por partes outras que o tradutor, autor e leitor (M. BAKER, 2018, p. 16). Mais detalhadamente, uma distinção entre nível da palavra e nível acima da palavra é feita por M. Baker. No nível da palavra, é possível que não exista um equivalente para uma palavra do texto fonte na língua alvo. Nesse caso, a estratégia usada poderá variar de acordo com o tipo da não-equivalência. M. Baker lista alguns problemas 18 comuns de não equivalência entre a língua-fonte e a língua alvo, tais como um conceito cultural específico, um conceito da língua-fonte que não foi lexicalizado na língua alvo, uma palavra da língua-fonte semanticamente complexa, diferentes distinções de significado entre as línguas, falta de um superordenado na língua alvo ou termo específico; e algumas estratégias que podem ser adotadas, como traduzir por uma palavra mais geral ou mais neutra (menos expressiva), trocando um item cultural específico por um que tenha um impacto semelhante no leitor, usando uma palavra emprestada ou por uma palavra emprestada mais uma explicação, por uma paráfrase usando uma palavra correlata, omitindo uma palavra ou utilizando-se uma ilustração (2018, p. 19-46). Um dos exemplos de não equivalência é uma palavra semanticamente complexa da língua-fonte. M. Baker cita a palavra ‘arruação’, que significa “retirada dos resíduos vegetais (folhas, paus), terra solta e outros detritos para o centro da rua, com o objetivo de facilitar o recolhimento, com menos impurezas, dos frutos que caem antes da colheita e provenientes da derriça”9. Nesse caso, em que uma única palavra é usada para designar um processo complexo, a estratégia de traduzir utilizando uma paráfrase com palavras relacionadas pode ser uma solução. Embora seja vitualmente impossível encontrar equivalentes perfeitos entre o texto clássico e a língua portuguesa, em razão dos distanciamentos cronológico, cultural e linguístico, existem recursos que aproximam o tradutor do texto como o alinhamento de um tradução e a anotação em treebank, métodos decorrentes do Classicismo Digital. Segundo Ferreira, Blackwell e Palladino (2020), “o alinhamento de uma tradução analítica através de anotação digital é uma poderosa experiência pedagógica que estimula o reconhecimento crítico de diferenças culturais e linguísticas entre duas ou três línguas diferentes” (p. 124). Uma tradução alinhada pode ser definida como “a comparação entre dois ou mais textos em diferentes línguas, chamados textos paralelos, para descobrir quais unidades dos textos fonte e alvo correspondem conjuntamente” (YOUSEF, 2019, p. 1)10. É uma tarefa excepcionalmente complexa, segundo Palladino, Foradi e Yousef, por causa das inúmeras variáveis envolvidas (2021, p. 2). As opções lexicais do tradutor ficam 9 PREPARATIVOS para a colheita. Guaxupé, MG: Notícias Cooxupé. Disponível em: https://www.coox upe.com.br/noticias/preparativos-para-colheita. Acesso em: 7/04/2023. Além desse significado específico citado por M. Baker, pode-se encontrar outros significados mais básicos como traçado de ruas, ação ou resultado de arruar. 10 Esta definição foi formulada a partir do artigo de M. Kay e M. Röscheisen, “Text-Translation Alignment” (1993). 19 evidentes e podem ser questionadas pelo leitor ao mesmo tempo em que as discrepâncias identificadas, tal como o alinhamento entre uma palavra grega com várias da língua alvo, levantam suspeitas sobre a complexidade da construção, podendo consistir em expressões idiomáticas (FERREIRA, 2015b, P. 241). O uso de editores de alinhamento, manual ou automático, tem sido feito há décadas em diversas áreas, como tradução a partir de estatísticas automáticas, aprendizagem de línguas e indução léxical bilingue (YOUSEF et al., 2022b). Os diversos tipos de editores de alinhamento automático11 variam no método de alinhar, como o tipo ou tamanho do texto, mas todos têm em comum a falta de precisão das correspondências, enquanto o alinhamento manual, às custas de muito tempo e recursos, produz resultados mais precisos, desde que realizado por acadêmicos ou especialistas (YOUSEF, 2019, p.1). Por outro lado, o editor de alinhamento multilíngue Ugarit-iAligner, o mais usado atualmente entre os editores desenvolvidos, foi criado, a princípio, para coletar dados para a “implementação de máquinas estatísticas de tradução de línguas históricas” (PALLADINO; FORADI; YOUSEF, 2019, p. 2), ou seja, tem-se em vista a formação de grandes corpora de textos alinhados para realização de tradução automatizada. Em conjunto com o alinhamento de tradução, outro recurso que contribuiu com a análise do corpus foi o registro da leitura sintática do texto por meio da anotação em treebank pelo editor Arethusa. Segundo Bammam e Crane (2011), treebank consiste em “uma grande coleção de sentenças em que a relação sintática de cada palavra é feita explícita - onde um humano codificou uma interpretação da sentença na forma de uma anotação linguística” (p. 2). As palavras das sentenças são individualmente etiquetadas de acordo com seu nó linguístico e função sintática, sendo dispostas visualmente como árvores, “cujos vértices/nós, com exceção do nó ROOT, correspondem aos tokens de uma sentença e cujas extremidades direcionadas representam dependências sintáticas” (CELANO, 2019, p. 279-280). A anotação usada, aqui, no editor Arethusa, da plataforma Perseids, segue as diretrizes da AGLDT, atualmente na versão 2.1, e cujo repositório de língua grega contém mais de 550.000 tokens incluindo textos (ou partes) de Ilíada, Odisseia, Histórias de Heródoto, dentre muitos outros (CELANO, 2019, p. 284). 11 Uma recente análise do procedimento de alinhamento automático foi feita por M. Mikhailov e R. Cooper (2016, p. 29-34) 20 O levantamento quantitativo de palavras-chaves, tokens e types visou a descobrir a “temacidade” do corpus. As ferramentas e procedimentos serão detalhadas na próxima seção. 21 3 METODOLOGIA Nesta seção serão apresentadas as características do corpus, uma descrição do ferramental utilizado no auxílio da leitura, análise e anotação do corpus e os procedimentos, que visaram a tradução do corpus. 3.1 Corpus Foram selecionados como corpus os cinco capítulos iniciais da obra Discursos, registrados por Arriano, mas de autoria atribuída a Epicteto, da edição do texto grego estabelecida por Schenkl, segunda edição publicada pela Teubner em 191612, e que está disponível na PDL13. 3.2 Descrição do ferramental Algumas ferramentas digitais foram utilizadas para realizar, em um primeiro momento, análises quantitativas do corpus e encontrar seus termos chave. As ferramentas recebem uma breve apresentação a seguir, tendo em vista que cada uma possui um tutorial completo de suas funcionalidades em seus respectivos domínios eletrônicos. Todas as ferramentas são gratuitas e o acesso está disponível através de seus respectivos websites indicados abaixo. 3.2.1 Ferramentas para análises quantitativas e data-mining do corpus O corpus foi analisado primeiramente através da ferramenta digital Voyant Tools (VoyanT)14, que consiste “em um ambiente baseado em web de leitura e análise de textos”15. De uso gratuito, a VoyanT permite ao usuário ter um texto, ou uma coleção de textos, analisado por diferentes índices e disposto de forma dinâmica: são diversas ferramentas que mostram, por exemplo, a frequência de palavras através de bolhas ou nuvens, a distribuição de palavras no texto, frases comuns, dentre outras. Ao acessar a 12 Existem versões mais recentes, como as preparadas por Oldfather (1926) e Souilhé (1948-65), mas em razão das informações contidas na PDL serem referentes ao texto de Schenkl, esta edição foi a utilizada. 13 SCHENKL, H. (ed.). Epicteti Dissertationes ab Arriano digestae. Epictetus. 2 ed. Leipzig: Teubner, 1916. Disponível em: . Acesso em: 04/03/2023. 14 https://voyant-tools.org/ 15 Definição extraída da página de ajuda da ferramenta. Disponível em: https://voyant- tools.org/docs/#!/guide/about. 22 página da ferramenta, um texto ou o URL de um texto pode ser colado na caixa de texto16 e, em seguida, a opção “revelar” deve ser selecionada para que o texto seja analisado. Em seguida, a Greek Vocabulary Tools17 (VocabT), da PDL, foi utilizada. Nela, a partir das obras completas de um autor, é possível ter o número total de palavras, palavras de contagem única, densidade vocabular e o número de palavras que ocorrem uma única vez. Também é possível realizar buscas, a partir de obras completas e de capítulos separadamente, por filtros que indicam a frequência das palavras, a frequência ponderada e termos chaves. A figura 2 mostra a interface da ferramenta, o corpus a ser selecionado, os filtros disponíveis, a porcentagem da quantidade de palavras que estarão no resultado da busca e, ainda, se o resultado da busca será disposto em uma tabela ou em formato XML. 16 Também é possível fazer upload de textos em diversos formatos, como PDF, XML, HTML e outros. 17 https://www.perseus.tufts.edu/hopper/vocablist. Fonte: Captura de tela Figura 1: Interface da ferramenta VoyanT Figura 2 :Interface da ferramenta VocabT Fonte: Captura de tela 23 Depois de selecionado o filtro desejado, as palavras são distribuídas em uma tabela de acordo com sua pontuação. Na figura 3, é possível ver as 10 palavras com maior pontuação de termo chave do primeiro capítulo do primeiro livros dos Discursos (Epic. 1.1). A VocabT possui dois índices de frequência de palavras: mínima e máxima. Isso existe porque ainda que a ferramenta consiga desambiguar diversas palavras, existe algumas formas que podem derivar de mais de um lexema18. Quando há uma discrepância entre os índices de frequência, a frequência máxima é referente a todas as possíveis ocorrências de um lema e a mínima a todas as ocorrências da palavra desambiguadas pelo computador19. Há também a contagem da frequência relativa, que é o número de ocorrências de uma palavra a cada 10.000 palavras, que pode ser muito útil para a comparação de uma palavra entre vários autores. A frequência relativa também possui os índices de frequência mínima e máxima. Termo chave se refere às palavras que aparecem com relativa frequência em um corpus selecionado, mas que possui baixa frequência relativa na coleção como um todo. A alta pontuação de termo chave indica palavras-chave do texto, podendo ser um guia para pessoas, lugares e conceitos importantes na sessão. Já a frequência ponderada é determinada ao atribuir peso a cada forma flexionada baseado em um número de formas possíveis de dicionário da qual a forma flexionada poderia ser derivada. Por exemplo, uma palavra não ambígua teria peso 1, uma palavra que poderia ser derivada de dois lexemas teria peso 0,5 e assim por diante. A frequência ponderada é calculada pela soma do peso de cada forma flexionada que aparece em um texto. 18 O exemplo usado no site para explicar o fenômeno é o uso de flies, que pode ser o plural do substantivo fly, mosca, ou a conjugação de terceira pessoa do singular do verbo to fly. Já sneezed só pode ser uma forma do verbo to sneeze, espirrar. 19 As informações a respeito dos critérios de busca foram retiradas da página: http://www.perseus.tufts.edu/hopper/help/vocab#tfidf. Figura 3: Busca por Termo Chave na VocabT, Epic. 1.1 Fonte: Captura de tela 24 Assim, se a pontuação da frequência ponderada é igual à média da pontuação mínima e máxima, depreende-se que a palavra é totalmente ambígua em todas as suas formas. Por outro lado, se as pontuações mínima, máxima e ponderada são as mesmas, depreende-se que a palavra é totalmente não ambígua em todas as suas formas. À medida que o peso se aproxima da pontuação máxima, isso significa que é mais provável que a contagem máxima é próxima à contagem atual; a contagem atual seria maior que a pontuação ponderada e menor ou igual à máxima. As palavras com maior frequência ponderada são essenciais para se conhecer um autor. A última ferramenta utilizada na análise quantitativa foi o software Diorisis Search (DS), um dos lematizadores mais precisos atualmente. Segundo a página inicial do website do software20, Diorisis é “uma aplicação projetada para desenvolver e operar pesquisas linguísticas complexas no Diorisis Ancient Greek Corpus (Vatri e McGillivray 2018) através de uma interface gráfica intuitiva”. Através da figura 5, nota-se que depois de um autor ser selecionado na minha caixa, suas obras disponíveis aparecem na segunda e, em seguida, uma ou mais obras pode ser selecionada como corpus de análise na terceira caixa. Nota-se também, que as buscas no corpus podem seguir os seguintes filtros: uma frase exata, uma forma de palavra exata, uma forma que contém uma determinada sequência, a forma de um lema, a forma de um leva que contém uma determinada sequência, uma palavra com determinadas características morfológicas ou um tipo de pontuação. 20 https://www.crs.rm.it/diorisissearch/ Figura 4: Interface DS Fonte: Captura de tela 25 A ferramenta realiza a lematização das palavras que, segundo Vatri e McGillivray, é “o processo em que cada forma de palavra em um texto é associada ao seu lema” (2020, p. 180). Esse processo é particularmente importante nos estudos de língua grega cuja variação flexional é alta e cuja ambiguidade de formas de palavras é uma constante. Assim, a busca por uma palavra específica em um texto pode ser feita na DS a partir de seu lema, a forma de entrada do dicionário, e respondida por todas as formas de palavra presentes no texto. Por exemplo, a busca por ἅνθρωπος21 é respondida por ἀνθρώπου22, ἄνθρωπον23 e assim por diante. Esse tipo de pesquisa pode ajudar a identificar e contar padrões de larga escala (e.g., colocação e n-gramas definidos por lexemas e não simplesmente por séries de caracteres) e aumentar a eficiência na coleta de dados de fenômenos linguísticos (VATRI & MCGILLIVRAY, 2020, p. 180). Vatri e McGillivray listaram uma série de lematizadores de grego antigo e realizaram um experimento para medir sua eficácia. Uma das primeiras iniciativas de lematizar textos foi feita a partir do analisador morfológico Morpheus, utilizado pela PDL e que provia todos os lemas possíveis, assim como as análises morfológicas, de uma dada forma de palavra. O projeto Perseus Under PhiloLogic trouxe contribuições ao implementar desambiguação manual para morfologia de língua grega e lematização. Utilizando as informações provenientes destas duas contribuições, Giuseppe Celano realizou a desambiguação automática da literatura canônica grega e dos textos do First Thousand Years of Greek Project24. Esse esforço ficou conhecido como Lemmatized Ancient Greek Texts25 (LAGT) e, segundo Vatri e McGillivray, "funciona bem para desambiguar aquelas formas que podem ser associadas a mais de um lema com diferentes classes gramaticais" (2020, p. 182). Já o Classical Language Toolkit26 (CLTK), "contém um lematizador que desambigua entre múltiplos lemas ao escolher o mais frequente de acordo com o seu corpus de frequência" (VATRI & MCGILLIVRAY, 2020, p. 182). Os resultados foram aprimorados a partir do desenvolvimento de um lematizador backoff por Patrick Burns (BURNS, 2019). O sistema opera diferentes lematizadores ao mesmo tempo para que, 21 DDGP: homem, ser humano. Subs., masc., sing., nom. 22 Subs., masc., sing., gn. 23 Subs., masc., sing., ac. 24 https://github.com/OpenGreekAndLatin/First1KGreek/releases/tag/1.1.1802 25 https://github.com/gcelano/LemmatizedAncientGreekXML 26 https://github.com/cltk/cltk 26 caso algum não consiga analisar uma forma, outro é acionado e, assim, o número de formas não analisadas diminua. Os lematizadores são vários: um com base em dicionário, que procura por formas com alta frequência em um léxico; um que aprende padrões de coocorrência via sistemas de aprendizagem de máquina em dados previamente lematizados extraídos do Perseus Ancient Greek and Latin Dependency Treebank; um que depende de parear formas com certas terminações morfológicas via expressões regulares; um segundo lematizador baseado em dicionário que usa lemas do Morpheus, e um que simplesmente completa lacunas ao retornar o token como lema (VATRI & MCGILLIVRAY, 2020, p. 182). O lematizador GLEM tem um componente de aprendizagem de máquina, construído a partir de algoritmos baseados em memória, que é combinado com uma ferramenta de pesquisa em léxico cujo propósito é usar informação de classe gramatical para desambiguar múltiplos lemas. O funcionamento do GLEM é escolher "o lema da combinação de forma de palavra/classe gramatical mais frequente de acordo com léxico PROIEL quando quer que uma desambiguação puramente baseada em classe gramatical não seja possível" (VATRI & MCGILLIVRAY, 2020, p. 182). Um estudo realizado pelos desenvolvedores mostrou que a precisão de GLEM é maior do que dois outros lematizadores, sendo um deles o CLTK (BARY et al., 2017). DS é último lematizador apresentado por Vatri e McGillivray e o mais recente entre os já desenvolvidos. Foi desenvolvido utilizando o corpus de Diorisis Ancient Greek, que já possui uma coleção de textos lematizados e analisados sintaticamente, provenientes repositório da Perseus Canonical Greek Literature, das bibliotecas digitais The Little Sailing27 e Bibliotheca Augustana28. As formas de palavras dos textos foram automaticamente comparadas com as já analisadas pela PDL. No comparativo realizado por Vatri e McGillivray, textos selecionados foram analisados por três especialistas em grego antigo e depois pelos lematizadores GLEM e CLTK e pelos corpora lematizados DS e LAGT. Segundo os autores, e em linhas gerais, os melhores resultados para uma amostra em Homero foram as presente no corpus do Diorisis e pelos produzidos pelo lematizador CLTK, cujas precisões não foram significantemente diferentes. Em seguida, vieram LAGT e GLEM, igualmente. No corpus 27 http://www.mikrosapoplous.gr/en/texts1en.html 28 http://www.hs-augsburg.de/~harsch/augustana.html#gr 27 de Lisias, DS foi predominantemente superior, vindo depois GLEM e CLTK (VATRI & MCGILLIVRAY, 2020, p. 194). 3.2.2 Ferramentas para auxílio da tradução, alinhamento e anotação em treebank Tendo em vista que a língua grega é altamente flexionada29, foram utilizados ferramentas e websites de identificação morfológica das palavras e léxicos. Dois editores de alinhamento e um editor de anotação sintática em treebank foram utilizados para o auxílio da leitura, análise e tradução do texto30. Em desenvolvimento desde 201731, o Dicionário Digital Grego-Português (DDGP)32 é um dicionário on-line cujo corpus foi extraído dos cinco volumes do dicionário Grego-Português (FERREIRA, A.; RODRIGUES, R, 2019)33, elaborado sob a coordenação de D. Malhadas, M. C. C. Dezotti e M. H. M. Neves e publicado pela editora Ateliê (FERREIRA; BLACKWELL; PALLADINO, 2020, p. 129). Ao acessar a página do dicionário, o usuário pode procurar pelos vocábulos seguindo as instruções para letras e acentos, conforme a figura 5. 29 Segundo Crane, “um único verbo pode ter aproximadamente 1000 formas e, se nós considerarmos que cada verbo possa ser precedido de até três prefixos distintos, o número de formas explode para aproximadamente 5.000.000” (1991, p. 1). 30 Já foi publicada uma breve descrição do uso das ferramentas da plataforma Perseids por Ferreira (2017, p.6-9). 31 O dicionário é parte do projeto guarda-chuva Projetos abertos em Letras Clássicas Digitais - FCLAr/UNESP e contou com a colaboração de pesquisadores, profissionais de TI e alunos locais e colaboradores internacionais, cf. https://github.com/aniseferreira/Grc-Por-DigDict. 32 http://perseidas.fclar.unesp.br/3x. 33 Embora não se limite ao corpus do dicionário impresso: “Sob licença Creative Commons32, a edição digital nunca visou apenas reproduzir o conteúdo lexical do dicionário impresso, mas também a ampliar seu corpus, fornecer ligações com outros dados, tais como entidades nomeadas: nomes próprios de lugares, pessoas e objetos, bem como exemplos de uso associados a identificações em fontes originais e traduções” (FERREIRA, A. D'O. BLACKWELL, C. PALLADINO, 2020, p. 129). Figura 5: Interface DDGP Fonte: Captura de tela 28 Morpheus é o analisador morfológico da PDL, que foi desenvolvido por Gregory Crane nos anos 1900 e cuja abrangência passa de 8 milhões de palavras gregas (CRANE, 1991; BABEU, 2011, p. 52). De fácil e gratuito acesso, é possível acessar a análise morfológica de uma palavra e seus significados, principalmente pelo LSJ, apenas clicando em uma palavra de um texto aberto. A figura 6 apresenta o resultado da busca de μουσική (mousike), encontrada em Epic. 1.1.3, que pode ser tanto uma forma do substantivo feminino singular μουσική, no caso vocativo ou nominativo, ou uma forma do adjetivo feminino singular μουσικός, nos mesmos casos. Ao clicar em LSJ, as acepções dos vocábulos de acordo com o dicionário são apresentas. Outro analisador morfológico de fácil acesso é o Alpheios Reading Environment (ARE), que pode ser adicionado como extensão do navegador do computador. Depois de instalado, as palavras em língua grega34 que receberem duplo clique na aba do navegador em que a ferramenta estiver ativada serão analisadas morfologicamente e alguns significados serão exibidos de acordo com o LSJ. A figura 7 apresenta a análise morfológica de μουσική após o duplo clique na palavra. 34 Também há suporte para o latim. Figura 6: Resultado da busca por μουσική Fonte: Captura de tela 29 Foram usados dois editores de alinhamento: Alpheios e Ugarit-iAligner. O primeiro pode ser acessado por uma conta pessoal na plataforma Perseids ou sem cadastro35. Usando uma conta pessoal, o usuário possui um dashboard com as opções de anotar um texto em treebank (New Treebank Annotation), alinhar textos (New Text Alignment), importar anotações (Import Annotations), fazer transcrições (New Transcription) e acesso aos trabalhos salvos. Ao selecionar a opção para realizar um novo alinhamento de texto, o usuário é redirecionado para um nova página com duas caixas para adicionar os textos a serem alinhados36, além de outras opções, como adicionar um título, indicar as respectivas línguas, dentre outras, de acordo com a figura 8. 35 Há interfaces em inglês e português para as opções sem cadastro. 36 Se o texto a ser anotado estiver no repositório Perseids, é possível carregá-lo colocando seu “endereço” (CTS urn) no campo “Search for a text” e depois clicando em “Retrieve passage” ou procurando pela obra ou autor no mesmo campo. As obras disponíveis no repositório estão listadas em “Availabe Works”. Figura 7: Exibição da análise morfológica de μουσική Fonte: Captura de tela Figura 8: Interface editor de alinhamento Alpheios Fonte: Captura de tela 30 Após selecionar “Align”, o usuário é redirecionado para uma nova página em que pode realizar o alinhamento dos textos por meio de clicks: seleciona-se uma palavra e, em seguida, a palavra que lhe é correspondente na outra língua e, por último, a primeira palavra selecionada novamente. Dessa forma, ao se passar a seta do mouse por uma palavra, tanto ela como sua correspondente da tradução ficarão destacadas. A figura 9 exemplifica o processo em Epic 1.1.1: as palavras não alinhadas encontram-se em vermelho, enquanto as alinhadas, em preto; as palavras destacadas οὐδεμίαν e “nenhuma” são correspondentes. Ugarit-iAligner é o editor de alinhamento cujo principal diferencial em relação ao Alpheios é a possibilidade de se alinhar até três textos. Após se cadastrar com uma conta pessoal, o usuário tem acesso a um dashboard com seus trabalhos anteriormente realizados, fazer um alinhamento com dois ou três textos e atalhos para acessar bibliografia sugerida, as diretrizes para o alinhamento e o tutorial completo de uso da ferramenta. Da forma semelhante ao Alpheios, após selecionar a opção para fazer um novo alinhamento, uma nova página é aberta com duas ou três caixas para os textos serem inseridos, de acordo com a opção escolhida37. Depois de selecionado “Align”, o usuário é redirecionado para a página de alinhamento. O editor Ugarit possui algumas opções não presentes no Alpheios, dentre elas a opções de colocar o tradutor, uma descrição, um histórico das palavras alinhadas e a porcentagem de palavras alinhadas em cada língua. A figura 10 exibe a interface do editor Ugarit. 37 Assim como o Alpheios, também é possível carregar um texto por meio de seu endereço (CTS urn). Figura 9: Alinhamento de Epic. 1.1.1 no editor Alpheios Fonte: Captura de tela 31 O último recurso utilizado na análise e anotação do texto é o editor de anotação em treebank Arethusa, também com acesso pela plataforma Perseids. Depois de selecionada a opção para realizar uma nova anotação em treebank, o usuário é redirecionado para uma página com uma caixa para que o texto a ser anotado seja inserido38, contendo opções como a língua do texto, o conjunto de etiquetas a ser utilizadas e a direção do texto. A figura 11 apresenta a interface do editor Arethusa. 38 Assim como o Alpheios, também há a opção “Search for a text”. Figura 11: Alinhamento de Epic. 1.1.1 no editor Ugarit Fonte: Captura de tela Figura 10: Interface do editor Arethusa Fonte: Captura de tela 32 Ao colar um texto na caixa branca e selecionar “Edit”, o texto será dividido em sentenças para que sejam anotadas individualmente. A anotação acontece por meio da seleção das palavras para demonstrar, de maneira dinâmica, sua relação de dependência entre as palavras e da atribuição de etiquetas a cada uma. A relação entre as palavras é feita ao selecionar uma palavra e, em seguida, outra da qual a primeira se torna dependente. Assim, como é exemplificado na figura 12, para que o adjetivo δοκιμαστικὴν fique dependente da conjunção ἢ, deve-se selecionar primeiro aquela e depois esta. Cada palavra também deve receber uma etiqueta que indica sua categoria morfossintática: pode-se clicar com o botão direito na palavra e procurar pela etiqueta que melhor se adeque a ela na primeira caixa de opções de etiquetas ou selecioná-la e, em seguida, clicar na aba “relation”, onde também haverá uma caixa com as opções de etiquetas. Na aba “morph” (morphology) se encontra a análise morfológica de cada palavra, podendo ser escolhida a opção correta para a sentença dentre as outras possibilidades morfológicas. A ferramenta também conta com outras funções, como o histórico de ações, adição de comentários e a adição de Artificial Tokens (aba “aT”), que é um recurso para adição de elipses nas sentenças, como a palavra δύναμιν na figura 12. 3.3 Procedimentos A partir dos resultados obtidos nas análises quantitativas e com o auxílio de ferramentas digitais para leitura, análise e tradução de texto, foi realizada a tradução do corpus, bem como seu alinhamento e anotação em treebank. Os passos envolvendo os procedimentos, e sua ordem de execução, que visaram a tradução são descritos a seguir. 3.3.1 Procedimentos de análise quantitativa Figura 12: Anotação em treebank de Epic 1.1.1 Fonte: Captura de tela 33 Inicialmente, foi realizada uma análise de texto auxiliada por computador, que consiste no uso de ferramentas computacionais ou programas “para analisar dados do texto de tamanhos variáveis ao produzir resultados quantitativos, tal como caracteres simples ou frequência de palavras, uso de significado de palavra, tipo de token e porcentagem de hapax39” (OHGE, 2021). Segundo Burrows, o estilo do autor é proveniente das palavras comuns de seu texto e o valor de estudá-las se apoia no fato que elas constituem o tecido subjacente de um texto, uma teia quase não visível que dá forma a qualquer coisa que é dita [...] O ponto principal de interesse não é um único ponto, um único fio, nem mesmo uma única cor, mas o efeito no geral. Tais efeitos são mais bem vistos, além do mais, quando diferentes peças são colocadas lado a lado (BURROWS, 2004, p.4). Para P. Baker (2006), entretanto, apesar de serem úteis em um primeiro momento ao pesquisador para revelar aspectos de um texto ou corpus que ocorrem com frequência, seus foci lexicais, e contribuir para revelar a presença de discursos, listas de frequência simples são limitadas e algumas vezes apenas ajudam a confirmar expectativas em volta do gênero do texto (p. 68, 121). Para se ter uma ideia de quais itens lexicais são interessantes em uma lista de frequência, é necessário comparar mais de uma lista em conjunto (P. BAKER, 2006, 124). Por outro lado, uma lista de palavras-chave é provavelmente mais útil para indicar “itens lexicais que poderiam garantir mais exame. Uma lista de palavras-chave, portanto, traz uma medida de saliência, enquanto uma simples lista de palavras apenas fornece frequência” (P. BAKER, 2006, p. 125). Palavras-chave (keywords) podem ser definidas por “palavras que são significantemente mais frequentes do que se poderia esperar em uma amostra de texto, dado sua frequência em um grande e geral corpus de referência” (STUBBS In: BONDI, 2010, p. 25). Assim, tanto frases como palavras que são chave em um texto podem ser “indicativos da posição e identidade do escritor, assim como do discurso da comunidade, com seus valores e crenças sobre a matéria subordinada e os gêneros que o caracterizam” (BONDI, 2010, p. 7). A mesma autora afirma, em seguida, que palavras-chave podem ser chave para a ontologia do discurso em um texto ou corpus, se apontarem para sua “temacidade” (aboutness), ou para a epistemologia deste, se apontarem para sua organização textual (BONDI, 2010, p. 8). Desta maneira, palavras-chave podem indicar 39 Hapax legomena são palavras que ocorrem uma única vez em um corpus. 34 os principais temas abordados pelo autor e características importantes de seu estilo, como a estrutura do texto. Por meio das ferramentas VoyanT e VocabT foi possível identificar as palavras mais frequentes do corpus e os contextos em que aparecem. Enquanto na primeira cada registro de palavra é contado separadamente para as diferentes formas do mesmo lexema, pois a ferramenta não realiza lematização, na segunda é possível obter o número de registros de cada lexema. Por exemplo, pela contagem da VoyanT, o lexema σῶμα40 ocorre 10 vezes nessa forma em todo o primeiro livro dos Discursos41, já na segunda ferramenta, é registrado 22 vezes por considerar as ocorrências em outros casos. É possível ter acesso a todas as ocorrências de σῶμα e seus respectivos contextos nos Discursos, seja nessa forma ou em qualquer outra flexão, através da ferramenta Diorisis Search ou através da busca pela palavra no website Perseus42. Visando a descobrir palavras-chave e frases importantes do corpus e do contexto em que este se insere nas obras de Epicteto, as ferramentas VoyanT, VocabT e DS foram utilizadas para realizar análises quantitativas a partir43: (1) das obras de Epicteto (Discursos, Enchiridion e Fragmentos); (2) do primeiro livro dos Discursos; e/ou (3) dos cinco capítulos iniciais dos Discursos. Para cada uma destas seções, uma lista foi feita com as 30 palavras com maior pontuação seguindo os filtros Termo Chave e Frequência Ponderada da VocabT44. As listas de palavras foram separadas em palavras gramaticais e palavras lexicais. As gramaticais, também conhecidas como palavras de função, pertencem às palavras de classe gramatical fechada: pronomes, determinantes, conjunções e preposições. As lexicais, de classe gramatical aberta, são substantivos, verbos, adjetivos e advérbios (P. BAKER, 2006, p. 53-55). Em linhas gerais, Scott e Tribble afirmam que palavras gramaticais são indicativos do estilo de um texto, enquanto as lexicais são indicativos de seu aboutness (2006, p. 84). A partir dos dados obtidos das três seções, foram selecionadas as palavras mais recorrentes entre as todas as listas de palavras em conjunto e cada uma foi pesquisada 40 DDGP: corpo; Subst., sing. e neut., de caso voc., acus. ou nom. 41 Sing., neut., no caso voc., acus. ou nom. 42 Disponível em: http://www.perseus.tufts.edu/hopper/searchresults?q=sw=ma&target=greek&doc=Perseus:text:1999.01.0 235&expand=lemma&sort=docorder. 43 A PDL utiliza como corpus de referência todas as obras presentes em seu banco de dados. 44 As listas de palavras selecionadas estão na Tabela 2 do anexo B. 35 individualmente na ferramenta da PDL e na DS45. Os resultados usando DS trouxeram precisão ao calcular o número exato de ocorrências das palavras pesquisadas por meio da lematização e apontar sua localização nas obras de Epicteto. 3.3.2 Procedimentos de tradução, alinhamento e anotação em treebank O procedimento tradutológico envolveu a Tradução do Corpus (TC), o alinhamento da Tradução (ATrd) utilizando os editores Alpheios e Ugarit-iAligner e a Anotação em Treebank (AnTrb) no editor Arethusa. Inicialmente, as etapas respeitaram a seguinte ordem: TC ≺ ATrd ≺ AnTrb46. Porém, após a tradução do primeiro capítulo dos Discursos, a ordem passou a ser TC ≺ AnTrb ≺ ATrd devido a questões linguísticas, que serão desenvolvidas nos Resultados. A primeira etapa, a tradução do corpus, foi realizada em um documento on-line do Google Docs, ao qual o texto grego foi copiado em disposição paralela à tradução. No documento, as palavras continuam carregando o hiperlink que redireciona, com um clique, para sua análise morfológica e à versão on-line do LSJ na PDL. A figura 13 apresente um recorte do arquivo no Google Docs da seção Epic 1.1.1-2 e o link exibido em um pop-up após a palavra μουσική receber um clique. Nessa etapa, houve a identificação da forma das palavras, função sintática e significados para realizar as primeiras tentativas de tradução do texto grego. Além da PDL, as ferramentas ARE e DDGP também foram utilizadas nesta etapa. Outras tradução serviram de auxílio na transposição do texto grego para a língua portuguesa, 45 A tabela com a frequência das palavras selecionadas, de acordo com VocabT e DS, está no anexo D. 46 ≺ é o símbolo de operação matemática que indica precedência: se x ≺ y, então x precede y. Cf. http://unicode.org/charts/nameslist/n_2200.html. Figura 13: Arquivo da tradução no Google Docs, Epic 1.1.1-2 Fonte: Captura de tela 36 especialmente Dobbin (2008), Hard (2014), Souilhé (1945) e García (1993), ao serem analisadas as escolhas de equivalentes e estrutura sintática em suas respectivas línguas. A segunda etapa foi realizar o alinhamento da tradução com o texto grego no editor Ugarit-iAligner47 seguindo os critérios que, em fase de desenvolvimento desde 2015 por Ferreira e Reis (YOUSEF et al., 2022c), com a participação de outros colaboradores, na execução do projeto Letras Clássicas Digitais, obteve índice de concordância de 88% entre os alinhadores em janeiro de 202248. A instrução geral dos critérios de alinhamento indica a preferência de se alinhar uma quantidade igual de palavras entre as línguas, mas podendo ser realizado o alinhamento de quantidade desigual para qualquer uma das línguas alinhadas, seguindo os critérios estabelecidos para partículas, artigos e preposições e construções verbais com conjunções, pronomes e partículas. Por fim, a terceira etapa consistiu no registro da tradução do texto grego por meio de anotação em treebank, no editor Arethusa. A anotação seguiu as diretrizes da AGDT 2.0, estabelecidas por Giuseppe G. A. Celano (2014)49, que é uma ampliação do AGDT 1.0 com uma anotação baseada nas categorias da gramática grega de Smyth50. O AGDT 2.0 é organizado em três camadas: a morfológica, a sintática e a de sintaxe avançada (também chamada de camada semântica). A tabela 1 apresenta um breve resumo das principais etiquetas de camada sintática. Tabela 1: Etiquetas e suas aplicações de acordo com AGDT 2.0 Etiqueta Aplicação da etiqueta PRED (predicado) Ao verbo principal de uma oração. Toda sentença tem apenas um PRED, com exceção de períodos compostos por coordenação, sendo os outros verbos, 47 A utilização do editor Ugarit em vez do editor Alpheios foi em razão do primeiro ter um léxico dinâmico, facilidade de agrupamento dos parágrafos em pastas e algumas outras funcionalidades, como a exibição do número e porcentagem das palavras alinhadas e não alinhadas. 48 Disponível em: https://github.com/aniseferreira/LetrasClassicasDigitais/blob/master/alignment_convent ions_portuguese.md 49 Disponível em: https://github.com/PerseusDL/treebank_data/blob/0205acd0d6b56f865a8f4ae4583dd723634f94ec/AGDT 2/guidelines/Greek_guidelines.md. 50 Disponível em: http://www.perseus.tufts.edu/hopper/text?doc=Smyth+grammar+1&fromdoc=Perseus%3Atext%3A1999. 04.0007 37 finitos e não finitos, anotados com outras etiquetas. SBJ (sujeito) A cada sujeito em uma sentença, sendo um substantivo ou verbo, podendo estar no caso nom., gen. (no caso de um genitivo absoluto) ou acusativo (oração infinitiva ou com um particípio em concordância). OBJ (objeto) A qualquer dependente que é um argumento de verbo, adjetivo ou advérbio. Pode ser um substantivo, um nome próprio, um advérbio ou um verbo no infinitivo. ATR (atributo) A qualquer dependente de um substantivo (ou equivalente), podendo ser um artigo, adjetivo, substantivo, nome próprio ou nó verbal de oração relativa. ADV (adverbial) A qualquer dependente que é um modificador opcional de verbo, adjetivo ou advérbio. Pode ser um substantivo, um nome próprio ou um advérbio. PNOM (predicado nominal) A qualquer termo com função predicativa dependente de um verbo de ligação. OCOMP (complemento de objeto) Ao predicado acusativo e a qualquer complemento que não concorda com o sujeito. COORD (coordenador) A conjunções coordenativas ou vírgulas que coordenam dois ou mais constituintes. APOS Etiqueta utilizada para apostos AuxC Etiqueta atribuída a conjunções subordinativas; AuxP Etiqueta atribuída a preposições; 38 AuxY Etiqueta usada para marcar nós técnicos e advérbios oracionais AuxZ etiqueta atribuída partículas de negação e intensificadores. ExD etiqueta atribuída a constituintes que não pertencem, sintaticamente, à sentença, como vocativos. Fonte: Autoria própria 39 4 RESULTADOS DAS ANÁLISES Esta seção apresenta uma breve introdução ao autor e a obra de onde foi extraído o corpus, seus Discursos, e os resultados das análises quantitativas de texto auxiliadas por computador e das análises do procedimento tradutológico. No primeiro tipo de análise, foi feita uma descrição quantitativa do corpus, obtida com os procedimentos expostos na seção metodológica. No segundo tipo, uma discussão da análise do procedimento tradutológico que se vale dos editores de alinhamento e anotação sintática. 4.1 Contextualização do autor e obra Epicteto51 nasceu por volta de 55 AD na cidade de Hierápolis, região da Frígia e atual Turquia, na época sob o domínio romano e que tinha o grego como língua local52. Sua morte foi por volta de 130 AD. Nascido de uma mãe escrava, foi para Roma como escravo de Epafrodito, um ex-escravo secretário do imperador Nero, que eventualmente emancipou Epicteto. Conheceu em Roma o professor estoico Musônio Rufo, um dos filósofos que impressionou e influenciou Epicteto. Foi Sócrates, entretanto, um de seus maiores influenciadores, como escreve Adamson: Epicteto modelou seu estilo de ensino no de Socrátes, propondo questões provocativas em interações vivas que estão preservadas com notável vivacidade em seus escritos. Epicteto também seguiu Sócrates em não escrever nada por si mesmo. Em vez disso, o que nós temos são registros de conversações e diatribes que aconteceram na escola de Epicteto, que ele fundou em Nicópolis, no oeste da Grécia, depois de ter sido liberto da escravidão (2015, p. 88). Após todos os filósofos serem banidos de Roma em 89, Epicteto funda sua própria escola em Nicópolis, “na rota principal entre Roma e Atenas, onde ele foi visitado por muitas pessoas gregas e romanas eminentes, incluindo o imperador Adriano” (GILL, 2003, p. 607). O mérito da propagação de seus pensamentos se deve a seu aluno, Arriano53, que também era historiador, por ter redigido suas conversações em formas de livro: a coleção mais extensa dos Discursos (Διατριβαί, “Diatribes”) e o Manual 51 É comum encontrar obras no Brasil com a grafia “Epiteto” para o nome do filósofo, porém aqui se seguirá o Índice de nomes próprios de Prieto (1995, p. 80). “Epicteto” é uma latinização de Ἐπίκτητος, que significa adquirido (DDGP). 52 As informações biográficas e acerca dos Discursos são provenientes de Hard (2014), Souilhé (1975), Xenakis (1969), Adamson (2015), García (1993), Long (2002) e Gill (2008). 53 Lúcio Flávio Arriano Xenofonte escreveu Anabáse de Alexandre e outras obras de história em grego ático. Em sua introdução aos Discursos, Arriano afirma que não tinha a ideia de compor um livro e publicá-lo, mas que tentou escrever tudo o que ouviu de Epicteto. 40 (Enchiridion) como uma obra menor e cujo significado é de algo confortável de se segurar com uma mão. Arriano provavelmente redigiu os Discursos depois da morte de Epicteto por conta da maneira que se expressa na carta dedicatória, por Lúcio Gélio só conhecer a obra na ocasião de sua estada em Atenas entre 160 e 164 e por Marco Aurélio ter tido tempo de conhecer e meditar na obra antes de escrever o livro 1 de suas Meditações, entre 170 e 180 (GARCÍA, 1993, p. 19; Souilhé, 1975, p. XIX). Os Discursos deveriam conter 8 livros, ou talvez 12, dos quais só legamos 4. Diatribes54 são conversações que tem por natureza o ensino: “pressupõe um auditório de discípulos e de discípulos ativos, que reagem às palavras do mestre e provocam por suas reflexões ou suas objeções os esclarecimentos mais prolixos” (SOUILHÉ, 1975, p. XXIII). Em Epicteto, a interação constante entre professor e aluno é notável, uma fonte a jorrar de questões e respostas, objeções e réplicas (Idem, p. XXVI). Os Discursos são registros de conversas informais, que provavelmente ocorreram dentro da escola de Epicteto ou ao redor dela, e ao ar livre (HARD, 2014, p. 11). Foram registrados em grego comum (koinê), a língua franca da época55. Sobre a filosofia de Epicteto, Long afirma que o principal projeto de Epicteto é se certificar que seus alunos entendam que nada está completamente em seu poder, exceto seus julgamentos, desejos e objetivos - nem nossos corpos e seus movimentos são nossos inteiramente ou estão sob nosso poder: "O corolário é de que nada fora da mente e volição pode, pela própria natureza, nos restringir ou frustrar a menos que escolhamos deixar que isso aconteça" (2002, p. 1). Assim, tudo o que nos afetaria, seja para nosso bem ou malefício, depende de nossos julgamentos e de como reagimos às circunstâncias que no advém. Da visão estoica tripartite da filosofia – física, lógica e ética – é a ética mais atenção de Epicteto em seus escritos. Como moralista, Epicteto tem o objetivo de ajudar seus alunos a assumirem um comportamento de acordo com os princípios estoicos e oferecê-los um caminho para alcançarem a felicidade pessoal (GARCÍA, 1993, p. 28). Sendo assim, a filosofia em si assume um papel mais grandioso em seu pensando do que 54 Sinônimo de διάλογος ou mesmo de λὀγος. 55 As principais diferenças do grego clássico são a transformação do sistema vocálico, reduzido a uma série de cinco vogais isócronas, e nos Discursos, pode-se notar: desaparição de partículas e do dual, alteração do sistema das preposições, confusão com o uso das negações, expansão do emprego de ἵνα, instabilidade das formas do futuro clássico ainda que outras o substituíram e a criação de mecanismos de reforço para a expressão dos valores modais do verbo (GARCÍA, 1993, p. 34). 41 era na antiguidade, “muito do que ele tem a dizer é concernente com o método filosófico e a natureza da educação filosófica, a vocação do filósofo e a filosofia como um modo de viver” (SCALTSAS; MASON, 2008, p. 3)56. Mason afirma que Epicteto não pode ser considerado um mero popularizador servil de seus predecessores, pois há inovação em seu pensamento: sua distinção entre os três topoi, ou campos de estudo: o desejo e a aversão, o impulso e a repulsão e o assentimento, distinção que pertence à teoria da educação (MASON, A. IN: SCALTSAS; MASON, 2008, p. 2). A maneira de abordar outras duas ideias também é distintiva no filósofo: a ideia de proairesis e a noção de liberdade (Idem, p. 2). A primeira é a vontade, a decisão racional, que não era tão comum no estoicismo antes de seu tempo, mas que para Epicteto é o verdadeiro eu pessoal e, diferente de nosso corpo, nossa proaresis nunca poderá ser restringida por qualquer coisa externa. Da noção de nossa verdadeira natureza vem a segunda ideia, pois se nossos interesses não estiverem em nenhuma coisa externa, seremos livres, pois nossa vontade não poderá ser frustrada. Segundo Adamson, essa noção de liberdade é a maior contribuição de Epicteto para a história do estoicismo e para a filosofia em geral: Epicteto faz da proiaresis o centro de sua teoria ética. Embora sua teoria seja definitivamente inovadora, é construída nos fundamentos estabelecidos pelos primeiros estoicos. Os estoicos descreveram a maioria das coisas que as pessoas valorizam e estimam como sendo de fato indiferente. Coisas tais como prazer, reputação, riqueza e mesmo falta de saúde carecem de qualquer valor intrínseco. Apenas a virtude, que guia o correto uso das coisas, é genuinamente boa e digna de ser buscada em si mesma. Epicteto adapta a teoria ao argumentar que nossa virtude realmente consiste no uso certo da proairesis - isto é, escolher de maneira correta (ADAMSON, 2015, p. 89). 4.2 Análise quantitativa de texto auxiliada por computador Os primeiros cinco capítulos do primeiro livro dos Discursos foram analisados por meio da ferramenta VoyanT57. Por não realizar lematização das palavras, não foi possível considerar os cálculos de frequência e densidade: a ferramenta considera, por exemplo, separadas as ocorrências de καὶ e καί, porém seu uso foi útil para obter pistas em relação à frequência de termos de forma invariável e frases exatas, sendo alguns deles ὅτι, οὖν, τῶν ἐκτὸς e διὰ τοῦτο. A figura 1 apresenta o dashboard da VoyanT com suas ferramentas de exibição dinâmica do corpus. 56 Sobre o estoicismo como modo de viver, cf. Cooper (2013). 57 A análise está disponível pelo link https://voyant-tools.org/?corpus=4c8b40d1772c2defd4d8780fad50b 21f. 42 A partir da VocabT, foi possível obter os seguintes dados das obras de Epicteto presentes na PDL (Discursos, Manual e Fragmentos)58: 8034659 tokens60, 6337 types61, densidade vocabular de 12,67962 e 1230 palavras de ocorrência única. Na coleção de obras de Epicteto, uma nova palavra é usada pelo autor a cada 12 palavras. A equação inversa à de densidade (types/tokens) informa quão rico ou variado lexicalmente é um corpus: 7,88% (0,0788) é uma relação baixa de variedade lexical, embora quanto maior o número de textos considerados, menor o número de novas palavras. Por isso, para se ter uma frequência mais precisa de um corpus em relação a outros, foi considerado o número de ocorrência a cada 100 palavras pelo DS63 das palavras-chave encontradas pela VocabT. Considerou-se como palavras-chave as palavras mais recorrentes entre as 30 palavras com maior pontuação nos filtros Termo Chave e Frequência Ponderada da ferramenta VocabT, pesquisadas e comparadas entre as seções: (1) todas as obras de 58 Dados disponíveis em: http://www.perseus.tufts.edu/hopper/vocablist?works=Perseus%3Atext%3A1999.01.0235&sort=weighte d_freq&filt=100&filt_custom=&output=table&lang=greek. 59 Segundo DS, a contagem total de palavras nas três obras de Epicteto é 83.615, sendo 74.640 nos Discursos, 4.965 no Manual e 4010 nos Fragmentos. 60 Número de palavras individuais em um texto ou mais textos. 61 Número de formas de palavras únicas. 62 Relação do número de palavras no documento para o número de palavras únicas (ou, tokens/types). Quanto maior o número resultante dessa proporção, menor será a densidade lexical. 63 A frequência a cada 100 palavras das palavras-chave está no Anexo C. Figura 14: Análise do corpus no VT Fonte: Captura de tela 43 Epicteto, (2) o livro 1 dos Discursos e (3) os cinco capítulos iniciais dos Discursos separados64. De acordo com os resultados das buscas de termos chave, as palavras φαντάζω65 (4 aparições), φαντασία66 (4), φαντασιόω67 (3) e φάντασις68 (3) tiveram mais recorrência entre as seções pesquisadas. Já com o filtro de frequência ponderada, foram εἰμί69 (6), ἄλλος70 (6), ποιέω71 (5), γίγνομαι72 (5), οὐδείς73 (5), μής74 (4) e ἐθέλω75 (3). Algumas palavras apareceram em ambos os filtros para as mesmas seções: εἰμί para a primeira seção e na terceira γραμματικός76 (primeiro capítulo dos Discursos); παρακρατέω77 e εὔλογος78 (segundo capítulo); ἀτύχημα79, σαρκίδιον80, ἀλώπηξ81 e ἀτυχής82 (terceiro capítulo); προκόπτω83 (quarto capítulo); e ἀπονεκρόω84, αἰδήμων85 e συνοράω86 (quinto capítulo). Outras, como ἔκκλισις87, apareceram com recorrência para ambos os filtros em seções diferentes. Em comparação a outros autores cujas obras estão disponíveis na PDL, algumas palavras selecionadas possuem grande frequência e frequência relativa. Em Epicteto, o verbo δύναμαι88 possui a mais alta frequência relativa máxima, mesmo comparando autores com volume maior ou menor de escritos e de outras épocas (e.g. República de 64 As palavras mais frequentes de acordo com cada filtro estão no Anexo D. 65 DDGP: 1 tornar visível; mostrar; 2   iludir; enganar (a percepção). 66 DDGP: 1 aparição de coisas extraordinárias ou que provocam ilusão; visão 2   exposição; ostentação; exibição. 67 DDGP: 1   fazer aparecer imagem ou fantasma na mente de alguém; méd. pas. 2   imaginar; imaginar que se vê; ver pela imaginação. 68 LSJ: portents. 69 DDGP: existir; ser. 70 DDGP: 1 pron. ou adj., (um) outro além dos que foram indicados. 71 DDGP: 1 fazer, i.e, fabricar; executar; confeccionar algo. 72 DDGP: 1 (pessoa) vir a ser; nascer; ser filho de; 2 (planta) nascer; brotar; crescer. 73 DDGP: 1 ninguém; nada; nenhum de. 74 DDGP: Ou μείς, mês. 75 DDGP: 1 querer; desejar; estar disposto a; consentir em. 76 DDGP: 1 que conhece as letras; erudito; sábio. 77 LSJ: detain, keep wailing, hold out to. 78 DDGP: 1 fundado na razão; sensato 2   plausível; verossímil. 79 DDGP: 1 revés; adversidade; infelicidade; 2 falta; erro; equívoco. 80 pequeno pedaço de carne. 81 DDGP: 1 raposa; 2 pessoa ardilosa. 82 DDGP: 1 que não tem êxito; infortunado; infeliz. 83 DDGP: 1 prosseguir em frente; avançar. 84 LSJ: destroy. 85 DDGP: cheio de temor respeitoso; reservado; discreto. 86 DDGP: 1 ver na totalidade, em conjunto; abarcar num golpe de vista. 87 DDGP: 1   desvio; deslocamento; declinação (astro) 2   inclinação; tendência 3   ação de evitar; recusa de. 88 DDGP: poder, ser capaz de. http://www.perseus.tufts.edu/hopper/morph?l=a%29lw%2Fphc&la=greek&can=a%29lw%2Fphc0&prior=a)/nqrwpos http://www.perseus.tufts.edu/hopper/morph?l=a%29tuxh%2Fs&la=greek&can=a%29tuxh%2Fs0&prior=e)pi/ http://www.perseus.tufts.edu/hopper/morph?l=proko%2Fptw&la=greek&can=proko%2Fptw0&prior=au)to/s http://www.perseus.tufts.edu/hopper/morph?l=sunora%2Fw&la=greek&can=sunora%2Fw0&prior=lo/gos 44 Platão, Ilíada de Homero e Metafísica de Aristóteles). Da mesma forma, palavras como φαντάζω, φαντασία, φαντασιόω e φάντασις aparecem com frequência e frequência relativa mais altas em Epicteto, sendo também frequentes em obras do mesmo dialeto koinê, como no De defectu oraculorum de Plutarco e Histórias de Políbio, e no também estoico Marco Aurélio. As palavras φαντάζω e φάντασις, que apareceram com alta frequência e alta frequência relativa na ferramenta da Perseus, mas com pontuação zero nas frequências mínimas, não estão registradas no corpus de Epicteto, segundo DS. As ocorrências localizadas89 pela ferramenta VocabT de φάντασις, nas formas φαντασιῶν90 e φαντασίας91, são na verdade formas de φαντασία e as ocorrências92 de φαντάζω são, na verdade, formas de φαντάζομαι e φαντασία. As demais palavras lexicais seguem a estimativa da ferramenta da Perseus, estando dentro da margem possível de frequência máxima e mínima. Em relação às palavras gramaticais, há alta frequência de οὐ, σός, σοῦ, καί, γάρ, οὖν, ὅτι, πως, πῶς, τις e τίς, que no texto estão ligadas ao caráter dialógico do estilo de Epicteto e a sequências argumentativas. Assim, perguntas e respostas, situações imaginadas, construção de argumentos e conclusões do texto são expressos por meio de pronomes na segunda pessoa, advérbios e pronomes interrogativos e conectivos lógicos. Em Epicteto, ainda, existem frases e expressões comuns nos registros de seus ensinos. Uma dessas expressões é a que abre o primeiro capítulo de seu primeiro livro: ἐφ᾽ ἡμῖν, formada pela preposição ἐπί e o pronome ἡμεῖς no dativo. Seu significado básico pode ser “ao alcance de” ou “no poder de”93 e, no caso, se refere literalmente àquilo que está sob nosso poder. A expressão também é encontrada com um advérbio de negação: οὐκ ἐφ᾽ ἡμῖν. Usando o Diorisis também foi possível encontrar a frequência94 e suas localizações na obra de Epicteto: são 71 ocorrências dessas expressões, sendo a 89 Disponível em: http://www.perseus.tufts.edu/hopper/searchresults?q=fa/ntasis&target=greek&doc=Perseus:text:1999.01. 0235&expand=lemma&sort=docorder 90 Subst. Fem., pl. e no caso gen. 91 Subst. Fem., pl. e no caso acus. 92 Disponível em: http://www.perseus.tufts.edu/hopper/searchresults?q=fanta/zw&target=greek&doc=Perseus:text:1999.01. 0235&expand=lemma&sort=docorder. 93 DDGP. Em Bailly e LSJ também aparece como “depender de”, “na dependência de”. 94 Cf. Anexo C. 45 maior parte em seu Manual. τὰ καθήκοντα é outra expressão comum formada pelo particípio plural do verbo καθήκω, que significa “descer”95, mas que na forma participial pode significar “a situação” ou “o que se deve enfrentar”96, “one's due or duty” ou “the payments due”97, mas que, segundo Watanabe (2020), seria melhor entendida para os estoicos como as ações corretas ou virtuosas98. Assim, retomando Burrows (2004), alguns traços do estilo dos Discursos Epicteto, sobretudo os cinco capítulos iniciais, foram apercebidos por meio das palavras comuns, palavras-chaves e expressões-chaves. A consideração desses traços estilísticos contribuiu com a análise do texto e, portanto, com proposta de tradução. 4.3 Análise do procedimento tradutológico A tradução do corpus, os cinco capítulos iniciais dos Discursos de Epicteto, foi realizada com o auxílio das ferramentas digitais, editores de alinhamento e anotação sintática em treebank, e contou com orientações tradutológicas de M. Baker (2018) para as escolhas dos equivalentes lexicais e apoio de outras traduções, especialmente Dobbin (2008), Hard (2014), Souilhé (1975) e García (1993). 4.3.1 Ordem das etapas Inicialmente, as etapas de procedimento tradutológico respeitaram a seguinte ordem: Tradução do Corpus (TC) ≺ Alinhamento da Tradução (ATrd) ≺ Anotação em Treebank (AnTrb). Essa ordem foi seguida por se considerar que a AnTrb registraria a leitura sintática já feita nas primeiras etapas, no entanto, durante a tradução do primeiro capítulo, percebeu-se que a AnTrb exigia constantes reformulações da TC, ou porque a leitura registrada em árvore não correspondia à da tradução ou porque a anotação demonstrou que a tradução possuía falhas em relação ao texto grego. Além disso, percebeu-se que a AnTrb, na verdade, auxiliou a compreensão do texto grego à medida que as árvores das sentenças foram montadas e as diferentes leituras possíveis de uma mesma sentença foram confrontadas. 95 DDGP. 96 DDGP. 97 LSJ. 98 Disponível em: http://www.perseus.tufts.edu/hopper/morph?l=fantasi%2Fa&la=greek&can=fantasi%2Fa0&prior=mo/nos #lexicon. 46 Assim, essas reformulações da TC provocadas pela AnTrb afetaram diretamente a etapa de ATrd, pois algumas vezes alinhar a tradução reformulada com o texto grego foi mais fácil do que alterar o código fonte do arquivo inicial. Então, a ordem do procedimento tradutológico foi alterada de modo a dar prioridade para a anotação sintática em treebank no procedimento tradutológico e passou a ser: TC ≺ AnTrb ≺ ATrd. No período “μόνη γὰρ αὕτη καὶ αὑτὴν κατανοήσουσα παρείληπται”, trecho de 1.1.4e, exemplifica essa necessidade ao apresentar uma discrepância em relação à anotação em treebank de μόνη99 e a tradução literal, “Pois esta é recebida sozinha”, em que o adjetivo é entendido estar em posição predicativa100 de acordo com as gramáticas, mas foi anotado inicialmente de maneira erronea como ATR, ou seja, um atributo do pronome αὕτη101 e, portanto, em posição atributiva102. A tradução correspondente à anotação com a etiqueta ATR, para μόνη, seria aparentemente “Pois esta só é recebida”, opção de alguns tradutores como García (2008)103 e Hard (2014)104. Para que houvesse coerência entre a leitura do texto grego, em que se entende estar μόνη de fato em posição predicativa105, pois precede o pronome (“μόνη αὕτη”), e o registro em treebank, o adjetivo foi anotado como ADV dependendo do verbo principal παρείληπται106 por ser um modificador opcional deste. A figura 15 exibe as duas anotações em treebank, sendo a árvore do lado 1 a anotação de μόνη em posição atributiva e recebendo a etiqueta ATR e a árvore do lado 2 como posição predicativa, anotado ADV. 99 DDGP: só, isolado de, único. 100 SG: O adj. predicativo pode tanto preceder ou suceder o artigo e seu substantivo, como em σοφὸς ὁ ἀνήρ ou ὁ ἀνὴρ σοφός, o homem é sábio. No caso de haver um pronome demonstrativo com o predicativo do sujeito, a posição é οὗτος σοφὸς ou σοφὸς οὗτος, este é sábio, com o verbo elíptico. 101 DDGP: este, esta, isto. 102 SG: O artigo e o adjetivo atributivo precedem o substantivo, como em ὁ σοφὸς ἀνήρ ou, como na construção menos frequente ὁ ἀνὴρ ὁ σοφός, o homem sábio. 103 ” Pues sólo ella nos ha sido entregada”, p. 56. 104 “For that alone of all the faculties that we’ve been granted”, p. 37. 105 CamG: em posição predicativa, μόνος significa sozinho, apenas, por si mesmo e em posição atributiva, o(a) único(a). 106 DDGP: παραλαμβάνω 1   tomar para si ou consigo; receber, acolher; 2   receber por herança ou transmissão algo. 47 4.3.2 Tradução do corpus O procedimento tradutológico iniciou-se com a decodificação das unidades e estruturas do texto, visando comunicar o sentido geral do trecho (BAKER, M., 2018, p. 10). Esse processo foi particularmente importante por ter a língua grega grande variação flexional e grande ambiguidade de formas de palavras. No período “ὁ οὖν ἐξηγούμενος αὐτὸ δοκεῖ ὅτι πλείονος ἄξιός ἐστιν ἢ πέντε δηναρίων”, em 1.4.16c, por exemplo, o verbo δοκέω107 aparece na forma δοκεῖ, que pode ser tanto segunda como terceira pessoa do singular108. A princípio, ambas as opções pareceram viáveis ao contexto, uma vez que o autor usa com frequência a segunda pessoa para se dirigir ao público, inclusive no contexto imediato, e sintaticamente δοκεῖ pode ter ὁ ἐξηγούμενος109 como sujeito experienciador. Os tradutores pareceram se dividir entre essas duas possibilidades, como García110 (1993) e Hard111 (2014) tomando preferência da primeira opção, e Souilhé112 (1975) e Long113 (1890), pela segunda. Somada a essa primeira impressão, a anotação incoerente em treebank fez com que a sentença recebesse mais atenção: ὁ ἐξηγούμενος foi anotado como SBJ de δοκεῖ por estar no caso nominativo, porém a primeira tentativa de tradução optou pelo verbo na segunda pessoa: “Então, pareces-te que aquele que o explica...”, ou seja, foi atribuído ao verbo um sujeito que lhe seria incompatível. 107 DDGP: parecer, considerar. 108 Pres. ind. e at. na terceira pessoa; mp. na segunda pessoa. 109 Part. sg. pres. mp. masc. nom.; DDGP : conduzir, dirigir, explicar, interpretar. 110 “Te parece entonces que el que lo explica valdrá más de cinco denarios?”, p. 68. 111 “So do you suppose that someone who interprets it is worth more than five denarii?”, p. 45. 112 “Et alors l'intrerprète de ce livre, croit-il valoir plus de cinq deniers?”, p. 19. 113 “Does then the expounder seem to be worth more than five denarii?”, disponível on-line: http://www.perseus.tufts.edu/hopper/text?doc=Perseus%3Atext%3A1999.01.0236%3Atext%3Ddisc%3A book%3D1%3Achapter%3D4. 1 2 Figura 15: Diferentes anotações de μόνη em 1.1.4e Fonte: Captura de tela 48 Então, a decisão sobre a pessoa do verbo, segunda ou terceira pessoa, e seu sujeito, um pronome de segunda pessoa ou ὁ ἐξηγούμενος, conduziu ao estudo dos usos do verbo δοκέω prescritos na gramática e por Epicteto. Segundo a CamG, δοκέω possui três usos: (1) como um verbo impessoal com um infinitivo dinâmico, (2) como um verbo pessoal com um infinitivo declarativo (e um complemento no dativo) e, ainda, (3) como um verbo pessoal com um declarativo acusativo-e-infinitivo. Segundo Ragon (2012), “quando uma oração completiva em um modo pessoal, no infinitivo ou no particípio, depende de um verbo ou de uma expressão impessoal, seu sujeito torna-se muitas vezes sujeito do verbo principal construído de forma pessoal” (p. 234). Em seu estudo sobre os papeis sintático-semânticos de δοκέω, Padín (2021) afirma que a construção pessoal é mais frequente e que geralmente corresponde ao esquema: Sujeito + δοκεῖ + oração no infinitivo + dativo experienciador (p. 402). A construção de 1.4.16c, entretanto, não apresenta um infinitivo nem pronome no dativo. Os casos encontrados nos dicionários DGE e LSJ parecem indicar que o uso impessoal é comum na forma ativa da terceira pessoa do singular com um experienciador no dativo (e.g. μοι, σοι), com o objeto ou infinitivo como sujeito. No uso pessoal o verbo também é encontrado na voz ativa, com sujeito no nominativo. O uso do verbo com voz média é raro, segundo Montanari (2000), podendo estar no particípio presente e no imperfeito, com o sentido de “imaginar-se”, “ser decretado”, ser “decidido” (p. 551). Assim, seria improvável que a forma na voz média fosse a pretendida por Epicteto. A investigação conduziu ao aparato crítico da edição de Schenkl (1916), em que há uma nota a respeito de δοκεῖ indicando duas edições com leituras diferentes: δοκεῖς em Meib. e δοκεῖ σοι em R114. Assim, as traduções que optam pelo uso do verbo na segunda pessoa pressupõem o verbo δοκεῖ na segunda pessoa com voz ativa, na forma δοκεῖς, ou com um pronome experienciador σοι elíptico. Estatisticamente, a forma exata δοκεῖ aparece 60 vezes em todos os quatro livros dos Discursos, segundo DS. Fora o trecho em questão, em nenhum outro contexto a ambiguidade (segunda ou terceira pessoa) parece ser possível. É muito mais comum a Epicteto usar a expressão δοκεῖ σοι115, com 16 ocorrências nos Discursos, quando está se 114 Meib: “M. Meobomii animadversiones ab H. Relando in ed. Enchir. 1711 evulgatae”; R: “animadversiones I. I. Reiskii in bibliotheca regia Hausiensi adservatae, quas partim in marg. ed. Cantabrigiensis (r), partim a. 1735 Uptoni editione adhibita in schedis (R) enotavit” (1916, p. CXII). 115 Pronome pessoal no dat., “te”. 49 dirigindo a um interlocutor (e.g. 1.11.32; 1.14.2) ou ainda mais precisamente, usar a forma δοκεῖς116, que possui 24 ocorrências (e.g. 1.19.9; 1.26.6). As possibilidades mais prováveis, de acordo com essa pesquisa, seria a leitura de δοκεῖ no uso impessoal, tendo por sujeito experienciador um pronome σοι, elíptico na edição adotada, mas subentendido pelo contexto ou no uso pessoal, com ὁ ἐξηγούμενος por sujeito. O registro dessas diferentes leituras em treebank seria conforme a figura 16. A árvore do lado 1 representa a primeira opção, em que δοκεῖ é entendido como segunda pessoa, singular, e teria σοι por sujeito experienciador e sendo ὁ ἐξηγούμενος sujeito de ἐστιν. A árvore do lado 2 representa δοκεῖ como terceira pessoa, singular, que possui ὁ ἐξηγούμενος como sujeito experienciador e ἐστιν impessoal. A opção escolhida pela tradução proposta, segue a leitura padrão da edição, tendo ὁ ἐξηγούμενος por sujeito experienciador de δοκεῖ: “Então, quem o explica parece mais valioso do que cinco denários?”. Após a identificação dos itens lexicais, buscou-se encontrar os equivalentes entre as línguas no nível da palavra, considerando as orientações tradutológicas de M. Baker nos casos de não equivalência (2008, p. 19-46). A autora lista problemas comuns de não equivalência e estratégias usadas por tradutores profissionais, cujo auxílio é exemplificado a seguir em alguns casos do corpus. No início do primeiro capítulo dos Discursos, Epicteto quer mostrar a superioridade da faculdade lógica acima das demais. O que poderia ser considerado como uma faculdade (δύναμις) para o autor? Segundo Dobbin, o substantivo abrange “não apenas artes como gramática e música (§1), mas também as faculdades da alma” (2008, 116 Segunda pessoa, sg. Pres. Ind. At. 1 2 Figura 16: Registros de 1.4.16c em treebank Fonte: Captura de tela 50 p. s.n.). É por isso que a opção de Oldfather117 (1925) e Hard118 (2014) foi a de traduzir δύναμις como “artes e faculdades”. Segundo o dicionário LSJ, o significado para este contexto está relacionado a faculty, art ou craft. Para o DGE, facutad é a opção indicada. O DDGP traz as opções capacidade, faculdade, talento, potência ou poder. Em língua portuguesa, nenhuma dessas opções parece abranger o sentido pretendido por Epicteto, consistindo em um problema de palavra semanticamente complexa da língua fonte. A saída adotada por Hard e Oldfather, traduzir por uma paráfrase usando palavras relacionadas, parece resolver parte do problema, pois em outras ocorrências de δύναμις apenas a palavra “faculdade” é usada para a traduzir o termo (e.g. 1.1.4). Por isso, a opção desta tradução foi manter apenas “faculdade” para designar as faculdades da alma e as artes, por ser um termo geral e considerar que é possível ao leitor compreender que o termo abrange as artes da gramática e música nos primeiros parágrafos do texto. Uma das palavras-chave nas obras de Epicteto é φαντασία (phantasia). É o substantivo com maior frequência nas buscas realizadas, aparecendo em ambos resultados de termo chave e frequência ponderada. Possui 106 ocorrências nas obras de Epicteto, sendo 94 apenas nos Discursos, em que a frequência a cada 100 palavras é de 0,13. Nos primeiros cinco capítulos aparece 5 vezes. A distribuição das formas da palavra nas obras de Epicteto pode ser vista no Diorisis, conforme a figura 17. 117 “Among the arts and faculties in general”, p. 7. 118 “Among all the arts and faculties”, p. 4. Figura 17: Resultado da busca por fantasia em DS Fonte: Captura de tela 51 No dicionário LSJ, o significado básico de φαντασία é “aparição” ou “aparência”119 e, para o DDGP120, “visão”, “exposição”, “faculdade de imaginar”, “vista” ou “visual”. Segundo Watanabe (2020), em seu glossário de termos filosóficos de Epicteto, a entrada φαντασία significa uma impressão que envolve percepção e também o julgamento sobre a percepção, sendo exemplificado pelo reconhecimento de algo, como em "aqui está o dinheiro", e por seu juízo, como em "dinheiro é uma coisa boa" ou "ninguém deve buscar dinheiro"121. Entre os tradutores, Hard (2014) prefere “impression”, enquanto García (1993) “representación” e Souilhé (1975) “représentation”. Segundo Dinucci (2017), a compreensão do termo é fundamental para a compreensão da filosofia estoica porque está a ligada a: questões lógicas, epistemológicas e éticas, estabelecendo a relação entre o hegemonikon (a parte diretriz da mente humana) e o mundo e possuindo simultaneamente um caráter corpóreo (na medida em que é uma alteração do hegemonikon causada por um objeto exterior), lógico (pois o mais importante tipo de phantasia dos seres racionais possui conteúdo proposicional) e epistemológico (pois através da phantasia os seres racionais podem efetivamente conhecer o mundo) (DINUCCI, 2017, p. 16). Arriano abre o registro mais importante dos ensinos de Epicteto abordando um tema tipicamente estoico: as coisas que estão e as coisas que não estão ao nosso alcance, ou que dependem de nós. De todas as faculdades que o ser humano possui, afirma Epicteto, apenas a racional consegue contemplar a si mesma, julgar as outras faculdades e é a que sabe fazer uso das φαντασίας. Foi designado pelos deuses aos seres humanos apenas o uso correto das φαντασίας, assim, todas as outras coisas não dependem de nós (1.1.7)122. Hadot demonstra que há em Epicteto um esquema temático ternário, que são “os domínios nos quais deve situar-se a prática dos exercícios espirituais filosóficos” (2014, 119 Disponível em: http://www.perseus.tufts.edu/hopper/morph?l=fantasi%2Fa&la=greek&can=fantasi%2Fa0&prior=mo/nos #lexicon. 120 http://perseidas.fclar.unesp.br/2x/s.php?id=30197. 121 Disponível em: https://dcc.dickinson.edu/epictetus-encheiridion/intro/glossary 122 “ὥσπερ οὖν ἦν ἄξιον, τὸ κράτιστον ἁπάντων καὶ κυριεῦον οἱ θεοὶ μόνον ἐφ᾽ ἡμῖν ἐποίησαν, τὴν χρῆσιν τὴν ὀρθὴν ταῖς φαντασίαις, τὰ δ᾽ ἄλλα οὐκ ἐφ᾽ ἡμῖν. ἆρά γε ὅτι οὐκ ἤθελον;”, traduzido como, “Portanto, como era conveniente, os deuses fizeram depender de nós unicamente aquilo que é o soberano mais poderoso de todos, o uso correto das impressões, mas as outras coisas não dependem de nós. Será que não queriam?”. 52 p. 154), e que corresponde às três partes da filosofia estoica: física, ética e lógica. A lógica corresponde ao terceiro tema, concernente à disciplina do assentimento, a um bom uso das φαντασίας. As três partes são interdependentes e exercem influência umas sobre as outras, como conclui Hadot: A disciplina dos desejos e a disciplina das tendências se reportam, todas as duas, a uma disciplina da representação, isto é, a uma mudança na maneira de ver as coisas: trata-se precisamente, como acabamos de ver, de recolocar os objetos na perspectiva geral da natureza universal ou da natureza racional humana; trata-se igualmente de separar a representação da emoção (isto é, da falsa representação) que a acompanha e que provoca em nós perturbação, tristeza ou medo. Por essa razão, a palavra “representação” (phantasia) é frequentemente carregada, em Marco Aurélio, de um certo valor afetivo, porque designa não somente a imagem de um objeto, mas a imagem de um objeto acompanhado de um falso juízo concernente a este objeto (HADOT, 2014, p. 157). Assim, seja qual for a opção escolhida para a tradução de φαντασία – impressão, representação, aparência ou apresentação – haverá falta de correspondência semântica entre as línguas. M. Baker qualifica esse tipo de não equivalência no nível da palavra como o de uma palavra da língua fonte que é semanticamente complexa: uma única palavra que consiste em um único morfema pode às vezes expressar um conjunto complexo de significados mais do que toda uma sentença. Línguas automaticamente desenvolvem formas concisas próprias para se referir a conceitos complexos se os conceitos se tornam importantes o bastante para serem falados com frequência (2018, p. 20). Uma das estratégias listadas por Baker para lidar com esse tipo de não equivalência é optar por uma palavra mais neutra, menos expressiva (2018, p. 27). Através do alinhamento da tradução, o leitor poderá identificar o equivalente usado na presente tradução, “impressão”, para φαντασία e ser estimulado a identificar as discrepâncias entre as línguas (FERREIRA, A.; BLACKWELL, C.; PALLADINO, C., 2020, p. 124). 4.3.3 Anotação em treebank e alinhamento do corpus A AnTrb, realizada em todo o corpus, contribuiu para a decodificação sintática das sentenças e sua exposição de maneira explícita. Essa contribuição foi ainda mais 53 destacada nas sentenças de construção bastante complexa, como 1.4.18b-19123, em que duas orações coordenadas, com vários dependentes cada, possuem seus verbos principais ἐστί elípticos. Sendo assim, as sentenças de 1.4.18b e 1.4.19 são a resposta à pergunta de 1.4.18a, “Onde, então, está o progresso?”, com duas orações coordenadas cujos verbos principais, seus PREDs, estão elípticos e que poderiam iniciar com “O progresso está em, se....”. O trecho foi traduzido da seguinte maneira: Se alguém de vós, tendo renunciado as coisas externas, volta a atenção para a sua própria escolha, cultivá-la e executá-la, de modo a torná-la de acordo com a natureza - elevada, livre, sem travas, desimpedida, leal e reservada; [19] e se aprendeu que quem deseja as coisas que não estão ao seu alcance ou as evita não é capaz de ser leal nem livre, mas é forçoso mudar e, ao mesmo tempo, ser levado por aquelas e, também, é forçoso se subordinar aos outros, que podem proporcionar ou impedi-las124. A figura 18 mostra a anotação em treebank de 1.4.18b, cujo verbo principal ἐστί (PRED_CO) é suprido por um aT. 123 [18b] εἴ τις ὑμῶν ἀποστὰς τῶν ἐκτὸς ἐπὶ τὴν προαίρεσιν ἐπέστραπται τὴν αὑτοῦ, ταύτην ἐξεργάζεσθαι καὶ ἐκπονεῖν, ὥστε σύμφωνον ἀποτελέσαι τῇ φύσει, ὑψηλὴν ἐλευθέραν ἀκώλυτον ἀνεμπόδιστον πιστὴν αἰδήμονα: [19] μεμάθηκέν τε, ὅτι ὁ τὰ μὴ ἐφ᾽ αὑτῷ ποθῶν ἢ φεύγων οὔτε πιστὸς εἶναι δύναται οὔτ᾽ ἐλεύθερος, ἀλλ᾽ ἀνάγκη μεταπίπτειν καὶ μεταρριπίζεσθαι ἅμα ἐκείνοις καὶ αὐτόν, ἀνάγκη δὲ καὶ ὑποτεταχέναι ἄλλοις ἑαυτόν, τοῖς ἐκεῖνα περιποιεῖν ἢ κωλύειν δυναμένοις:. 124 Cf. pg. 69. Fonte: Captura de tela Figura 18: AnTrb de 1.4.18b 54 Em 1.4.19, da mesma forma, “μεμάθηκέν”125 não é o verbo principal, mas um dependente da conjunção elíptica εἰ, que por sua vez é dependente de um ἐστί também elíptico que está em coordenado com 1.4.18b. A figura 19 apresenta a AnTrb da sentença 1.4.19. A complexidade tanto texto grego como do registro em árvore sintática dessas sentenças é em razão da sequência de condicionais e elisões como resposta de uma pergunta predicativa, “o que é progresso?”. A anotação em treebank demonstrou de maneira dinâmica essa complexidade, permitindo perceber com mais clareza as possibilidades sintáticas e a comparação das soluções dos tradutores. Da mesma forma, a AnTrb de 1.4.32 contribuiu para a compreensão e tradução da sentença. Nela também existem duas estruturas coordenadas, uma em relação aos verbos principais, coordenados por δέ, e outra em relação a duas orações que dependem do primeiro verbo, coord