ANNA LUISA LOPES ALVES As that-clauses em abstracts escritos por alunos brasileiros de universidades públicas: uma análise baseada em corpus São José do Rio Preto 2018 ANNA LUISA LOPES ALVES As that-clauses em abstracts escritos por alunos brasileiros de universidades públicas: uma análise baseada em corpus Dissertação apresentada como parte dos requisitos para obtenção do título de Mestre em Estudos Linguísticos, junto ao Programa de Pós-Graduação em Estudos Linguísticos, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CAPES Orientadora: Profª. Drª. Paula Tavares Pinto São José do Rio Preto 2018 Ficha catalográfica elaborada pela Biblioteca do IBILCE UNESP - Câmpus de São José do Rio Preto Alves, Anna Luisa Lopes. As that-clauses em abstracts escritos por alunos brasileiros de universidades públicas : uma análise baseada em corpus / Anna Luisa Lopes Alves . -- São José do Rio Preto, 2018 105 f : il., tabs. Orientador: Paula Tavares Pinto Dissertação (mestrado) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Instituto de Biociências, Letras e Ciências Exatas 1. Linguística aplicada. 2. Língua inglesa - Estudo e ensino. 3. Resumos. 4. Linguística de corpus. 5. Gramática comparada e geral – Cláusulas. 6. Comunicação em língua estrangeira. 7. Estudantes universitárias. I. Universidade Estadual Paulista "Júlio de Mesquita Filho". Instituto de Biociências, Letras e Ciências Exatas. II. Título. CDU – 420-07 ANNA LUISA LOPES ALVES As that-clauses em abstracts escritos por alunos brasileiros de universidades públicas: uma análise baseada em corpus Dissertação apresentada como parte dos requisitos para obtenção do título de Mestre em Estudos Linguísticos, junto ao Programa de Pós-Graduação em Estudos Linguísticos, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CAPES Comissão Examinadora Profª. Drª. Paula Tavares Pinto UNESP – Câmpus de São José do Rio Preto Orientadora Profª. Drª. Sandra Mari Kaneko Marques UNESP – Câmpus de Araraquara Profª. Drª. Deise Prina Dutra UFMG – Câmpus de Belo Horizonte Suplentes Profª. Drª. Adriane Orenha Ottaino UNESP – Câmpus de São José do Rio Preto Profª. Drª. Regiani Aparecida Santos Zacarias UNESP – Câmpus de Assis São José do Rio Preto 10 de abril de 2018 À minha amada família e especialmente ao meu querido avô Francisco B. Lopes (em memória). AGRADECIMENTOS Agradeço a Deus em primeiro lugar, por ter me concedido, através da fé, paciência, entendimento e clareza emocional, que foram essenciais para conseguir completar mais uma etapa da minha vida acadêmica. À minha família, Marilena, Joselias, João Pedro e o pequeno Renam, por serem meu porto seguro desta vida, por sempre andarem junto comigo, demonstrarem um amor incondicional e orgulho por minhas escolhas. Obrigada por serem as pessoas mais fortes, honestas e especiais que já tive o prazer de conhecer. Agradeço também às minhas avós, as mulheres mais especiais e maravilhosas da minha vida. Mulheres que merecem todo reconhecimento e honra nesta vida. A essas mulheres, que sempre, pela fé, me fortificaram e fortificam a cada dia, dedico a minha gratidão. Agradeço também a todos os familiares, primos, tias e tios que sempre acompanharam minhas conquistas e se orgulharam de mim. Agradeço ao meu companheiro Eduardo, por toda a paciência e amor durante o mestrado. Obrigada por dizer palavras positivas que me impulsionaram a buscar o meu melhor nos últimos anos, na vida, e como aluna de pós-graduação. Sou muito grata à minha orientadora, Profª. Drª. Paula Tavares Pinto, por me guiar desde os projetos de Iniciação Científica da minha graduação até o mestrado. Obrigada por todo aprendizado até aqui, por me mostrar o caminho da Linguística de Corpus e confiar na minha capacidade de completar todos os requisitos acadêmicos no meu processo de formação acadêmica. Muito obrigada à Profª. Drª. Deise Prina Dutra, por ter se disponibilizado a debater este trabalho no IX Seminário de Estudos Linguísticos da Unesp, câmpus de São José do Rio Preto – SP. Suas contribuições acrescentaram em muitos aspectos para minha pesquisa. Agradeço também pela disponibilização do corpus CorIFA para que fosse utilizado neste trabalho. Muito obrigada, também, às Profª. Drª. Talita Serpa e Profª. Drª. Sandra Kaneko Marques que aceitaram o convite para banca de qualificação e por contribuírem tão ricamente apontando considerações a respeito deste trabalho. Não posso deixar de citar e agradecer aos amigos que fiz durante o processo de mestrado. O meu agradecimento especial destina-se especialmente à Aline Cantarotti e Mayra Santos, vocês foram essenciais na minha caminhada acadêmica, obrigada por escutarem minhas dúvidas e tentarem saná-las da melhor maneira possível. Agradeço também os colegas Luciano Franco e Ariel Fernandes pela companhia no cumprimento das disciplinas e pela parceria nas orientações. Ademais, sou grata às minhas amigas da vida toda que, me fizeram rir e proferiram palavras de ânimo e conforto nos momentos mais difíceis do mestrado. Por fim, agradeço à CAPES, agência financiadora do presente trabalho. RESUMO A escrita de abstracts tem sido estudada por pesquisadores de diferentes áreas (BATHIA; 1993; SWALES; FEAK, 2009; DAYRELL, 2011) para que seja possível observar quais padrões são mais utilizados por autores de revistas de impacto internacional a fim de preparar pesquisadores para a escrita deste gênero textual. Nesta dissertação, objetivamos analisar como a Linguística de Corpus e o Corpus de aprendizes (DUTRA, et al, 2016), composto por textos de alunos brasileiros de universidades públicas, e o Corpus MICUSP (RÖMER, 2012), contendo textos de alunos nativos e não-nativos de língua inglesa da Universidade de Michigan, podem ser utilizados no desenvolvimento da escrita acadêmica de abstracts (BIBER, 2007; SWALES e FEAK, 2009; GLASMAN-DEAL, 2010) e como alunos universitários utilizam as that-clauses para reportarem as descobertas, resultados e conclusão de seus trabalhos em abstracts. Após coleta e compilação dos nossos corpora de análises, utilizamos o programa linguístico e computacional Sketch Engine (KILGARRIFF, et al, 2014) para criar linhas de concordância com a palavra that e, a partir dos resultados, foi possível observar que tanto na escrita de abstracts de alunos de universidades brasileiras, quanto na escrita de abstracts de alunos da Universidade de Michigan, as estruturas mais utilizadas no desenvolvimento da escrita das descobertas, resultados e conclusões, foram as seguintes: sujeito + verbo no passado simples + that e sujeito + verbo no presente simples + that, respectivamente, se alinhando com resultados de pesquisa de autores como Biber, et al. (2007) e Glasman-Deal (2010). O resultado final demonstrou que é possível utilizar a Linguística de Corpus para o ensino e aprendizagem de Inglês com Fins Acadêmicos e obter um desfecho positivo na escrita acadêmica de abstracts, de acordo com a verificação das estruturas utilizadas pelos alunos em seus resumos e, também é possível desenvolver atividades didáticas utilizando Corpus de aprendizes para que a autonomia do aluno como pesquisador seja desenvolvida. Ademais, notamos com esta pesquisa que a LC é uma área muito abrangente que permite diversos tipos de trabalhos e aplicações, visando análises de dados linguísticos para os mais diversos fins, e, ressaltamos, de acordo com Berber Sardinha (2004), que a utilização de corpus no ensino de línguas estrangeiras é uma maneira de auxiliar o ensino e aprendizagem de uma segunda língua tornando seu aprendiz mais autônomo. Palavras-chave: Linguística de Corpus e ensino. IFA. Abstracts. That-clauses. ABSTRACT The writing of abstracts has been studied by researchers from different areas (BATHIA, 1993; SWALES e FEAK, 2009; DAYRELL, 2011) so that it is possible to observe which standards are most used by authors of international impact journals in order to prepare researchers for the writing of this textual genre. In this dissertation, we aim to analyze how Corpus Linguistics and Learner Corpus (DUTRA, et al., 2016), composed of texts by Brazilian students of public universities, and Corpus MICUSP (RÖMER, 2012), with texts written by native and non-native speakers of English can be used to help academic writing (BIBER, 2007, SWALES and FEAK, 2009; GLASMAN-DEAL, 2010) and how college students use that-clauses to report discoveries, results and conclusion of their researchs in abstracts. After collecting and compiling our corporus of analysis , we used the linguistic and computational program Sketch Engine (KILGARRIFF, et al, 2014) to generate concordance lines with the search word “that” and, based on the results, it was possible to observe that in both, writing abstracts of students of Brazilian universities, as well as in the writing of abstracts of University of Michigan students, the most used structures in the development of the writing of discoveries, results and conclusions, were the following structures: subject + verb in past simple + that, and subject + present simple + that, respectively, aligning with search results of authors such as Biber, et al. (2007) and Glasman-Deal (2010). The final result showed that it is possible to use Corpus Linguistics for teaching and learning English for Academic Purposes and to obtain a positive result in the academic writing of abstracts, according to the verification of the structures used by the students in their abstracts. It is also possible to develop teaching activities using Learner Corpus so that the autonomy of the student as a researcher is developed. In addition, we observed with this research that Corpus Linguistics is a very broad area that allows different types of works and applications, aiming at analysis of linguistic data for the most diverse purposes, and, according to Berber Sardinha (2004), that the use of corpus in the teaching of foreign languages is a way of helping the teaching and learning of a second language making learners more autonomous. Keywords: Corpus Linguistics and teaching. EAP. Abstracts. That-clauses. LISTA DE FIGURAS Figura 01: Apresentação do CorIFA ...................................................................................... 30 Figura 02: Apresentação dos gêneros de IFA do website CorIFA ........................................ 31 Figura 03: Porcentagens dos textos disponibilizados pelo MICUSP .................................... 35 Figura 04: Porcentagens de áreas de pesquisa presentes no MICUSP .................................. 35 Figura 05: Abstract da área de Biológicas que está inserido no MICUSP ............................ 36 Figura 06: A estrutura de um artigo científico ou tese .......................................................... 40 Figura 07: Seleção da área de pesquisa para o corpus MICUSP ........................................... 53 Figura 08: Layout da página inicial da ferramenta Sketch Engine ........................................ 54 Figura 09: Demonstração de alguns corpora existentes no programa .................................. 55 Figura 10: Ilustração de como criar um corpus no Sketch Engine ........................................ 55 Figura 11: Exemplificação do upload de textos no Sketch Engine ....................................... 56 Figura 12: Processo de compilação de corpus no programa Sketch Engine .......................... 57 Figura 13: Demonstração do processo de compilação completo ........................................... 57 Figura 14: Pesquisando em seus próprios corpora ................................................................ 58 Figura 15: Sobre uma amostra de linhas de concordância geradas com a palavra de busca that .................................................................................................................................................. 59 Figura 16: Organização final do Corpus de aprendizes ......................................................... 62 Figura 17: Organização do Corpus MICUSP ........................................................................ 63 Figura 18: Amostra da lista de frequência da palavra de busca that no Corpus de aprendizes .................................................................................................................................................. 66 Figura 19: Apresentação do contexto em que a palavra de busca está inserida ..................... 68 Figura 20: Lista de frequência da palavra de busca that no Corpus MICUSP ...................... 75 Figura 21:Apresentação do contexto em que a palavra de busca está inserida – Corpus MICUSP .................................................................................................................................. 77 LISTA DE GRÁFICOS Gráfico 01: Reprodução do gráfico de Alves e Tagnin (2012, p. 18) sobre as áreas em que a LC está presente ...................................................................................................................... 25 Gráfico 02: Adaptação do gráfico de Alves e Tagnin (2012, p. 20) sobre a distribuição das pesquisas voltadas para o ensino de línguas estrangeiras ....................................................... 26 Gráfico 03: Representação do uso de that no Corpus de aprendizes ..................................... 70 Gráfico 04: Porcentagens de that-clauses nos movimentos retóricos 4 e 5 – Corpus de aprendizes ................................................................................................................................ 71 Gráfico 05: Representação do uso de that no Corpus MICUSP ............................................ 79 Gráfico 06: Porcentagens de that-clauses nos movimentos retóricos 4 e 5 – Corpus MICUSP................................................................................................................................... 79 LISTA DE QUADROS Quadro 01: Características e variáveis no ensino de IFE ...................................................... 28 Quadro 02: Características de um CA ................................................................................... 30 Quadro 03: Quadro de movimentos retóricos de Swales e Feak (2009) .............................. 41 Quadro 04: Os movimentos retóricos propostos por Bhatia (1993) ...................................... 42 Quadro 05: Palavras utilizadas para o desenvolvimento dos movimentos retóricos 4 e 5 em abstracts .................................................................................................................................. 44 Quadro 06: Adaptação da tabela de Swales e Feak (2009 p. 04) sobre média de palavras usadas em abstracts ................................................................................................................. 45 Quadro 07: Exemplos de sentenças para a construção dos movimentos retóricos 4 e 5 ....... 47 Quadro 08: Divisão das aulas de escrita de abstracts no curso de IFA da UNESP/IBILCE. 50 Quadro 09: Descrição do nível B1 no CEFR ........................................................................ 52 Quadro 10: Word List criada com palavras que compõem o Corpus de aprendizes ............. 60 Quadro 11: Ocorrências de that-clauses nos movimentos retóricos 4 e 5 do Corpus de aprendizes ................................................................................................................................ 69 Quadro 12: Word List do Corpus MICUSP .......................................................................... 74 Quadro 13: Ocorrências de that-clauses nos movimentos retóricos 4 e 5 do Corpus MICUSP .................................................................................................................................................. 78 Quadro 14: Ficha de coleta DIY corpora – Área: Biológicas ................................................ 83 Quadro 15: Ficha de coleta DIY corpora – Área: Humanas ................................................. 84 Quadro 16: Atividade didática que contempla os movimentos retóricos 4 e 5 ..................... 87 LISTA DE TABELAS Tabela 01: Corpus de aprendizes – Coleta I ......................................................................... 62 Tabela 02: Corpus de aprendizes – Coleta II ......................................................................... 62 Tabela 03: Média de palavras por abstract do Corpus de aprendizes ................................... 63 Tabela 04: Média de palavras por abstract do Corpus MICUSP .......................................... 64 LISTA DE ABREVIATURAS E SIGLAS DIY corpora – Do-it-Yourself Corpora Subst – Subjstantivo CA – Corpus de aprendizes CEFR – Common European Framework of Reference for Languages CEP – Comitê de Ética em Pesquisa CorIFA – Corpus de Inglês para Fins Acadêmicos CsF – Ciência sem Fronteiras DDL – Data Driven Learning EAP – English for Academic Purposes Enem – Exame Nacional do Ensino Médio ESP – English for Specific Purposes EUA – Estados Unidos da América IBILCE – Instituto de Biociências, Letras e Ciências Exatas ICLE – International Corpus of Learner English IFA – Inglês para Fins Acadêmicos IFE - Inglês para Fins Específicos LA – Lexical Approach LC– Linguística de Corpus LE – Língua Estrangeira LI – Língua Inglesa LS – Lexical Syllabus MEC – Ministério da Educação e Cultura MICUSP – Michigan Corpus of Upper-Level Students Papers Part – Particípio Passado PPerf (have) – Presente Perfeito PreS – Presente Simples PS – Passado Simples Sisu – Sistema de Seleção Unificada Suj – Sujeito TCLE – Termo de Consentimento Livre e Esclarecido toV – Verbo no infinitivo UFMG – Universidade Federal de Minas Gerais UNESP – Universidade Estadual Paulista “Júlio de Mesquita Filho” V – verbo Vbe – Verbo be V(ing) – Verbo no presente contínuo SUMÁRIO 1 INTRODUÇÃO ................................................................................................................ 16 2 OBJETIVOS DE PESQUISA E ORGANIZAÇÃO DA DISSERTAÇÃO ................... 19 3 FUNDAMENTAÇÃO TEÓRICA .................................................................................... 21 3.1 A Linguística de Corpus e o ensino de Línguas Estrangeiras ..................................... 21 3.1.1 A LC no ensino de Inglês para Fins Acadêmicos ...................................................... 25 3.2 O CorIFA ........................................................................................................................ 30 3.3 Corpus de aprendizes, DIY corpora e o MICUSP ......................................................... 32 3.4 A prática de escrita acadêmica de abstracts e os movimentos retóricos ..................... 37 3.5 As that-clauses na escrita acadêmica de abstracts ........................................................ 46 4 MATERIAIS E METODOLOGIA DE PESQUISA ....................................................... 49 4.1 A coleta e compilação do Corpus de aprendizes ........................................................... 49 4.2 A compilação do Corpus MICUSP ................................................................................ 52 4.3 A ferramenta Sketch Engine ...................................................................................... 54 5 ANÁLISE E DISCUSSÃO DOS DADOS ........................................................................ 61 5.1 Análise quantitativa dos corpora de pesquisa ............................................................... 61 5.2 Análises das that-clauses no Corpus de aprendizes ...................................................... 65 5.3 Análise das that-clauses no Corpus MICUSP ................................................................73 5.4 Resultados ........................................................................................................................ 81 5.4.1 Atividade 1: DIY corpora ............................................................................................. 82 5.4.2 Atividade 2: estudo dos movimentos retóricos 4 e 5 .................................................... 85 6 CONSIDERAÇÕES FINAIS ............................................................................................ 90 REFERÊNCIAS .................................................................................................................... 93 APÊNDICES ......................................................................................................................... 97 APÊNDICE A Termo de Consentimento Livre e Esclarecido - TCLE UNESP/IBILCE ................................................................................................................................................. 97 ANEXOS ............................................................................................................................... 98 ANEXO A Termo de Consentimento Livre e Esclarecido - TCLE - UFMG ..................................... 98 ANEXO B Lista de frequência da palavra de busca that no Corpus de aprendizes .......................... 99 ANEXO C Linhas de concordância com a palavra de busca that - Corpus de aprendizes ............ 100 ANEXO D Linhas de concordância com a palavra de busca that - Corpus MICUSP .................... 104 16 1 INTRODUÇÃO Esta dissertação está inserida na área de Linguística Aplicada, na linha de pesquisa “Pedagogia do Léxico e da Tradução Baseada em Corpora”, do Programa de Pós- Graduação em Estudos Linguísticos, da Universidade Estadual Paulista “Júlio de Mesquisa Filho”, câmpus de São José do Rio Preto. Iniciamos nossa pesquisa após notarmos, no curso de inglês oferecido no Centro de Línguas do referido instituto, a necessidade de aperfeiçoamento da escrita acadêmica de abstracts por aprendizes universitários. A produção desse gênero textual tornou-se uma prática recorrente nos dias atuais devido à demanda de pesquisas a serem publicadas em revistas de fator de impacto internacional, tais como: Journal of Physical Mathematics 1 , da área de Matemática, Journal of Linguistics 2 , da área de Linguística, e Biochemistry & Analytical Biochemistry 3 , da área de Ciências Biológicas. Observamos, portanto, que cada vez mais alunos de mestrado e doutorado são incentivados a publicar seus trabalhos e difundi-los internacionalmente, tanto por meio de publicações quanto por participações em congressos internacionais, e também pela oportunidade de ingressar em programas de mobilidade acadêmica. Desse modo, o gênero textual abstract tem sido amplamente difundido em aulas de Inglês com Fins Específicos, principalmente em cursos voltados para o ensino de Inglês com Fins Acadêmicos. A partir da importância do desenvolvimento da escrita acadêmica de abstracts, que é abordada por Bathia (1993); Huckin (2001); Swales e Feak (2009) e Glasman-Deal (2010), é possível afirmar que esse tipo de texto é considerado um chamariz para os leitores da área de publicação e que também veiculam as principais informações do artigo ou trabalho escrito como as descobertas, resoluções e resultados de pesquisa (SWALES; FEAK, 2009) Ademais, notamos que a escrita de abstracts normalmente é desenvolvida com um número de palavras pré-estabelecido pela revista de publicação (GLASMAN- DEAL, 2010) e possui uma estrutura determinada (BATHIA, 1993). Neste momento, é válido ressaltar que, a estrutura da escrita de abstracts é dividida em movimentos retóricos, que, de acordo com Swales e Feak (2009), são definidos como partes de um texto que expressam um objetivo específico, e esse termo é 1 Acesso online pelo site: https://www.omicsonline.org/physical-mathematics.php 2 Acesso online pelo site: https://www.cambridge.org/core/journals/journal-of-linguistics 3 Acesso online pelo site: https://www.omicsonline.org/biochemistry-and-analytical- biochemistry.php 17 caracterizado como um item funcional e não gramatical. Ademais, a estrutura da escrita desse gênero textual pode apresentar diferenças nas quantidades de movimentos retóricos de pesquisador para pesquisador, área de pesquisa, normas de publicação de revistas científicas e também, normas de publicação e de apresentação em eventos acadêmicos. Além de todos os requisitos necessários para o aprimoramento da escrita acadêmica de abstracts, Huckin (2001), bem como Swales e Feak (2009, p. 02), destacam que esses tipos de texto possuem algumas funções distintas. Para esses últimos os abstracts podem apresentar as funções de mini-textos, dispositivos de triagem (screening devices), prévias textuais e auxílio para escritores e editores. Devido à importância da escrita desse gênero textual, decidimos abordar esse tema em nossa pesquisa, visando auxiliar alunos de universidades públicas a desenvolverem suas habilidades linguísticas em práticas de escrita acadêmica. Por esse motivo, oferecemos um curso de Inglês com Fins Acadêmicos na UNESP/IBILCE, por meio do qual pudemos trabalhar a escrita acadêmica com aprendizes das três grandes áreas do conhecimento: Humanas, Exatas e Biológicas. A partir desse projeto, foi possível coletar dados para análises sobre a escrita de abstracts por aprendizes, que serão apresentadas no decorrer desta dissertação. Com a elaboração de um curso de auxílio para a escrita acadêmica em inglês, observamos que, para coletar os dados necessários para a análise da escrita de abstracts, seria necessária a utilização de ferramentas computacionais e linguísticas. Neste momento, é válido mencionar que, considerando o contexto atual de globalização em que o mundo se encontra, é possível notar que a tecnologia proporciona uma profusão de informações para as mais diversas áreas do conhecimento humano, e para o estudo, ensino e aquisição de línguas estrangeiras não é diferente. A tecnologia é um fator relevante, não só para a pesquisa, mas para o ensino e aprendizagem de novas línguas, tanto pela possibilidade de aquisição de vocabulário a partir de programas de tradução online, como também pelo uso de aplicativos e programas computacionais e linguísticos que possibilitam o ensino de língua estrangeira (LE). Ressaltamos que uma das áreas de estudos que contempla a utilização de tecnologia para coleta de textos a fim de serem analisados linguisticamente é a Linguística de Corpus (doravante LC), que, por sua vez, é a área de pesquisa utilizada para o desenvolvimento desta dissertação, conforme já mencionado. Tomamos por base a metodologia da Linguística de Corpus para analisar abstracts escritos por alunos brasileiros de universidades públicas e também para 18 examinar a escrita de abstracts por aprendizes falantes nativos e não-nativos de inglês da Universidade de Michigan, e verificar como os alunos, brasileiros e da universidade do exterior, estruturam seus textos de acordo com os movimentos retóricos disponibilizados por Swales e Feak (2009), principalmente quando relatam suas descobertas, resultados e conclusão de pesquisa. Além do uso da tecnologia (isto é, da facilidade do uso de programas computacionais para análises linguísticas) e da demanda de escrita de abstracts para a publicação em revistas internacionais, este trabalho se justifica, também, pela importância e necessidade da aquisição de língua inglesa por alunos universitários. Tal necessidade foi percebida devido a falta de preparação linguística de muitos intercambistas observada nos resultados obtidos a partir do lançamento do programa governamental Ciência sem Fronteiras 4 (CsF), uma vez que o nível de proficiência em inglês de um número relevante dos candidatos ao programa não correspondia às exigências das universidades de outros países (DUTRA, et al, 2016, p. 151-152). A carência nos níveis de proficiência em língua inglesa também é percebida na vida acadêmica dos alunos, pois, um grande número de ingressantes em universidades públicas apresenta dificuldades ao cursar algumas disciplinas que exijam o conhecimento do idioma. Acreditamos que esse possa ser um dos motivos pela busca por cursos complementares de inglês para que seja possível acompanhar os conteúdos propostos nos cursos de graduação e/ou pós-graduação. Tendo em vista, portanto, a precariedade do ensino de língua inglesa nesse contexto, surge a necessidade de soluções que visem diminuir as carências de aprendizagem dos alunos universitários, o que nos motivou a desenvolver esta pesquisa. Acreditamos que o curso de Inglês com Fins Acadêmicos (IFA), inserido em universidades brasileiras, proporciona aos alunos a oportunidade de prática de atividades didáticas e também de coleta de corpus de estudo, resultando em uma melhora na qualidade de seus textos acadêmicos em inglês, para que possam divulgá-los, assim como suas pesquisas, internacionalmente. 4 Embora o CsF tenha sido encerrado, de acordo com as informações disponibilizadas no site, este foi um programa que apresentou o objetivo de promover a consolidação, expansão e internacionalização da ciência e da tecnologia, da inovação e da competitividade brasileira a partir do intercâmbio e da mobilidade internacional. < http://www.cienciasemfronteiras.gov.br/web/csf/o-programa> Acesso em 06 de junho de 2017. 19 2 OBJETIVOS DE PESQUISA E ORGANIZAÇÃO DA DISSERTAÇÃO Nesta seção, descreveremos os objetivos da presente pesquisa, como também a organização desta dissertação. Os principais objetivos traçados neste trabalho foram: 1. Apresentar considerações a respeito do uso da Linguística de Corpus (LC) no ensino de Inglês com Fins Acadêmicos; 2. Auxiliar os aprendizes a desenvolver uma coleta de textos autênticos para que seja utilizada como base para a escrita autônoma de seus abstracts (coleta DIY corpora); 3. Analisar como aprendizes de Inglês com Fins Acadêmicos empregam as that-clauses para evidenciar descobertas e conclusões em seus abstracts. Além das informações disponibilizadas no primeiro capítulo (introdução), a dissertação é organizada em mais cinco capítulos. Conforme mencionado anteriormente, primeiro capítulo destina-se à introdução do trabalho e aborda brevemente a respeito dos principais assuntos a serem desenvolvidos no presente trabalho. O segundo capítulo trata a respeito dos objetivos e organização do trabalho, assim como a explicação dos temas de cada capítulo da dissertação. A terceira seção desta pesquisa, denominada “Fundamentação Teórica”, discorre sobre as principais teorias que compõem esta pesquisa, desdobrando-se em subseções que tratam sobre o Corpus de Inglês com Fins Acadêmicos (o CorIFA), DIY corpora, a escrita de abstracts, os movimentos retóricos de abstracts e as that-clauses em abstracts. O quarto capítulo é dedicado à metodologia da pesquisa, no qual descrevemos as aulas de Inglês com Fins Acadêmicos e a coleta do Corpus de aprendizes (composto por abstracts recolhidos nas aulas de IFA da UNESP/IBILCE e do corpus CorIFA), assim como a descrição sobre a compilação do corpus do MICUSP, o corpus a ser utilizado para a comparação de dados linguísticos. Apresentamos, também, informações referentes à ferramenta tecnológica utilizada para desenvolver as linhas de concordância com that-clauses, o Sketch Engine (KILGARRIFF, et al, 2014). O quinto capítulo é destinado às análises que compõem este trabalho, ou seja, a análise quantitativa dos dados dos corpora da presente pesquisa e as análises linguísticas das that- 20 clauses. O quinto capítulo ainda discorre sobre os resultados da pesquisa e também apresenta algumas atividades didáticas desenvolvidas a respeito da utilização das that-clauses na escrita de abstracts para serem divulgadas interinstitucionalmente com a finalidade de beneficiar alunos de cursos de Inglês com Fins Acadêmicos. Além disso, apresentamos na sexta seção as considerações finais que tem o objetivo de concluir a dissertação e apresentar alguns encaminhamentos futuros para a pesquisa. Em sequência, são apresentadas as referências bibliográficas, apêndice e anexos que compõem a dissertação. Após apresentarmos a organização desta pesquisa, o próximo capítulo tratará a respeito do embasamento teórico deste trabalho. 21 3 FUNDAMENTAÇÃO TEÓRICA Neste tópico do trabalho, apresentaremos as teorias utilizadas para embasar a presente dissertação. Ademais, a seção 3 está dividida em 5 subseções que estão pautadas em autores e pesquisadores da grande área da Linguística e também da Linguística de Corpus. 3.1 A Linguística de Corpus e o ensino de línguas estrangeiras Apresentamos, brevemente, na introdução desta dissertação, que esta pesquisa está pautada sob o viés metodológico da LC, e que o fator primário contribuinte para o aproveitamento da LC está ligado à utilização de ferramentas computacionais para o estudo linguístico. Portanto, elucidamos que a era da tecnologia e a implementação de computadores foram imprescindíveis para o desenvolvimento dessa linha de estudos. A principal sentença norteadora de sentido para classificarmos a LC, neste trabalho, é a seguinte afirmação de Berber Sardinha e Shepherd (2012, p. 06): “quando não há a análise de materiais, não há a Linguística de Corpus”, portanto, consideramos que a necessidade de análise de dados textuais é inerente à LC. Ao tratarmos a respeito de pesquisas ou estudos linguísticos na área de LC, é necessário trazer à tona o sentido dos termos corpus/corpora computadorizado/s, pois essa área de investigação volta-se à coleta, análise e aplicação de corpora (o conjunto de corpus) nas várias esferas de atividade humana. De acordo com os autores mencionados anteriormente, um corpus é um conjunto de textos (escritos ou falados) em formato de arquivo de computador, coletados e organizados com a finalidade de serem amostras de uma língua ou de uma variedade linguística. A palavra “corpus” vem do latim e significa “corpo”, conjunto de algo, em nosso caso, de amostras de uso da língua (BERBER SARDINHA; SHEPHERD, 2012, p. 07). A fim de complementar e clarificar ao leitor a citação anterior, um corpus, segundo Tagnin (2010), é uma coletânea de textos compilados em formato eletrônico a partir de critérios específicos para servirem de instrumentos de análise linguística, portanto, o objeto principal de investigação da LC é o corpus. Além de um estudo linguístico baseado na análise de dados e materiais, a LC constitui uma abordagem de cunho empirista, que estuda a língua como um sistema probabilístico a partir da exploração sistemática de um corpus (BERBER SARDINHA, 2000; VIANA, 2010). 22 A partir desse levantamento de textos por meio de computadores, notamos que a pesquisa na LC otimizou o tempo de linguistas e demais pesquisadores, pois, “durante séculos, estudiosos das línguas coletaram corpora para auxiliarem na observação, catalogação, sistematização e ensino da língua de indivíduos de certo local (a língua de um determinado país) ou em certos documentos [...]”(BERBER SARDINHA; SHEPHERD, 2012, p. 08). Com o aperfeiçoamento eletrônico, os estudiosos puderam realizar, finalmente, suas pesquisas e armazená-las dentro de arquivos em computadores de maneira mais fácil e prática. Apoiando-se na facilidade de armazenamento de dados para os mais diversos fins dentro da grande área denominada Linguística, uma nova metodologia de ensino de línguas (o ensino que visa a aprendizagem a partir do estudo de dados coletados) vem sendo desenvolvida e aprimorada no decorrer dos anos. Nas últimas décadas, segundo Berber Sardinha (2004), é possível perceber o aumento da quantidade de dissertações e teses voltadas ao ensino de LE com base em corpora, e, atualmente, dentre as várias aplicações da LC no ensino de línguas, destacam-se algumas propostas (as quais serão abordadas sucintamente a seguir): o Lexical Syllabus (LS), o Lexical Approach (LA) e o Data Driven Learning (DDL). Além disso, o autor também menciona a exploração de corpora de alunos em processo de formação como elementos essenciais para o mapeamento da aprendizagem de línguas estrangeiras (e é o mapeamento desse corps que será analisado posteriormente nesta dissertação). A proposta do Lexical Syllabus, que em português tem seu correspondente linguístico em Currículo Lexical, é uma proposta de ensino de LE desenvolvida por Dave Willis no início da década de 1990 que utiliza a metodologia e os conceitos da LC. O Lexical Syllabus é um tipo de abordagem e uma proposta de ensino fundamentada no estudo e na análise do léxico como forma de aprendizado, ou seja, é um modo de ensino pautado na análise do léxico de um determinado corpus que permite a utilização dos dados analisados de modo autônomo e que coopera com a aprendizagem do aluno. A linguagem do material utilizado para o ensino é autêntica, ou seja, não modificada pelo professor, um material não editado. Acredita-se que devido a isso, os alunos se identificariam mais rapidamente com o conteúdo do curso (BERBER SARDINHA, 2004). Na abordagem LS, os alunos aprendem a língua por meio da análise de textos e também por self-study (um estudo autônomo, em que o aluno atua por conta própria com material autêntico e pertencente à sua realidade), através dos quais estão livres para comparar o léxico dos textos escolhidos para o estudo de LE. 23 Como informação adicional a respeito dos currículos lexicais para o ensino de LC, Berber Sardinha (op. cit.) afirma que o curso a partir de tal abordagem de ensino encoraja o processo de observação da linguagem em uso que pode vir a contestar o conhecimento assumido da linguagem. Dessa forma, não é somente o Corpus que informa a produção de materiais, mas também a própria metodologia de descoberta contemplada pela Linguística de Corpus é incorporada ao curso como princípio didático (BERBER SARDINHA, op.cit. p. 285). Um “aspecto importante da metodologia é a centralidade no aluno, por meio da qual a responsabilidade pelo aprendizado é transferida para o aprendiz. O curso concebe o aluno como descobridor [...]” (BERBER SARDINHA, 2004, p. 286). O aprendiz é visto, portanto, como aquele que vai em busca do conhecimento de maneira embasada (nos materiais coletados) e autônoma. Há uma vantagem na aplicação de LS, a qual está relacionada ao fato de que os alunos têm a oportunidade de se identificar mais rapidamente com o conteúdo do programa a partir da aprendizagem lexical e não gramátical. Em contrapartida, há outro tipo de abordagem descrita por Berber Sardinha (2004), intitulada Abordagem Lexical ou, em inglês, Lexical Approach. Essa é outra proposta de ensino baseada na LC e desenvolvida por Michael Lewis (1997), cuja principal característica é o papel central que o léxico, não observado isoladamente, mas como uma noção de porção, norteia o conteúdo e a metodologia de ensino. Além das abordagens destacadas anteriormente, há outra que mais recebe destaque, segundo Beber Sardinha (2004), a abordagem movida por dados, a Data Driven Learning (DDL), Aprendizagem Movida por Dados, concebida por Tim Johns (1986) apud Berber Sardinha (op.cit). Esse modo de investigação tem por objetivo ensinar a gramática da língua inglesa por meio do processo de descoberta (discovery learning), ou seja, visa tornar o aluno um pesquisador utilizando o computador como ferramenta para gerar listas de concordâncias linguísticas. Alguns anos depois, Johns (1991) enfatiza em seu artigo três princípios sobre o uso da DDL em sala de aula: 1. A característica que distingue a DDL é a primordialidade dos dados, e o fato de o professor não saber de antemão quais as regras e padrões linguísticos o aluno descobrirá, de fato, este perceberá que algumas ocorrências não serão conhecidas pelo professor, como também não estarão de acordo com a gramática normativa da língua; 2. A segunda consideração está no papel do professor, visto que a incerteza sobre o que os alunos descobrirão gera no professor insegurança e preocupação; 24 3. A terceira conclusão sobre a DDL é uma reavaliação do papel da gramática no ensino/aprendizagem de LE. Visto que a DDL coloca a descoberta da gramática do aprendiz no centro da abordagem. Usando evidências do uso autêntico da língua como base para tais descobertas, o aluno criará e desenvolverá uma melhor consciência linguística (JOHNS, 1991). Ao articularmos brevemente as teorias aqui apresentadas com a nossa pesquisa, é importante destacar que não há uma única abordagem que permeia o presente trabalho, há uma intersecção das abordagens apresentadas que servem para tornar possível a pesquisa e a análise dos dados que serão desenvolvidas no decorrer da dissertação. O princípio da LS cooperou para que pudéssemos enxergar os textos (nosso corpus de aprendizes) como o produto de self-study dos aprendizes, pois utilizaram materiais autênticos e da realidade de cada um. Além disso, no momento de coleta de textos pelos estudantes, notamos que, em nossa pesquisa, o aspecto mais importante dessa metodologia é ser centrada no próprio aluno. Além da LS, a LA acrescentou uma valiosa qualidade ao nosso trabalho. De acordo com Lewis (1993), o texto induz o tema e atua como fonte linguística onde os aprendizes podem reunir itens de estudo, e é exatamente onde a LS atua na nossa pesquisa, pois o aluno utiliza o texto coletado como um instrumento de análise. A abordagem DDL é mais utilizada na presente pesquisa, pois, conforme já mencionado, o pesquisador, a partir de utilização de ferramentas computacionais, cria listas de concordância para a análise linguística (demonstraremos essa criação nas análises), e, além disso, (ou aluno que estuda por meio de corpus) bem como utiliza a percepção, o raciocínio e a inferência para identificar padrões linguísticos no corpus estudado. Em nossas palavras, podemos dizer que a observação do comportamento linguístico pelos alunos é importante para a sua construção como falante de LE, pois, ao observar as ocorrências e recorrências de determinadas palavras ou expressões dentro de um corpus, o estudante aprende a língua de maneira autêntica. Ele pode perceber que o uso da língua revela mais do que dicionários e gramáticas, pois trata-se de um fenômeno em constante mutação e o uso de corpus é uma oportunidade para que o professor e o aluno aprendam com o contato e análise de textos reais. A seguir, ainda dentro do contexto da utilização da LC para o ensino de LE, trataremos brevemente a respeito do uso da LC e o ensino de língua inglesa (como língua estrangeira). 25 3.1.1 A LC no ensino de Inglês para Fins Acadêmicos A LC utilizada no ensino de inglês é uma área que foi e ainda é palco de discussão e pesquisa de professores e estudiosos desse ramo linguístico. Segundo Alves e Tagnin (2012, p. 18), a LC está presente nas seguintes áreas de pesquisa: a) tradução; b) descrição da linguagem; c) ensino 5 ; d) terminologia e; e) Processamento de Linguagem Natural (PLN), conforme podemos observar no gráfico a seguir: Gráfico 01: Reprodução do gráfico de Alves e Tagnin (2012, p. 18) sobre as áreas em que a LC está presente Fonte: http://www.letras.ufmg.br/site/e-livros/Anais do X Encontro de Linguística de Corpus.pdf Partindo da amostra de trabalhos analisados pelos autores, é possível perceber que, dos textos que compuseram o corpus analisado, a maior parte está inserida nas áreas de Ensino (43%), e as demais áreas representam as menores porcentagens de utilização de LC como suporte teórico-metodológico. Para que esse estudo pudesse ser realizado, os autores mencionam que a análise e classificação dos textos não ocorreram de forma simples, pois houve dificuldades para situar alguns dos trabalhos nas áreas identificadas por falta de clareza na localização teórica dos textos escritos. Assim, para que o estudo fosse concluído, os pesquisadores e autores realizaram revisão da amostra e uma análise detalhada tanto nos títulos dos textos que compuseram a amostra, quanto no texto em si. 5 Grifos nossos empregados para destacar onde esta pesquisa se insere, a área de ensino e aprendizagem em língua estrangeira. 26 Considerando as pesquisas que investigam o ensino utilizando ferramentas de corpora, o perfil traçado na análise dos materiais por Alves e Tagnin (2012) identificou um grande interesse pelo estudo a partir dos dados de corpora no ensino de língua inglesa, lembrando que a língua espanhola e o ensino de português para estrangeiros também têm espaço, mas com menor representatividade, conforme mostra o gráfico a seguir: Gráfico 02: Adaptação do gráfico de Alves e Tagnin (2012, p. 20) sobre a distribuição das pesquisas voltadas para o ensino de línguas estrangeiras Fonte: http://www.letras.ufmg.br/site/e-livros/Anais do X Encontro de Linguística de Corpus.pdf Para ratificar nossa escolha por utilizar a LC nesta pesquisa, acrescentaremos ao tópico a informação de que a inovação nos procedimentos de pesquisa, os programas tecnológicos e a facilidade do acesso aos computadores são uma realidade na vida da maioria dos aprendizes de LE, e esse acesso a tais recursos tem feito com que as aplicações da LC no ensino de línguas estrangeiras ganhem o interesse de professores e pesquisadores. Esse interesse tem permitido a muitos repensar as metodologias de ensino utilizadas em sala de aula (BERBER SARDINHA, 2004). Retomamos, aqui, que esta pesquisa fundamenta-se na necessidade de alunos ingressantes em universidades públicas da aprendizagem de inglês como língua estrangeira, principalmente na área de IFA. Para tentar amenizar essa necessidade e proporcionar aos alunos a oportunidade de desenvolver e divulgar suas pesquisas em âmbito internacional, além dos objetivos tratados no início deste trabalho, almejamos propor atividades didáticas que auxiliem os aprendizes a 27 escrever seus próprios resumos em inglês 6 , de maneira autônoma, inseridos em contexto de um curso de IFA. A fim de apresentar mais detalhadamente o que é o contexto de um curso de IFA, ou o que é o ensino de IFA, é necessário tratar, primeiramente, a respeito de IFE, Inglês para Fins Específicos (em inglês: English for Specific Purposes - ESP). O ensino de IFA está inserido na grande área denominada IFE e por isso nos pautaremos em Dudley-Evans (1998) e Dudley-Evans e St. John (1998) sobre o assunto. Dudley-Evans postula que, de acordo com suas pesquisas na área de linguística, não há uma única e fácil definição para IFE, pois definir o ensino de IFE exige muito mais do que apenas reconhecer a importância da análise de necessidades dos alunos. Nesse sentido, é necessário elaborar um estudo mais focado dos gêneros e linguagem envolvidos nas atividades em que o aluno deve realizar em inglês, concentrando a análise na investigação dos gêneros e exercícios utilizados nas atividades propostas nesse tipo de aula. Além disso, para o autor, é necessário estabelecer qual é a metodologia utilizada na disciplina, pois os alunos terão necessidades específicas, como por exemplo, nas palavras de Dudley-Evans, “[...] se os alunos estão estudando ou trabalhando em engenharia, o curso ESP pode fazer uso da metodologia de resolução de problemas da engenharia. Se, em contrapartida, os alunos estiverem trabalhando ou estudando negócios, a abordagem do estudo de caso será familiar e pode ser usada na aula de ESP.” 7 (DUDLEY-EVANS, 1998, p. 02). Desse modo, a metodologia deve ser adaptada de acordo com o público a ser ensinado, dentro das necessidades específicas para as quais o curso foi desenvolvido. Segundo o autor, há três aspectos que podem ser elencados dentro do ensino de IFE: 1) a análise de necessidades (em geral); 2) a análise do gênero e da linguagem que estão relacionados às necessidades dos alunos; e 3) a utilização da metodologia das disciplinas ou das profissões que gera materiais na sala de aula. Para Dudley-Evans (1998) o ensino de IFE é, na maioria das vezes, elaborado para alunos que possuem uma base da língua inglesa e estão em níveis superiores (intermediário ou avançado), porém os cursos de IFE também podem ser desenvolvidos para alunos iniciantes em língua inglesa. 6 Nesta pesquisa, utilizaremos resumos de artigos em inglês e abstracts como sinônimos. 7 Tradução nossa de: […] if learners are studying or working in engineering, the ESP course can make use of the problem solving methodology of engineering. If, by contrast, learners are working in or studying business, the case study approach will be familiar and can be used in the ESP class. 28 Para um melhor entendimento a respeito do ensino de IFE, Dudley-Evans e St. John (1998) apontaram características absolutas e variáveis para clarificar a definição de IFE, representada no quadro a seguir. Quadro 01: Características e variáveis no ensino de IFE Características absolutas Características variáveis  IFE é desenvolvido a fim de atender às necessidades específicas do aluno;  O IFE é utiliza de metodologia subjacente e das atividades das disciplinas que serve;  O ESP é centrado na linguagem apropriada para essas atividades em termos de gramática, léxico, registro, habilidades de estudo, discurso e gênero.  O IFE pode estar relacionado ou projetado para disciplinas específicas;  O IFE pode usar, em situações de ensino específicas, uma metodologia diferente da do ensino de inglês geral. Fonte: Quadro elaborado pela autora a partir das informações disponibilizadas por Dudley-Evans (1998, p. 03) que foram tratadas posteriormente por Dudley-Evans e St. John (1998) em outra publicação. Em conclusão a respeito do ensino de IFE, Dudley-Evans (1998) permite-nos acrescentar que, se um assunto, como medicina ou computação, é ensinado em inglês, não é por si só ensino IFE e sim é o ensino do conteúdo. O IFE deve envolver o ensino da linguagem e as habilidades associadas a uma série de disciplinas ou uma disciplina, como no caso do IFA, que é um curso desenvolvido a partir de um projeto maior denominado Inglês para Fins Específicos. Nesse sentido, os materiais serão abordados com base na análise de léxico e gêneros específicos usados pela disciplina, de tal modo que o objetivo principal não é ensinar o tema em si, mas proporcionar aos alunos uma consciência suficiente da linguagem, da retórica e das habilidades de estudo para que possam aprender a matéria propósta. Após discorrer brevemente a respeito do ensino de IFE, é válido ressaltar que o ensino IFA surgiu do desenvolvimento do IFE para diversas disciplinas. Podemos mencionar neste momento que o IFA é apenas um galho da grande árvore denominada IFE, ou seja, o IFA nasceu e se amplificou a partir do IFE. O ensino de IFA se justifica, pois, por ser a língua franca da comunidade científica internacional. De acordo com Jenkins (2007), o termo língua franca refere-se a “uma língua de contato usada entre pessoas que não compartilham a mesma língua materna, e é 29 comumente entendida como uma segunda (ou subsequente) língua de seus falantes” 8 (JENKINS, 2007, p. 01). Com isso, o IFA (também denominado English for Academic Purposes – EAP – em inglês) tornou-se um requisito importante para pesquisadores em todo o mundo (HYLAND, 2009. p. 3-5; SWALES e FEAK, 2009. p. ix-xi.), pois o uso da língua inglesa favorece a divulgação internacional de pesquisas e estudos, trazendo ao autor ou pesquisador a oportunidade de ter seu trabalho reconhecido em diversos países. A escrita de abstracts, gênero textual escolhido para análise no presente trabalho, é uma prática importante do aluno e/ou pesquisador, pois, de acordo com Swales e Feak (2009, p. 02), esses resumos de artigos são vistos como um chamariz ao leitor e são reconhecidos como a “porta de entrada” para a leitura completa dos trabalhos desenvolvidos. Isso porque, decidir entre ler ou não um artigo científico completo (ou um trabalho acadêmico completo), na maioria das vezes, depende da impressão e compreensão do leitor sobre o resumo de sua pesquisa (abstract). Para colocar em prática o ensino de inglês para alunos de meio acadêmico, algumas universidades federais e estaduais planejaram cursos de IFA para atender às necessidades básicas de alunos que anseiam difundir seus trabalhos em meio acadêmico internacional. Por ser uma pesquisa cujo objetivo é beneficiar alunos de diversas universidades brasileiras, adicionaremos a informação de que os campi da Universidade Federal de Minas Gerais (UFMG) e do Instituto de Biociências, Letras e Ciências Exatas (IBILCE) da Universidade Estadual Paulista de São José do Rio Preto (UNESP) são alguns exemplos de universidades que estão desenvolvendo pesquisas que têm por objetivo principal o ensino de IFA (baseado em corpus) para alunos universitários. Além disso, o corpus de aprendizes desta pesquisa está sendo desenvolvido para uso interinstitucional e, posteriormente, será disponibilizado para instituições de ensino superior do Brasil, ou até mesmo para instituições internacionais, que tiverem interesse de trabalhar ou desenvolver pesquisas linguísticas a partir da análise de corpus. A seguir, trataremos a respeito do Corpus de Inglês com Fins Acadêmicos, denominado CorIFA, e sua importância para o avanço das pesquisas linguísticas voltadas ao ensino de IFA em universidades públicas brasileiras. 8 Tradução nossa de: a lingua franca is a contact language used among people who do not share a first language, and is commonly understood to mean a second (or subsequent) language of its speakers. 30 3.2 O CorIFA O corpus de aprendizes (CA) é parte fundamental para o desenvolvimento de trabalhos que visam ensino de LE por meio de corpora. Baseada em autores como Granger e Tribble (1998), Dayrell (2011) destaca essa importância, mostrando que os corpora de aprendizes são úteis para colocar em evidência as dificuldades reais enfrentadas pelos alunos, inclusive aquelas dificuldades que poderiam passar despercebidas pela intuição e experiência dos professores. Ainda sobre CA, de acordo com as informações disponibilizadas na página online (https://sites.google.com/site/corpusifa/), e segundo Scott e Tribble (2006, p. 133), desenvolvemos o quadro explicativo abaixo: Quadro 02: Características de um CA O CA é:  Uma organização de textos escritos que ainda não foram publicados;  Um conjunto de textos desenvolvidos em ambiente de ensino ou treinamento; geralmente escritos em contexto de avaliação pelo professor;  Um conjunto de textos que após coletado, permite que haja uma investigação a respeito de fenômenos linguísticos, embasando-se nas frequências e padrões de utilização. Fonte: Quadro elaborado pela autora. Para embasar as informações acima, utilizamos os dados online do CorIFA a partir do acesso pelo link: https://sites.google.com/site/corpusifa/. Apresentamos a figura a seguir para ilustrar como é o acesso inicial ao CorIFA, assim como suas informações relevantes: Figura 01: Apresentação do CorIFA Fonte: Print de tela (https://sites.google.com/site/Corpusifa/) 31 Como é possível perceber através da leitura das informações contidas na imagem, o CorIFA é um corpus de Inglês com Fins Acadêmicos da UFMG, gerenciado pela Profa. Dra. Deise Prina Dutra. Além dos dados disponibilizados no site, atualmente esse corpus permite a participação de outras universidades públicas (e recebe a denominação de corpus interinstitucional) que queiram colaborar com o desenvolvimento de pesquisas em LC para alunos universitários. Ao pensarmos a respeito do CA, é interessante questionar-nos sobre qual é a real importância da utilização desses textos em pesquisas linguísticas para IFA. A resposta, de acordo com Dutra, et al, no website CorIFA, embasando-se em Granger (2002) e Nesselhauf (2004) é a seguinte: “A importância dos estudos com corpus de aprendizes é enfatizada por diversos pesquisadores, principalmente pelo fato de revelarem as dificuldades dos aprendizes de uma determinada língua, sendo possível, assim, analisar sua produção linguística” (DUTRA, et al, https://sites.google.com/site/Corpusifa/corpora-de-aprendizes). No contexto de IFA, o CorIFA apresenta os seguintes gêneros (conforme figura a seguir): Figura 02: Apresentação dos gêneros de IFA do website CorIFA 9 Fonte: Captura de tela (https://sites.google.com/site/Corpusifa/sobre-os-gneros) 9 Disponível em: . Acesso em 09 de fevereiro de 2017. 32 Conforme os gêneros textuais acadêmicos apresentados na figura acima, colocamos em destaque o gênero IFA II, no qual inserimos totalmente a coleta do corpus de aprendizes a ser analisado na presente pesquisa. Conforme citado neste subcapítulo, o CA desta pesquisa também é constituído por abstracts escritos em aulas de IFA na UNESP/IBILCE. Neste momento, é relevante dizer que, os textos de coleta são o resultado da prática de Do-it-Yourself corpora (o DIY corpora é uma prática de pesquisa e coleta de textos, realizada por aprendizes, com o intuito de compilarem seus próprios corpora para estudo). O próximo subcapítulo, portanto, trará informações a respeito desse assunto. 3.3 Corpus de aprendizes, DIY corpora e o MICUSP Além de abordagens de ensino inovadoras na grande área denominada Linguística, a LC coopera com o aprendizado de LE por meio de corpora de aprendizes e, para desenvolvermos nosso texto a respeito desses corpora utilizados em contexto de ensino e aprendizagem de LE, embasaremos esta seção em Beber Sardinha (2004) e Gomide (2016). Berber Sardinha (2004) elucida que a descrição da linguagem a partir de corpora de aprendizes teve um impacto considerável sobre o ensino de LE, especialmente por ter redefinido o conceito original de um corpus, oriundo de linguagem estritamente pertencente à variedade nativa. Além disso, Gomide (2016) aponta que os corpora de falantes nativos são atualmente muito utilizados no ensino de LE, pois esses textos provaram ser especialmente úteis para revelar alguns aspectos da linguagem que seriam mais difíceis de serem identificados somente por meio da intuição. No entanto, quando tratamos do ensino de uma segunda língua, a descrição, somente, não é suficiente, é também necessário identificar quais são as maiores lacunas e dificuldades dos aprendizes da língua estrangeira a ser aprendida (NESSELAUL, 2004, apud GOMIDE, 2016). Visto que, “a aprendizagem de uma segunda língua envolve necessariamente a produção de erros, mas não se trata de uma anomalia na aquisição” (BEBER SARDINHA, 2004, p. 266), e justamente por serem compostas de dados provenientes de falantes não- nativos, as pesquisas com corpora de aprendizes, diferentemente de corpora compilados por dados de falantes nativos, reconhecem erros gramaticais como parte natural do processo de aquisição e se propõem a descrever tais desvios da forma mais neutra possível. 33 Nesse sentido, existe um amplo projeto que estuda corpora de aprendizes, chamado International Corpus of Learner English, ICLE, que tem como objeto de estudo o inglês escrito, produzido por falantes não-nativos de quatorze nacionalidades. Nesse projeto, os analistas do ICLE visam à descrição e comparação das tendências observadas em cada nacionalidade (BEBER SARDINHA, 2004). A importância dos estudos com base em corpora de aprendizes está no auxílio de materiais e desenvolvimento de currículos educacionais, bem como no fornecimento de uma descrição da interlíngua utilizada nos países onde o inglês é tido como língua estrangeira. Para o autor (op. cit.), os corpora de aprendizes são de suma importância para a produção de materiais didáticos de LE, pois esses corpora podem informar quais as áreas de maior dificuldade e/ou facilidade dos alunos e quais as tendências do aprendizado de LE de determinada comunidade linguística, permitindo ao professor ter um perfil mais detalhado sobre seu público para, assim, ser mais assertivo na escolha de materiais e atividades em sala de aula. Dayrell (2011), citando Granger e Tribble (1998), Granger (2002) e Nesselhauf (2004) ainda nos permite discorrer que a comparação entre corpora de aprendizes e corpora compostos por textos escritos por falantes nativos e/ou experientes oferece contribuições importantes para o ensino. Dois aspectos beneficiam particularmente com os resultados desse tipo de estudo, a saber: (a) a seleção do conteúdo programático do curso e (b) a elaboração de materiais didáticos (GRANGER; TRIBBLE, 1998; GRANGER, 2002; NESSELHAUF, 2004 apud DAYRELL, 2011, p.162). Tendo em vista a importância da prática de comparação textual citada anteriormente, é possível dizer que, atualmente, existem sites linguísticos que permitem o acesso a textos desenvolvidos por falantes nativos (ou experientes) de LE para estudo, pesquisa ou comparação linguística. A coleta e compilação de textos escritos por alunos que têm como objetivo a análise linguística que resultará em aprendizado é um exemplo de prática DIY corpora. Para contextualizarmos o termo citado, utilizaremos algumas informações baseadas no trabalho Translation and Do-it-Yourself Corpora used as pedagogical tools in EAP 34 activities 10 , apresentado em forma de painel por Alves e Pinto (2016), em uma conferência de Linguística de Corpus, na cidade de Giessen, Alemanha, em julho de 2016. O uso de corpora para o ensino vem sendo consolidado como uma área produtiva de pesquisa. Ao classificarmos as aplicações pedagógicas de corpus (como por exemplo: o uso de ferramentas tecnológicas de análise de corpus para o ensino e aprendizagem), é possível estabelecer uma distinção útil entre as aplicações diretas e indiretas. Isso significa que, indiretamente, os corpora podem ajudar com as decisões sobre o que / quando / e como ensinar um tópico em particular, mas também podem ser acessados diretamente por alunos e professores em sala de aula de tradução ou de idiomas, de modo a auxiliar os alunos durante seus processos de aprendizagem (LEECH, 1997). Nesse contexto, a demanda contínua de publicações científicas em língua inglesa exigiu atenção especial de pesquisadores em geral que, ao escreverem seus próprios artigos, fazem do estudo de gênero acadêmico e linguagem científica um vasto campo a ser descrito. Atualmente, a abordagem teórica e metodológica da Linguística de Corpus tem favorecido a investigação de grandes quantidades de textos com a ajuda de ferramentas computacionais desenvolvidas para fins de pesquisa em linguística, como por exemplo, a ferramenta Sketch Engine (KILGARRIFF, et al, 2014) utilizada para a análise dos dados da presente pesquisa. Na prática DIY corpora, o aluno e/ou pesquisador compila seu próprio corpus, para que seja utilizado como base de informações e guia para a escrita na segunda língua. No caso da nossa prática em sala de aula, disponibilizamos a informação sobre o acesso aos abstracts do MICUSP 11 como uma alternativa para coleta. Para Römer (2012), o Michigan Corpus of Upper-level Student Papers (MICUSP) é um exemplo de corpus online, desenvolvido como um novo recurso que fornece aos professores, estudantes e pesquisadores de cursos de inglês para fins acadêmicos ou inglês como segunda língua, acesso a 829 amostras de textos escritos em inglês classificados com conceito “A”. Römer (2012) afirma, ainda, que “os alunos que pretendem melhorar suas habilidades de escrita acadêmica podem acessar o MICUSP como uma ferramenta para explorar padrões de escrita acadêmica, sendo seus próprios tutores” 12 (RÖMER, 2012, p. 71). Dessas 829 amostras de textos escritos por nativos e não-nativos de língua inglesa, 17% são textos de pesquisas acadêmicas – denominados Research Papers - (conforme podemos observar na 10 As informações apresentadas nessa seção estão disponíveis no site do evento, na página 108 do caderno de abstracts . 11 MICUSP - Disponível em < http://micusp.elicorpora.info/> acesso em 10 de janeiro de 2018. 12 Tradução nossa de: Students seeking to improve their academic writing skills can access MICUSP as a tool to explore patterns of academic writing in a self-tutoring fashion. (RÖMER, 2012, p.71) 35 figura abaixo), nos quais os alunos têm a possibilidade de selecionar suas áreas de pesquisas a fim de encontrar resumos de artigos para as suas coletâneas. Figura 03: Porcentagens dos textos disponibilizados pelo MICUSP Fonte: Captura de tela do site: http://micusp.elicorpora.info/ As áreas de pesquisa presentes no MICUSP são: Biologia (BIO); Engenharia Civil e Ambiental (CEE); Economia (ECO); Educação (EDU); Inglês (ENG); História e Estudos Clássicos (HIS); Engenharia Industrial e de Operações (IOE); Linguística (LIN); Engenharia Mecânica (MEC); Recursos Naturais e Meio Ambiente (NRE); Enfermagem (NUR); Filosofia (PHI); Física (PHY); Ciência política (POL); Psicologia (PSY) e Sociologia (SOC). É possível observar suas respectivas porcentagens 13 no gráfico seguinte: Figura 04: Porcentagens de áreas de pesquisa presentes no MICUSP Fonte: Captura de tela do site: http://micusp.elicorpora.info/ 13 As porcentagens de cada área estão disponíveis no site http://micusp.elicorpora.info/ e para obtê-las é necessário clicar com o mouse em cima de cada barra do gráfico. A área em questão aparecerá em destaque (em cor vermelha) e acima aparecerá a porcentagem exata. 36 De acordo com a imagem, as áreas de estudo que mais disponibilizam textos acadêmicos para coleta são: Biologia (com 26% dos textos); Engenharia Mecânica (19%); Linguística (15%); Psicologia (14%), Economia (11%) e Engenharia Industrial e de Operações (11%). A seguir, temos um exemplo de coleta textual na área de Biologia que pode ser facilmente realizada pelo aprendiz. Figura 05: Abstract da área de Biológicas que está inserido no MICUSP Fonte: Print de tela do site http://micusp.elicorpora.info/search/view/?pid=BIO.G0.11.2 O MICUSP não disponibiliza somente o abstract ao aprendiz, mas também adiciona algumas informações sobre a disciplina (discipline), o nível do aluno (student level), o sexo do aluno (sex), o status de falante nativo (native speaker status), o tipo de texto (paper type) e as características textuais (paper features). A prática de DIY corpora, como já mencionada na presente seção, tem por objetivo o desenvolvimento da autonomia do aprendiz em pesquisar e coletar seu próprio corpus de estudo. Na nossa pesquisa, os alunos realizaram essa prática a fim de construir uma base de dados da sua área de estudos para que pudessem escrever seus próprios abstracts, e é esse tema que abordaremos a seguir: a escrita acadêmica de abstracts. 37 3.4 A prática de escrita acadêmica de abstracts e os movimentos retóricos Iniciaremos esta seção tratando a respeito do que é o gênero textual denominado abstract (neste momento, é importante ressaltar que utilizaremos abstracts e resumos de artigos em inglês como sinônimos), isso porque, a nosso ver, não há como discorrer sobre gênero, sem abordar, mesmo que brevemente, algumas definições em torno desse tema. Para tanto, serão tomados por base os trabalhos de Martin (1984), Swales (1990) Huckin (2001), Ramos (2004) e Swales e Feak (2009). Para definir o que é o gênero textual abstract, Martin (1984) teoriza que esse gênero é uma atividade conduzida por objetivos e intenções, realizada em etapas (estágios) para um propósito final, no qual os falantes se engajam como membros de uma determinada cultura. Para complementar a teoria apresentada, Ramos (2004), inserida em uma perspectiva sistêmico-funcional Hallidayana e apoiando-se teoricamente em Martin (1984), postula que o reconhecimento de propósito pelos membros especialistas constitui a base para a identificação do gênero e atua como um sistema de convenções de seleção e restrição léxico-gramatical. Essa base, em outras palavras, dá forma à organização retórica ou à estrutura textual do discurso e influencia ou restringe as escolhas de conteúdo e estilo (RAMOS, 2004, p. 111) Para a autora, as definições apresentadas evidenciam a importância do propósito comunicativo e a comunidade discursiva como elementos de identificação do gênero e também como aqueles que compõem a estruturação dos gêneros e influenciam as escolhas de léxico e gramática, fator a ser considerado para a sua aplicação em sala de aula (RAMOS, 2004). Para complementar as considerações sobre o gênero abstract, Swales (1990) elucida que gêneros são entendidos como eventos comunicativos os quais apresentam propósitos compartilhados por membros que constituem um determinado grupo, uma comunidade discursiva. Observando as considerações de Martin (1984) e Swales (1990) sobre o gênero, é possível mencionar que ambos os teóricos apresentam preocupações distintas. O primeiro dá importância ao contexto em que a situação ocorre e ao contexto de cultura, que constituem os diferentes níveis de contexto nos quais o texto se materializa juntamente com o estudo dos elementos provenientes do léxico e também da gramática que realizam essas variáveis e colaboram na identificação de propósito e estrutura do texto (EGGINS & MARTIN, 1997). 38 Sob outra perspectiva linguística, Swales (1990) “concentrou sua investigação principalmente na compreensão dos padrões organizacionais e retóricos responsáveis pela realização de um discurso” (RAMOS, 2004, p. 112), e como consequências de seu trabalho, surgiram algumas preocupações pedagógicas voltadas ao ensino de Inglês para Fins Específicos (que será abordado futuramente nesta dissertação), principalmente quanto ao ensino de língua inglesa para alunos estrangeiros. Conforme mencionado na introdução deste trabalho, os abstracts são textos utilizados com o objetivo de chamar a atenção do leitor e veiculam informações relevantes do artigo ou trabalho escrito (SWALES; FEAK, 2009). Por essa razão, estão inseridos na área de gêneros textuais acadêmicos, onde também se encontram os textos dissertativos, dissertações de mestrado, teses de doutorado e artigos científicos acadêmicos, por exemplo. No decorrer dos anos, os resumos de artigos de pesquisa tornaram-se um gênero textual cada vez mais importante em meio acadêmico, pois, antigamente (pensando na década de 1950), a maioria dos artigos não apresentava os resumos, que só foram introduzidos em artigos de pesquisa (nesse caso, na pesquisa médica) durante a década de 1960, e o resumo estruturado que englobava as demais áreas de pesquisa não havia aparecido até 1987 (SWALES; FEAK, 2009, p. 01). O desenvolvimento da escrita desse gênero textual é recente e crescente dia após dia, pois, atualmente, há uma demanda de publicações acadêmicas cada vez maior e, saber escrever um resumo de qualidade é uma necessidade real para alunos universitários e pesquisadores. O abstract é onde o aprendiz ou pesquisador apresenta as primeiras e mais relevantes informações ao leitor, que poderá decidir se o assunto é interessante para a leitura completa do trabalho ou artigo acadêmico, ou não. De acordo com Huckin (2001) e Swales e Feak (2009), os abstracts apresentam, no mínimo, quatro funções distintas: 1. Atuam como mini-textos autônomos, atribuindo aos leitores um breve resumo do tópico, metodologia e principais descobertas de um estudo; 2. Assumem o papel de “dispositivos de triagem” (screening devices), ajudando o leitor a decidir se deseja ler todo o artigo ou não; 3. Atuam como prévias (previews) para os leitores que pretendem ler o artigo completo, dando-lhes um mapa de leitura; 4. Fornecem auxílio para escritores profissionais e editores. 39 Além disso, há algumas sugestões, pelo menos na literatura médica (como por exemplo, em: Bordage & McGaghie, 2001 apud Swales e Feak, 2009, p. 02), que: 5. Eles fornecem aos editores uma supervisão imediata do documento que foram solicitados a revisar. Devido à importância do desenvolvimento da área de estudos a respeito da escrita de abstracts, decidimos abordar esse tema na nossa pesquisa com o intuito de auxiliar alunos universitários a desenvolverem suas habilidades linguísticas em práticas de escrita acadêmica em um curso de Inglês com Fins Acadêmicos. Atualmente, o ensino de IFA tem sido cada vez mais abordado por pesquisadores linguistas, pois, conforme já mencionado no início desta dissertação, o inglês é reconhecido como língua franca e o estudo desse idioma para a escrita de textos acadêmicos é crescente, pois o inglês é a língua de divulgação internacional, principalmente quando se trata de pesquisas científicas, acadêmicas e estudos. O estudo e prática de escrita de abstracts, visando publicações em revistas científicas de excelência, fizeram com que pesquisadores, como Swales e Van Boon (2007), Swales e Feak (2009) e Glasman-Deal (2010), voltassem seus olhares para a pesquisa nesse contexto e, a partir de seus trabalhos, pudemos embasar a presente seção. Uma variedade de abstracts é amplamente utilizada no mundo da pesquisa acadêmica atual. De acordo com a autora Glasman-Deal (2010), a estrutura e o conteúdo dos abstracts têm se modificado nas décadas recentes, e a internet tem influenciado a forma como a pesquisa científica é publicada, bem como a maneira com que pesquisadores e cientistas acessam trabalhos já publicados. Segundo a autora, os bancos de dados de abstracts permitem que os leitores pesquisem e digitalizem a literatura científica para depois decidirem quais artigos desejam ler em detalhes. Alguns leitores apenas almejam saber o que está acontecendo em sua área de pesquisa e podem não estar interessados nos detalhes completos, enquanto outros podem querer se aprofundar nos detalhes, mas só têm interesse em artigos científicos que sejam diretamente relevantes para suas próprias pesquisas. Por esse motivo, cada vez mais pessoas realizam a leitura do título e do abstract, sendo importante, portanto, que ele tenha uma validade independente, ou seja, que apresente a sua própria importância e relevância como texto e que não seja um mero resumo de informações básicas do trabalho ou artigo no geral. Os abstracts devem promover ao leitor um ponto de vista breve e exato do artigo ou trabalho completo (BATHIA, 1993). 40 A escrita de abstracts não é considerada fácil, o autor deve se atentar às principais informações discutidas em seu trabalho e tentar sumarizar de modo que instigue o interesse do leitor e, para que o autor consiga atingir seus objetivos, alguns pesquisadores da área de linguística desenvolveram movimentos retóricos a fim de cooperar com o desenvolvimento da escrita de abstracts científicos e acadêmicos. Demonstraremos a seguir uma figura que aborda a estrutura de um abstract, que para Glasman-Deal (2010) é a representação, em forma sucinta, do artigo científico. Figura 06: A estrutura de um artigo científico ou tese Fonte: Captura de tela do livro de GLASMAN-DEAL, 2010 (p. 198) Como é possível perceber, para a autora, a estrutura de um abstract de artigo é dividida em quatro partes: 1. Introdução (introduction) – informações iniciais a respeito do trabalho, tais como, assunto principal e os objetivos da pesquisa; 2. Metodologia (Methodology) – o que foi feito e utilizado na pesquisa; 3. Resultados (Results) – O que foi encontrado; e 4. Discussão/Conclusão (Discussion/Conclusion) – o que o autor descobriu com a pesquisa e a conclusão. A autora ainda aponta que os abstracts de conferência podem ter estruturas diferentes e não seguir os passos apresentados na figura anterior. Quanto à estrutura, a partir da visão de Swales e Feak (2009), os abstracts são desenvolvidos por meio de uma forma previamente estabelecida, derivada de resultados de pesquisas linguísticas, pois, para os autores (op.cit.), muitos trabalhos recentes sobre análise do discurso têm investigado o número de movimentos retóricos ou estágios comunicativos em resumos de artigos em inglês de diferentes áreas de pesquisa. 41 Um movimento retórico ou estágio comunicativo é uma parte de um texto que tem um objetivo específico. É um termo funcional, não gramatical, que não apresenta um tamanho específico, podendo variar entre frase e parágrafo (SWALES; FEAK, 2009, p. 05). É importante ressaltar que, na presente pesquisa, utilizaremos apenas “movimento(s) retórico(s)” a partir de agora. Neste trabalho, podemos observar três tipos de sistematização de estrutura de abstracts (movimentos retóricos): o primeiro é abordado por Glasman-Deal (2010), apresentado na página 41 (figura 06); o segundo é desenvolvido por Swales e Feak (2009), conforme quadro a seguir ( número 03, p. 42); e o terceiro é uma tentativa de sistematização de estrutura, em quatro movimentos retóricos, proposta por Bhatia (1993, p. 78/79), do qual falamos posteriormente. Para Swales e Feak (2009), a maioria dos pesquisadores identifica um total de cinco movimentos retóricos 14 , conforme podemos observar no quadro abaixo: Quadro 03: Quadro de movimentos retóricos de Swales e Feak (2009) Movimento Retórico Nomenclatura Questões Implícitas 1 Background/ Introdução/ situação O que nós sabemos sobre este tópico? Por que este tópico é importante? 2 Pesquisa atual/ objetivo Sobre o que é este tópico? 3 Métodos/ materiais/ procedimentos Como foi feito? 4 Resultados/ descobertas O que foi descoberto? 5 Discussão/ conclusão/ implicações/ recomendações O que os resultados significam (relevância)? Fonte: Quadro elaborado pela autora a partir de informações contidas na obra de Swales e Feak (2009) Os abstracts apresentam cinco movimentos retóricos, sendo os números dois e quatro os mais comuns, e o cinco o menos comum na escrita de resumos de artigos em inglês (SWALES; FEAK, 2009, p. 05). Ao passo que, para Glasman-Deal (2010), um abstract é constituído por quatro movimentos retóricos. Observaremos, a seguir, a proposta de Bathia (1993): 14 Neste trabalho analisaremos apenas os movimentos retóricos quatro e cinco, pois, são neles que estão contidas as that-clauses. 42 Quadro 04: Os movimentos retóricos propostos por Bhatia (1993) Movimento Retórico Perguntas Descrição 1 O que o autor realizou na pesquisa? No primeiro movimento o autor apresenta a introdução aos propósitos da pesquisa, suas intenções, teses, hipóteses e pode apresentar também os objetivos da pesquisa ou problemas a serem discutidos. 2 Como o autor fez? No segundo movimento há a descrição da metodologia de pesquisa, tais como os possíveis dados utilizados. 3 O que foi encontrado/descoberto pelo autor? No terceiro movimento há o resumo dos resultados. O autor deve apresentar as conclusões, descobertas e soluções para os problemas abordados na pesquisa. 4 O que o autor concluiu com sua pesquisa? No quarto movimento o autor conclui a respeito de sua pesquisa, podendo apresentar uma interpretação dos dados obtidos e algumas indicações a respeito do que foi descoberto. Fonte: Quadro elaborado pela autora a partir de informações disponibilizadas em Bhatia (1993, p. 78-79) Ao compararmos Glasman-Deal (2010), Swales e Feak (2009) e Bhatia (1993), é possível notar que a primeira autora apresenta quatro movimentos retóricos para a escrita de abstracts (Introdução; Metodologia; Resultados; Discussão/Conclusão), e esses movimentos não se diferem dos quatro movimentos propostos por Bhatia (1993), que também propõe os movimentos de introdução, metodologia, resultados e conclusão. Os únicos autores que apresentam cinco movimentos retóricos de forma definida são Swales e Feak (2009). Para eles, a escrita de um abstract deve ser realizada de maneira completa, seguindo cinco movimentos bem delineados (Introdução, Situação; Objetivos; Métodos, Materiais, Procedimentos; Resultados, Descobertas; Discussão, Conclusão, Implicações, Recomendações). A partir do nosso ponto de vista, o modelo proposto por Swales e Feak (2009) é o mais completo em comparação com os demais, pois apresenta um movimento separado da introdução para o desenvolvimento dos objetivos da pesquisa, além de propor no movimento 5 o desenvolvimento de implicações e recomendações a respeito da pesquisa. Por esse motivo, utilizaremos esse modelo, a partir de agora, quando tratarmos dos movimentos retóricos. Além da apresentação de propostas de movimentos retóricos para a escrita acadêmica de abstracts, a presente pesquisa trará, posteriormente, uma análise sobre as that-clauses em abstracts de alunos de universidades públicas brasileiras. Portanto, abordaremos a seguir os movimentos retóricos 4 (Resultados, Descobertas) e 5 (Discussão, Conclusão, Implicações, 43 Recomendações), de Swales e Feak (2009). Os movimentos referidos serão abordados mais profundamente na sequência. No movimento 4, devem estar inseridos os resultados e descobertas da pesquisa. Quando se trata da organização dos resultados em abstracts, é comum surgir algumas dúvidas: 1. Como devemos organizar nossos resultados e descobertas dentro do texto? Devemos primeiramente tratar dos resultados da pesquisa de uma forma genérica? Após a apresentação geral, devemos prover informações específicas sobre os resultados? ; 2. Para estudos quantitativos, apresentamos os números e porcentagens de forma precisa no abstract ou seria melhor prover valores aproximados dos resultados? (SWALES; FEAK, 2009). A fim de responder às questões anteriores, os autores realizaram uma pesquisa utilizando 20 abstracts de disciplinas distintas: Educação, Odontologia e Microbiologia. Em resposta à primeira questão, a partir da análise dos textos, os autores anteriormente citados afirmam que, a tendência geral de organização dos resultados e descobertas é de se apresentar os resultados gerais em primeiro lugar (normalmente com a utilização de in general, overall, more generally), seguidos pelos resultados específicos. Quanto à segunda questão, os autores ainda postulam que há em pesquisas quantitativas a descrição dos números exatos, porcentagens e estatísticas em suas descobertas/resultados. Os autores de abstracts utilizam dessa estratégia a fim de realçarem a precisão dos dados de suas pesquisas já nos seus resumos, procurando capturar a atenção do leitor (SWALES; FEAK, 2009, p. 17). Ademais, sobre as características do movimento retórico 4, de acordo com a pesquisa realizada pelos autores citados, é possível afirmar que esse movimento é quase universal na escrita de abstracts das mais diversas áreas de pesquisas, podendo ser observado na maioria dos resumos de artigos em inglês. A respeito do movimento retórico 5, Swales e Feak (2009) apontam que esse item é pautado no desenvolvimento da conclusão de um abstract tradicional. Para checarem como ocorre a escrita do movimento, os autores estudaram cerca de 25 abstracts do ano de 2006, de um campo de pesquisa denominado Computer Modeling in Engineering Science 15 (CMES). Pelo menos 72% dos textos analisados apresentaram conclusões definidas e positivas, geralmente colocando em evidência a utilidade ou aplicação dos resultados reportados nos abstracts (SWALES; FEAK, 2009, p. 21). As conclusões geralmente apresentaram as 15 Tradução nossa: Modelização por computador em Ciências de Engenharia. 44 seguintes escolhas de palavras: We... conclude that; ...demonstrate the...; is found; is clearly demonstrated that...; was verified ... that. Os textos analisados pelos autores demonstraram a utilização do movimento 5 na maioria de suas produções, porém essa não é uma regra. Há áreas de pesquisa em que os abstracts apresentam somente a parte dos resultados e não contemplam o movimento retórico 5. Ademais, sobre esse movimento, é possível notar que nele estão contidas as últimas palavras que o leitor lerá no abstract, obviamente, nesse contexto, é melhor dizer algo significativo (SWALES; FEAK, 2009, p. 23) – algo que o leitor possa reconhecer como relevante e atraente para impulsionar a continuação da leitura, recorrendo ao trabalho no todo. A fim de complementar as informações disponibilizadas anteriormente sobre os movimentos 4 e 5, Glasman-Deal (2010) apresenta alguns tipos de vocabulário geralmente utilizados para colocar em evidência os resultados e descobertas do autor, assim como a conclusão do trabalho. Para a autora, os abstracts precisam ser entendidos por uma larga escala de pessoas, por isso devem constituir um texto mais simples, com uma linguagem mais convencional possível. O uso do vocabulário é importante para o entendimento da maioria das pessoas sobre o assunto abordado, e, para que a seguinte lista de palavras fosse desenvolvida, Glasman- Deal (2010) realizou uma pesquisa linguística em mais de seiscentos abstracts de diferentes áreas acadêmicas. Todos os textos foram escritos por falantes nativos de língua inglesa e publicados em revistas científicas, isso significa que a lista contém palavras e frases que são consideradas comuns e aceitas por escritores e editores desses meios de publicação. Segue, portanto, a lista de palavras selecionadas pela autora que designam descoberta/resultado (primeira coluna) e conclusão (segunda coluna) de pesquisa: Quadro 05: Palavras utilizadas para o desenvolvimento dos movimentos retóricos 4 e 5 em abstracts Fonte: GLASMAN-DEAL, 2010, p. 220. 45 De acordo com as informações do quadro, é possível afirmar que, para a autora, os resultados são, geralmente, apresentados a partir das palavras: indicate(s) that; mean(s) that e suggest(s) that e a conclusão de um abstract é, normalmente, indicada a partir de it is thought that; we conclude that; we suggest that; além de can e may. Ao final desta seção, acrescentamos, sobre a escrita de abstract que, além de se adaptar ao modelo de movimentos retóricos, o autor deve se atentar à quantidade de palavras que compõem seu texto. Glasman-Deal (2010), Swales e Feak (2009), e Swales e Van Boon (2007) concordam quando dizem que há um número de palavras restrito para escrever um abstract. Este, geralmente, deve seguir um limite de palavras estrito, a maioria estabelece de 80 a 150 palavras em parágrafo único, e os demais, na maior parte das vezes, contém de 100 a 250 palavras, também em parágrafo único. Para Swales e Feak (2009), a restrição em relação ao número de palavras torna a tarefa da escrita um tanto quanto difícil. Mesmo os autores experientes em publicações geralmente têm que desenvolver várias versões, revisar a escrita diversas vezes, antes de estarem satisfeitos quanto ao resumo de seus trabalhos, que ao final devem apresentar a máxima eficiência e clareza ao leitor (SWALES; FEAK, 2009, p. xiii). Em concordância com Glasman-Deal (2010), Swales e Feak (2009, p. xiv), em uma pesquisa para confirmar a média de palavras utilizadas em abstracts tradicionais (média de 150 a 200), estudam um número de corpora especializados, incluindo um corpus de 240 artigos acadêmicos que contemplam mais de cinco disciplinas distintas, conforme quadro a seguir: Quadro 06: Adaptação da tabela de Swales e Feak (2009 p. 04) sobre média de palavras usadas em abstracts Campo de pesquisa Média de palavras utilizadas por área Ciências da computação 232 Química 215 Inteligência artificial 166 Biologia 196 Antropologia 158 Linguística 150 Média geral de palavras 175 Fonte: Elaboração da autora a partir de informações disponibilizadas em Swales e Feak (2009 p. 04) 46 A partir das informações até aqui discutidas, ao observar os dados apresentados por Glasman-Deal (2010) e também ao analisar os números do quadro, a conclusão a que chegamos sobre a questão do número de palavras nos abstracts é a seguinte: não há uma regra absoluta para a quantidade de palavras que um resumo deve conter, há inúmeras variáveis como: diferentes revistas de publicação acadêmica, diferentes áreas de pesquisa e objetivo do abstract (podendo ser para publicação ou para apresentação em congressos ou conferências). Desse modo, é necessário observar se há regras para a submissão desse gênero e se não houver, é importante seguir a média de palavras utilizadas em abstracts já publicados na revista almejada ou trabalhos enviados para os eventos acadêmicos almejados. Portanto, sobre a escrita de abstracts, é possível dizer que, segundo Swales e Feak (2009, p. 02), os resumos são vistos como a “porta de entrada” para a leitura de trabalhos e artigos. Tomar a decisão de ler ou não um texto completo (ou um trabalho acadêmico completo) geralmente depende da impressão e compreensão do leitor sobre o abstract. Ainda sobre a escrita de abstracts, trataremos a seguir a respeito do desenvolvimento das that-clauses nos movimentos retóricos 4 e 5. Esses movimentos são utilizados para apresentar ao leitor as descobertas, resultados e conclusão de pesquisa, e neles estão contidas orações com that, o foco de análise da nossa pesquisa. 3.5 As that-clauses na escrita acadêmica de abstracts A fim de contextualizarmos o que são as that-clauses, recorremos ao dicionário online Oxford 16 . No referido dicionário, as that-clauses são consideradas orações relativas devido ao pronome relativo that, utilizado para introduzir uma oração definida, especialmente aquela que seja essencial para algum tipo de identificação. Por esse motivo, as that-clauses são reconhecidas em português como orações, à medida que são constituídas a partir do pronome relativo “que”. Ao tratarmos a respeito dessas orações em textos acadêmicos e mais especificamente em abstracts, primeiramente, elucidamos que Biber, et al. (2007) afirma, de acordo com suas pesquisas linguísticas, que as that-clauses são mais comuns em textos acadêmicos do que em outros gêneros textuais. Essa é uma das justificativas para a utilização desse tipo de oração na presente pesquisa, uma vez que, em nossas análises, verificamos que os alunos brasileiros do 16 Acesso ao dicionário a partir do link < https://en.oxforddictionaries.com/definition/that> 47 curso de IFA utilizam esses tipos de orações em seus abstracts, que atualmente compõe o nosso corpus de aprendizes. De fato, os autores dos abstracts utilizam as that-clauses para apresentar maiores detalhes de seus resultados de pesquisa, antecedendo-as pela oração principal. De acordo com Biber, et al. (2007, p. 18), há uma tendência maior em utilizar that após sujeitos inanimados, tais como the results...; the findings of this study..., conforme podemos verificar nos exemplos:  This research shows that junior scholars often need help with their abstracts;  The results offer clear evidence that global warming is a reality […]. Nas sentenças acima, os sujeitos inanimados “esta pesquisa” (this research) e “os resultados” (the results) precedem o uso do pronome relativo that, conforme a teoria de Biber, et al. (2007). O uso das orações com that evidenciam os resultados da pesquisa e permitem aos autores a escolha dos verbos a serem utilizados, que podem variar de verbos fortes a fracos (como por exemplo, os verbos prove e suggest, respectivamente). Portanto, o objetivo da utilização desse tipo de orações é direcionar ênfase aos resultados e descobertas da pesquisa. Demonstraremos, a seguir, algumas maneiras de escrever os resultados e conclusões de pesquisa tendo em vista os movimentos retóricos 4 e 5 e a utilização de that-clauses, para tanto, utilizaremos Dayrell (2014). Segundo a autora, a maneira mais clara de descrever e concluir a respeito dos resultados da pesquisa é utilizar a exploração dos padrões usados em abstracts e verificar os verbos que são comumente utilizados para descrever os resultados, conforme verificamos nas sentenças do quadro a seguir. Quadro 07: Exemplos de sentenças para a construção dos movimentos retóricos 4 e 5 17 Sentenças apresentadas para a verificação do uso de that-clauses 1. In this paper, we demonstrate that current procedures produce... 2. These results show that dynamical processes can have… 3. It is found that interconnects… are major… 4. The paper shows experimentally that when preemption is… 5. Measurements indicate that the system achieves performance comparable to… 6. The csl is found to vanish when the mean… 7. Examinations of the experimental results in combination with empirical models suggest that distributions are… 8. We found no evidence of excess cases corresponding to... Fonte: Quadro editado pela autora a partir do original de Dayrell (2014, p. 161/162) 17 80% das sentenças analisadas utilizaram that na construção dos movimentos retóricos que evidenciam resultados e também conclusão de abstracts. 48 Observando o quadro acima, notamos que as that-clauses 1, 2, 4, 5 e 7 são construídas a partir da utilização de verbos no presente simples (demonstrate, show, shows, indicate e suggest). Há uma sentença (3) que utiliza verbo no passado (found) para preceder that, e duas sentenças não apresentam that-clauses para evidenciar os resultados e conclusões de pesquisa. Logo, a partir das sentenças apresentadas, observamos que é comum desenvolver a escrita dos movimentos retóricos 4 e 5 (SWALES; FEAK, 2009) pelo uso de that-clauses, principalmente precedidos por verbos no presente simples e também por sujeitos inanimados. Após apresentarmos as that-clauses, trataremos, na seção posterior, a respeito dos materiais e metodologia de pesquisa, pois é necessário demonstrar como a nossa pesquisa foi desenvolvida e quais materiais foram utilizados para que as análises dos abstracts fossem realizadas. 49 4. MATERIAIS E METODOLOGIA DE PESQUISA Quando propusemos uma investigação a partir de corpus foi necessário pensar, primeiramente, a respeito de como poderia ocorrer a coleta dos textos. Depois de realizada a coleta, pensamos em qual seria a maneira mais propícia para que utilizássemos os textos para análise, de modo que correspondesse aos objetivos finais da pesquisa. Portanto, apresentaremos, a seguir, os materiais utilizados para o desenvolvimento do presente trabalho, assim como os passos metodológicos para que a coleta de dados de alunos universitários da aula de IFA fosse realizada de modo satisfatório. 4.1 A coleta e compilação do Corpus de aprendizes A partir da necessidade de alunos de universidades públicas brasileiras pela prática da escrita acadêmica de abstracts, decidimos realizar uma pesquisa a partir de dados autênticos sobre o tema escolhido para a presente dissertação. A utilização de corpus, em nosso trabalho, revela a importância de se investigar textos autênticos, escritos por alunos em contexto de sala de aula, para as análises da pesquisa, à medida que o texto desenvolvido em contexto real por alunos de universidades públicas brasileiras retrata com autenticidade como aprendizes desenvolvem suas produções de escrita acadêmica em aulas de IFA. Para que fosse possível realizar a coleta e compilação do nosso Corpus de aprendizes, utilizamos textos produzidos por alunos da Universidade Estadual Paulista “Júlio de Mesquita Filho” – câmpus de São José do Rio Preto, inseridos em um projeto de aulas de inglês, denominado English for Academic Purposes (EAP). Além dos textos produzidos pelos alunos mencionados anteriormente, também examinamos produções escritas de abstracts de alunos da Universidade Federal de Minas Gerais – câmpus Pampulha, Belo Horizonte, também inseridos no contexto de aulas em disciplinas de IFA. Os textos dos alunos da UFMG foram coletados, compilados e disponibilizados na plataforma online CorIFA, pela Profa. Dra. Deise Prina Dutra e seu grupo de pesquisa. A coleta de abstracts, para a pesquisa de mestrado, iniciou-se no ano de 2013, na UNESP/IBILCE. As aulas de IFA começaram como um projeto de extensão universitária e, em 2015, foram incorporadas ao Centro