unesp UNIVERSIDADE ESTADUAL PAULISTA Faculdade de Ciências e Letras Campus de Araraquara - SP ALINE CAMILA LENHARO OOOSSS SSSYYYNNNSSSEEETTTSSS DDDEEE VVVEEERRRBBBOOOSSS DDDOOO PPPOOORRRTTTUUUGGGUUUÊÊÊSSS CCCOOOMMM OOO SSSEEEIIINNNEEERRREEENNNTTTEEE EEE OOOSSS SSSEEEUUUSSS EEEQQQUUUIIIVVVAAALLLEEENNNTTTEEESSS DDDOOO IIINNNGGGLLLÊÊÊSSS ARARAQUARA – SP 2009 ALINE CAMILA LENHARO OOOSSS SSSYYYNNNSSSEEETTTSSS DDDEEE VVVEEERRRBBBOOOSSS DDDOOO PPPOOORRRTTTUUUGGGUUUÊÊÊSSS CCCOOOMMM OOO SSSEEEIIINNNEEERRREEENNNTTTEEE EEE OOOSSS SSSEEEUUUSSS EEEQQQUUUIIIVVVAAALLLEEENNNTTTEEESSS DDDOOO IIINNNGGGLLLÊÊÊSSS Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Lingüística e Língua Portuguesa da Faculdade de Ciências e Letras – Unesp/Araraquara, como requisito para a obtenção do título de Mestre em Lingüística e Língua Portuguesa. Linha de pesquisa: Estudos do Léxico Orientador: Bento Carlos Dias da Silva Bolsa: FAPESP ARARAQUARA – SP. 2009 ALINE CAMILA LENHARO OOOSSS SSSYYYNNNSSSEEETTTSSS DDDEEE VVVEEERRRBBBOOOSSS DDDOOO PPPOOORRRTTTUUUGGGUUUÊÊÊSSS CCCOOOMMM OOO SSSEEEIIINNNEEERRREEENNNTTTEEE EEE OOOSSS SSSEEEUUUSSS EEEQQQUUUIIIVVVAAALLLEEENNNTTTEEESSS DDDOOO IIINNNGGGLLLÊÊÊSSS Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Lingüística e Língua Portuguesa da Faculdade de Ciências e Letras – Unesp/Araraquara, como requisito para a obtenção do título de Mestre em Lingüística e Língua Portuguesa. Estudos do Léxico FAPESP Data de aprovação: 05/05/2009 MEMBROS COMPONENTES DA BANCA EXAMINADORA: Presidente e Orientador: Prof. Dr. Bento Carlos Dias da Silva UNESP/FCL/Araraquara. Membro Titular: Profa. Dra. Rosane de Andrade Berlinck UNESP/FCL/Araraquara. Membro Titular: Profa. Dra. Marilza de Oliveira USP/FFLCH/São Paulo. Local: Universidade Estadual Paulista Faculdade de Ciências e Letras UNESP – Campus de Araraquara Aos meus pais, Adair e Leonina. AGRADECIMENTOS A Deus, por mais uma meta alcançada. Ao professor Bento, que desde 2002, o meu primeiro ano de graduação, desempenha um papel fundamental em minha formação. Por sua paciência, pelas inúmeras explicações e correções, pelo conhecimento compartilhado e pelos “puxões de orelha”, fundamentais para meu desenvolvimento. À minha família, pela confiança depositada e pelo apoio nos momentos mais difíceis. Às professoras Marilza e Rosane e, pela atenção dispensada, pela prontidão com a qual se disponibilizaram, pelas críticas e sugestões que fizeram, ajudando este trabalho a tomar forma e se tornar uma dissertação. Aos amigos do CELiC (Centro de Estudos Lingüísticos e Computacionais), sempre presentes. Em especial à Mirna – cuja “carta de recomendação”, em 2003, me ajudou a fazer parte do seleto grupo de orientandos do professor Bento –, e à Ana Eliza, um anjo sempre disposto a ajudar, por sua amizade. À CAPES, que financiou este trabalho durante o período de março a agosto de 2007, e à FAPESP, pelo apoio financeiro de setembro de 2007 a fevereiro de 2009. Por fim, mas não com menos importância, agradeço ao Rodrigo, pelo companheirismo, pelo incentivo e pelo forte estímulo, sempre presente, que fizeram com que eu acreditasse em mim mesma e chegasse até aqui. RESUMO Esta dissertação abrange temas de dois domínios complementares: o domínio lingüístico e o domínio lingüístico-computacional. No domínio lingüístico, a pesquisa sistematiza os diferentes tipos de clíticos do português, estabelecendo, assim, um critério heurístico que possibilita a identificação e a seleção de verbos com clítico se inerente. No domínio lingüístico-computacional, a partir da apresentação das redes do tipo wordnet e da descrição dos principais tipos de alinhamento semântico que podem ser estabelecidos entre a base de verbos da WordNet.Br e a base de verbos da WordNet de Princeton, a pesquisa de natureza aplicada propôs um alinhamento dos verbos com clítico se inerente do português com seus correspondentes do inglês. Palavras-chave: verbo, clítico se, verbos com clítico se inerente, alinhamento semântico, wordnet. ABSTRACT This thesis discusses the Brazilian Portuguese clitics in two complementary domains: the linguistics domain and the computational-linguistic domain: in the linguistics domain, the research aims to frame the different types of Brazilian Portuguese clitics and to draw heuristics to identify and to select the verbs with inherent clitic se. In the computational- linguistic domain, after presenting wordnet projects and describing the different types of semantic alignment that can be effected between synsets of verbs from different wordnets, the tasks were to construct synsets of Brazilian Portuguese verbs with inherent clitic se in the WordNet.Br database under construction and to align them semantically with the corresponding synsets of English in the Princeton WordNet database. Keywords: verb, clitic se, verbs with inherent clitic se, semantic alignment, wordnet. SUMÁRIO 1 INTRODUÇÃO ............................................................................................................. 8 1.1 Caracterização do problema................................................................................... 10 2 EQUACIONAMENTO DO DOMÍNIO LINGÜÍSTICO .............................................. 19 2.1 O léxico e a gramática ........................................................................................... 19 2.2 Fundamentos para a caracterização dos verbos com clítico se ................................ 20 2.2.1 Estrutura de argumentos e transitividade verbal .............................................. 20 2.2.2 O complexo clítico se............................................................................... 23 2.2.2.1 Os clíticos ................................................................................................ 23 2.2.2.2 Os diferentes tipos de clítico se ................................................................ 30 2.2.2.3 Considerações finais: sobre o uso do clítico se ......................................... 37 2.3 Tipologia dos verbos com clítico se ....................................................................... 43 2.4 Seleção dos verbos ................................................................................................ 48 2.4.1 Verbos com clítico se...................................................................................... 49 2.4.2 Verbos com clítico se inerente ........................................................................ 55 3 EQUACIONAMENTO DO DOMÍNIO LINGÜÍSTICO-COMPUTACIONAL............ 59 3.1 A WordNet de Princeton e as redes wordnets......................................................... 61 3.1.1 A EuroWordNet.............................................................................................. 65 3.1.2 A WordNet.Br ................................................................................................ 66 3.2 Tipos de alinhamento entre wordnets..................................................................... 69 3.3 Amostra do alinhamento dos verbos com clítico se inerente................................... 73 4 CONSIDERAÇÕES FINAIS ....................................................................................... 82 REFERÊNCIAS BIBLIOGRÁFICAS............................................................................. 84 APÊNDICE..................................................................................................................... 90 8 1 INTRODUÇÃO Este trabalho se situa entre as pesquisas interdisciplinares que começaram a surgir depois da invenção do computador, nos meados da década de 40, e foram se intensificando a partir da década de 50. Hoje, essas pesquisas são conhecidas como Tecnologias da Linguagem Humana e se valem do estudo do Processamento Automático de Língua Natural (PLN). O PLN, por sua vez, é uma disciplina em efervescência, que aglutina diversas áreas do conhecimento – sobretudo, Letras, Lingüística e Ciências da Computação – e agrega diferentes interesses, desde o científico-acadêmico até os interesses ligados à indústria de informática (DIAS-DA-SILVA, 2006). Nessa concepção de PLN, são considerados os sistemas baseados em conhecimento, ou seja, os sistemas especialistas, que se beneficiam das estratégias dos modelos de representação do conhecimento (DIAS-DA-SILVA, 2006) e, como estratégia metodológica, seguem as seguintes etapas: (i) a extração do solo, em que são explicitados o conhecimento e o desempenho lingüísticos; (ii) a lapidação, em que são formalmente representados esse conhecimento e esse desempenho; (iii) a incrustação, em que é desenvolvido o programa de computador que codifique a representação proposta em (ii) (HAYES-ROTH, 1990 apud DI FELIPPO, 2008). Com uma reinterpretação dessas etapas, Dias-da-Silva (1996) propõe que as pesquisas em PLN sejam desenvolvidas em três domínios que lhes são próprios, a saber: o lingüístico, o lingüístico-computacional e o computacional. No primeiro, as atividades se concentram na investigação dos fatos de uma ou mais línguas naturais; no segundo, no estudo dos modelos de representação formal (HANDKE, 1995) para os conhecimentos construídos no domínio anterior; no terceiro, no desenvolvimento dos recursos e sistemas de PLN computacionalmente implementados (DIAS-DA-SILVA et al. 2008; DI FELIPPO, 2008). Nesse contexto, esta pesquisa, motivada pelos estudos de natureza teórica e prática realizados como parte das atividades de iniciação científica (PIBIC-CNPq), ligadas ao projeto de PLN Face Lingüística da Rede WordNet para o Português do Brasil, que visa à construção de uma rede semelhante à rede WordNet de Princeton para o português do Brasil (DIAS-DA-SILVA, 2004), propôs-se inicialmente, no domínio lingüístico, a 9 investigar três tipos específicos de verbos do português, classificados na literatura como verbos pronominais (orgulhar-se), verbos impessoais/unipessoais (acontecer) e verbos com sujeito sintático afetado/paciente (apanhar)1. Entretanto, com o melhor domínio dos estudos e, sobretudo, com a observância das imprescindíveis sugestões da banca do Exame Geral de Qualificação2, estabeleceram- se um recorte e uma escolha terminológica: o recorte consistiu em restringir o estudo aos verbos denominados verbos pronominais (BECHARA, 2000; BORBA, 2002; DUBOIS et al., 1973; NEVES, 2000); uma escolha terminológica consistiu em substituir o termo verbos pronominais pelo termo verbos com clítico se, pois se observou que não há consenso na adoção do termo verbos pronominais, havendo, inclusive, discrepância classificatória, sinalizando que ainda é preciso considerar a seguinte advertência: na Lingüística, há, por um lado, “termos idênticos, empregados com sentidos diversos por diferentes autores” e, por outro, “vários termos alternativos para o que é essencialmente o mesmo fenômeno” (DIAS-DA-SILVA, 1990, p. 14). No domínio lingüístico da pesquisa, propõe-se (i) contextualizar o estudo no domínio da léxico-gramática; (ii) sistematizar os diferentes tipos de clíticos do português, com considerações sobre diferenças apontadas pelos autores entre as variantes européia e brasileira, e estabelecer o critério de seleção dos verbos do grupo verbos com clítico se inerente; (iii) constituir o inventário dos verbos que satisfazem o critério para serem trabalhados no alinhamento semântico a ser proposto na etapa lingüístico-computacional. No domínio lingüístico-computacional, realizam-se as seguintes investigações complementares: (i) apresentar brevemente a noção de wordnets (redes de palavras conceitualmente organizadas) e descrever os principais tipos de alinhamento semântico que se estabelecem entre a base de verbos da WordNet.Br (WN.Br) e a base de verbos da WordNet de Princeton (WN.Pr); (ii) aplicar esse alinhamento aos verbos português do tipo verbos com clítico se inerente; (iii) apresentar uma amostra do alinhamento. Adverte-se que não se trabalharão questões do domínio computacional, que consistiriam na codificação dos alinhamentos no editor da base da WN.Br (DIAS-DA-SILVA et al. 2006). Assim, em termos estruturais, além desta introdução, que ainda caracterizará na Subseção 1.1 o problema que originou esta pesquisa, o texto contempla mais três seções. 1 Decorre desse fato o título do projeto original ser Descrição dos significados das construções verbais pronominais e com sujeito afetado do português com vistas ao alinhamento semântico de wordnets. 2 A banca do Exame Geral de Qualificação, além da participação do orientador, contou com a participação das professoras Dra. Marilza de Oliveira (DLCV/FFLCH/USP/São Paulo) e Dra. Rosane de Andrade Berlinck (PPGLLP/FLC/UNESP/Araraquara). 10 Na primeira, a Seção 2, procede-se à descrição sistemática do clítico se e das propriedades sintáticas e semânticas dos verbos classificados como verbos com clítico se inerente, o estabelecimento do critério operacional de identificação do grupo de verbos desse tipo (DIAS-DA-SILVA et al. 2002; JACKENDOFF, 2002; NUNES, 1995; MATEUS et al., 2003; RODRIGUES, 1998) e a seleção dos verbos desse grupo que será feita a partir de córpus. Na segunda, a Seção 3, procede-se à representação dos significados desses verbos em termos de synsets da base da WN.Br e ao alinhamento desses synsets aos seus correspondentes na base da WN.Pr. Na terceira, a Seção 4, apresentam-se as considerações finais sobre a pesquisa realizada, com prospecção de desenvolvimentos futuros. 1.1 Caracterização do problema No domínio lingüístico, não é uma tarefa fácil, com base em gramáticas e em obras lexicográficas tradicionais (BECHARA, 2000; BORBA, 2002; DUBOIS et al., 1973; GEIGER, 2007; NEVES, 2000), definir e delimitar os verbos cuja atualização inclui um clítico, daí ser aqui adotado o termo verbos com clítico se. Essa tarefa é abordada, nesta subseção, demonstrando-se duas maneiras de se apreender essa dificuldade: uma abordagem mais teórica, embasada na literatura, e uma abordagem mais prática, embasada na comparação da classificação dos verbos proposta em diferentes dicionários. Ao se consultarem os teóricos, os verbos aqui denominados verbos com clítico se são rotulados de “verbos pronominais” e definidos como unidades lexicais formadas pela união de um verbo com um pronome reflexivo. Entretanto, ao se comparar obras que utilizam essa terminologia, constatam-se informações divergentes: cada autor os define de sua maneira (note-se ainda que, enquanto um aborda o assunto de maneira superficial e marginal, outros dedicam páginas para tentar explicá-los). O próprio termo “verbo pronominal” não é consensual: há rótulos diversos. Os exemplos são parcos e não permitem a devida comparação entre os estudos dos diferentes autores, não possibilitando o teste das propostas de análise oferecidas. Essas divergências já são suficientes para mostrar que a compreensão da temática é assunto difícil. Ilustram-se, a seguir, essas divergências. Neves (2000, p. 468) define sucintamente que os “os verbos pronominais” são aqueles em que “as formas oblíquas 11 reflexivas dos pronomes pessoais” são parte integrante desses verbos, e cita como exemplos os verbos abraçar-se, admirar-se, avizinhar-se (NEVES, 2003, p. 107), bronzear-se, chatear-se, chocar-se, comover-se, concentrar-se, decepcionar-se, decompor-se, dedicar-se, descamar-se, desinteressar-se, desintoxicar-se, doutorar-se, embriagar-se, familiarizar-se, fatigar-se, graduar-se, habituar-se, maravilhar-se, preocupar-se, reabilitar-se, reanimar-se, sagrar-se, sentar-se, silenciar-se, tranqüilizar-se, viciar-se e zangar-se3. Note-se, entretanto, que a autora aborda o tema de maneira bastante esquemática. Borba (2002, p. vii), do ponto de vista sintático, porém, também de modo esquemático, observa que os “verbos pronominais” são aqueles construídos “com um pronome da mesma pessoa do sujeito que, não tendo função sintática específica, serve como índice do grau de participação do sujeito naquilo que o verbo expressa, como o verbo afastar-se em Glória se afastou sorrindo. Dubois et al. (1973, p. 489-490) afirmam que os “verbos pronominais” correspondem aos verbos da voz média do indo-europeu, onde “o sujeito e o agente, que podem ser distintos, exercem uma ação sobre si mesmos, em seu benefício ou interesse, podendo tais verbos dispensar o ‘objeto’, como os intransitivos”. Especificam ainda os seguintes tipos: “verbos pronominais propriamente ditos”, como penitenciar-se, que correspondem aos verbos intransitivos e não apresentam forma ativa correspondente; “verbos pronominais cuja voz passiva representa um aspecto acabado”, a voz passiva pronominal, como vender-se em Vendem-se doces; e “verbos pronominais reflexivos e recíprocos, como lavar-se em Ana se lava, em que o complemento do verbo, idêntico ao sujeito da voz ativa, é substituído por um pronome reflexivo singular ou plural. Por fim, Bechara (2000, p. 222-223) considera que o “verbo pronominal” é aquele empregado “na forma reflexiva propriamente dita”, isto é, é uma: 3 Neves (2000, p. 468-469) apresenta as seguintes ocorrências: Rosalinda abraçou-se ao corpo de Jacob; Um transeunte admirou-se do berro; Havia um banco na areia (...) onde as meninas se bronzeavam; [Arlequim] chateou-se de ter perdido o melhor da noite [...]; Chocou-se meu amigo com aquele cinismo [...]; José comoveu-se com a dedicação do companheiro [...]; A proteína concentra-se principalmente nas sementes [...]; Já vi de tudo e já me decepcionei; Porque a Argentina pareceu se decompor depois do doping de Maradona? (sic); Os meninos dedicaram-se a vingar a morte da mãe; No céu, [...] a lua branca e enorme se descamava num mar de claridade; Rosa, [...] desinteressa-se da capoeira; Agora seria difícil desintoxicar- me por completo; [Sérgio Porto] doutorou-se em Física nos Estados Unidos; Os pássaros que comeram dos frutos embriagaram-se; Em dois dias aquele gente começava a familiarizar-se comigo; E eles [...] não se fatigavam de cantar a letra toda [...]; Alexandre graduara-se em três profissões diferentes; Quem disse que o menino precisa ir se habituando a essas coisas? Os homens são crianças grandes, maravilham-se diante do mistério; [Os Soares] não se preocupam tanto comigo; Os pequenos delinqüentes [...] nunca mais se reabilitam; O sorriso reanimou-se por um instante; A associação Francana sagrou-se campeã da II Taça Cidade de Goiânia; Zú de Peixoto sentou-se numa pedra; Gusto silenciou-se por algum tempo; [Pacuera] tranqüilizara-se; A gente almoça e se vicia; Se você não se zangar, eu quero ver de novo. 12 [...] forma verbal que indica que a ação verbal não passa a outro ser (negação da transitividade), podendo reverter-se ao próprio agente (sentido reflexivo propriamente dito) [...] formada de verbo seguido do pronome oblíquo de pessoa igual à que o verbo se refere: eu me visto, tu te feriste, ele se enfeita. Das obras consultadas, as de Bechara (1980, 2000) apresentam mais informações sobre os “verbos pronominais”. Mesmo assim, há controvérsias: 2ª.) Em geral, o pronome átono que acompanha a voz reflexiva propriamente dita funciona como objeto direto, embora raras vezes possa exercer a função de indireto. 3ª.) Com verbos como atrever-se, indignar-se, queixar-se, ufanar-se, admirar-se, não se percebe mais a ação rigorosamente reflexa, mas a indicação de que a pessoa a que o verbo se refere está vivamente afetada [isto é, o pronome se fossilizou]. Com os verbos de movimento ou atitudes da pessoa ‘em relação ao seu próprio corpo’ como ir-se, partir- se, e outros como servir-se, onde o pronome oblíquo empresta maior expressividade à oração, também não se expressa a ação reflexa. Alguns gramáticos chamam ao pronome oblíquo, nessas últimas circunstâncias, pronome de realce. 4ª.) Muitos verbos normalmente não pronominais se acompanham de pronome átono para exprimirem aspectos estilísticos, como a mudança lenta de estado [...]. 5ª.) Inversamente, elimina-se o pronome de muitos verbos que o exigem na língua padrão: aquecer, chamar (ter nome), mudar (transferir-se), gripar, machucar, formar (Eu formei em Medicina), classificar (Ele classificou em 3º. lugar), etc. (BECHARA, 2000, p. 223-224). Essa breve apresentação de diferentes propostas de descrição dos verbos com clítico se do português, permite concluir que há um mesmo fenômeno, aqui denominado verbos com clítico se, que está sendo rotulado por diferentes termos: “verbos pronominais”, “verbos pronominais cuja voz passiva representa um aspecto acabado”, “verbos pronominais reflexivos e recíprocos” e “verbos reflexivos propriamente ditos”. Essa “subcategorização” também ocorre no inglês, como observado por Levin (1993, p. 107-109), que, ao estabelecer as classes e alternâncias para os verbos do inglês, observou, por exemplo, que: há verbos que devem ser utilizados obrigatoriamente na passiva, como rumor (“espalhar boato”) em It is rumored that he left town; outros pedem obrigatoriamente um advérbio, como mean (“dispor-se”) em The teacher meant well; ou exigem um pronome reflexivo como objeto, como pride (“orgulhar-se”) em He prides himself on his position. Segundo a autora, entre os verbos que requerem um pronome reflexivo como objeto, há aqueles que podem ser encontrados com um objeto não- 13 reflexivo. Neste caso, apresentam um sentido diferente. Poucos deles são encontrados com o mesmo sentido na passiva (passiva adjetiva), como embroil (“envolver-se”) em He embroiled himself in the latest controversy over the budget, He was embroiled in the latest controversy over the budget. Ao observar a explicação de Quirk et al. (1985) para esse assunto – que, de modo mais específico, explicam que os tipos de construção que exigem o pronome reflexivo podem ser classificados em reflexivo, semi-reflexivo e não-reflexivo, nota-se que, também no inglês, há o problema da terminologia. Assim como na proposta de Levin (que se assemelha à de Lyons (1979)), para Quirk et al. (1985, p. 357) os verbos reflexivos são aqueles que sempre exigem um objeto reflexivo, como em pride oneself on (“orgulhar-se de”); os semi-reflexivos são aqueles que podem omitir o pronome, com pouca ou nenhuma variação de sentido, como em behave (oneself) (“comportar-se”) e os não-reflexivos são os verbos que são transitivos, mas não são associados a nenhum pronome reflexivo em particular. A consulta às classificações lexicográficas, por sua vez, torna mais evidente a discrepância classificatória dos verbos com clítico se, sobretudo ao se considerarem, além dos rótulos adotados pelos dicionaristas, as notas introdutórias dessas obras, em que é explicada a metodologia de confecção da obra. Neste exercício, utilizaram-se os dicionários Caldas Aulete (GEIGER, 2007), Dicionário de usos do português do Brasil (BORBA, 2002), doravante DUP, Dicionário Aurélio do Século XXI (FERREIRA, 1999), doravante Aurélio, e Webster’s (TAYLOR, 2003). A comparação foi feita a partir de um universo de 49 verbos apresentados por Rodrigues (1998, p. 104) (Cf. discussão mais adiante nesta dissertação) como exemplos de um grupo de verbos, doravante a Classe III de Rodrigues, que admitem a construção média4 com a presença obrigatória do clítico se medial. O dicionário Caldas Aulete faz referência apenas a “verbos pronominais” e a sinaliza pela abreviatura “pr.”. Como o seu prefaciador é Evanildo Bechara, infere-se que a descrição desse tipo de verbo segue a análise sugerida por esse gramático (apresentada há pouco). As figuras 1 e 2 ilustram verbetes desse dicionário, evidenciando que as informações apresentadas acerca do assunto são insatisfatórias. 4 São exemplos de construção média: Essas doenças se transmitem facilmente e Uno se dirige facilmente (RODRIGUES, 1998, p. 105). 14 orgulhar (or.gu.lhar) v. Fazer sentir ou sentir orgulho (1). [td.: Esse prêmio orgulharia qualquer pessoa. pr.: Tem bons motivos para se orgulhar.] [► 1 orgulhar] Figura 1. Verbete do verbo orgulhar (GEIGER, 2007, p. 725). debater (de.ba.ter) v. 1 Trocar idéias sobre (um assunto), conversando; DISCUTIR. [td.: Debatiam os pontos centrais do projeto. int. Agora vão debater até a cerveja acabar. tdi. + com: O cineasta debatia com os jornalistas o sucesso do festival.] ◘ debater-se pr. 2 Agitar-se (tb. Fig.); CONTORCER-SE: “...debati-me no leito em agitação violenta...” (Joaquim Manoel de Macedo, A luneta mágica); [Os peixes debatem-se na rede.] [► 2 debater] • de.ba.te.dor a.sm. Figura 2. Verbete do verbo debater (GEIGER, 2007, p. 295). Com o levantamento feito no Caldas Aulete, em função da presença ou da ausência da abreviatura pr. para os verbos da Classe III de Rodrigues, constatou-se que dos 49 verbos, 27 não são classificados como pronominais. Dos 21 verbos classificados como pronominais, 6 apresentam mais de um sentido pronominal, a saber: corromper, desvalorizar, distinguir, preparar, projetar e purificar. O verbo definir não é classificado como pronominal pelo dicionário, porém, o verbete desse verbo inclui a subentrada definir-se. O verbo enfrascar não consta do dicionário, o que justifica o total de 48 verbos. A figura 3 mostra essa classificação dos verbos com base nesse dicionário. PRONOMINAL NÃO-PRONOMINAL agrupar, alicerçar, castrar, corrigir, corromper, cultivar, definir-se, desvalorizar, dirigir, distinguir, nivelar, pintar, preparar, projetar, purificar, realçar, resgatar, resumir, traduzir, transmitir, transportar afugentar, arquivar, bordar, colher, construir, contornar, coroar, costurar, desperdiçar, dosar, elaborar, encadernar, erradicar, escovar, esculpir, esmaltar, irrigar, lapidar, ler, niquelar, paginar, raspar, rebocar, rechear, redigir, semear, transcrever Total: 21 verbos Total: 27 verbos Total geral: 48 verbos Figura 3. Como o dicionário Caldas Aulete classifica os 49 verbos da Classe III. O DUP foi prefaciado pelo próprio autor (BORBA, 2002), cujas considerações sobre os “verbos pronominais” foram apresentadas no terceiro parágrafo desta subseção. O resultado do levantamento no DUP é apresentado na figura 4. Os verbos em negrito ressaltam as diferenças entre os verbos do DUP e os verbos do Caldas Aulete. Dos 49 verbos da Classe III de Rodrigues, 24 não são classificados como pronominais no DUP. É importante ressaltar que o verbo rebocar, classificado como não-pronominal no Caldas Aulete, apresenta duas entradas no DUP: o rebocar1 é classificado como um verbo de ação, pronominal, com o sentido de “lambuzar-se” e o rebocar2 como um verbo de ação- 15 processo, não-pronominal, com o sentido de “conduzir por meio de reboque” ou “arrastar”. Por esse motivo, na figura 4, ele foi inserido nas duas colunas, o que, somado à falta dos verbos enfrascar e niquelar, justifica a quantia de 50 verbos levantados. PRONOMINAL NÃO-PRONOMINAL agrupar, alicerçar, coroar, corrigir, corromper, definir, desperdiçar, desvalorizar, dirigir, distinguir, nivelar, escovar, esculpir, pintar, preparar, projetar, purificar, raspar, realçar, rebocar1, resumir, traduzir, transmitir, transportar afugentar, arquivar, bordar, castrar, colher, construir, contornar, costurar, cultivar, dosar, elaborar, encadernar, erradicar, esmaltar, irrigar, lapidar, ler, paginar, rebocar2, rechear, redigir, resgatar, semear, transcrever Total: 24 verbos Total: 24 verbos Total geral: 48 verbos Figura 4. Como o DUP classifica os 49 verbos da Classe III de Rodrigues. No DUP, o verbo ler não é classificado como pronominal, porém, o verbete desse verbo inclui a subentrada leia-se. Os verbos castrar, cultivar e resgatar, que apresentam ao menos uma marca de pronominal no Caldas Aulete, são não-pronominais no DUP, onde são classificados como ação-processo. Já o contrário ocorre com 6 verbos com marca de não-pronominal no Caldas Aulete. No DUP, esses verbos são assim classificados: coroar (processo.pronominal), desperdiçar (processo.pronominal), escovar (ação.pronominal), esculpir (processo.pronominal), raspar (ação.pronominal) e rebocar ((rebocar1) ação.pronominal). Vale lembrar que essas não são, necessariamente, as únicas classificações que esses seis verbos apresentam no DUP. O dicionário Aurélio não apresenta nenhuma informação explicativa sobre as classificações adotadas. Esse dicionário, apesar de também apresentar duas entradas para o verbo rebocar, como o DUP, classifica as duas entradas como verbo transitivo direto, ao contrário do anterior. Desse modo, o dicionário Aurélio apresenta 28 verbos classificados como pronominais e 21 verbos que não apresentam nenhuma acepção com essa classificação, como mostra a figura 5. Enquanto o DUP classifica os verbos desperdiçar, escovar e esculpir como pronominais, o Aurélio os classifica como não-pronominais. O oposto ocorre com os verbos castrar, cultivar, elaborar, encadernar, esmaltar, rechear e resgatar, classificados como não-pronominais no DUP e como pronominais no Aurélio. Comparando-se as classificações do Aurélio e do Caldas Aulete, verifica-se que os 21 verbos não-pronominais no Aurélio também recebem a mesma classificação no Caldas 16 Aulete, juntamente com os verbos coroar, elaborar, encadernar, enfrascar, esmaltar, raspar e rechear, que no Aurélio são classificados como pronominais. PRONOMINAL NÃO-PRONOMINAL agrupar, alicerçar, castrar, coroar, corrigir, corromper, cultivar, definir, desvalorizar, dirigir, distinguir, elaborar, encadernar, enfrascar, esmaltar, nivelar, pintar, preparar, projetar, purificar, raspar, realçar, rechear, resgatar, resumir, traduzir, transmitir, transportar afugentar, arquivar, bordar, colher, construir, contornar, costurar, desperdiçar, dosar, erradicar, escovar, esculpir, irrigar, lapidar, ler, niquelar, paginar, rebocar, redigir, semear, transcrever Total: 28 verbos Total: 21 verbos Total geral: 49 verbos Figura 5. Como o dicionário Aurélio classifica os 49 verbos da Classe III de Rodrigues. O dicionário Webster’s também não apresenta nenhuma informação explicativa sobre os verbos com clítico se, e, diferentemente dos dois dicionários anteriores, não utiliza o rótulo de “verbo pronominal”. Nesse dicionário, a classificação adotada é a de “verbo reflexivo” (v.r.). A figura 6 apresenta o levantamento feito em função da presença ou da ausência do rótulo de verbo reflexivo no dicionário. REFLEXIVO NÃO-REFLEXIVO agrupar, cultivar, distinguir, enfrascar, nivelar, escovar, pintar, preparar, projetar, raspar, rechear, resumir, traduzir, transmitir, transportar afugentar, alicerçar, arquivar, bordar, castrar, colher, construir, contornar, coroar, corrigir, corromper, costurar, definir, desperdiçar, desvalorizar, dirigir, dosar, elaborar, encadernar, erradicar, esculpir, esmaltar, irrigar, lapidar, ler, niquelar, paginar, purificar, realçar, rebocar, redigir, resgatar, semear, transcrever Total: 15 verbos Total: 34 verbos Total geral: 49 verbos Figura 6. Como o dicionário Webster’s classifica os 49 verbos da Classe III de Rodrigues. Com esse último levantamento, observa-se uma discrepância ainda maior em relação aos dois levantamentos anteriores: os 49 verbos citados por Rodrigues (1998) constam do dicionário, porém, apenas 15 deles são classificados como reflexivos. Entre os 34 classificados como verbos não-reflexivos, o verbo definir apresenta em seu verbete a expressão definir-se, que equivale a “to take form” e o verbo dirigir apresenta as seguintes expressões dirigir-se a (“to address oneself to”, “to speak to (someone)”) e dirigir-se para (“to go towards a place or person”). 17 Observa-se, assim, que não há um consenso descritivo sobre a classificação dos verbos com clítico se, tanto na teoria quanto na prática. Como defini-los? Como identificá- los? Portanto, no domínio lingüístico, responder a essas questões se torna fundamental para que as atividades do domínio lingüístico-computacional sejam realizadas. Isso porque, como já mencionado, no domínio lingüístico-computacional são estudados os modelos formais de representação para os conhecimentos apreendidos no domínio lingüístico. Herda-se, dessa maneira, a dificuldade existente nesse domínio: a falta de consenso descritivo sobre a classificação dos verbos com clítico se e, sobretudo, a falta de explicação e descrição dessa família de verbos. Além dessa “herança”, no domínio lingüístico-computacional deve-se resolver à questão de qual procedimento deve ser adotado para se alinhar um conjunto de verbos sinônimos do português, formado por verbos com clítico se, como {acobardar-se, acovardar-se, amedrontar-se, apavorar-se, assustar-se, atemorizar-se, intimidar-se}, que atualiza o sentido de “tornar-se covarde”, quando não há um conjunto de verbos sinônimos do inglês registrado na WN.Pr com esse sentido. Note-se que, na WN.Pr, há o conjunto unitário {intimidate}, com o sentido transitivo de “to make timid or fearful” (“tornar tímido ou com medo”), que pode ser alinhado ao conjunto {acobardar, acovardar, amedrontar, apavorar, assustar, atemorizar, intimidar}, que atualizam o sentido de “tornar covarde”. Buscando solucionar esses problemas, ou, ao menos, formulá-los de modo mais sistemático, este trabalho desenvolverá a temática seguindo o seguinte plano: além da Introdução, que contextualiza o estudo e caracteriza o problema que instigou a pesquisa, como mencionado anteriormente, o texto da dissertação distribui-se em três seções. Na Seção 2, denominada “Equacionamento do domínio lingüístico”, são desenvolvidas as discussões pertinentes a esse domínio. Essa seção divide-se em quatro partes: na Subseção 2.1, é traçada uma distinção entre léxico e gramática; na Subseção 2.2, são apresentados os fundamentos teóricos para a caracterização dos verbos com clítico se, que incluem a estrutura de argumentos e a transitividade verbal (Subseção 2.2.1) e a complexidade existente em torno do clítico se (Subseção 2.2.2) – com a caracterização dos clíticos do português (Subseção 2.2.2.1), os diferentes tipos de clítico se (Subseção 2.2.2.2) e algumas considerações sobre o seu uso (Subseção 2.2.2.3); na Subseção 2.3, é apresentada a tipologia dos verbos com clítico se e, na Subseção 2.4, são apresentados os critérios adotados para a seleção dos verbos, lembrando que, primeiramente, foram 18 levantados todos os verbos com clítico se (Subseção 2.4.1) e, depois, os dados foram refinados e somente os verbos com clítico se inerente foram trabalhados (Subseção 2.4.2). Na seção 3, “Equacionamento do domínio lingüístico-computacional”, procede-se à representação dos significados dos verbos com clítico se inerente em termos de synsets da base da WN.Br e ao alinhamento desses synsets aos seus correspondentes na base da WN.Pr. Essa seção divide-se em três: na Subseção 3.1, são apresentadas as redes wordnets, em especial a WordNet de Princeton, que motivou o desenvolvimento de todas as demais redes análogas, como a EuroWordNet (Subseção 3.1.1) e a WordNet.Br (Subseção 3.1.2); na Subseção 3.2, são ilustrados os tipos de alinhamento entre wordnets e na Subseção 3.3, é apresentada uma amostra do alinhamento dos synsets de verbos com clítico se inerente do português com seus respectivos synsets da WordNet de Princeton. Na seção 4, são apresentadas as considerações finais sobre a pesquisa realizada, com prospecção de desenvolvimentos futuros. Por fim, apresentam-se as “Referências bibliográficas” do trabalho e, no apêndice, o levantamento dos verbos com clítico se. 19 2 EQUACIONAMENTO DO DOMÍNIO LINGÜÍSTICO Nesta seção serão desenvolvidas as discussões do domínio lingüístico, em que introduzem-se, em seqüência, (a) as noções léxico-gramaticais norteadoras e relevantes para a compreensão dos clíticos e do procedimento de alinhamento semântico descrito na Seção 3, (b) a caracterização dos verbos com clítico se em termos de estrutura de argumentos e de transitividade e a caracterização e da classificação dos tipos de clíticos, (c) a classificação dos verbos com clítico se e o critério de discriminação dos verbos com clítico se inerente e (d) a seleção do grupo de verbos rotulados verbos com clítico se inerente, alvos do alinhamento semântico a ser proposto na Seção 3. 2.1 O léxico e a gramática O léxico de uma língua pode ser considerado “o conjunto das unidades submetidas às regras da gramática dessa língua, sendo a conjunção da gramática e do léxico necessária e suficiente à produção (codificação) ou à compreensão (descodificação) das frases” dessa língua (REY-DEBOVE, 1984, p. 46). Assim, um indivíduo, ao adquirir uma língua natural, incorpora tanto as unidades de significado (o léxico) quanto o sistema de regras (a gramática) dessa língua, isto é, ele adquire uma competência léxico- gramatical. Embora não seja o foco deste trabalho o estudo de uma léxico-gramática, vale lembrar que diferentes autores se propuseram a estudar essa “léxico-gramática” a partir de diferentes abordagens teóricas (ALVES, 1990; ANDRADE, 1998; BARBOSA, M., 1991; BARROS, 2004; CHOMSKY, 1965; FELLBAUM, 1999; HANDKE, 1995). As palavras intuitivamente identificáveis em uma língua natural têm resistido a uma conceituação teórica universal. Cada língua, segundo Biderman (1978, 1998a, 1999), possui características próprias e peculiaridades que impossibilitam uma definição homogênea do que deve ser considerada palavra. Além dessa não universalidade, há uma vasta discussão acerca dos termos que devem ser empregados: palavra, vocábulo, lexema, unidade ou item lexical, lexia ou listema, entre outros (Cf. BIDERMAN, 1978, 1998, 20 1998a, 1999; BORBA, 2002, 2003; DI SCIULLO; WILLIAMS, 1987; JACKENDOFF, 1990, 2002). Com base nas discussões propostas por esses autores, conclui-se, que, entre os termos apresentados, o de palavra é o de valor mais ambíguo, o “que torna desaconselhável o seu uso num discurso especializado” (VILELA, 1995, p. 97). Assim, neste trabalho, como na maioria dos trabalhos estudados, adota-se o termo unidade (ou item) lexical para nomear unidades como os verbos e os substantivos, que são unidades semanticamente plenas e tipicamente registradas no léxico da língua e têm a potencialidade de se combinar umas com as outras ou com elementos afixais para formarem outras unidades ou sintagmas. Já o termo unidade gramatical é adotado para se referir a unidades semanticamente “esvaziadas” como os clíticos, pronomes e artigos, que são unidades que operam na gramática. 2.2 Fundamentos para a caracterização dos verbos com clítico se Nesta subseção focalizam-se os temas considerados essenciais para a caracterização dos verbos com clítico se. Destacam-se as noções de estrutura de argumentos e transitividade e a tipologização dos clíticos, com ênfase na descrição de uma tipologia para o se. 2.2.1 Estrutura de argumentos e transitividade verbal Na teoria de estruturas de argumentos proposta por Jackendoff (2002), que se situa na interface sintático-semântica, a estrutura da unidade lexical compreende estruturas como a fonológica e a de argumentos, sendo que os argumentos que constituem a segunda são de duas espécies: argumentos semânticos (elementos que representam os conceitos na língua, denominados papel semântico, ou papel temático ou ainda cases, e argumentos sintáticos (elementos que expressam os argumentos semânticos na sintaxe). Por exemplo, os verbos devorar e comer apresentam os mesmos argumentos semânticos (argumento externo (ao SV e com propriedade de Sujeito) = “quem come/devora” e argumento interno 21 (SV e com propriedade de Objeto) = “o que come/devora”), mas diferem na realização sintática desses argumentos: devorar exige a expressão sintática de ambos, mas comer, só a do aexterno. A literatura citada por Jackendoff aponta que os argumentos semânticos podem variar de zero (verbos que expressam fenômenos meteorológicos como chover, nevar e ventar: Choveu muito.) a quatro (verbos que expressam uma transação comercial como vender, comprar e negociar: Paula1 vendeu o carro2 a Paulo3 por mil reais4!). Os papéis semânticos são apresentados na figura 7. Agente: designa a entidade controladora de uma ação; Fonte/Origem/Causa/Causativo: designa a entidade que está na origem de uma situação, mas não a controla. Segundo Nunes (1995, p. 208), é “um elemento que de maneira não intencional desencadeia um processo ou produz um estado”; Experienciador: designa a entidade que é a sede (física ou psicológica) de uma propriedade ou relação; Locativo: designa a localização espacial de uma entidade. Segundo Nunes (1995, p. 208), “situa o tema espacialmente”; Alvo/Meta/Beneficiário/Destinatário: designa a entidade para qual algo é transferido, com sentido locativo ou não. Segundo Nunes (1995, p. 208), “participa de relações de posse, ganho ou perda”; Tema/Paciente/Objeto: designa a entidade que muda de lugar, de posse ou de estado em situações dinâmicas. De acordo com Nunes (1995, p. 208), “refere-se ao papel temático obrigatoriamente subcategorizado pelo verbo, com o qual estabelece várias relações”. Tempo: designa a ocasião em que se dá determinado evento ocorre; Modo: designa a maneira como determinado evento. Figura 7. Papéis semânticos. 5 A estrutura de argumentos do verbo, embora seja uma noção semântico-lexical, tem conseqüências na sintaxe da frase em que o verbo ocorre, pois, “quando a frase não respeita a estrutura argumental do seu predicador verbal, é mal formada sintaticamente, i.e., é agramatical” (MATEUS et al., 2003, p. 186). Para serem gramaticais, as frases devem, além de realizarem o número de argumentos exigido pelo verbo, realizar as 5 Os papéis semânticos podem receber várias denominações e podem variar quanto ao número, de acordo com os autores (COOK, 1979 apud NUNES, 1995; JACKENDOFF, 1983, 2002; NUNES, 1995; VILELA, 1999). Mateus et. al. (2003), por exemplo, diferentemente de Jackendoff (2002), estabelecem que o número de argumentos pode variar de zero a três, dado que verbos como arrastar, levar, transferir e trazer apresentariam, como um dos seus argumentos, um argumento padrão, isto é, um argumento que tem realização sintática opcional. De acordo com as autoras, alguns autores diferenciam, por exemplo, o Tema, utilizado para designar entidades que sofrem uma mudança de lugar ou de posse, do Paciente, utilizado para designar entidades que sofrem uma mudança de estado. 22 propriedades de seleção categorial de cada argumento da estrutura. Compare-se, por exemplo, Maria acredita em milagres e *Maria acredita em casas.6 Os verbos que não têm nenhum argumento apresentam o esquema relacional representado por [V]: são os chamados verbos impessoais (MATEUS et al., 2003). Borba (2002 p. viii) classifica os verbos impessoais como aqueles que se apresentam “na 3ª. pessoa do singular por ausência de sujeito”. Os protótipos dos verbos impessoais são os verbos que expressam fenômenos meteorológicos. Já o esquema relacional [SUJ V] representa os verbos com um argumento, os verbos intransitivos. São classificados como inergativos, quando selecionam um argumento externo como sujeito gramatical, como andar, chorar, correr e dormir, e como ergativos (ou inacusativos/anticausativos), quando selecionam um argumento interno como sujeito gramatical (com as propriedades de Objeto Direto), como acontecer, adormecer, cair e morrer (MATEUS et al., 2003). Ressalva-se que Rodrigues (1998, p. 105) diferencia os verbos ergativos dos verbos anticausativos. Segundo a autora, os verbos ergativos são aqueles que participam da alternância transitiva/intransitiva (João quebrou o copo/O copo quebrou), ao passo que os verbos anticausativos são exclusivamente intransitivos (Três passageiros chegaram à estação), sendo agramaticais se usados transitivamente (*Eu cheguei três passageiros à estação). Os verbos com dois argumentos são os verbos transitivos. Eles podem ser subclassificados como: transitivo direto, selecionando um argumento externo como Sujeito e um argumento interno como Objeto Direto (esquema relacional [SUJ V OD]) como abrir, beber, amar e fazer; e como transitivo indireto, que seleciona como argumento interno um Objeto Indireto e apresenta o esquema relacional [SUJ V OI], como agradar, concordar, telefonar e obedecer. Os verbos com três argumentos são os verbos ditransitivos (ou transitivo direto e indireto), com esquema relacional [SUJ V OD OI], como atirar, dar, persuadir e transformar (MATEUS et al., 2003). Os verbos, todavia, podem apresentar variação em suas estruturas de argumentos. Quanto a essa ampliação ou redução da valência verbal, Vilela (1999, p. 345) adverte que “a variabilidade de construção de um mesmo verbo deixa-nos, por vezes, na dúvida sobre se estamos perante o mesmo verbo ou verbos diferentes”. Por exemplo, o verbo ergativo apodrecer pode ser construído transitiva ou intransitivamente: A umidade apodreceu a fruta./A fruta apodreceu. O que diferencia essas duas construções é que, enquanto as 6 O símbolo * indica a agramaticalidade da frase. 23 construções transitivas permitem identificar uma entidade causadora das situações, as construções intransitivas não fazem “referência à entidade causadora, como se fosse uma situação independente dela” (PERES; MÓIA, 1995, p. 195-196). De acordo com Peres e Móia (1995, p. 197-200), essa “confusão” em torno da variação das estruturas argumentais de alguns verbos pode ter início nas obras lexicográficas, pois verbos como aderir são dicionarizados como admitindo o valor de causatividade, embora sejam pouco utilizados como causativos e muitos são os casos de verbos anticausativos, como perigar, perdurar e sobressair, utilizados como causativos. Essa afirmação dos autores é mais um argumento que fortalece a discussão sobre a falta de consenso descritivo dos dicionários apresentada na Seção 1. Salienta-se, com Vilela (1999) e Peres e Móia (1995, p. 197-200), que um mesmo verbo pode apresentar diferentes realizações de seus argumentos. O clítico se atua de maneira determinante nessas possíveis realizações argumentais. 2.2.2 O complexo clítico se Dado que o objeto de estudo deste trabalho são os verbos com clítico se, considerou-se essencial para a investigação a caracterização dos clíticos (Subseção 2.2.2.1) e, em particular, a descrição de uma tipologia para o clítico se. Para que a tipologia do se seja apresentada por completo, julgou-se também necessária a inclusão do clítico que marca a voz média (Subseção 2.2.2.2). Na seqüência, apresenta-se uma breve incursão pelas principais diferenças de uso do clítico se nas variedades brasileira e portuguesa do português apontadas pelos autores e um quadro comparativo dos diferentes tipos se (Subseção 2.2.2.3). 2.2.2.1 Os clíticos Muitos trabalhos (Cf. RODRIGUES, 1998) concernentes à literatura específica sobre a cliticização pronominal já foram elaborados para as línguas românicas (PEREIRA, 2006). Um desses trabalhos mais recentes é o da Gramática da Língua Portuguesa 24 (MATEUS et al., 2003), que apresenta critérios de descrição e de classificação dos clíticos do português europeu. De acordo com essa gramática, os clíticos são um tipo particular de pronomes que, prototipicamente, correspondem “às formas átonas do pronome pessoal que ocorrem associadas à posição dos complementos dos verbos”, mas eles “não se limitam a denotar a pessoa gramatical, podendo exibir uma função predicativa, ou revestir-se de propriedades morfossintáticas características de alguns sufixos derivacionais” (MATEUS et al., 2003, p. 827). Por exemplo, o clítico o em Carinhoso com Teresa, ele sempre assim o foi, não denota uma entidade, mas um predicado, e é correlato do pronome demonstrativo isso7. Já o clítico se em Os sucos derramaram-se devido ao balanço do navio, apesar de ter a mesma forma do pronome reflexivo, não designa uma entidade, mas tem a propriedade gramatical de transformar o verbo transitivo derramar no verbo intransitivo derramar-se. Mateus et al. (2003, p. 835) propõem que todos os clíticos do português europeu sejam diferenciados um do outro segundo cinco potencialidades: • o potencial de ser referencial ou predicativo, • o potencial de receber papel temático, • o potencial de indicar referência específica ou arbitrária, • o potencial de ocorrer em construções com redobro ou de supressão de clítico e • o potencial de funcionar como afixo que altera a estrutura argumental do verbo. De acordo com essa caracterização, os clíticos classificam-se em cinco tipos: • clíticos argumentais, • clíticos argumentais proposicionais ou predicativos, • clíticos quase-argumentais, • clíticos afixais derivacionais, • clíticos sem conteúdo semântico ou morfo-sintático. O primeiro tipo abriga os clíticos com referência definida e o clítico com referência arbitrária; o segundo grupo, o dos clíticos argumentais proposicionais ou predicativos, corresponde aos clíticos demonstrativos; o terceiro grupo, o dos clíticos quase-argumentais, é formado pelo clítico com estatuto argumental e funcional e pelos 7 Vale destacar que, no português brasileiro, há muito tempo a forma o não se instancia como correlata do demonstrativo isso, que foi um dos primeiros clíticos a desaparecer do sitema (PEREIRA, 2006). 25 clíticos referenciais não associados à grade argumental do verbo; o quarto grupo, o do clítico com comportamento de afixo derivacional, corresponde ao clítico ergativo; o quinto grupo, o dos clíticos desprovidos de conteúdo semântico ou morfo-sintático, corresponde ao clítico inerente. Os clíticos com referência definida são representados pelos clíticos anafóricos, os pronomes reflexivos ou recíprocos, e pelos clíticos pronominais (não-reflexivos), os pronomes pessoais de 3ª pessoa.8 São caracterizados como argumentais porque ocorrem associados às posições de objeto direto ou indireto dos verbos transitivos ou transitivos diretos e indiretos, os ditransitivos, como em Convidavam-na constantemente para cantar em conhecidas bandas de jazz e As pessoas perguntavam-lhe quando faria filmes mais profundos (MATEUS et al., 2003, p. 835), aceitam construções de redobro “em que o constituinte redobrado assinala a posição argumental a que o clítico está associado”, como em Só a convidavam a ela para cantar e As pessoas perguntavam-lhe a ele quando faria filmes mais profundos (MATEUS et al., 2003, p. 836) e podem ser recuperados em construções em que estão subentendidos como em Dizem que a convidam [-] para cantar e aplaudem [-] entusiasticamente (MATEUS et al., 2003, p. 836). O clítico com referência arbitrária também é conhecido como SEnominativo e como índice de indeterminação do sujeito, pois ocupa a posição de sujeito da frase e faz com que o sujeito seja interpretado como indefinido e não-específico como em Aluga-se casas e Trabalha-se demais (MATEUS et al., 2003, p. 837). É caracterizado por ser parafraseável por expressões nominais como alguém, como em A grande questão está naquilo em que alguém/uma pessoa acredita, mas, por isso, não admite redobro, como em *Alguém aluga- se casas (MATEUS et al., 2003, p. 837). O SEnominativo é obrigatoriamente referencial, por esse motivo, não pode ocorrer associado a uma posição de pronome expletivo, como em *Há-se muitos livros nesta biblioteca. Também por esse motivo, é possível ser recuperado em construções em que está subentendido, como em Informa-se que se aluga apartamentos e vende moradias (MATEUS et al., 2003, p. 837). Os clíticos demonstrativos, entre os quais o pronome o, correlato do demonstrativo isso (no português europeu), denotam situações e estados de coisas. 8 A anáfora, para as autoras, é a relação “referencial que se estabelece entre certas expressões tradicionalmente consideradas pronominais [...] e que não têm nunca referência autônoma, e uma expressão que fixa o seu valor referencial”, enquanto a co-referência é a relação estabelecida entre duas expressões nominais com valor referencial (a segunda expressão pode ser um item lexical ou um item gramatical). Deste modo, os pronomes eu, tu, nós, e vós só apresentam valor dêitico (não apresentam valor de co-referência) (MATEUS et al., 2003, p. 805-806). 26 Ocorrem com verbos “que selecionam frases por objeto direto”, como em Que era culpado, ele não o declarou abertamente e Não havia provas concludentes para incriminar os argüidos e a juíza sabia-o perfeitamente (MATEUS et al., 2003, p. 837- 838). Esse clítico também pode ocorrer como predicado nominal, mas sua realização como “predicado é sentida por alguns falantes como pouco natural, sendo preferencialmente substituída por elipse”, como em A Ana está em casa e a Maria também está [-] (MATEUS et al., 2003, p. 838). Os clíticos demonstrativos não podem ocorrer em construções com redobro de clítico, mas podem ser recuperados em construções em que estão subentendidos, como em *Ele não o declarou a isso abertamente e Acho que ele não o declarou [-] nem negou [-] abertamente (MATEUS et al., 2003, p. 838-839). O clítico com estatuto argumental e funcional, também conhecido como SEpassivo, tem como referente uma “entidade arbitrária identificada com o chamado ‘agente da passiva’”, como em Venderam-se hoje muitos livros na feira do livro, e, por isso, não admite redobro de clítico (como o SEnominativo) como em *Venderam-se hoje muitos livros por alguém na feira do livro (MATEUS et al., 2003, p. 839)9. Entretanto, dado o seu valor argumental, pode ser recuperado em construções em que está subtendido, como em Já hoje se venderam e compraram muitos livros na feira do livro (MATEUS et al., 2003, p. 839). Além desse valor argumental, desempenha as funções “tipicamente atribuídas ao morfema passivo [como em Foram vendidos muitos livros hoje (por alguém)], bloqueia a atribuição de relação temática à posição de argumento externo e de caso acusativo ao argumento interno do verbo” (MATEUS et al., 2003, p. 839-840). Os clíticos referenciais não associados à grade argumental do verbo são os dativos éticos e de posse. O dativo ético “designa tipicamente o locutor” e manifesta seu interesse “na realização da situação expressa pela frase”, como em Cala-me essa boca, pois já não te posso ouvir chorar!, em que me “designa uma entidade que pode ser considerada o Beneficiário” (MATEUS et al., 2003, p. 840). Por sua natureza não-argumental, não pode ocorrer em construções com redobro de clítico e nem pode ser recuperado em construções em que foi suprimido, como em *Cala-me essa boca a/para mim, pois já não te posso ouvir chorar! (MATEUS et al., 2003, p. 841). O dativo de posse, diferentemente do dativo ético, “embora não esteja correlacionado com uma posição argumental do predicador verbal, está associado a uma posição de argumento ou de adjunto de um complemento 9 Destaca-se que essa afirmação das autoras, de que o SEpassivo tem como referente uma entidade arbitrária identificada com o agente da passiva, causa estranhamento, dado que o SE elimina o agente da construção passiva e, portanto, não pode ter um referente, mesmo que seja uma entidade arbitrária. 27 deste predicador, como em Dói-me a cabeça, e, por isso, aceita o redobro de clítico, como em Dói-me a cabeça a mim (MATEUS et al., 2003, p. 841). O clítico ergativo, também conhecido como clítico anticausativo, apresenta forma idêntica à dos pronomes anafóricos reflexivos (me, te, se, nos, vos e se). Não são “verdadeiros argumentos dos verbos, mas morfemas ou afixos, que, através de um processo lexical, tornam os verbos que são transitivos em intransitivos” (MATEUS et al., 2003, p. 807). Desse modo, quando o clítico ergativo ocorre, ele inibe a “presença do argumento externo do verbo a que se associa, argumento externo esse que deteria normalmente as relações temáticas de causador ou de agente”, portanto, sua principal função é a de “destransitivar o verbo principal a que se associa, comportando-se como um sufixo derivacional destransitivizador” (MATEUS et al., 2003, p. 841). O clítico ergativo ocorre essencialmente com verbos que não apresentam uma contraparte intransitiva sem o clítico, como em O barco virou-se./A tempestade virou o barco./* A tempestade virou-se o barco./??O barco virou. e Eu enervei-me./Aquela situação enervou-me./*Eu enervei (MATEUS et al., 2003, p. 842)10, 11. Embora se pareça com o SEpassivo, o SEergativo se difere dele por não ter valor argumental e poder, desse modo, co-ocorrer com um adjunto que explicite a causa externa do evento denotado pelo verbo, como em O barco virou-se por causa de/com a tempestade e Nós enervámo-nos por causa de/ com aquela situação. Só aceita redobro em situações marginais, como (?)O barco virou-se por si próprio por causa da tempestade (MATEUS et al., 2003, p. 842). Só pode ser suprimido quando “cliticiza num verbo que forme um complexo verbal com os verbos a destransitivizar”, como em O barco tinha-se virado junto da costa e afundado no alto mar/ *Julgamos que o barco de papel se molhou com a chuva e virou (MATEUS et al., 2003, p. 843). Por fim, o clítico inerente corresponde às formas do pronome reflexivo que não estão associadas “a qualquer posição argumental ou de adjunto” do verbo e “em que o clítico não pode ser interpretado como uma partícula destransitivadora”, como em A Maria apaixonou-se por aquele homem encantador/ *Aquele homem encantador apaixonou a 10 De acordo com Rodrigues (1998, p. 105), as propriedades que caracterizam o verbo ergativo são: a) poder participar da alternância causativa transitiva/intransitiva; b) poder atribuir ao argumento externo os papéis de Agente, Causa ou Instrumento; c) ser compatível com o pretérito pontual, com o imperativo e com o presente contínuo e d) ser incapaz de formar nomes terminados em -or com leitura agentiva. Segundo a autora, a representação semântica clássica para esses verbos ergativos é: [[ X DO-SOMETHING] CAUSE [ Y BECOME STATE]]. 11 Como se observará na Subseção 2.2.2.3, construções do tipo O barco virou e Eu enervei são totalmente aceitáveis no Brasil. 28 Maria, Tu zangas-te sem saber por quê/*Aquilo zangou-te, Rio-me às gargalhadas das graças desse cômico/*As graças desse cômico riem-me às gargalhadas e em As tristezas acabaram-me/Aquele acontecimento acabou as tristezas (MATEUS et al., 2003, p. 843). O Agente da ação expressa pelo verbo com esse clítico só pode ser explicitado com a utilização do verbo fazer, como em Aquele homem encantador fez a Maria apaixonar (MATEUS et al., 2003, p. 843). O clítico inerente não afeta a estrutura argumental do verbo e não admite redobro, como em *A Maria apaixonou-se a si própria/por si própria por aquele homem encantador, *Tu zangas-te a ti próprio/por ti próprio sem saber por quê, *Rio-me a mim própria/por mim própria às gargalhadas das graças desse cômico e em *As tristezas acabaram-se a si próprias/por si próprias” (MATEUS et al., 2003, p. 844). O clítico inerente, “consoante os verbos, ocorre opcional ou obrigatoriamente” (MATEUS et al., 2003, p. 844), como em *A Maria apaixonou por aquele homem encantador, *Tu zangas sem saber por quê, Rio às gargalhadas das graças desse cômico e em As tristezas acabaram”. O clítico inerente, assim como o clítico ergativo, só pode ser suprimido da construção quando “tem por hospedeiro um verbo exterior à estrutura coordenada”, como acontece em Ela estava-se sempre a queixar do filho e a zangar com a filha, pois, senão, “as frases são marginais, dado que o clítico omitido não é recuperável devido à ausência de conteúdo argumental ou predicativo”, como em *Ela não só se queixava do Pedro como zangava com a Maria/ Ela não só se queixava do Pedro como se zangava com a Maria (MATEUS et al., 2003, p. 844). Os clíticos argumentais com referência definida e os argumentais com referência arbitrária, os clíticos quase-argumentais com estatuto argumental, o clítico com comportamento de afixo derivacional (o clítico ergativo) e os clíticos sem conteúdo semântico ou morfossintático (o clítico inerente) serão estudados neste trabalho. Já os clíticos argumentais proposicionais ou predicativos (clíticos demonstrativos) e os clíticos referenciais não associados à grade argumental do verbo (os clíticos dativo) não serão abrangidos por este estudo por não serem um problema para o alinhamento semântico entre verbos do inglês e do português. A figura 8 apresenta um resumo dessa tipologia dos clíticos com base em Mateus et al. (2003), já desconsiderando os clíticos que não serão estudados neste trabalho. 29 DENOMINAÇÕES DO CLÍTICO CARACTERÍSTICAS GERAIS FUNÇÃO SINTÁTICA REDOBRO DE CLÍTICO SUPRESSÃO DE CLÍTICO DESTRANSITIVADOR DE VERBO SE ANAFÓRICO Possui conteúdo argumental e referência não-arbitrária Objeto Direto Objeto Indireto Sim Sim - SE NOMINATIVO SE INDETERMINADOR Possui conteúdo argumental e referência arbitrária Sujeito Não Sim - SE PASSIVO Possui conteúdo quase- argumental com estatuto argumental e funcional Agente da Passiva Não Sim - SE ERGATIVO Não possui conteúdo argumental e apresenta comportamento de afixo derivacional Não-argumental Não1 Não2 Sim SE INERENTE Não possui conteúdos argumental, semântico ou morfológico Não-argumental Não Não Não 1 Admite redobro de clítico em situações marginais. 2 Admite supressão de clítico somente quando o verbo não exige o clítico. Figura 8. Síntese da nomenclatura e das características dos clíticos com base em Mateus et al. (1993). 30 2.2.2.2 Os diferentes tipos de clítico se Com a caracterização da tipologia dos clíticos do português com base em Mateus et al. (2003), observa-se que há, pelo menos, cinco tipos, a saber: SEanafórico, SEnominativo, SEpassivo, SEergativo e SEinerente. É essa diversidade de possibilidades de uso, pois, que torna o estudo desses elementos complexo. Observe-se, por exemplo, as construções de (1) a (4), que exemplificam, respectivamente, as chamadas orações passivas sintéticas, reflexivas, recíprocas e com sujeito indeterminado do português. Do ponto de vista gramatical, elas são bem semelhantes (DIAS-DA-SILVA, 1990, p. 30). (1) Vende-se a casa. (2) Ela se perfuma. (3) Eles se amam. (4) a) Estuda-se. b) Dorme-se. c) Vende-se casas12. Tradicionalmente, o clítico se dessas orações é classificado como: pronome apassivador (1), pronome reflexivo, (2) e (3), pronome indeterminador do agente (4a), pronome indeterminador do sujeito de verbos intransitivos (4b) e pronome indeterminador do sujeito de qualquer verbo (4c) (BECHARA, 1980). Porém, Ikeda (1980 apud DIAS-DA-SILVA, 1990) propõe outra classificação, apresentada na figura 9, na qual ela considera o clítico se presente em (1) e em (4a, b, c) idênticos, pois nos dois tipos de exemplos apresentam o mesmo comportamento e nos dois tipos de exemplos indeterminam o sujeito da oração. Lima (1985) concorda que SEpa e SEiis sejam iguais e acrescenta que: [...] a interpretação passiva [de orações do tipo ‘Vendem-se casas’] vai recuando lentamente, mesmo entre os gramáticos. A existência do sujeito ativo e potente [nesse tipo de oração] é tão fortemente sentida pelo falante, que na fala popular [...] é comum a não ocorrência da concordância do verbo com o argumento afetado [casas], o que mostra 12 Embora se diga que esse tipo de construção fuja aos padrões cultos da língua, Perini (2001, p. 270-271) afirma que “os gramáticos normativos aconselham” que se diga “Comem-se pizzas”, e não “Come-se pizzas”, mas “isso deve ser um fenômeno basicamente escolar; não creio que haja pessoas que aprendam nativamente a produzir frases como essa”. 31 que ele continua na sua função de objeto direto [...]. (LIMA, 1985, p. 183 apud DIAS-DA-SILVA, 1990, p. 40). SEiis: índice de indeterminação do sujeito (4a, b, c). SEpa: partícula apassivadora (1). SErefl: pronome reflexivo (2), compreendendo o se recíproco (3) e o se sujeito de oração infinitiva, como em Deixou-se ficar à janela. SEinco: pronome incoativo, como em Pedro se feriu ao pular o muro, em que o se expressa ação ou estado experimentado pelo sujeito, sem ação intencional deste. SEfoss: pronome fossilizado, como em Ele se lembra de tudo, em que não se percebe mais o sentido reflexivo da construção, sendo considerado como parte integrante do verbo, sem classificação especial. SEreal: pronome de realce, como em Ele se foi; com verbos que indicam movimento ou atitude da pessoa com relação ao seu próprio corpo. Figura 9. Proposta de classificação do clítico se com base em Ikeda (1980 apud DIAS-DA-SILVA, 1990). Além disso, estruturalmente, tanto em aluga-se casas, construção denominada passiva impessoal por Câmara Jr. (1989), como em alugam-se casas, denominada passiva pessoal pelo o autor, tem-se “um morfema se num tipo de frase passiva que omite o agente tanto nos verbos transitivos como nos intransitivos, elevando o paciente a sujeito nos verbos transitivos (com norma literária) ou não (molde popular)” (CÂMARA JR., 1977, p. 185 apud DIAS-DA-SILVA, 1990, p. 41). Dias-da-Silva (1990, p. 42) argumenta ser viável considerar esses dois tipos de construções com se como “gramaticalmente idênticas, deixando para os fatores pragmáticos a tarefa de explicar a diferença de interpretação apontada [...] entre as passivas impessoais e as passivas sintéticas”. Levando em consideração a influência do “conhecimento da realidade”, Coseriu (1980, p. 66 apud DIAS-DA-SILVA, 1990, p. 42) propõe que as construções com se reflexivo se assemelham às distinções da voz média (a ser tratada mais adiante), obtendo-se o se (i) reflexivo próprio, por exemplo: João se lava, onde “a ação recai sobre o agente que é também objeto”; o (ii) reflexivo recíproco, João e Ana se esbofeteiam, dado que “a ação é reciprocamente realizada pelos dois sujeitos” e o (iii) reflexivo impessoal, A letra d se escreve assim, já que “a ação não é realizada pelo sujeito”. 32 O trabalho de Nunes (1995) corrobora com a exemplificação da complexidade relacionada ao clítico se, pois, ao apresentar uma classificação análoga à de Ikeda (1980 apud DIAS-DA-SILVA, 1990), propõe nove tipos de clítico se. De acordo com o autor, as nove classes de clíticos anafóricos são: se reflexivo (recíproco ou não), se ergativo, se inerente, se índice de espontaneidade, se apassivador, se indeterminador, se médio, se ex-ergativo e se quase-inerente (NUNES, 1995, p. 204), conforme resume a figura 10. SE reflexivo: realiza o papel temático de argumento interno (abraçar-se). SE ergativo: detematiza a posição do sujeito de verbos transitivos (magoar-se). SE ex-ergativo: indica que houve uma provável agentivação de construções com se ergativo. Isto é, o clítico se (marcador da eliminação do argumento externo) foi reinterpretado como marcador da fusão entre o argumento externo (Agente) e um argumento interno (ocupar-se, casar-se e prestar-se). SE inerente: o chamado clítico “fossilizado” junto a um verbo “essencialmente pronominal”. SE quase-inerente: o clítico de verbos como portar-se e comportar-se, que, apesar de apresentarem uma contraparte transitiva (com outro significado), no sentido de “agir” resistem ao preenchimento do argumento interno, o que sugere que Agente e Tema já se fundiram lexicalmente. SE enfático: refere-se ao que a gramática tradicional chama de índice de espontaneidade. Enquanto enfático, o clítico funciona como um operador lexical que normalmente reflete a fusão de dois papéis temáticos (utilizar-se, decidir-se e parecer-se). Figura 10. Classificação do clítico se proposta por Nunes (1995, p. 204-206)13. Rodrigues (1998), ao estudar os verbos do português que realizam construções médias, contribui, juntamente com as considerações sobre a voz média tecidas nos parágrafos que se seguem, para o entendimento do último tipo de clítico estudado neste trabalho: o clítico medial, o SEmédio. As contribuições de Rodrigues, ao mostrar que há no português um clítico medial de realização obrigatória sem, entretanto, ser um clítico inerente ao verbo, e a breve incursão sobre a voz média, ao mostrar a “proliferação” de usos do clítico se nas línguas românicas, trazem mais luz para a melhor compreensão não só do sistema de clíticos como também para a delimitação do grupo de verbos denominados verbos com clítico se inerente. Intensamente investigada nos estudos do grego e muitas vezes deixada de lado nos estudos do português (Cf. CAMBRUSSI, 2007), a voz média é o contexto dentro do qual se caracteriza o SEmédio, o último tipo de clítico inventariado neste trabalho. 13 Nunes, nesse trabalho, apenas menciona a exitência dos clíticos se apassivador, se indeterminador e se médio dentre os tipos de clíticos, mas não os caracteriza. 33 O termo grego diáthesis (diátese)14, que no latim corresponde ao termo voz, significa “estado, disposição, função”. Assim, a voz do verbo, ou seja, a sua diátese, especifca “a relação entre o acontecimento comunicado e seus participantes” (BECHARA, 2000, p. 213). De acordo com Dubois et al. (1973, p. 615), ela “indica a relação gramatical entre o verbo, o sujeito ou o agente e o objeto”15. Câmara Jr. relaciona a voz média com a gênese da voz passiva e, sobretudo, observa a tendência de sua absorção pela voz ativa: a) de um lado, a voz medial caracterizada por desinências verbais próprias, como em sânscrito e grego; b) de outro lado, a voz reflexivo- pronominal, em que o que há de paciente no ser agente fica mais nitidamente expresso por um pronome oblíquo de pessoa do sujeito (latim e línguas românicas, germânico, eslavo). A voz medial, assim compreendida, está permanentemente em risco de sofrer duas alterações de forma e conteúdo a um tempo. Em primeiro lugar, há a tendência a obumbrar-se a participação, como paciente, do sujeito no processo verbal. Daí, o aparecimento de uma forma puramente ativa [...]. [e portanto a tendência, como se verá, do apagamento do SEmédio] Em segundo lugar, pode manifestar-se um aumento de insistência no morfema medial. Em conseqüência, fica principalmente em realce o caráter de PACIENTE do sujeito, e surge, por extensão, o emprego na forma medial para as frases da voz verbal, que a gramática greco- latina denominou VOZ PASSIVA. (CÂMARA JR., 1977, p. 183-184 apud DIAS-DA-SILVA, 1990, p. 53). Dias-da-Silva (1990, p. 54-55) destaca o caráter obscuro da caracterização das vozes verbais e enfatiza a noção de voz média como intermediária entre as vozes ativa e a passiva, assim como a hipótese, normalmente aceita, de que a voz passiva deriva-se da voz média. Caracterizar a voz ativa não é problemático, dado que o significado de 14 Atribui-se a Dionísio da Trácia (século II a.C.) e a Apolônio Díscolo (século II d.C.), gramáticos alexandrinos, a primazia dos estudos sobre a voz. Com base na forma do verbo grego, eles “depreenderam o conceito de diáthesis (‘disposição’) para categorizar ‘as distinções marcadas pelas flexões verbais às quais eles se referiam como ‘ativa’, ‘passiva’ (designando o estado de ‘sofrer os efeitos de uma ação’) e ‘média’” (LYONS, 1979, p. 393). Seguindo esse modelo, os romanos aplicariam “o mesmo conceito de diáthesis para analisar o fenômeno da apassivação em latim”. Tempos depois, foram os termos usados por eles que chegaram a nós, sendo que “a palavra grega diáthesis (diátese) foi substituída pela palavra latina vocem (voz) para referir-se ao mesmo conceito. No entanto, esses gramáticos depreenderam apenas duas vozes para o latim: activum (ativa) e passivum (passiva)” (DIAS-DA-SILVA, 1990, p. 51). Há, porém, controvérsias na literatura especializada acerca da natureza e da essência desses conceitos. Neves (1987, p. 160 apud DIAS-DA-SILVA, 1990, p. 52), por exemplo, afirma que “Dionísio indica três diátheseis (VOZES): enérgeia (ATIVA), páthos (PASSIVA) e mesótes (MÉDIA)” e que ele são se baseou apenas em critérios formais, mas também em critérios nocionais, incluindo “na voz média flexões verbais que formalmente pertencem à ativa, como, por exemplo, o perfeito de forma ativa e significação passiva”. 15 Para Cambrussi (2007, p. 16), pode-se inferir dessa afirmação de Dubois et al. (1973) que o “entendimento de voz do verbo está ligado à relação do verbo com os papéis temáticos da sentença (e depende de quais papéis temáticos estão envolvidos nesta relação). 34 energéia é o de “atividade, execução”. O problema é interpretar os termos páthos e mesótes do grego, pois, a flexão média nessa língua desempenha diferentes funções: (i) Média Plena: quando a ação ou o estado afeta o referente do sujeito ou seus interesses; (ii) Média Recíproca: quando os referentes do sujeito se afetam mutuamente; (iii) Média Reflexiva: quando o referente do sujeito afeta a si mesmo; (iv) Média Depoente: quando a ação denota uma disposição física e/ou mental do referente do sujeito; (v) Média ‘Nucleônica’: quando o referente do objeto da ação pertence à esfera do referente do sujeito, ou move-se para esfera do referente do sujeito ou dela se afasta (corresponde aos verbos chamados ‘inacusativos’, isto é, os de sujeito é inanimado.) (vi) Passiva Plena: quando o referente do sujeito não faz nada e é afetado em conseqüência da ação. (ANDERSEN, 1989, p. 3 apud DIAS-DA-SILVA, 1990, p. 55-56). Em suma, “a oposição da voz em grego faz-se primariamente entre ativa e ‘média’”, como resume Lyons (1979, p. 393-394). Em oposição à ativa, a voz média pode indicar que “a ‘ação’ ou o ‘estado’ afeta o sujeito do verbo ou seus interesses”, como a reflexiva I am washing (myself), ou que “a ‘ação’ é realizada pelo sujeito em seu próprio benefício ou em seu próprio interesse, como I got myself a new suit (LYONS, 1979, p. 394). Conforme explica Camara Jr. (1981), a expressão formal da voz média, morfológica no grego clássico e no sânscrito, nas línguas românicas, instancia-se na voz reflexivo-pronominal. Assim, no português, é o uso do clítico se, ou, como denomina Câmara Jr (1981, p. 164), “construção verbal pronominal”, que permite a distinção entre as vozes ativa e média (ARCE-ARENALES, 1994; CAMACHO, 2003). Há, entretanto, outra instanciação da voz média em que não há ocorrência do clítico se, como em Pão de queijo assa rápido, que não é explicitado pelos gramáticos e que vai contra o verificado em línguas românicas como o italiano, que utiliza o SEmédio si, e o francês, o espanhol e o português europeu, que utilizam o SEmédio se, como exemplificam, respectivamente, as frases Questo vestito si lava facilmente, Le grec se traduit facilment, El pan se corta facilmente e Essa parede se pinta facilmente (RODRIGUES, 1998). 35 Rodrigues (1998) explica que a alternância média é um subtipo da alternância transitiva16. Vilela (1995, p. 173), por sua vez, explica que, nas construções transitivas, atribui-se ao sujeito a responsabilidade do processo, possuindo um Agente prototípico17. Para o autor, a voz média se apresenta como um esquema alternativo ao modelo transitivo. Para Vilela (1995, p. 174), os verbos de afeto são bons exemplos de verbos que admitem a voz média, apesar de nem todos os verbos dessa classe construírem-se com voz medial. Ele explica que, com a voz média, o “processo se perspectiva a partir do argumento animado [complemento indireto]”, isto é, ocorre um “processo de topicalização que permite ao participante animado passar à posição privilegiada de sujeito”, colocando este em segundo plano (um complemento preposicional ou oração adverbial). São exemplos de verbos de afeto que admitem uma “realização pronominal (mais ou menos similar)” (VILELA, 1995, p. 175): interessar, doer, surpreender, divertir, alegrar, envergonhar, irritar, incomodar, iludir, preocupar, tranqüilizar, assustar, entristecer, apaixonar, perturbar, entre outros. Para Rodrigues (1998), as construções médias, em particular, apresentam características semânticas e sintáticas próprias: (a) características semânticas: (i) apresentar marca temporal genérica, isto é, as construções médias não descrevem um evento marcado pelo tempo, elas descrevem uma propriedade inerente ao objeto lógico, indiferente ao tempo e (ii) receber interpretação de propriedade, isto é, as construções médias não indicam a ocorrência de um evento, mas a “existência de uma propriedade da entidade representada pelo sujeito gramatical” (RODRIGUES, 1998, p. 123-124), como em Bolo de fubá assa rápido; (b) sintáticas: (i) exigir um modificador, que pode ser um advérbio de modo, como facilmente, rapidamente e bem (Este chão encera bem.), um advérbio de negação (Chão de pedra não limpa.), um sujeito quantificado negativamente (Poucas caminhonetes capotam.) ou um acento contrastivo (ESSA PORTA abre.) e (ii) ter a posição de sujeito gramatical preenchida pelo objeto lógico, de maneira semelhante às passivas e ergativas, nas quais o sujeito gramatical corresponde 16 Na alternância transitiva, o verbo pode integrar frases transitivas e intransitivas, com a seguinte propriedade: o sujeito gramatical da frase intransitiva (O vasoSujeitoi quebrouV) corresponde ao objeto lógico da frase transitiva (A MariaSujeito quebrouV o vasoObjetoi). 17 O Agente prototípico apresenta as seguintes características: (i) ser origem ou fonte do processo; (ii) ter existência prévia ao processo (ser conhecido, isto é, ser pressuposto); (iii) ter responsabilidade primária sobre processo e (iv) deter o controle do processo, como em Tranqüiliza-me que todos procurem o bem comum e Tranqüilizei-a: vamos procurar uma solução. 36 ao objeto lógico, enquanto na estrutura transitiva correspondente, ele desempenha a função de objeto direto18. Rodrigues (1998), por fim, propõe três classes de verbos que instanciam construções médias: (i) Verbos da Classe I, como acelerar, afundar, aumentar, cozinhar, derramar, derreter, empobrecer, engrossar, limpar, torrar, entre outros (RODRIGUES, 1998, p. 103), que se caracterizam por não permitirem a presença do SEmédio, como ilustram as frases Bolo de cenoura assa facilmente e *Bolo de cenoura sem assa facilmente.19 (ii) Verbos da Classe II, como abrir, afogar, assustar, congelar, descolorir, endurecer, envelhecer, fechar, partir, entre outros (RODRIGUES, 1998, p. 104), que se caracterizam por admitirem o SEmédio opcional, como mostram as frases Essa porta (se) fecha facilmente, Essa janela (se) abre facilmente e Esse vaso (se) quebra facilmente (RODRIGUES, 1998, p. 102). (iii) Verbos da Classe III, como agrupar, arquivar, bordar, colher, construir, escovar, irrigar, ler, traduzir, transmitir, pintar, resumir, rebocar, redigir, resgatar, semear, entre outros (RODRIGUES, 1998, p. 104), que se caracterizam por exigirem o SEmédio, como ilustram as frases Línguas eslavas se traduzem facilmente, Essas doenças se transmitem facilmente e Essa parede se pinta facilmente (RODRIGUES, 1998, p. 105). Conclui-se, com Rodrigues (1998, p. 103), que, enquanto as construções médias com verbos da Classe III são agramaticais sem o SEmédio, a situação se inverte nas construções médias com verbos da Classe I. Já nas construções médias com os verbos da Classe II, a presença do SEmédio é facultativa. Essas considerações sobre o SEmédio e sobre o três tipos de se compilados em Nunes (1995), o SEex-ergativo, o SEinerente e o SEquase-inerente, permitem ampliar a tipologia 18 Comparem-se Essa porta abre facilmente (média), A porta foi aberta por Roberta (passiva), A porta abriu (ergativa) e Roberta abriu a porta (transitiva). Observe-se que, na construção média, “o objeto lógico ocupa a posição de sujeito gramatical” e “o sujeito lógico não tem manifestação sintática” (RODRIGUES, 1998, p. 13). 19 Há frases construídas com verbos da Classe I que ocorrem com o marcador impessoal sei, mas, nessas construções, o objeto direto ocupa a posição de tópico, como sinaliza a presença da vírgula, como em Bolo de cenoura, PRO se assa facilmente. Nesse caso, “a posição de sujeito é ocupada pela categoria vazia PRO com interpretação arbitrária”. Em frases como “*Pães de queijo se assam facilmente”, o objeto lógico ocupa a posição de sujeito, como mostra a concordância verbal, por isso, “a presença do marcador se faz com que a sentença fique agramatical”: “Pães de queijo assam facilmente” (RODRIGUES, 1998, p. 103). 37 baseada em Mateus et al. (2003) para a seguinte tipologia: SEanafórico, SEnominativo, SEpassivo, SEergativo, SEinerente, SEex-ergativo, SEinerente, SEquase-inerente e SEmédio. 2.2.2.3 Considerações finais: sobre o uso do clítico se Nesta subseção, são tecidas as considerações finais sobre a sistematização do “famigerado se” (NUNES, 1990)20, para melhor compreender essa diversidade tipológica e partir para a seleção do grupo de verbos alvo do trabalho: os verbos com clítico se inerente. Tomando-se a tipologia dos clíticos listada na subseção anterior e uma breve incursão sobre a gramaticalização, é possível concluir que os clíticos do português encontram-se em diferentes estágios de gramaticalização21. Os autores argumentam que a granularidade da gramaticalização presente nos diferentes tipos de se reflete diferenças entre o português europeu (PE) e o português brasileiro (PB). Para Mateus et al. (2003, p. 845), a gramaticalização está presente nos pronomes clíticos sob dois aspectos diferentes: (i) de um ponto de vista formal, os clíticos instanciam um elo de um processo de evolução que leva a que formas pronominais plenas se convertam em constituintes e afixos; (ii) do ponto de vista da sua carga semântica, os clíticos em português repartem-se por diferentes subtipos que vão desde aqueles que exibem um conteúdo substantivo pleno (argumental ou predicativo), aos clíticos que apresentam (parcial ou exclusivamente) propriedades de afixos, ou até aos clíticos que estão desprovidos de qualquer conteúdo atribuível, ocorrendo como vestígios fossilizados de estágios anteriores da língua. As autoras, entretanto, advertem que, no PE, embora os clíticos detenham um conteúdo argumental ou predicativo intrínseco, eles “não ocupam posições de sintagmas” e ocorrem sempre “em adjunção estrita ao seu hospedeiro verbal” (MATEUS et al., 2003, p. 845). Elas advertem ainda que, mesmo os clíticos mais 20 Nunes (1990) estuda o SEpassivo e o SEnominativo (o SEindeterminador). 21 A gramaticalização é definida como o desenvolvimento de um item lexical em um item gramatical ou o desenvolvimento de um item gramatical em outros itens mais gramaticais, isto é, ele passa a assumir posições mais fixas nas frases, tornando-se previsível em termos de uso (MARTELOTTA et al., 1996). Por exemplo, preposições podem se desenvolver em conjunções, determinantes demonstrativos podem se desenvolver em artigos definidos ou marcadores de orações relativas, etc. (HEINE; KUTEVA, 2002). 38 gramaticalizados “não são verdadeiros afixos”, pois, se o fossem, se comportariam “como sufixos derivacionais (como o da passiva, ocorrendo unicamente em posição pós-verbal e exclusivamente em adjacência ao verbo principal que destransitivizam”, mas não é isso que acontece (MATEUS et al., 2003, p. 845-846)22. Todavia, Duarte et al. (2001 apud MATEUS et al., 2003, p. 846) assumem que os clíticos argumentais, entre eles o SEreflexivo e SEnominativo, “na qualidade de clíticos substantivo pleno, eram inicialmente gerados na posição de argumento ou predicado que lhes correspondia, só depois cliticizando no seu hospedeiro”. Já o SEergativo e o SEinerente, “caracterizados como quase-afixos, seriam gerados diretamente como núcleo de uma projeção funcional verbal com propriedades destransitivizadoras”. Sendo que, essa mesma projeção do SEergativo e do SEinerente é considerada presente nas construções com SEpassivo, “admitindo- se que, embora inicialmente gerado em posição argumental, o se passivo cliticizaria nesta projeção verbal devido às suas propriedades destransitivizadoras”. Em suma, o comportamento dos clíticos no PE, em relação ao verbo hospedeiro, de modo geral, permite que eles sejam caracterizados “como itens lexicais que partilham um estatuto intermédio entre as palavras acentuadas e os afixos” (MATEUS et al., 2003, p. 847). Seu processo de gramaticalização tende a, de acordo com as gramaticistas: [...] ir no sentido de considerar a todos [os clíticos], independentemente do seu conteúdo semântico, como quase-afixos flexionais, exibindo, em particular, marcas de pessoa. É o que sugerem os dados de aquisição da linguagem e algumas manifestações da língua não-padrão, de registro coloquial, em que a ênclise ocorre mesmo em contextos em que a próclise é obrigatória na língua padrão. (MATEUS et al., 2003, p. 847). Para o PB, Galves e Abaurre (1996) assumem que os clíticos argumentais são sintagmas e, como tal, ocorrem nas estruturas sintáticas, enquanto os não-argumentais são núcleos que, no léxico, formam uma unidade com o verbo. Desse modo, o SEreflexivo e SEnominativo, clíticos argumentais, assim como o SEpassivo e SEergativo, quase- argumentais, ocorrem em estruturas sintáticas e o SEinerente, um clítico não-argumental, ocorre no léxico, isto é, faz parte inerente do verbo. Nas palavras das autoras: 22 Compare-se, por exemplo, Entornaram-se as bebidas./As bebidas já se entornaram e O garçom limpou as bebidas entornadas./*O garçom limpou as bebidas dasentorna., onde o sepassivo pode preceder ou seguir, imediatamente, o seu verbo hospedeiro, mas o morfema de particípio passivo deve, obrigatoriamente, ocupar a posição final da palavra, precedendo o sufixo flexional. 39 [...] estes clíticos [dos verbos pronominais] não são argumentais, e, portanto, não podem ser considerados como projeções máximas. Fazem parte do verbo, e são, portanto, de natureza nuclear e não sintagmática. No léxico, podemos atribuir-lhes a seguinte representação: [v cl [V] ]. (GALVES; ABAURRE, 1996, p. 293). Como já observado anteriormente, o SEinerente, no PE, não pode ser suprimido da construção, pois ele não é recuperável devido à falta de conteúdo argumental ou predicativo (MATEUS et al., 2003) 23. Entretanto, no PB, a sua omissão é aceitável. Para Galves (2001, p. 149), a diferença entre o PB e o PE sobre a omissão ou não do SEinerente é explicada pela tendência que o SEinerente tem de desaparecer no PB, pois: [...] tanto os verbos pronominais quanto os verbos indeterminados por se alternam com formas simples do verbo. A geração dos clíticos como morfemas que não são afetados por processos sintáticos, que são, portanto, inertes no nível sintático, parece ser um passo em direção a seu total desaparecimento. A fixação de uma análise lexical para o se dos verbos pronominais pode ter conseqüências importantes para a subsistência dos pronomes clíticos na língua, já que implicaria uma diminuição tão grande de sua presença nos enunciados que as crianças que aprendem português no Brasil acabariam por ignorá-los completamente em seu aprendizado. Aparentemente, não estamos longe dessa situação. (GALVES, 2001, p. 149). Galves (2001, p. 55) afirma que “Minas Gerais parece ser uma região do Brasil em que, em geral, o uso do se tem mais tendência a desaparecer em todas as suas aplicações”. Pereira (2006) concorda que a supressão do SEinerente é uma diferença expressiva entre o PB e o PE, e acrescenta que no PB, ao contrário do PE, também não há redobro de clítico. Ela propõe, inclusive, que a proposta tipológica dos clíticos de Mateus et al. (2003) seja adaptada para o PB. Pereira (2006, p. 19) propõe que os critérios utilizados sejam: “possibilidade de receber papel temático; possibilidade de modificar a grade argumental do verbo e possibilidade de veicular referência específica ou arbitrária”, apresentado a tipologia exibida na figura 11. A autora entende que o clítico recebe o papel temático do verbo que o hospeda quando “ele é realizado em uma cadeia que tem uma posição Ө-marcada” (PEREIRA, 2006, p. 21). O clítico altera a grade argumental do verbo quando ele absorve a “referência” de um dos argumentos. O SEnominativo, por exemplo, se relaciona a verbos que podem ter diferentes possibilidades 23 A não ser que, quando o clítico for omitido, o verbo ao qual ele está ligado seja um “verbo exterior à estrutura coordenada” (Ela estava-se sempre a queixar do filho e a zangar com a filha) (MATEUS et al., 2003, p. 844). 40 de argumento externo, desde que ele seja necessariamente interpretado como arbritário. Já o SEergativo, de forma parecida, se associa ao “argumento externo do verbo hospedeiro que, tematicamente, pode ser um causador ou um agente”, inibindo a sua presença e fazendo com que o verbo seja transformado em intransitivo (PEREIRA, 2006, p. 21- 22). Já o terceiro critério da autora diz respeito à referência definida ou indefinida que o clítico tenha. CARACTERÍSTICAS CLÍTICO Recepção de papel temático Alteração da grade argumental Tipo de referência FUNÇÃO GRAMATICAL FORMA Acusativo me, te, lhe Dativo me, te, lhe Reflexivo me, te, se TIPO 1 + - Específica Recíproco se Arbitrária Nominativo se TIPO 2 + + Específica Ergativo se Inerente me, te, se Dativo ético me TIPO 3 - - Específica Dativo de posse me, te Figura 11. Tipologia dos clíticos do PB proposta com base em Pereira (2006, p. 21). Desse modo, Pereira (2006, p. 20-36), não totalmente a favor da proposta de Galves e Abaurre (1996) para o PB, postula que o SEreflexivo, como em Me vesti rapidinho e o SErecíproco, como em Eles não se mataram por pouco, são clíticos que recebem o papel temático dos verbos que os hospedam, são não-argumentais e apresentam referência específica. O SEnominativo, como em Se fala muito em..., e o SEergativo, como em A porta se fechou sozinha, também recebem o papel temático do verbo que os hospedam, porém, são argumentais. Entretanto, o SEnominativo, como os demais, apresenta referência específica, enquanto o SEergativo é o único clítico que apresenta referência arbitrária. Por fim, o SEinerente, como em Eu me mordo/mato/morro de ciúmes do Pedro, não recebe o papel temático do verbo que o hospeda, é não- argumental e apresenta referência específica. Portanto, enquanto para Galves e Abaurre (1996) somente o SEinerente é um clítico não-argumental, para Pereira (2006), o SEreflexivo e o SErecíproco também são clíticos não-argumentais, mas se diferem do primeiro por receberem o papel temático do verbo hospedeiro. Também diferentemente de Galves e Abaurre (1996), Pereira (2006, p. 32) postula que “alguns dialetos do PB, mais especificamente no sul do Brasil, exigem a presença do clítico [SEinerente]”. 41 Outra diferença notada entre o PB e o PE relaciona-se ao uso do SEmédio. Como mencionado anteriormente, as frases médias construídas com os verbos da Classe II aceitam facultativamente a presença do SEmédio (RODRIGUES, 1998). Todavia, destaca-se, com Rodrigues (1998, p. 103), que, na variante coloquial do PB, a opção é pela omissão do SEmédio, enquanto que no PE as “estruturas intransitivas formadas por verbos como abrir, quebrar e acender exigem a presença obrigatória do pronome se”. De acordo com Vilela (1995, p. 52), o PB, nesse aspecto, se aproxima do português de Angola e de Moçambique. O autor, ao traçar as características do português nesses dois países, com base nas construções recorrentes e nos desvios observados (em relação à norma padrão do PE), conclui que os traços caracterizadores do português africano “se situam em lexemas simples, nos processos derivativos (composição, derivação, etc.) e na sintagmática (grupo de palavras e construções)”, tendendo à simplificação na omissão do clítico se na voz média, como em Os bilhetes esgotaram, Os olhos encheram de água e Aí os guerrilheiros zangaram obrigando o povo a dispersar (VILELA, 1995, p. 55), como no Brasil. Para finalizar, a figura 12 retoma os diferentes tipos de clítico se apresentados na Subseção 2.2.2.2 e, com essas novas considerações abordadas nesta Subseção, traça uma correspondência sistemática entre as tipologias propostas para o clítico se. 42 Mateus et al. (2003) Peres e Móia (1995) Pereira (2006) Galves e Abaurre (1996) Ikeda (1980 apud DIAS-DA- SILVA, 1990) Nunes (1995) Rodrigues (1998) SEANAFÓRICO argumental com referência definida (reflexivo, recíproco) SEREFLEXIVO SEANAFÓRICO (SEREFLEXIVO e SERECÍPROCO) não-argumental com referência definida, com papel temático SEREFLEXIVO argumental sintagma, sintático SEREFLEXIVO reflexivo, recíproco e sujeito de oração infinitiva SEREFLEXIVO recíproco ou não SENOMINATIVO argumental com referência arbitrária SENOMINATIVO argumental com referência arbitrária SEINDETERMINADOR argumental Sintagma SEIIS índice de indeterminação do sujeito SEINDETERMINADOR SEPASSIVO quase-argumental com estatuto argumental e funcional SEPASSIVO quase-argumental sintagma, sintático SEPASSIVO partícula apassivadora SEAPASSIVADOR SEINERENTE sem conteúdo semântico ou morfossintático SEINERENTE SEINERENTE não-argumental com referência definida, sem papel temático SEINERENTE não-argumental Léxico SEFOSS pronome fossilizado SEINERENTE fossilizado SEERGATIVO / SEANTICAUSATIVO com comportamento de afixo derivacional SEANTICAUSATIVO SEERGATIVO argumental com referência definida SEERGATIVO quase-argumental, sintagma, sintático SEINCO pronome incoativo SEERGATIVO detematizador da posição de sujeito SEEX-ERGATIVO fusão entre Agente e um argumento interno SEREAL pronome de realce SEENFÁTICO índice de espontaneidade SEQUASE-INERENTE presente em verbos que apresentam contraparte transitiva SEMÉDIO SEMÉDIO Figura 12. Correspondências entre as tipologias do clítico se. 43 2.3 Tipologia dos verbos com clítico se Esta subseção apresentará as principais propostas de classificação dos verbos com clítico se (NUNES, 1995; PERES; MÓIA, 1995) e selecionará o critério operacional de identificação dos verbos com clítico se inerente, mesmo diante da forte tendência de omissão do clítico se no PB discutidas no final da Subseção 2.2. Primeiramente, apresenta-se a proposta de Nunes (1995, p. 205), que sugere que o grupo de verbos com clítico se inerente seja dividido em três subgrupos: (i) o subgrupo dos “reflexivos”, formado por aqueles verbos que apresentam uma noção de reflexividade no radical, como suicidar-se e autodenominar-se; (ii) o subgrupo dos ergativos sem contrapartes transitivas, formado por verbos ergativos que parecem ter perdido suas contrapartes transitivas, como arrepender-se;24 (iii) ex-ergativos inerentes, formado por verbos do segundo grupo que sofreram um processo de agentivização, como demasiar-se, esbaldar-se, dignar-se, atrever-se e queixar-se (apresentados em escala decrescente de agentividade). Entretanto, considerando-se a sua proposta de classificação dos tipos de clítico se, é possível se estabelecer estes quatro subgrupos: (i) o subgrupo dos verbos que têm seu papel temático de argumento interno preenchido com o SEreflexivo, como abraçar-se; (ii) o subgrupo dos verbos transitivos com posição de sujeito detematizada, isto é, com sujeito paciente devido à realização do SEergativo, como magoar-se; (iii) o subgrupo dos verbos transitivos com posição de sujeito detematizada devido a um processo de fusão (NUNES, 1995) dos argumentos externo e interno do verbo marcada pela realização do SEex-ergativo, como ocupar-se, casar-se e prestar-se e (iv) o subgrupo dos verbos com o sentido de “agir”, que, apresentando uma contraparte transitiva com outro sentido, resistem ao preenchimento do argumento interno, sugerindo também uma fusão entre os argumentos externo e interno do verbo, marcada pela realização do SEquase-inerente, como portar-se e comportar-se. 24 Para Nunes, os verbos indignar-se, dignar-se e lastimar-se são evidências indiretas para essa hipótese de perda da contraparte transitiva, pois, enquanto indignar-se admite construções como Eu me indignei com aquilo./ Aquilo me indignou., dignar-se não: Eu me dignei a fazer aquilo./ *Fazer aquilo me dignou. Já o verbo lastimar-se ilustra que, no PB moderno, houve uma perda da acepção causativa existente no português clássico: Ele se lastimou pela derrota./ *A derrota o lastimou./ ‘Não te lastimam as lágrimas dos miseráveis?’ (Padre Vieira) (NUNES, 1995, p. 238). 44 A segunda proposta é a de Peres e Móia (1995, p. 419), na qu