UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” INSTITUTO DE BIOCIÊNCIAS - RIO CLARO Uma abordagem neuroproteômica do cérebro de operárias de Apis mellifera africanizadas submetidas ao ensaio de reflexo de extensão de probóscide ANALLY RIBEIRO DA SILVA MENEGASSO Rio Claro/SP Junho- 2017 Pós-Graduação em Biologia Celular e Molecular Tese apresentada ao Instituto de Biociências do Câmpus de Rio Claro, Universidade Estadual Paulista, como parte dos requisitos para obtenção do título de Doutor em Biologia Celular e Molecular. UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO Instituto de Biociências Campus Rio Claro Pós-Graduação em Biologia Celular e Molecular Anally Ribeiro da Silva Menegasso Uma abordagem neuroproteômica do cérebro de operárias de Apis mellifera africanizadas submetidas ao ensaio de reflexo de extensão de probóscide Orientador: Prof. Dr. Mario Sergio Palma RIO CLARO Junho/2017 Tese apresentada ao Instituto de Biociências do Câmpus de Rio Claro, Universidade Estadual Paulista “Júlio de Mesquita Filho”, como parte dos requisitos para obtenção do título de Doutor em Biologia Celular e Molecular. À minha família.... Que sempre mе dеu coragem para questionar realidades е propor um novo mundo dе possibilidades. AGRADECIMENTOS Ao meu orientador, Prof. Dr. Mario Sergio Palma, por todas as oportunidades dadas a mim ao longo destes 8 anos. Oportunidade de aprender, de crescer e de me reinventar a cada projeto. Oportunidade de partilhar comigo toda a sua força e dedicação em prol da ciência e da construção de conhecimento sólido e de qualidade. Sou grata por encontrar em você, por muitas vezes, um amigo. Sou grata por você entender que muitas vezes eu não sigo os caminhos convencionais, que tenho minhas peculiaridades, mas que acima de tudo, amo o que faço e dou o melhor de mim em qualquer situação. Obrigada pela paciência, pelos ensinamentos e por sempre saber o que dizer e fazer. Ao Prof. Dr. Gert Lubec da Universidade de Viena, pela oportunidade a mim concedida, por toda a colaboração e empenho na realização deste estudo. Obrigada também pela amizade, pelas reuniões, festas, jogos e viagens em grupo que nos propiciaram construir um ambiente de trabalho saudável e divertido. Conviver com sua pessoa, com sua a experiência de vida e conhecimento científico foi sem dúvida uma incrível e desafiadora experiência profissional e pessoal. Muito obrigada. Obrigada também as suas filhas, Sophie e Marie, que me receberam super bem e me apoiaram em um momento de transição tão difícil. Obrigada Jana, pela paciência e por me receber tantas vezes na casa de vocês. Obrigada Philip pelas risadas, brincadeiras e por ser essa criança doce e contagiante. Um obrigada especial ao Michl e à sua esposa por nos ceder uma colmeia de abelhas, pela confiança e os ensinamentos em apicultura. Obrigada ao Dr. Martin Streinzer por me ensinar a dissecar cérebros de abelhas e por nos fornecer todo o equipamento necessário para isto, você foi demais. A todos do Laboratório de Proteômica Gert Lubec da Universidade de Viena, por terem me recebido tão bem, por toda a troca de experiência profissional e pessoal. Obrigada por todas as longas horas, noites e finais de semana no laboratório. Nós sabemos o quão difícil é se manter de pé, respirar e respirar novamente. Obrigada pelas inúmeras vezes em que contamos até dez (seja no idioma que fosse) e apoiamos uns aos outros. Pelas trocas culturais, de alimentação, idioma e enfim, cultural. Eu nunca aprendi tanto na minha vida! Vocês foram demais. Obrigada Fernando, Roman, Tanja, Bosko, Dragana, Sascha, Ahmed, Tamara, Martina, Michaela, Jana, Andras, Pedrag, Vladimir, Jovana, Barnhi, Daniel, Babak, Marija, Edit, Judith, Mikite, Yasemin e Nilima. Obrigada a todos vocês, por tudo de bom e de ruim (risos) que passamos juntos. Obrigada em especial à Tamara, Jovana e Bosko, a amizade de vocês ficará para sempre guardadinha em um lugar especial em meu coração. Aos amigos que fiz em Viena, Martin, Max, Yannick, Claus, Annalisa e Ulrich, vocês foram de fundamental importância na minha rotina, me mostraram que o Mundo é grande por demais! E que sou sortuda por ter amigos mundo a fora. Tenho certeza que nos veremos novamente! Obrigada por me darem tantos momentos bons! We may meet again! À Fiocruz do Paraná, especialmente Prof. Dr. Paulo Costa Carvalho e a Dra. Juliana de Saldanha da Gama Fischer, pela colaboração e dedicação dispensadas na parte de análise do proteoma solúvel. Aprendi muito com vocês. Ao LECA (Laboratório de Ecotoxicologia e Conservação de Abelhas), especialmente ao Prof. Dr. Osmar Malapsina e à Dra. Thaisa Roat, por tudo que me ensinaram, pela colaboração e apoio ao nosso estudo. Agradeço também ao Sergio por todas as coletadas e ajuda com as abelhas. Ao Prof. Dr. Brian Smith e à Dra. Cristina Burden (Universidade do Arizona – EUA) que me ensinaram como realizar os ensaios de REP-condicionado. A dedicação de vocês ao estudo de abelhas é, certamente, inspiradora. À Profa. Dra. Zilá L. P. Simões (USP-Ribeirão Preto) que com sua graciosidade e gentileza, por inúmeras vezes, aconselhou-me e me ajudou ao longo do desenvolvimento desta tese. Meu carinho e respeito pela Senhora são enormes. A ciência precisa de mais pessoas como a senhora, sempre disposta a ajudar! Ao Laboratório de Biologia Estrutural e Zooquímica, Fran, Beto, Caroline, Marcel, Kenny, Bibiana, Nathália, Helen e Ana Maria. Muito obrigada Marcel, pelo companheirismo, pela ajuda com as abelhas, com as leituras e com os experimentos de forma geral, mas principalmente, obrigada pelo apoio constante e por sempre acreditar no meu potencial. Obrigada Fran por toda sua amizade, paciência e apoio. À minha mãe Lilian, por ser o meu exemplo de caráter, força e fé... por tudo o que já passamos e superamos, sem nunca desistir, sem jamais nos afastarmos. Obrigada mãe, por me apoiar e me compreender, por respeitar minhas escolhas e me amar incondicionalmente. Não importa o momento, a dificuldade ou a distância, você sempre esteve lá... me deu a mão, me apoiou e me ajudou a levantar; a construir momentos que serão para sempre meu porto seguro. Ao meu irmão Arthur, meu anjinho em forma de criança. Você foi uma benção em nossas vidas, sua doçura, seu carinho e sua graça me mantiveram de pé, firme e forte. Ao meu pai adotado, Sandro, obrigada por todo o seu apoio e amizade... por cuidar dos meus tesouros enquanto estive ausente e por ao longo destes anos todos, se tornar um tesouro para mim. Por todas as piadas, conversas e apoio, muito obrigada. À minha família (Lilian, Sandro, Arthur, Dirce, Raimundo, Ligia, Marcos, Júnior, Pabola, Laércio, Letícia, Isabela, Laís, Ivair, Luciana, Leonardo e Carmen) por me educar, me amar e me apoiar. Vocês são meu bem mais precioso, meu orgulho. Não importa aonde eu vá ou quanto tempo eu demore para voltar, vocês sempre estarão comigo. Meu muito obrigada a vocês! Aos meus amigos, próximos e distantes... pela amizade, por acreditarem no meu potencial, torcerem por mim e vibrarem comigo em cada vitória; mas, também por tornarem os momentos difíceis mais amenos com a atenção e o amor que sempre me deram. Obrigada Mayara, Sidney, Lucilene, Claúdia, Gustavo, Franciele, Jovana, Tamara, Bosko, Meire, Rosely, Felipe, Martin e Uli. A todos os professores, pelo conhecimento e atenção... aos técnicos e funcionários pela simpatia, atenção, e dedicação e à Unesp pela oportunidade. Às abelhas por serem tão fofas e inteligentes e contribuírem para a realização deste estudo, em prol do desenvolvimento neurocientífico. Ao Programa BIOprospecTA/FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) (Proc. 2015/13542-6 e Proc. 2016-26025-5) pelo suporte financeiro para a realização deste trabalho. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001. A todos que de alguma forma contribuíram para o meu crescimento pessoal e intelectual, que confiaram em mim e torceram por mim... muito obrigada! Obrigada Thank you Danke Ďakujem Hvala Salamat Köszönöm Grazie Хвала Děkuji धन्यवाद شكرا A gratidão é a memória do coração... ...é a porta aberta para um mundo melhor! “Tenho a impressão de ter sido uma criança brincando à beira-mar, divertindo-me em descobrir uma pedrinha mais lisa ou uma concha mais bonita que as outras, enquanto o imenso oceano da verdade continua misterioso diante de meus olhos. ” (Isaac Newton) “Só se pode alcançar um grande êxito quando nos mantemos fiéis a nós mesmos. ” (Friedrich Nietzsche) “Aprender é a única coisa de que a mente nunca se cansa, nunca tem medo e nunca se arrepende. ” (Albert Schweitzer) “A ciência nunca resolve um problema sem criar pelo menos outros dez. ” (George Bernard Shaw) RESUMO Atualmente, as abelhas têm sido utilizadas como modelos de aprendizagem e memória, destacando a sua utilidade para a neurociência, em particular para o melhor entendimento das bases da cognição. Para isso, o reflexo de extensão de probóscide (REP) é um estímulo incondicionado (US) amplamente utilizado para acessar a habilidade das abelhas para correlacioná-la com um estímulo condicionado (CS) durante a aprendizagem e aquisição de memória. No presente estudo REP foi utilizado para estudos proteômicos do cérebro de abelhas por meio de diversas estratégias inovadoras. Proteômica shotgun foi aplicada ao estudo de proteínas solúvel em sistema µLC-ESI-micrOToF-QIII e quantificação label-free em sistema nano-LC-LTQ-Orbitrap XL ETD, sendo o primeiro estudo de análise proteômica que chama atenção para o fato de que o comportamento reflexo (não-condicionado - US) por si só ativa diversas cascatas metabólicas, incluindo processos biológicos relacionados à memória. A análise comparativa dos perfis proteômicos para os cérebros de operárias do grupo controle e do grupo REP demonstraram uma ativação do metabolismo de compostos cíclicos/heterocíclicos/aromáticos em paralelo com o metabolismo de compostos nitrogenados. Este processo seguiu-se pela regulação negativa de proteínas envolvidas no metabolismo de metabólitos fosforilados e a regulação positiva das proteínas relacionadas com o metabolismo dos carboidratos. Isto provavelmente ocorreu para fornecer energia metabólica para os processos celulares necessários para adaptar o cérebro ao REP. Além disso, foi realizada a análise do transcriptoma de cérebro de abelhas forrageiras (naive), a qual foi utilizada na criação de um banco de dados que reuniu as sequências depositadas no Uniprot, NCBI e sequências obtidas pela análise de transcriptoma. O estudo do proteoma de membrana em cérebro de abelhas submetidas a REP e REP-condicionado, com quantificação TMT em sistema LTQ- Orbitrap XL ETD permitiu a identificação de um total de 6.882 proteínas, dentre as quais 1.582 são proteínas de membrana e 658 apresentaram diferença de expressão entre os grupos controle, REP e REP-condicionado. Diversos importantes processos do sistema nervoso foram detectados, tais como proteínas envolvidas na transdução olfativa, proteínas de sinapse GABAérgica, colinérgica, dopaminérgica, serotonérgica, glutamatérgica, dentre outros importantes receptores neuronais. Fica claro que se trata de um processo multicomplexo que exige a expressão/síntese de proteínas e a transdução de diferentes sinais. Sugere-se que as rotas mais correlacionadas com o processo de memória associativa (REP-condicionado vs REP) em comparação à REP vs controle sejam a transdução olfativa, sinapse dopaminérgica, sinapse glutamatérgica e sinapse GABAérgica. No caso de recuperação de memória previamente adquirida, a sinapse colinérgica (acetilcolina) parece ser de fundamental importância para o grupo REP. Estudos de validação estão sendo empregados para a melhor compreensão destes processos. Por fim, a análise proteômica in situ de neuropeptídeos por MALDI Imaging. Para os neuropeptídeos apidaecina, NPLP-1, SIFamide os resultados obtidos sugerem à baixa detecção de peptídeos nos indivíduos de REP com a rápida liberação e utilização dessas biomoléculas na modulação dos processos biológicos estudados, corroborando com a hipótese de que a memória e aprendizagem olfativa estão mais intimamente relacionadas com os cálices. Já para os neuropeptídeos Alatostatinas e Taquicininas, a intensa marcação desses neuropeptídeos no grupo REP, sugere a síntese de neuropeptídeos através da degradação enzimática de novos precursores protéicos presentes nessas regiões do cérebro. A partir das diferentes estratégias metodológicas aplicadas espera-se ter contribuído para a compreensão da neurociência em nível de proteínas e peptídeos, e seu papel na formação de memória em abelhas. Palavras-chave: Proteômica, espectrometria de massas, abelhas, memória e aprendizagem ABSTRACT Nowadays, bees have been used as models in studies of learning and memory, highlighting their utility for neuroscience, in particular for a better understanding of the bases of cognition. For this, proboscis extension reflex (PER) is an unconditioned stimulus (US) widely used to access bees' ability to correlate it with a conditioned stimulus (CS) during learning and memory acquisition. In the present study, PER was used for proteomic studies of bees brain through several innovative strategies. Proteomic shotgun was applied to the study of soluble proteins in μLC-ESI-micrOToF-QIII system and label-free quantification in nanao-LC-LTQ-Orbitrap XL ETD system, being the first proteomic analysis study that draws attention to the fact that reflex behavior (US) alone activates various metabolic cascades, including biological processes related to memory. The comparative analysis of the proteomic profiles for the workers' brains from control group and REP group demonstrated metabolism of cyclic / heterocyclic / aromatic compounds in parallel with the metabolism of nitrogen compounds. This process was followed by the negative regulation of proteins involved in metabolism of phosphorylated metabolites and the positive regulation of proteins related to the metabolism of carbohydrates. This has probably occurred to provide metabolic energy for the cellular processes needed to adapt the brain to PER. In addition, the transcriptome analysis of foraging bees brain was performed, which was used in the creation of a database that gathered the deposited sequences in the Uniprot, NCBI and sequences obtained by the transcriptome analysis. The study of membrane proteome in the brain of PER and PER-conditioned bees with TMT quantification in the LTQ- Orbitrap XL ETD system allowed the identification of 6,882 proteins, of which 1,582 were membrane proteins and among them 658 presented differential expression between control, REP and REP-conditioned groups. Several important processes of the nervous system have been detected, such as proteins involved in olfactory transduction, synapses GABAergic, cholinergic, dopaminergic, serotonergic e glutamatergic, among other important neuronal receptors. It is clear that this is a multicomplex process that requires the expression / synthesis of proteins and different transduction signals. It is suggested that the routes most correlated with the associative memory process (PER-conditioned vs PER) compared to PER vs control are olfactory transduction, dopaminergic synapse, glutamatergic synapse and GABAergic synapse. In the case of previously acquired memory recovery, the cholinergic synapse (acetylcholine) seems to be of fundamental importance for the PER group. Validation studies are being used to better understand these processes. Finally, it was applied the in situ proteomic analysis of neuropeptides by MALDI Imaging. For the neuropeptides apidaecin, NPLP-1, SIFamide the results obtained suggest the low detection of peptides in REP individuals with the rapid release and use of these biomolecules in the modulation of biological processes studied, corroborating with the hypothesis that, probably, memory and olfactory learning are more closely related to the chalices. For the neuropeptides Alatostatin and Tachykinins, the intense labeling of these neuropeptides in PER group suggests the synthesis of neuropeptides through the enzymatic degradation of new protein precursors present in these regions of the brain. From different methodological strategies applied it is expected to have contributed to the understanding of neuroscience at the level of proteins and peptides, and their role in memory formation in bees. Key words: Proteomics, mass spectrometry, bees, memory and learning LISTA DE ILUSTRAÇÕES Figura 1. Mosaico fluído da membrana celular........................................................... 34 Figura 2. Esquema representativo de preparo de amostra utilizando-se FASP............ 38 Figura 3. Esquema representativo de cromatografia de fase reversa........................... 39 Figura 4.Esquema representativo de peptídeo com estado de carga ionizado e neutro............................................................................................................................ 40 Figura 5. Relação existente entre o número de proteínas presentes na amostra, número de proteínas identificadas e o número de proteínas quantificadas................... 41 Figura 6. Estrutura química genérica do reagente TMT.............................................. 43 Figura 7. Variabilidades do reagente TMT. (A) TMT0; (B) TMT2; (C) TMT6 e (D) TMT10........................................................................................................................... 44 Figura 8. Esquema representativo de um exemplo fluxo de trabalho empregado quando se utiliza o reagente TMT................................................................................. 45 Figura 9. Forrageira de A. mellifera submetida ao teste de REP, aprisionada, mantendo-se a cabeça e as peças bucais livres. (A) oferecimento de água – sem extensão da probóscide. (B) oferecimento de solução de sacarose (80% (m/v)) – com extensão da probóscide........ ........................................................................................ 57 Figura 10. Diagrama de Venn para as proteínas identificadas nos cérebros de abelhas do grupo controle (C), e do grupo REP (E), com o uso do sistema QToF...................... 66 Figura 11. Processo Biológico – Proteínas comuns aos grupos controle e REP......... 67 Figura 12. Processo Biológico – Proteínas identificadas somente no grupo controle. 74 Figura 13. Processo Biológico – Proteínas identificadas somente no grupo REP....... 84 Figura 14. Representação em formato de teia da distribuição funcional das proteínas identificadas em ambos os grupos (verde). O número entre parênteses corresponde ao número de proteínas identificadas em cada grupo funcional..................................... 87 Figura 15. Representação em formato de teia da distribuição funcional das proteínas identificadas no grupo controle (azul) e no grupo REP (vermelho). O número entre parenteses corresponde ao número de proteínas identificadas em cada grupo funcional....................................................................................................................... 88 Figura 16. Rede de interação de proteínas identificadas somente no grupo controle. Rac1; RPL8 – Ribosomal protein L8; Cdc42; asf1 - anti-silencing factor 1; Rpl40 - Ribosomal protein L40; Sir2; foxo - forkhead box%2C sub-group O; Akt1; ird5 - immune response deficient 5; WASp; RpS3A - Ribosomal protein S3A; FOR – foraging; Pak; tlk - Tousled-like kinase; CaMKII - alcium/calmodulin-dependent protein kinase II.......... ................................................................................................. 89 Figura 17. Rede de interações de proteínas identificadas soemente no grupo REP. Sgg – shaggy; Rala - Ras-related protein; Smg1; Egfr - Epidermal growth factor receptor; rho – rhomboid; Argos; Shc - SHC-adaptor protein; Cbl; sec5; Pgk - Phosphoglycerate kinase; Eno – Enolase; spi – spitz; Ras85D - Ras oncogene at 85D; Pyk - Pyruvate kinase; Axn – Axin; dco - discs overgrown; Ephrin; arm – armadillo; Pld - Phospholipase D................................................................................................... 90 Figura 18. Rede de interação de algumas proteínas identificadas somente no grupo REP e classificadas de acordo com a base GO. A: desenvolvimento do sistema nervoso central; B: desenvolvimento de olhos e antena e C: desenvolvimento de estruturas anatômicas.................................................................................................... 91 Figura 19. Rede de interação de algumas proteínas identificadas somente no grupo REP e classificadas de acordo com a base GO. A: diferenciação de neurônios/neurogênese; B: morfogênese de estruturas anatômicas............................. 91 Figura 20. Rede de interação de algumas proteínas identificadas somente no grupo REP e classificadas de acordo com a base GO. A: aprendizagem e memória; aprendizado olfativo e cognição; B: transmissão sináptica........................................... 92 Figura 21. Diagrama de Venn para as proteínas identificadas nos grupos controle e experimental, identificadas com o uso do sistema LTQ-Orbitrap XL ETD.............................................................................................................................. 94 Figura 22. Categorização de todas as proteínas identificadas no cérebro da abelha (considerando os grupos controle e REP) em processo biológico de nível 4 de acordo com a análise pelo Blast2GO......................................................................................... 95 Figura 23. Categorização de acordo com o processo biológico em nível 4 usando o algoritmo Blast2GO para as proteínas únicas de cada grupo: (A) proteínas identificadas apenas no controle grupo; (B) proteínas identificadas apenas no grupo REP............................................................................................................................... 103 Figura 24. Rede de interação proteína-proteína construída usando STRING v10.0 para (A) proteínas identificadas apenas no grupo controle; (B) Morte celular, (C) Desenvolvimento do sistema nervoso, neurogênese e diferenciação neuronal e (D) Proteólise envolvida no processo de catabolismo de proteína. Proteínas com associação mais forte são ligadas por linhas mais espessas.......................................... 105 Figura 25. Rede de interação proteína-proteína construída usando STRING v10.0 para (A) proteínas identificadas apenas no grupo REP; (B) Processo biossintético, (C) Processo metabólico derivado de carboidrato, (D) Desenvolvimento do sistema nervoso, neurogênese e diferenciação neuronal, (E) Processo metabólico primário e (F). Resposta ao estímulo. Proteínas com associação mais forte são ligadas por linhas mais espessas. ............................................................................................................... 106 Figura 26. Quantificação label-free baseada nas contagens espectrais para as proteínas identificadas nos grupos controle e REP, usando o teste-T. As proteínas são plotadas como pontos de acordo com o Log2 do valor de p (eixo x) e Log2 do valor de TFold (eixo y). Os pontos vermelhos são proteínas que não atingiram valores satisfatórios tanto para valores “p”, como para valores de TFold (FDR com α = 0,05); os pontos verdes são aqueles que satisfazem o valores de TFold, mas não os valores de p; os pontos alaranjados são aqueles que satisfazem valores de p, mas não de TFold. Os pontos azul representam as proteínas que satisfazem todos os filtros estatísticos. ................................................................................................................... 109 Figura 27. Categorização de acordo com o processo biológico em nível 4 usando o algoritmo Blast2GO para as proteínas diferencialmente expressas: (A) proteínas down-regulated no grupo REP; (B) proteínas up-regulated no grupo REP................. 115 Figura 28. Rede de interação proteína-proteína construída usando STRING v10.0 para (A) proteínas down-regulated no grupo REP; (B) Sistema de desenvolvimento, estruturas anatômicas desenvolvimento e diferenciação celular, (C) Processo biossintético e (D) Regulação biológica. Proteínas com associação mais forte são ligadas por linhas mais espessas................................................................................... 117 Figura 29. Rede de interação proteína-proteína construída usando STRING v10.0 para (A) proteínas down-regulated no grupo REP; (B) Sistema de desenvolvimento, estruturas anatômicas desenvolvimento e diferenciação celular, (C) Processo biossintético e (D) Regulação biológica. Proteínas com associação mais forte são ligadas por linhas mais espessas................................................................................... 118 Figura 30. Fluxo de trabalho para preparo da biblioteca de RNA............................... 125 Figura 31. Visão geral global do projeto sobre a análise transcriptômica que abrange o estabelecimento de uma montagem de novo e inclusão de dados de transcriptoma publicados abelha obtidos de repositórios públicos (estirpe DH4: NC_001566.1, Uniprot). ....................................................................................................................... 126 Figura 32. Proporção de RNA-seq mapeado nas sequências de referência de DH4... 127 Figura 33. Quantidade de proteínas onde o cluster contém um modelo de gene a partir da anotação de referência ("Match") e aqueles sem correspondência com a anotação de referência ("No match")............................................................................ 127 Figure 34. Comparação de novo assembled contigs com as proteínas de referência... 128 Figure 35. Expressão de proteínas quinase, proteínas de membrana e receptores comparados com a expressão geral............................................................................... 129 Figura 36. Teste de reflexo de extensão de probóscide condicionado (REP- condicionado) aplicado a indivíduos forrageiros para compor o grupo REP- condicionado para estudos de aprendizagem e memória.............................................. 133 Figura 37. Exemplo de resultado obtido através do procedimento de ultracentrifugação com gradiente de sucrose aplicado para enriquecimento de proteínas de membrana................................................................................................. 134 Figura 38. Número de proteínas identificadas em cada análise. A. Cabeça inteira submetida à fração total de membrana e ao enriquecimento de membrana, seguida pela estratégia shotgun; B. Cérebro dissecado submetido à fração total de membrana, fracionamento off-line e LC-MS/MS e C. Cérebro dissecado submetido à fração total de membrana, quantificação por TMT, fracionamento off-line e LC- MS/MS.......................................................................................................................... 142 Figura 39. Proteínas de membrana identificadas em: A. cabeça inteira (815); B. Cérebro dissecado (1547); C. TMT (658) e D. Total (1582)....................................... 143 Figura 40. Anotação de GO para a análise quantitativa. A. Processo Biológico e B. Função Molecular......................................................................................................... 144 Figura 41. Anotação de GO para o processo de neurobiologia..................................... 145 Figura 42. Agrupamento de anotação funcional para os três primeiros clusters que foram considerados up-regulated no grupo REP-condicionado quando comparado ao grupo REP..................................................................................................................... 146 Figura 43. Agrupamento de anotações funcionais para o Cluster 73 que foram consideradas up-regulated no grupo REP-condicionado quando comparado ao grupo de REP. Várias importantes anotações neurobiológicas são representadas no cluster... 147 Figura 44. Uma visão 2D das evidências dos treze termos / categoria dos membros presentes no Cluster 73. Verde - associação correspondente do gene-termo relatada positivamente; Preto - associação correspondente do gene-termo não relatada ainda... 147 Figura 45. Agrupamento de anotação funcional para os três primeiros clusters que foram considerados down-regulated no grupo REP-condicionado quando comparado ao grupo REP................................................................................................................ 148 Figura 46. Agrupamento de anotação funcional para os três primeiros clusters que foram considerados up-regulated no grupo REP-condicionado quando comparado ao grupo REP..................................................................................................................... 149 Figura 47. Agrupamento de anotações funcionais para o Cluster 74 que foram consideradas up-regulated no grupo REP quando comparado ao grupo controle. Várias importantes anotações neurobiológicas são representadas no cluster............... 150 Figura 48. Uma visão 2D das evidências dos dezenove termos / categoria dos membros presentes no Cluster 74. Verde - associação correspondente do gene-termo relatada positivamente; Preto - associação correspondente do gene-termo não relatada ainda................................................................................................................ 151 Figura 49. Agrupamento de anotação funcional para os três primeiros clusters que foram considerados down-regulated no grupo REP quando comparado ao grupo controle......................................................................................................................... 152 Figura 50. Agrupamento de anotação funcional para o Cluster 69 para as proteínas que foram consideradas down-regulated no grupo REP quando comparado ao grupo controle......................................................................................................................... 152 Figura 51. Uma visão 2D das evidências dos sete termos / categoria dos membros presentes no Cluster 69. Verde - associação correspondente do gene-termo relatada positivamente; Preto - associação correspondente do gene-termo não relatada ainda... 153 Figura 52. Análise pelo software Blast2GO do banco de dados utilizado nas análises do proteoma de membrana. .......................................................................................... 154 Figura 53. Os 20 termos de GO mais representativos (em termos de porcentagem de sequência). Azul – banco de dados de proteínas; Vermelho – proteínas down- regulated no grupo REP quando comparado ao grupo controle................................... 155 Figura 54. Análise de enriquecimento (funções moleculares) de proteínas down- regulated no grupo REP quando comparado ao grupo controle. Vermelho - termos de GO over-representated; Verde – termos de GO under-representated. A intensidade da cor está relacionada com o valor de FDR.............................................. 156 Figura 55. Os 20 termos de GO mais representativos (em termos de porcentagem de sequência) para as proteínas up-regulated. Azul – banco de dados de proteínas; Vermelho – proteínas up-regulated no grupo REP quando comparado ao grupo controle......................................................................................................................... 157 Figura 56. Análise de enriquecimento (funções moleculares) de proteínas up- regulated no grupo REP quando comparado ao grupo controle. Vermelho - termos de GO over-representated; Verde – termos de GO under-representated. A intensidade da cor está relacionada com o valor de FDR............................................. 158 Figura 57. Os 20 termos de GO mais representativos (em termos de porcentagem de sequência) para as proteínas down-regulated. Azul – banco de dados de proteínas; Vermelho – proteínas down-regulated no grupo REP-condicionado quando comparado ao grupo REP.............................................................................................. 159 Figura 58. Análise de enriquecimento (funções moleculares) de proteínas down- regulated no grupo REP-condicionado quando comparado ao grupo REP. Vermelho - termos de GO over-representated; Verde – termos de GO under-representated. A intensidade da cor está relacionada com o valor de FDR............................................. 160 Figura 59. Os 20 termos de GO mais representativos (em termos de porcentagem de sequência) para as proteínas down-regulated. Azul – banco de dados de proteínas; Vermelho – proteínas up-regulated no grupo REP-condicionado quando comparado ao grupo REP................................................................................................................ 161 Figura 60. Análise de enriquecimento (funções moleculares) de proteínas up- regulated no grupo REP-condicionado quando comparado ao grupo REP. Vermelho - termos de GO over-representated; Verde – termos de GO under-representated. A intensidade da cor está relacionada com o valor de FDR.............................................. 162 Figura 61. Lista dos códigos de acessos (12) para GABAB encontrados na literatura e que representam apenas um número KO em KEGG................................................. 164 Figura 62. Transdução olfativa para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 167 Figura 63. Transdução olfativa para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP e em Verde – proteínas up- regulated e sem coloração – proteínas não identificadas neste estudo......................... 168 Figura 64. Transdução gustativa para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 174 Figura 65. Transdução gustativa para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 175 Figura 66. Vesícula sináptica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 179 Figura 67. Vesícula sináptica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo..................................................................... 180 Figura 68. Sinapse serotonérgica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 184 Figura 69. Sinapse serotonérgica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas 185 down-regulated; em Verde – proteínas up-regulated; e sem coloração – proteínas não identificadas neste estudo.............................................................................................. Figura 70. Sinapse dopaminérgica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 190 Figura 71. Sinapse dopaminérgica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.................................................................... 191 Figura 72. Sinapse glutamatérgica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 195 Figura 73. Sinapse glutamatérgica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated e sem coloração – proteínas não identificadas neste estudo. ............................................................................................ 196 Figura 74. Sinapse GABAérgica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 200 Figura 75. Sinapse GABAérgica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo..................................................................... 201 Figura 76. Sinapse colinérgica para as proteínas diferencialmente expressas comparando-se o grupo REP ao grupo controle. Vermelho – proteínas down- regulated; em Verde – proteínas up-regulated; Amarelo – proteínas identificadas, mas não classificadas quanto ao padrão de expressão e sem coloração – proteínas não identificadas neste estudo. ............................................................................................ 206 Figura 77. Sinapse colinérgica para as proteínas diferencialmente expressas comparando-se o grupo REP-condicionado ao grupo REP. Vermelho – proteínas down-regulated; em Verde – proteínas up-regulated e sem coloração – proteínas não identificadas neste estudo.............................................................................................. 207 Figura 78. Estratégia geral adotada para imageamento químico dos neuropeptídeos em cérebro de A. mellifera............................................................................................ 216 Figura 79. Máscara adotada para os estudos de MSI. As estruturas foram nomeadas de acordo com Rybak e colaboradores (2010)............................................................... 217 Figura 80. Imagens moleculares de moleculares de alguns neuropeptídeos, comparando os cérebros de abelhas do grupo controle (coluna da esquerda) e experimental (coluna da direita). A e B – apidaecina (GNNRPVYIPQPRPPHP- NH2); C e D – NPLP-1 (NVGSVAREHGLPY-NH2); E e F – SIFamida (RKPPFNGSIF-NH2) ................................................................................................... 221 Figura 81. Imagens moleculares de moleculares de alguns neuropeptídeos pertencentes às classes das taquicininas e alatostatinas, comparando os cérebros de abelhas do grupo controle (coluna da esquerda) e experimental (coluna da direita). A e B – alatostatina AmAST-1 (LPVYNFGI-NH2); C e D – alatostatina AmAST-3 (RQYSFGL- NH2); E e F – taquicinina AmTRP-5 (ARMGFHGMR-NH2); G e H – taquicinina AmTRP-2 (ALMGFQGVR-NH2) ............................................................. 226 LISTA DE TABELAS Tabela 1. Proteínas identificadas em ambos os grupos (controle e REP)............ Tabela 2. Proteínas identificadas somente no grupo controle.............................. 69 Tabela 3. Proteínas identificadas somente no grupo REP.................................... 76 Tabela 4. Proteínas identificadas em ambos o grupos, controle e REP................ Tabela 5. Proteínas identificadas somente no grupo controle.............................. 97 Tabela 6. Proteínas identificadas somente no grupo REP.................................... 99 Tabela 7. Proteínas down-regulated no grupo REP, quando comparadas ao grupo controle........................................................................................................ 110 Tabela 8. Proteínas up-regulated no grupo REP, quando comparadas ao grupo controle.................................................................................................................. 112 Tabela 9. Visão geral dos genes que pertencem às proteínas da membrana, receptores ou proteínas quinase............................................................................. 129 Tabela 10. Seqüências UniProt mais expressas no conjunto de dados...................................................................................................................... 130 Tabela 11. Comparação entre as diferentes análises aplicadas ao estudo do cérebro das abelhas: número de proteínas identificadas; número de proteínas de membrana identificadas; número de proteínas com atividade de receptor; número de proteínas com função de neurobiologia (sinapse, transporte de neurotransmissores e neurogênese). A contagem foi feita com base nos termos GO......................................................................................................................... 141 LISTA DE ABREVIATURAS °C – grau Celsius µg – micrograma µL – microlitro Ach - acetilcolina ACN – acetonitrila BN-PAGE – eletroforese nativa CE – eletroforese capilar CID – dissociação induzida por colisão cm – centímetro CS – estímulo condicionado DA – dopamina Da- Daltón DDM - n-Dodecil-β-D-Maltoside DTT - ditiotreitol ESI – ionização por electrospray ETD – dissociação por transferência de elétrons FA – ácido fórmico FASP - Filter assisted sample preparation FDR – false rate discovery g – força de aceleração gravítica GABA ácido gama-aminobutírico Glu - glutamato GR – receptores odoríferos H – hora HCD – dissociação por colisão de alta energia HPLC – cromatografia líquida de alta pressão IAA – iodoacetoamida IEF – focalização isoelétrica IR – receptores ionotrópicos kDa – quilo Daltons kHz – quilo hertz kPa – quilo pascal kV – quilo volts LA – lóbulo antenal LC – cromatografia líquida M – molar m/v concentração massa por volume m/z - relação massa por carga MALDI – ionização por dissociação à laser assistia por matriz MB – corpos pedunculados MeOH – metanol mM – milimolar ms – milisegundos MS/MS – espectrometria de massas em tandem MSI – Mass spectrometry imaging MudPIT – tecnologia multidimensional de identificação de proteínas NaCl – cloreto de sódio Ng – nanograma nL – nanolitro NMDA – N-metil-aspartato ORN – neurônios receptores olfativos pH – potencial de hidrogênio pI – ponto isoelétrico QToF – quadrupolo / tempo de voo rcf – força centrífuga relativa REP – reflexo de extensão de probóscide RPLC - cromatografia líquida em fase reversa SCX – troca catiônica SDS – lauril sulfato de sódio SNC – sistema nervoso central TEAB – brometo de tetraetilo de amônio TFA – ácido trifluoracético TMT – marcadores de massa em tandem UA – uréia UPLC – cromatografia líquida de ultra pressão US – estímulo não-condicionado UV – ultravioleta V – volts v - volume v/v – volume por volume vs – versus SUMÁRIO 1. INTRODUÇÃO........................................................................................................ 28 1.1 Aprendizado e Memória em abelhas..................................................................... 28 1.1 Neuroproteômica................................................................................................... 30 1.2.1 Proteínas de membrana....................................................................................... 33 1.2.1.1 Preparo de amostra........................................................................................... 34 1.2.1.2 Enriquecimento de proteínas de membrana..................................................... 35 1.2.1.3 Espectrometria de massas vs proteínas de membrana...................................... 36 1.2.1.4 Filter assisted sample preparation (FASP)………………………………….. 37 1.2.1.5 SPE e stage tip.................................................................................................. 38 1.2.1.6 HPLC e pré-fracionamento............................................................................... 38 1.3 Proteômica quantitativa......................................................................................... 41 1.3.1 Quantificação Label............................................................................................. 42 1.3.2 Quantificação Label-free..................................................................................... 45 1.4 Transcriptômica...................................................................................................... 49 1.5 Neuropeptidômica………………………………………………………………. 51 1.6 Imageamento molecular por MALDI..................................................................... 52 2. OBJETIVOS............................................................................................................. 54 PARTE I: Proteoma Citosólico.................................................................................... 55 3. MATERIAIS E MÉTODOS.................................................................................... 56 3.1 Material Biológico.................................................................................................. 56 3.2 Reflexo de Extensão da Probóscide (REP)............................................................. 56 3.3 Obtenção do cérebro e preparação do extrato de proteínas solúveis...................... 57 3.4 Preparação do extrato de proteínas associadas aos debris para análise shotgun em equipamento do tipo QToF..................................................................................... 58 3.5 Análise de proteínas citosólicas e dos debris por abordagem shotgun em instrumento do tipo QToF............................................................................................ 58 3.6 Análise de proteínas citosólicas e daquelas presentes nos debris por abordagem shotgun em instrumento do tipo Orbitrap..................................................................... 59 3.7 Identificação de proteínas ...................................................................................... 60 3.8 Quantificação de proteínas label-free..................................................................... 61 3.9 Análise funcional.................................................................................................... 61 3.9 Análise de rede de interações proteína-proteína..................................................... 61 4. RESULTADOS E DISCUSSÃO.............................................................................. 62 4.1 Resultados obtidos por estratégia shotgun e análise de espectrometria de massas com instrumento micrOToF-QIII................................................................................. 62 4.1.1 Proteínas identificadas tanto no grupo controle quanto no grupo REP.............. 67 4.1.2 Proteínas identificadas: exclusivamente no grupo controle................................ 68 4.1.3 Proteínas identificadas: exclusivamente no grupo REP...................................... 75 4.1.4 Análise de rede de interação de proteínas (exclusivas ao grupo controle, ou exclusivas ao grupo REP)............................................................................................. 88 4.2 Resultados obtidos por estratégia shotgun em espectrômetro de massas LTQ- Orbitrap XL ETD......................................................................................................... 93 4.2.1 Proteínas identificadas tanto no grupo controle quanto no grupo REP.............. 94 4.2.2 Proteínas identificadas exclusivamente no grupo controle e exclusivamente no grupo REP com o uso do sistema LTQ-Orbitrap XL ETD.......................................... 96 4.2.3 Proteínas comuns a ambos os grupos, mas que são diferencialmente expressas 109 5. Conclusões gerais.................................................................................................... 119 PARTE II: Transcriptoma............................................................................................ 121 6. MATERIAIS E MÉTODOS.................................................................................... 122 6.1 Isolamento de mRNA, fragmentação e priming .................................................... 122 6.2 Cadeia primária e segunda síntese de cDNA.......................................................... 123 6.3 Purificação de cDNA de cadeia dupla.................................................................... 123 6.4 End repair/dA-tail da biblioteca de cDNA ............................................................ 123 6.5 USER excisão, enriquecimento e purificaçao da biblioteca PCR.......................... 124 6.6 Seleção de Adaptor-ligated DNA e sequenciamento............................................. 124 7. RESULTADOS E DISCUSSÃO............................................................................. 126 7.1. Reference-guided and de novo assembly approach.............................................. 126 7.2 Anotação funcional................................................................................................ 128 7.3 Sequências com maior grau de expressão ............................................................. 130 PARTE III: Proteoma de membrana............................................................................ 131 8. MATERIAL e MÉTODOS...................................................................................... 132 8.1 Ensaio de REP e REP-condicionado ..................................................................... 132 8.2 Preparo de amostra ................................................................................................ 133 8.2.1 Fração total da membrana.................................................................................... 133 8.2.2 Enriquecimento de proteínas de membrana......................................................... 134 8.3 Digestão sequencial de tripsina-quimotripsina (FASP).......................................... 135 8.4 Fracionamento off-line............................................................................................ 136 8.5 LC-MS / MS........................................................................................................... 136 8.6 Análise de Dados.................................................................................................... 137 8.7 Anotações funcionais.............................................................................................. 138 9. RESULTADOS E DISCUSSÃO............................................................................. 140 9.1 Criação de perfil de proteoma e estabelecimento de estratégias............................ 140 9.2 Análise de quantificação......................................................................................... 143 9.2.1 Análises funcionais das proteínas diferencialmente expressas............................ 146 9.2.1.1 David - Functional Annotation Tool................................................................ 146 9.2.1.2 Blast2GO.......................................................................................................... 153 9.2.1.3 BlastKOALA.................................................................................................... 163 10. Conclusões gerais................................................................................................... 208 PARTE IV: MALDI Imaging....................................................................................... 212 11. MATERIAIS E MÉTODOS................................................................................... 213 11.1 Obtenção de cortes de cérebro de Apis mellifera................................................. 213 11.2 MALDI Imaging dos neuropeptídeos................................................................... 214 11.3 Processamento dos dados de imageamento químico e Análise das Imagens....... 214 12. RESULTADOS E DISCUSSÃO............................................................................ 217 13. CONCLUSÕES...................................................................................................... 227 14. REFERÊNCIAS BIBLIOGRÁFICAS................................................................... 232 ANEXO I...................................................................................................................... 257 ANEXO II..................................................................................................................... 301 ANEXOS III, IV, V, VI, VII, VIII, IX, X, XII, XII e XIII.......................................... CD- ROM 28 1. INTRODUÇÃO Décadas de estudos com invertebrados têm estabelecido alguns animais como modelos robustos, confiáveis e influentes para o estudo da neurobiologia. Podemos observar um aumento significativo da aceitação desses animais, por diversas razões, como modelos de elevado potencial para o entendimento de questões básicas na biologia, particularmente ao nível comportamental, neural e molecular, o que tem proporcionado a adoção de novas ideias e conceitos no estudo do comportamento e da neurobiologia. Depois de um prolongado ceticismo, pode-se observar que o tipo de contribuição de alguns invertebrados para o desenvolvimento da neurociência está mudando, e ganhando importância (MENZEL e ERBER 1978; MENZEL 1985; SATTELLE e BUCKINGHAM, 2006). As abelhas Apis mellifera são caracterizadas por apresentarem um sistema nervoso estruturado de forma simples, com relativamente poucos neurônios em relação aos cérebros de mamíferos, apresentam, no entanto, uma riqueza comportamental e uma impressionante capacidade cognitiva (MENZEL e GIURFA, 2001). A maior parte dos estudos realizados com este grupo animal e que objetivam a compreensão do aprendizado e da memória, são realizados a partir de ensaios comportamentais em que a capacidade de cognição é analisada. Abelhas são capazes de aprender uma série de tarefas se treinadas para tal. Além disso, observa-se que atualmente as abelhas têm sido utilizadas como modelos de aprendizagem e memória, destacando a sua utilidade para a neurociência, em particular para o melhor entendimento das bases da cognição (MENZEL e GIURFA, 2001; GIURFA, 2003; MENZEL et al., 2006; MENZEL, 2012). 1.1 Aprendizado e Memória em abelhas As abelhas têm um grande número de habilidades sofisticadas de aprendizagem para rastrear rapidamente a distribuição de recursos de néctar e pólen, necessários para a sobrevivência da colônia (GIURFA, 2007). Além disso, as abelhas são excelentes modelos, porque a capacidade de aprendizado pode ser avaliada tanto no campo quanto em condições laboratoriais, permitindo sua utilização concomitante em análises fisio/farmacológicas. Segundo Menzel e colaboradores (2006) o aprendizado envolve o reconhecimento de odores, cores, formas e texturas, sendo que os odores desempenham o papel mais proeminente, uma vez que são prontamente associados ao néctar ou ao pólen. 29 As habilidades olfativas das abelhas foram reconhecidas experimentalmente por Karl von Frisch (1919), que desenvolveu ensaios nos quais esses insetos visitaram um alimentador artificial que continha vários óleos essenciais (misturas de odores). No condicionamento pavloviano da extensão da probóscide por reflexo (REP), um odor (estímulo condicionado) é associado a uma solução de sacarose (estímulo não condicionado) (BITTERMAN et al., 1983). Mais recentemente, um protocolo de aprendizagem olfativa aversiva foi desenvolvido, em que o odor (estímulo condicionado) é associado com um leve choque elétrico (estímulo não condicionado), avaliando-se o reflexo de ferroar das abelhas (VERGOZ et al., 2007). O sistema nervoso opera esta transformação/associação de estímulos, detectando moléculas químicas, por meio do processamento das representações neurais e formando a percepção; esses aspectos têm sido objetos de intensa investigação, tanto em vertebrados como em insetos (GIURFA, 2007). Sabe-se que no caso de estímulo olfativo, o primeiro processamento é o mapeamento do espaço físico de moléculas de odor para um receptor olfativo. Este passo envolve a detecção de características particulares de proteínas receptoras de moléculas, conduzidas através da transdução de sinal, e da ativação de um subgrupo de células receptoras. Este conjunto de sinais funciona com um código, que será então transportado para uma série de estruturas cerebrais, e ficarão sujeitos a tratamento e representação de odor. Em seguida, estas representações são mapeadas para o espaço perceptivo, envolvido na decisão comportamental, associando a qualidade do odor com o valor prazeroso e assim, aprendendo as relações existentes entre os odores e resultados fisiológicos e comportamentais (PAGE, 2012). Nesse processo, diversas biomoléculas são fundamentais, tais como proteínas (receptoras) e metabólitos (transmissores). Diversos experimentos têm demonstrado as diferentes funções do sistema de transmissão na modulação da cognição. No cérebro de abelhas, pelo menos dois tipos de receptores nicotínicos de acetilcolina foram identificados; um está envolvido com o processo de recuperação da memória e outro está relacionado com o processo de formação da memória de longo prazo (GAUTHIER e GRÜNEWALD, 2012). A via de processamento de recompensa depende muito da neuromodulação octopaminérgica (GAUTHIER e GRÜNEWALD, 2012); a serotonina prejudica a resposta condicionada durante a aquisição da memória (GAUTHIER e GRÜNEWALD, 2012). As funções da dopamina mediando o comportamento aversivo, e da octopamina mediando a aprendizagem apetitiva ainda precisam ser analisados (GAUTHIER e GRÜNEWALD, 2012). Vários estudos indicam que os receptores de GABA (ácido gama-aminobutírico) desempenham um papel central durante a aprendizagem olfativa, porém a função específica da inibição/ativação 30 dos mesmos ainda não está clara (GAUTHIER e GRÜNEWALD, 2012). Os receptores de glutamato, tanto excitatórios quanto inibitórios são necessários para algumas formas de aprendizagem e para a recuperação da memória (GAUTHIER e GRÜNEWALD, 2012). Em abelhas, como em outras espécies, a indução de fases distintas de memória depende de parâmetros como o número e a sucessão de tentativas de treino. Segundo Müller (2012): “Empregando técnicas desenvolvidas para monitorar e manipular a atividade de cascatas de sinalização em abelhas, parâmetros de treinamento podem estar ligados a modulações temporais de cascatas de sinalização que contribuem para as diferentes fases de memória. Análises revelaram que existe uma rede dinâmica de eventos de sinalização nos lobos antenais e nos corpos cogumelares necessários para a indução e a manutenção da memória em fases distintas”. Dentro deste contexto, pelo menos três fases de memória podem ser identificadas ao nível comportamental: uma memória de curto prazo, em nível de minutos, memória de médio prazo em nível de horas e memória de longo prazo em nível de dias e semanas (NGUYEN et al., 1994). Conforme citado por Müller e colaboradores (2012), no estudo da memória olfativa sabe-se que nos lóbulos antenais (LAs), após treinamento, ativam a protease calpaina (dependente de cálcio) e a proteína quinase-C. A calpaina atua clivando a proteína quinase-C, conduzindo à formação de proteína quinase-M (determinante na formação de memória em médio prazo). Num processo paralelo, independente, também localizado nos LAs, o treinamento induz a ativação prolongada de proteína quinase-A que é essencial para a indução de memória de longo prazo. Além destes processos situados nos LAs, o neurotransmissor glutamato medeia eventos de sinalização nos corpos pedunculados (MBs), que contribui para a formação de memória de longo prazo. No entanto, os alvos moleculares desencadeados por estes eventos iniciais da formação de memória de longo prazo nos LAs e nos MBs ainda precisam ser identificados. Em paralelo, a memória induzida por condicionamentos que gerem memória de curto prazo é ainda desconhecida (MÜLLER, 2012). 1.2 Neuroproteômica O sistema nervoso é responsável pelo controle de diversas atividades biológicas, tais como controle da percepção, do comportamento, da cognição, da memória, dentre outras atividades. Apesar dos grandes avanços científicos, os conhecimentos atuais sobre essa complexa estrutura biológica estão longe de explicarem suas funções. Nesse contexto, existe uma abordagem emergente nos últimos anos, que visa a compreensão ao nível molecular, dos 31 mecanismos envolvidos na função cerebral, sob o ponto de vista da regulação da expressão de proteínas – a neuroproteômica (BECKER et al., 2007). O termo neuroproteômica começou a ser utilizado em 2004 por Kim e colaboradores (2004) e continuou ganhando enorme aceitação como uma subárea da proteômica (BUTCHER, 2007). A abordagem proteômica pode ser utilizada para diversas finalidades, tais como: para a identificação e caracterização de proteínas expressas pelo cérebro e/ou sistema nervoso periférico, num determinado tempo; para a identificação e compreensão das modificações pós-traducionais das neuroproteínas; para determinar mudanças no perfil proteômico em função do tempo, de mudanças ambientais, de fatores genéticos e até variações oriundas de ensaios experimentais; e para a determinação de como todas essas mudanças afetam o organismo como um todo (ALZATE, 2010). Conforme citado por Lübec e colaboradores (2003) diversas classes de proteínas já foram identificadas no cérebro de camundongos, dentre elas cita-se: i) as proteínas de citoesqueleto, que além de serem estruturais atuam diretamente sobre o transporte e a sinalização de proteínas de outras naturezas; ii) enzimas de metabolismo intermediário, as quais são uteis na determinação de alterações metabólicas no cérebro e na avaliação do estado metabólico das células e tecidos; iii) proteínas da cadeia respiratória e do ciclo do ácido cítrico; iv) proteínas antioxidantes, que possuem grande importância na determinação de mecanismos patológicos em doenças neurológicas, além de serem úteis em diversas condições experimentais tais como as de neurotoxicidade; v) proteínas relacionadas com o proteossoma (ubiquitinação); vi) proteínas ligadas a moléculas de RNA e proteínas de transcrição e splicing, que possuem grande importância para a biologia molecular, pois são determinantes nas vias de divisão celular, nuclear e funções do nucléolo; vii) proteínas de choque térmico e chaperonas, que possuem múltiplas funções incluindo a proteção de proteínas recém- sintetizadas do ribossomo até seu destino final, e seu papel em inúmeros processos fisiológicos e patológicos relacionados com o enovelamento incorreto de suas estruturas e viii) proteínas neuronais, que são extremamente importantes no estudo de tumores. Em relação aos receptores nervosos/ proteínas de membranas e as estratégias de estudo para estas proteínas, Lubec e colaboradores (2011) estudaram o receptor GABAA, um elemento chave na sinalização e na transmissão neural, por meio da extração de proteínas de membrana do hipocampo e submissão do extrato a eletroforese nativa. As bandas do gel foram digeridas e então analisadas por nana-LC-ESI-MS/MS. Por meio da estratégia utilizada os pesquisadores descreveram 5 subunidades para o receptor GABAA, além de 6 novos sítios de fosforilação. Lubec e colaboradores (2012) utilizaram-se desta mesma abordagem para o 32 estudo da subunidade alfa-3 de Na, K-ATPase em níveis de complexidade de desempenho da memória em roedores. Esta proteína é encontrada na membrana plasmática de praticamente todas as células animais, que utiliza a energia derivada da hidrólise do ATP para transportar 3 íons Na+ e 2 íons K+. Desta forma, proteínas de membrana do hipocampo foram submetidas à separação por BN-PAGE e em seguida, a AT1A3 foi caracterizada utilizando-se espectrometria de massa (nano-LC-ESI-MS/MS). A partir disso, observou-se alto nível de AT1A3 e alta atividade de ATPase em ratos treinados e uma série de novos sítios de fosforilação em AT1A3. Os dados mostraram-se relevantes para a compreensão do papel da hidrólise catalítica de ATP juntamente com a troca de íons sódio e potássio através da membrana plasmática que gera o gradiente electroquímico desses íons. Os dados encontrados nos dois estudos citados anteriormente (Lubec et al., 2011 e Lubec et al., 2012) comprovam a alta eficiência da estratégia BN-PAGE/LC-MSMS para o estudo de receptores nervosos e proteínas de membrana. Em abelhas, estudos demonstraram diferentes padrões de expressão gênica entre forrageiras e nutridoras, como por exemplo, os genes que codificam as proteínas mais abundantes de geléia real (MRJPs) e enzimas metabólicas (ALBERT et al., 2004 e KUCHARSKI et al., 2002), e os genes envolvidos na transdução de sinal, canal de íons, neurotransmissores, transcrição e adesão celular (SHAPIRA et al., 2001), sugerindo assim plasticidade e remodelação de propriedades neurocelulares durante o envelhecimento e desenvolvimento comportamental em abelhas (TSUCHIMOTO et al., 2004). Embora os dados genômicos e transcriptômicos sejam extremamente relevantes, é principalmente ao nível de proteínas que se pode compreender a diversidade bioquímica e a funcionalidade da expressão gênica (GYGI et al., 1999). Assim, a análise proteômica torna-se fundamental para o alcance de uma visão real da expressão diferencial de proteínas em cérebro de abelhas sob ponto de vista ontogenético e comportamental (GARCIA et al., 2009). Com o sequenciamento do genoma da abelha A. mellifera (CONSORTIUM, 2006) estes insetos tornaram-se um poderoso modelo para estudos de proteômica comparativa. Estudos recentes sobre proteômica de A. mellifera focaram na análise da secreção da glândula hipofaríngea de nutridoras (SANTOS et al., 2005) na composição proteômica da geléia real (FURUSAWA et al., 2008), nos neuropeptídeos no cérebro (HUMMON et al., 2006), nos corpos de cogumelo do cérebro (UNO et al., 2007) e, mais recentemente, diferenças nos perfis protéicos de corpo inteiro das abelhas nutridoras e forrageiras (GARCIA et al., 2009 e HERNÁNDEZ et al., 2012). 33 Garcia e colaboradores (2009) encontraram grandes diferenças em expressão de proteínas, comparando-se cérebros de A. mellifera de forrageiras e nutridoras por meio de eletroforese bidimensional e espectrometria de massas MALDI-ToF. As abelhas que desempenham papéis de nutridoras apresentaram maior expressão das proteínas MRJPs, as quais estão diretamente relacionadas com a determinação de castas durante a diferenciação das larvas. Já as abelhas forrageiras apresentaram maior expressão de proteínas relacionadas com a produção de energia, com a sinalização metabólica e com o metabolismo de neurotransmissores. Em trabalho subsequente, Hernández e colaboradores (2012) realizaram um mapeamento do proteoma do cérebro de abelhas por MudPIT e identificaram 2.742 proteínas, sendo que 17% delas apresentou expressão proteica diferencial, ao se comparar forrageiras e nutridoras por espectrometria de massas quantitativa, utilizando-se a estratégia label-free. Dentre as proteínas identificadas como superexpressas nas abelhas forrageiras, estão proteínas relacionadas com produção de energia, associadas ao aumento da atividade cerebral durante o processo de aprendizagem e memorização, que são acionados durante a atividade de forrageamento. Um exemplo foi a detecção da proteína quinase- A - AMPc dependente, que contribui para a formação de memória de longo prazo (FIALA et al., 1999). 1.2.1 Proteínas de membrana Proteínas de membrana desempenham diversas importante funções nos sistemas biológicos, dentre elas transporte transmembranar, comunicação celular, transdução de sinal, adesão celular e muitos outros processos. Entretanto, elas representam um desafio em análise proteômica em decorrência de sua baixa expressão gênica, grau de hidrofobicidade e baixo número de sítios de clivagem para tripsina (PETRAK et al., 2016). A membrana plasmática é uma estrutura que separa a célula do ambiente celular, sendo uma estrutura dinâmica responsável pelo controle do tráfego de substâncias químicas para dentro e/ou para fora da célula (BUDIN and DERAJVA, 2012). Sua estrutura básica é composta por lípidios e proteínas de membrane que possuem funçòes específicas, dependendo do sub-tipo cellular e do tipo cellular (adesão cellular, condutividade iônica, sinalização, etc). Os dois tipos básicos de grupos de proteínas de membrana são: (i) integral (constantemnte ligadas à membrana) e (ii) periferial (temporariamente ligadas à membrana) (Figura 1) (KROGH et al., 2001). Mostrou-se que de 20-30% do genoma é responsável pela codificação de proteínas de membrana e que elas representam mais de 50% de todas as drogas na medicina moderna. Proteínas de membrana representam uma importante parte da medicina 34 moderna e das pesquisas biológicas, porque as mudanças em sua estrutura e função são responsáveis pelo desenvolvimento de diversas doenças e transtornos (ALMEN et al., 2009; VON HEIJNE, 2006 and LAI, 2013). Figura 1. Mosaico fluído da membrana celular. Fonte: Adaptado de Campbell, Neil A.; Reece, Jane B. Biology, 7th Edition. 1.2.1.1 Preparo de amostra Diferentes tipos de amostras biológicas são utilizados em proteômica: células, tecidos e fluídos corporais. O preparo de amostra é um passo crucial na análise de proteinase deve ser especificamente determinada de acordo com o tipo de amostra. O procedimento ideal consiste da solubilização, denaturação e redução, em ordem para a quebra completa de interações entre proteínas, e remoção de todos os componentes químicos que podem ter efeito negativo no preparo de amostra (RABILLOUD, 2001). Cultura de cálulas são menos desafiadoras para o preparo de amostras do que tecidos, em decorrência de sua estrutura simples. No caso de tecidos, a composição das amostras deve ser considerada, baseando-se em sua origem (lípidios no cérebro, conectividades de tecido na pele, etc). Em caso de amostra proveniente de pele, a melhor forma é a maceração da amostra em nitrogênio líquido, seguido pela homogenização em tampão de lise com detergente, redutores e inibidores de proteases/fosfatases (BODZON-KULAKOWSKA et al., 2007). Homogenização mecânica pode ser combinada com homogenização ultrasônica. A vantagem do ultrassom é que além de homogeneização, também provê emulsificação, dispersão e suspensão de misturas (PACHECO, 2003; WATKINS et al, 1999; JOO et al., 2003). 35 Em caso de lipídeos, especialmente em fraçòes de membrane provenientes de cérebro, eles podem influenciar a solubilidade protéica, bem como o pI e a massa molecular. Dependendo do método aplicado para análise proteômcia, os lipídeos podem ser removidos por TCA ou precipitação com acetona, ou pela centrifugação de amostras com em tampão de amosra que inclua CHAPS ou SDS (BODZON-KULAKOWSKA et al., 2007). O método mais comum para a remoção de lípidios de amostras biológicas é a combinação de Uréia/Tiouréia/CHAPS com a centrifugação utilizando filtro cut-off (de 3 a 100 kDa). Estudos mostram que o método não só remove os lipídeos como também, sais. Estima-se que, desta forma, mais de 90% das proteínas são solubilizadas (BODZON-KULAKOWSKA et al., 2007 and JOO et al., 2003). O método de preparo de amostra e de sepração depende dos objetivos do projeto de pesquisa e do tipo de análise a ser desenvolvida. 1.2.1.2 Enriquecimento de proteínas de membrana Após a extração e o isolamento de proteínas, pela nativa estrutura, estarão insolúveis. Para viabilizar a solubilização de proteínas e expor os sítios de clivagem da enzima, as interações em proteínas devem ser quebradas (pontes disulfeto, interações iônicas e hidrofóbicas) (RABILLOUD, 1996). Dependendo do método de separação, diferentes reagents podem ser utilizados, dentre eles SDS, uréia/tiouréia, DTT, iodoacetamida e etc. Análises de extratos de proteínas oriundas de celulas inteiras permanecem um grande desafio em função do elevado grau de complexidade e da ampla faixa dinâmicana em abundância das proteínas. Já a separação de proteínas em regiões subcelulares é uma estratégia amplamente aplicada na investigação de proteínas de interesse presentes em uma fração, como proteínas de membrana as quais estão presentes em concentrações relativas baixas nas células (ZHANG et al., 2011). De acordo com a literatura disponível, o gradiente de centrifugação por densidade (utilizando sucrose, sorbitol, Ficoll ou Percoll), é uma das técnicas mais comumente utilizadas para a separação de proteínas de membrana (ZHANG et al., 2005 e ZHANG et al., 2006), mitocondriais (HUNGIZER et al., 2006 e REIFSCHENEIDER et al., 2006), Golgi e vesículas sinápticas (BURRE et al., 2006 e COUGHENOUR et., 2004). Existem dois principais tipos de centrifugação por gradiente de densidade: separação por índice regional (tamanho) e separação isopícnica (densidade). No caso da separação por indíce regional, a sacarose com maior concentração molar fica no fundo do tubo, e então a densidade é gradualmente reduzida para o topo do tubo. Já no caso da separação isopícnica, 36 duas ou mais camadas de sucrose em diferentes densidades são depositadas no tubo, levando- se em conta que a densidade máxima de sucrose é maior do que as das partículas de interesse (amostra). Além da ultracentrifugação, utiliza-se também uma combinação de clorofórmio e metanol para o enriquecemento da fração da membrana. Este método baseia-se na hidrofobicidade de proteínas transmembranares associadas à membrana (FERRO et al., 2000). Além disso, Sivars e Tjereld (2000) e Everberger e colaboradores (2004) descreveram o papel de detergentes tais como n-Dodecil-β-D-Maltoside (DDM), TritonX-114 e polietilenoglicol (COLLABORATION et al., 2013) neste tipo de aplicação. As vantagens dos sistemas aquosos de duas fases são numerosas: separação rápida, estabilidade das biomoléculas, uso em larga escala e a suplementação do sistema com protease / fosfatase. 1.2.1.3 Espectrometria de massas aplicada ao estudo de proteínas de membrana A análise por espectrometria de massas de uma mistura complexa é muito difícil de analisar completamente devido ao número esmagador de componentes. Este problema é exacerbado pela digestão enzimática de uma amostra em um grande número de produtos peptídicos. O sucesso da cromatografia líquida MS (LC-MS) e do MS em tandem (LC-MS / MS) depende de amostras limpas com a limitação da complexidade da amostra para minimizar a supressão de íons por espécies de alta abundância e prevenir a subamostragem de peptídeos. Embora as proteínas intactas sejam tipicamente estudadas por eletroforese em gel, os fluxos de trabalho de espectrometria de massa mais comuns para amostras de proteína complexa analisam peptídeos, que são mais fáceis de serem fracionados por LC do que as proteínas e ionizam e fragmentam mais eficientemente do que proteína. Além disso, os espectros resultantes são mais fáceis de serem interpretados. A preparação de peptídeos envolve a redução e alquilação de cisteínas, a digestão da amostra empeptídeos, a dessalinização e a concentração dos peptídeos, seguida pela análise dos mesmos por estratégias de MS baseadas em MALDI-MS ou ESI (LC-MS e LC-MS / MS). A complexidade da amostra afeta negativamente a capacidade de detectar, identificar e quantificar proteínas de baixa abundância por MS, porque os peptídeos de proteínas de alta abundância podem mascarar a detecção de proteínas de baixa abundância. Por conseguinte, quanto mais uma amostra puder ser simplificada e maior a gama dinâmica das concentrações de proteína possa ser reduzida, maior será a capacidade de detectar proteínas a concentrações muito baixas. 37 As estratégias de depleção e enriquecimento foram desenvolvidas para remover proteínas altamente abundantes ou isolar proteínas alvo na amostra, respectivamente. A depleção é mais frequentemente utilizada para reduzir a complexidade de amostras biológicas, tais como sangue ou soro, que contêm altas concentrações de albumina e imunoglobulinas. Uma desvantagem significativa para esta abordagem, porém, é que proteínas abundantes muitas vezes se ligam a outras proteínas, o que poderia resultar no esgotamento de complexos com proteínas de baixa abundância. 1.2.1.4 Filter assisted sample preparation (FASP) Quer sejam simples ou complexas, as amostras necessitam frequentemente serem processadas de várias formas para assegurar que são compatíveis e estão otimizadas para a digestão e análise por espectrometria de massa. Por exemplo, uma vez que a MS mede íons carregados, os sais, especialmente os sais de sódio e fosfato, devem ser removidos antes da MS para minimizar a sua detecção. Nos últimos anos, principalmente como resultado da introdução da preparação de amostras assistida por filtro (FASP) e do estabelecimento da captura de superfície celular (CSC), este cenário está mudando. O FASP apresenta várias vantagens: (i) digestão protéica livre de ácidos nucleicos e outros componentes celulares, (ii) ser aplicada a amostras contendo altas concentrações de detergentes, (iii) não há precipitação e a concentração da amostra é mantida elevada e (iv) num dispositivo de filtro único podem ser processadas entre 0,2 - 200 μg de proteína total. Em suma, o método combina as vantagens da digestão in-gel e em solução comumente usada em espectrometria de massa. O método permite também a digestão da amostra se utilizando diferentes enzimas (por exemplo, tripsina e quimotripsina). Está bem documentado que a eluição dos peptídeos após a primeira digestão (com tripsina) altera o equilíbrio da reação de clivagem, o que por sua vez facilita a digestão de proteínas menos abundantes, bem como a digestão de sítios de clivagem com menor afinidade para a enzima (FONSLOW et al., 2014, FONSLOW et al., 2014). Neste caso, é possível aplicar quimotripsina ao mesmo filtro (mesma amostra) após a eluição de digestões com tripsina. Os digestos originados de ambos os procedimentos são submetidos à espectrometria de massa (separadamente) e os resultados são analisados por bioinformática resultando em uma lista maior de proteínas identificadas com alta porcentagem de cobertura protéica. O procedimento geral para FASP é mostrado na Figura 2. 38 Figura 2. Esquema representativo de preparo de amostra utilizando-se FASP. Fonte: Criado pelo autor, 2017. De acordo com Wiśniewski (2016), o método FASP pode resultar em 1,5 a 2 vezes mais peptídeos do que o método em solução usualmente utilizado na análise proteômica e a reprodutibilidade de acordo com a correlação de Pearson é r ≥ 0,98 entre medidas FASP únicas. Além de permitir a análise de proteínas de membrana, os peptídeos eluídos do filtro apresentam alta grau de pureza e elevada cobertura protéica (WIŚNIEWSKI et al., 2009). 1.2.1.5 SPE e stage tip O enriquecimento de peptídeos alvo específicos e a limpeza da amostra são necessários para a análise bem-sucedida de proteínas de baixa abundância ou a identificação de peptídeos pós-translacionalmente modificados. Após o enriquecimento de peptídeos, os sais e os tampões podem ser removidos utilizando-se ponteiras ou colunas C18 e os detergentes podem ser removidos utilizando colunas de afinidade ou reagentes que precipitam o detergente. As amostras diluídas podem também ser concentradas utilizando concentradores de diferentes intervalos de corte de peso molecular (PMCO). 1.2.1.6 HPLC e pré-fracionamento A cromatografia é uma técnica analítica para separar uma mistura de substâncias químicas em componentes individuais com base em diferentes propriedades de cada componente. Em princípio, a separação dos componentes depende da afinidade dos constituintes para a fase estacionária e da sua solubilidade com a fase móvel. 39 A cromatografia líquida de alta eficiência ou a cromatografia líquida de alta pressão (HPLC) utiliza uma fase estacionária sólida com uma fase móvel líquida. A pressão operacional durante a separação é entre 50 e 350 bar, o que é significativamente maior do que na cromatografia regular. O volume da amostra é menor (poucos microlitros), o diâmetro da coluna analítica é de 2,1-4,6 mm e é embalada com partículas sorventes do tamanho de 2-50 μm. Todas essas características físicas dão ao HPLC uma alta resolução na separação da mistura de compostos. Aplicado à análise proteômica, o sistema de HPLC mais comumente utilizado para a separação de peptídeos é a cromatografia líquida em fase reversa (RPLC). Isto envolve a separação de peptídeos com base na sua hidrofobicidade. O RPLC é realizado numa fase estacionária hidrofóbica (C18) com uma fase móvel polar de gradiente acídico. A fase estacionária é constituída por C18 polimérico (hidrocarboneto de octadodecilo) integrado através de uma sililação tri-funcional de 2 ou 3 átomos de sílica no esqueleto de gel de sílica. Isto aumenta os resultados de sililação com uma maior estabilidade da coluna, particularmente em condições de fase móvel ácida. Os peptídeos hidrofílicos passam através da coluna e são eluídos em primeiro lugar; isto resulta na eluição sucessiva de peptídeos hidrofóbicos pela alteração da composição da fase móvel (aumentando a percentagem do solvente orgânico) (Figura 3) (MOLNAR, 1996). Figura 3. Esquema representativo de cromatografia de fase reversa. Fonte: Modificado de Cuatreca, 1976. Dada a vasta gama de proteínas de amostras biológicas, a separação bidimensional a nível de peptídeos pode ser realizada para reduzir a complexidade da amostra. Isto é 40 conseguido empregando-se dois ou mais métodos com diferentes seletividades de separação (ZHANG et al., 2010). A cromatografia líquida bidimensional, 2D-LC, consiste-se em uma cromatografia líquida para os peptídeos de pré-fracionamento seguida das análises LC MS / MS individuais das frações separadas. As estratégias / modos de separação atuais incluem: troca de catiônica (SCX), focalização isoelétrica (IEF), eletroforese capilar (CE), focalização isoelétrica capilar (CIEF) e fase inversa de pH em modo misto (RP-RP). (SLEBOS et al., 2008). Tradicionalmente, a SCX era a abordagem clássica de pré-fraccionamento de peptídeos. Outros métodos além do SCX foram desenvolvidos em ecorrência da necessidade de dessalinização de amostra antes da análise LCMS levando a perda de amostra de até 50%. Além disso, a resolução de peptídeos em tampões iônicos é uma preocupação devido à supressão iônica de espécies durante análises de EM. O advento de RPLC / RPLC 2D que utilizam tampões que possuem baixa concentração salina ou até mesmo que não utilizam tampões salinos acabou por substituir SCX. MudPIT (2D RPLC / RPLC) é uma técnica proteômica baseada em cromatografia, na qual uma amostra peptídica complexa é separada primeiro em frações e depois cada fração é analisada separadamente no sistema RPLC-MS / MS. Gilar e colaboradores (2005) demonstraram que o valor de pH diferente da fase móvel tem um impacto crucial na qualidade da RPLC na análise de MudPIT. Os peptídeos contêm grupos funcionais carboxílicos (RCOOH) ou básicos (RNH2). Quando o pH do tampão é igual ao ponto isoeléctrico de um peptídeo, o peptídeo estará em ambos os estados: ionizado e neutro (Figura 4). Figura 4.Esquema representativo de peptídeo com estado de carga ionizado e neutro. Fonte: Criado pelo autor, 2017. O estado zwitteriónico tem retenção fraca nas colunas de fase reversa. A retenção do peptídeo pode ser melhorada modulando o pH da fase móvel aquosa. Em pH baixo, as espécies positivamente carregadas dominam e em pH elevado, dominam espécies carregadas negativamente. Em cada uma destas duas condições (abaixo ou acima do seu isoelético pI), o 41 analito adquire um "estado suprimido de íons". A eluição dos peptídeos retidos é então realizada aumentando-se o gradiente de solventes orgânicos (ACN, MeOH, iPrOH). Por pré- fracionamento dos peptídeos a pH 10 seguido de LC MS/MS a pH 2,6, a maior ortogonalidade é obtida com C18 (GILAR et al., 2005). 1.3 Proteômica quantitativa A identificação qualitativa de milhares de proteínas em amostras biológicas é bem estabelecida em análise proteômica. Pesquisas da última década estão colocando esforços no desenvolvimento de métodos para quantificar essas proteínas. Devido à natureza dinâmica e interativa das proteínas, a proteômica quantitativa é consideravelmente mais complexa do que a simples identificação de proteínas em uma amostra. Em 2007, Bantscheff e colaboradores fizeram um esquema da relação entre o número de proteínas existentes em uma amostra biológica, o número de proteínas identificadas, e também a quantidade individual de cada proteína (Figura 5). Figura 5. Relação existente entre o número de proteínas presentes na amostra, número de proteínas identificadas e o número de proteínas quantificadas. Fonte: modificado de Bantscheff et al., 2007. A maioria dos métodos proteômicos quantitativos desenvolvidos até o momento implicam na marcação isotópica de proteínas ou peptídeos nos grupos experimentais analisados por espectrometria de massas. Métodos de quantificação relativa (SILAC, ICAT, ICPL e marcadores isobáricos) são usados para comparar a abundância de proteínas ou peptídeos entre amostras, enquanto que as amostras não marcadas com concentrações conhecidas de peptídeos sintéticos marcados isotopicamente podem produzir quantificação Proteínas na amostra Proteínas identificadas Proteínas quantificadas Concentração de proteína N ú m e ro d e p ro te ín a s 42 absoluta de peptídeos alvo (via SRM). As estratégias livres de marcação (label-free) também estão disponíveis para a quantificação relativa e absoluta. Embora essas estratégias sejam mais complexas do que a simples identificação de proteínas, a proteômica quantitativa é crítica para a compreensão da expressão global de proteínas e modificações subjacentes aos mecanismos moleculares de processos biológicos e estados de doença. 1.3.1 Quantificação label Nas abordagens que se realiza uma marcação nas amostras (quantificação label), as amostras são diluídas em isótopos estáveis, partindo-se do princípio de que um peptídeo marcado com isótopos estáveis é idêntico a seu peptídeo nativo e, por consequência, ambos se comportarão da mesma forma durante a cromatografia líquida e a análise por espectrometria de massas. A partir disso será possível identificar a diferença a partir dos dados obtidos na espectrometria de massas entre a forma marcada e não marcada de um peptídeo apenas pela comparação da intensidade de sinal no espectro (BANTSCHEFF et al., 2007). Diversas marcações químicas têm surgido recentemente, dentre elas as principais são a marcação com O-18 (WU et al., 2007), aminoácidos marcados com isótopos estáveis em cultura aminoácidos marcados em cultura (SILAC) (MANN, 2006), iTRAQ (WIESE et al., 2007) e ICAT (SHIIO e AEBERSOLD, 2006). Tandem mass tags (TMT) Os marcadores de massa em tandem (TMT ou TMTs) são marcadores químicos utilizados para quantificação de macromoléculas biológicas baseadas em MS, tais como proteínas e peptídeos. TMT pertence a uma família de reagentes referidos como marcadores de massa isobárica (THOMPSON et al., 2003). Proporcionam um método alternativo para a quantificação baseada em gel ou anticorpo e é possível combiná-lo com estes e outros métodos para fornecer informação quantitativa. As marcas contêm quatro regiões, denominadas região de repórter de massa (M), uma região de ligação clivável (F), uma região de normalização de massa (N) e um grupo reativo (R) (Figura 6). 43 Figura 6. Estrutura química genérica do reagente TMT. Fonte: Retirado de https://www.thermofisher.com/order/catalog/product/90111 - acessado em 15/01/2017. As estruturas químicas de todas os marcadores são idênticas, mas cada uma contém isótopos substituídos em várias posições, de modo que as regiões de repórter de massa e de normalização de massa têm massas moleculares diferentes em cada marcador. As regiões M- F-N-R combinadas dos marcadores têm as mesmas massas moleculares totais e estrutura de modo que durante a separação cromatográfica ou eletroforética e no modo MS simples, as moléculas marcadas com etiquetas diferentes são indistinguíveis. Após a fragmentação no modo MS / MS, a informação da sequência é obtida a partir da fragmentação do do peptídeo e os dados de quantificação são obtidos simultaneamente a partir da fragmentação dos marcadores, dando origem a íons repórter de massa. O TMT está atualmente disponível em quatro variedades: TMT0, uma estrutura nuclear não-isotopicamente substituída; TMT2, um par isobátrico de marcadores de massa com uma única substituição isotópica; TMT6, um conjunto isobárico de seis marcadores de massa com cinco substituições isotópicas e TMT10 - um conjunto de 10 marcadores de massa isotópica que utilizam a região repórter TMT6, mas utilizam diferentes isótopos elementares (contêm números e combinações diferentes de isótopos 13C e 15N na massa repórter) para criar uma diferença de massa de 0,0063 Da (WERNER et al., 2014 (Figura 7). 44 (A) Figura 7. Variabilidades do reagente TMT. (A) TMT0; (B) TMT2; (C) TMT6 e (D) TMT10. Fonte: modificado de LICIER et al., 2016. A quantificação por marcadores isobáricos é realizada medindo-se as intensidades dos íons-repórteres de fragmento liberados a partir dos marcadores durante a fragmentação do peptídeo no modo MS em tandem (MS2). O passo de seleção de íons (no modo de exploração (B) (C) (D) 45 completo - MS1) é vantajoso, uma vez que reduz a complexidade dos espectros de massa (Figura 8). Figura 8. Esquema representativo de um exemplo fluxo de trabalho empregado quando se utiliza o reagente TMT. Fonte: Modificado de https://www.thermofisher.com/order/catalog/product/90111 - acessado em 15/01/2017. 1.3.2 Quantificação Label-free Um método alternativo sem risco para introduzir erros tais como marcação incompleta ou mistura de precursores, é a quantificação de peptídeos sem marcação. A técnica chamada label-free oferece uma medida dos sinais espectrométricos de massa dos peptídeos que podem ser comparados diretamente entre diferentes análises de proteoma dado que as condições permanecem idênticas entre análises separadas. Em princípio, não existem, portanto, restrições no número de amostras devido ao número limitado de marcadores (LICIER et al., 2016). De acordo com Licier e colaboradores (2016), o intervalo linear de quantificação tem 46 um limite inferior de aproximadamente 1 fmol, tanto para os fluxos isobáricos como para análises label-free. Em função do elevado custo financeiro e do longo tempo necessários para a aplicação do método de quantificação por marcação com isótopos estáveis existe uma forte tendência de aplicação do método label-free. Além disso, a quantificação por label-free mantém a promessa de quantificação "shotgun" (ELLIOTT et al., 2009). Para que a promessa seja alcançada, existe a enorme necessidade de uso de cromatografia ortogonal para reduzir os efeitos da supressão de moléculas pouco abundantes permitindo a detecção e a identificação até mesmo de proteínas presentes em quantidades ínfimas. Por outro lado, há o desafio de normalizar os dados de modo que a quantificação exata pode ser feita através de múltiplas amostras e de análises múltiplas. Dado o fato de que, teoricamente, a intensidade de pico de qualquer íon deve ser proporcional à sua abundância, a espectrometria de massas tem sido utilizada há décadas como uma técnica para a quantificação de moléculas pequenas em química analítica (ABDALLAH et al., 2012). No entanto, a variação da técnica, tanto em nível de LC quanto em nível de ionização, pode tornar as comparações de intensidades de pico entre diferentes amostras não confiáveis. Os recentes avanços nas abordagens LC / MS permitiram que estas diferenças entre amostras fossem minimizadas (ABDALLAH et al., 2012). Atualmente, a observação da correlação entre a abundância de uma proteína e a área do pico (BONDARENKO et al., 2002; CHELIUS e BODARENKO, 2002) ou o número de espectros MS / MS (LIU et al., 2004) ampliou a escolha deste procedimento analítico para a quantificação de proteínas. A tarefa não é fácil e softwares especiais têm sido desenvolvidos a fim de alinhar a corrida cromatográfica de peptídeos correspondentes em amostras diferentes (BYLUND et al., 2002; WANG et al., 2007; JAITLY et al., 2006 e STRITTMATTER et al., 2003) Para a abordagem de contagem de espectros, a quantificação de proteínas entre duas ou mais amostras é simplesmente realizada comparando os respectivos números do peptídeo em cada amostra. Se 10 espectros são observados para uma proteína na amostra 1 e 15 espectros na amostra 2, a mudança entre as duas condições é cerca de 1,5 vezes. Rappsilber e colaboradores (2002) desenvolveram um sistema computadorizado para medir o índice de abundância de uma proteína (PAI). O valor é obtido dividindo-se o número de vezes em que um peptídeo é observado pelo número de todos os digestos trípticos que seriam possíveis de encontrar em determinada proteína. Em um refinamento posterior, o mesmo grupo transformou o PAI em uma forma modificada exponencial (emPAI) 47 (ISHIHAMA et al., 2005), que demonstraram ser uma melhor correlação de quantidades de proteínas conhecidas presentes na amostra. Outros avanços têm sido feitos por meio de modelos computacionais que predizem quais os peptídeos de uma dada proteína são susceptíveis de serem detectados pelo espectrômetro de massa, e assim, se formaria uma base melhor para iniciar os procedimentos para quantificação (LU et al., 2007; TANG et al., 2006; CRAIG et al., 2005). Um exemplo deste avanço são os resultados obtidos pelo método de perfis de expressão absoluta de proteínas (APEX) (LU et al., 2007). O método label-free certamente não é tão preciso quando comparado ao label quando se considera todo o procedimento experimental, já que todas as variações sistemáticas entre os experimentos de amostras diferentes são refletidas nos dados de espectrometria de massas obtidos no final. No entanto, o método label-free deve ser considerado por um grande número de razões (LU et al., 2007). Em termos de praticidade, o método com marcação consome tempo para introdução das marcações, os quais são obtidos por meio de kits com elevado custo. Em contrapartida o método label-free não exige kit de preparação de amostra e nem preparação prévia da amostra, sendo o experimento de quantificação realizado no mesmo experimento em que realizado para identificação e sequenciamento das proteínas. Segundo Lu e colaboradores (2007), em termos de estratégia de análise, alguns pontos devem ser levados em conta: (I) Não há em princípio um número limite de amostras que podem ser comparadas. Isto certamente é uma vantagem sobre as outras técnicas de quantificação que utilizam isótopos estáveis e limitam o número de amostras que podem ser comparadas. (II) Ao contrário