Ccccccccccccccccccccccccccccccccc Vinícius dos Santos Santana Expressão, purificação e caracterização estrutural in silico das proteínas capsidiais codificadas pelo Grapevine virus A e B São José do Rio Preto 2014 Vinícius dos Santos Santana Expressão, purificação e caracterização estrutural in silico das proteínas capsidiais codificadas pelo Grapevine virus A e B Tese apresentada como parte dos requisitos para obtenção do título de Doutor em Microbiologia, junto ao Programa de Pós-Graduação em Microbiologia, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Orientador: Prof. Dr. Raghuvir Krishnaswamy Arni São José do Rio Preto 2014 Santana, Vinícius dos Santos. Expressão, purificação e caracterização estrutural in silico das proteínas capsidiais codificadas pelo Grapevine virus A e B / Vinícius dos Santos Santana. -- São José do Rio Preto, 2014 103 f. : il. Orientador: Raghuvir Krishnaswamy Arni Tese (doutorado) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Instituto de Biociências, Letras e Ciências Exatas 1. Bioquímica. 2. Vírus de plantas. 3. Proteínas capsidiais - Purificação. 4. Cristalização. I. Arni, Raghuvir Krishnaswamy. II. Universidade Estadual Paulista "Júlio de Mesquita Filho". Instituto de Biociências, Letras e Ciências Exatas. III. Título. CDU – 581.2 Ficha catalográfica elaborada pela Biblioteca do IBILCE UNESP - Câmpus de São José do Rio Preto Vinícius dos Santos Santana Expressão, purificação e caracterização estrutural das proteínas capsidiais codificadas pelo Grapevine virus A e B Tese apresentada como parte dos requisitos para obtenção do título de Doutor em Microbiologia, junto ao Programa de Pós-Graduação em Microbiologia, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Comissão Examinadora Prof. Dr. Raghuvir Krishnaswamy Arni UNESP – São José do Rio Preto Orientador Profª. Drª. Priscila Belintani UNORP – São José do Rio Preto Profª. Drª. Ana Theresa Silveira de Morais FAMERP – São José do Rio Preto Profª. Drª. Alessandra Vidotto FAMERP- São José do Rio Preto Prof. Dr. Fábio Rogério de Moraes UNESP – São José do Rio Preto São José do Rio Preto 2014 AGRADECIMENTOS À minha família que esteve sempre presente e me dando apoio. Aos meus amados pais Vanderlei Santana e Ana Maria P. dos Santos, à minha irmã Natália dos Santos Santana e à minha namorada Patrícia Buck por todo amor, ensinamentos e sábios conselhos. Ao meu orientador Dr. Raghuvir Krishnaswamy Arni, pela paciência e confiança para investir na minha formação, e ainda mais, pela sua amizade durante esses 4 anos de convivência. Ao Prof. Dr. José Osmar Gaspar, por ceder os plasmídeos clonados e pelo apoio dado em relação aos vírus de plantas. Aos meus amigos do Laboratório de Bioquímica: André, Anwar, Eliana, Fábio, Josie, Mônica, Raphael, Rehana e Ricardo, pela convivência, confidências, risos fartos e cumplicidade. Aos professores Dra. Andreia Estela Moreira de Souza, Dra. Priscila Belintani, Dr. Marcelo Andres Fossey, Dra. Ana Theresa Silveira de Morais, Dr. Ramon José Beltran Abrego, Dra. Alessandra Vidotto, Dr. Fábio Rogério de Moraes, pela disponibilidade na composição da banca. Agradeço as sugestões que contribuiram para a melhoria deste trabalho. Ao meu amigo Fábio pela ajuda com as técnicas de bioinformática e ao Ícaro pela ajuda com alguns experimentos, dúvidas e análise de dados experimentais. Ao Prof. Dr. Marcelo Andres Fossey, pela ajuda com as técnicas de dicroísmo circular. Ao Prof. Dr. Christian Betzel (Universität Hamburg, Alemanha), pelo apoio e por permitir a realização parcial deste trabalho em seu laboratório. À FAPESP, pela sua relevância como órgão de fomento para a pesquisa científica e pela concessão de bolsa de doutorado e pela bolsa de estágio de pesquia no exterior (BEPE), que permitiu o desenvolvimento do nosso projeto. Ao programa de Pós Graduação em Microbiologia do IBILCE/Unesp. ÍNDICE LISTA DE FIGURAS ........................................................................................................................... 7 LISTA DE ABREVIAÇÕES .............................................................................................................. 10 RESUMO ............................................................................................................................................. 12 ABSTRACT ......................................................................................................................................... 13 1. Introdução ........................................................................................................................................ 14 1.1 Lenho rugoso da videira (Grapevine Rugose Wood) .................................................................. 15 1.2 Intumescimento dos ramos da videira (Grapevine corky bark) .................................................. 15 1.3 Acanaladura do lenho de kober ("Kober stem grooving") .......................................................... 17 1.4 Organização do genoma viral ...................................................................................................... 18 1.5 Funções das proteínas capsidiais de vírus de plantas ................................................................. 19 1.6 Relevância e Justificativa ............................................................................................................ 20 2. Objetivo geral .................................................................................................................................. 22 2.1 Objetivos específicos................................................................................................................... 22 3. Materiais e Métodos ........................................................................................................................ 23 3.1 Plasmídeos contendo as ORFs codificadoras das proteínas capsidiais ....................................... 23 3.2 Linhagem de bactéria utilizada para expressão das proteínas ..................................................... 23 3.3 Transformação dos vetores em células competentes ................................................................... 23 3.4 Confecção de oligonucleotídeos para adicionar o sítio de clivagem para a TEV protease ......... 24 3.5 Reação em cadeia da Polimerase (PCR) ..................................................................................... 26 3.6 Corte enzimático ......................................................................................................................... 27 3.7 Purificação dos vetores e dos insertos após o corte enzimático .................................................. 27 3.8 Reação de ligação dos insertos nos vetores ................................................................................. 27 3.9 Extração dos plasmídeos recombinantes ..................................................................................... 28 3.10 Transformação do plasmídeo recombinante em células de linhagem de expressão .................. 28 3.11 Expressão e purificação da TEV protease ................................................................................. 28 3.12 Testes de expressão das proteínas capsidiais ............................................................................ 29 3.13 Purificação das proteínas capsidiais sob condição desnaturante ............................................... 30 3.14 Purificação das proteínas capsidiais sob condição nativa ......................................................... 30 3.15 Análise das proteínas purificadas em gel de poliacrilamida (SDS-PAGE) ............................... 31 3.16 Western blotting ........................................................................................................................ 31 3.17 Dicroísmo Circular .................................................................................................................... 32 3.18 Espalhamento dinâmico de luz (DLS)....................................................................................... 34 3.19 Predição da estrutura tridimensional das proteínas capsidiais .................................................. 35 3.20 Validação dos modelos gerados ................................................................................................ 37 3.21 Ensaios de cristalização ............................................................................................................. 38 4. Resultados ........................................................................................................................................ 40 4.1 Expressão e purificação da TEV protease ................................................................................... 40 4.2 Resultados da proteína capsidial do GVB ....................................................................................... 42 4.2.1 Clonagem da proteína capsidial no vetor pET28a .................................................................... 42 4.2.2 Testes de expressão e purificação ........................................................................................... 44 4.2.3 Western Blotting ...................................................................................................................... 48 4.2.4 Dicroísmo Circular ................................................................................................................... 49 4.2.5 Experimento de espalhamento dinâmico de luz (DLS) ............................................................ 50 4.2.6 Ensaios de cristalização ............................................................................................................ 51 4.2.7 Predição da estrutura tridimensional da GVBcp ...................................................................... 52 4.3 Resultados da proteína capsidial do GVA ....................................................................................... 64 4.3.1 Clonagem da proteína capsidial no vetor pET28a .................................................................... 64 4.3.2 Expressão e purificação das proteínas capsidiais .................................................................... 66 4.3.3 Dicroísmo Circular ................................................................................................................... 68 4.3.4 Espalhamento dinâmico de luz (DLS)...................................................................................... 69 4.3.5 Ensaios de cristalização ............................................................................................................ 71 4.3.6 Predição da estrutura tridimensional da GVAcp ...................................................................... 78 5. Discussão .......................................................................................................................................... 89 6. Conclusões ........................................................................................................................................ 94 7. Perspectivas Futuras ....................................................................................................................... 95 8. Referências ....................................................................................................................................... 96 7 LISTA DE FIGURAS Figura 1. Uvas da cultivar Isabel colhidas de plantas com a doença do intumescimento dos ramos. ....................................................................................................................................... 14 Figura 2. Intumescimento dos ramos na cultivar Isabel. .......................................................... 16 Figura 3. Planta da cultivar Petit Syrah sem a doença do intumescimento dos ramos ............ 16 Figura 4. Caneluras do tronco após a retirada da casca ............................................................ 17 Figura 5. Aparência da copa de vinífera tinta infectada .......................................................... 18 Figura 6. Organização e expressão do genoma da espécie-tipo do gênero Vitivirus................ 19 Figura 7. Esquema da construção das proteínas capsidiais ...................................................... 25 Figura 8. Ciclagem da temperatura utilizada na amplificação dos insertos. ............................ 26 Figura 9. Diagrama de ligação peptídica .................................................................................. 41 Figura 11. Teste de clivagem da cauda de histidina ................................................................. 41 Figura 12. SDS-PAGE 12% mostrando o resultado do experimento de clivagem. ................. 41 Figura 13. Gel de agarose a 1% mostrando o resultado da amplificação da ORF ................... 42 Figura 14. Gel de agarose a 1,0% mostrando o corte enzimático do plasmídeo pET28a.........43 Figura 15. Gel de agarose a 1,0% mostrando o resultado da PCR. .......................................... 44 Figura 16. SDS-PAGE 12% da purificação da GVBcp............................................................ 45 Figura 17. SDS-PAGE 12% da GVBcp expressa a 18 ºC ........................................................ 46 Figura 18. SDS-PAGE 12% da purificação da GVBcp............................................................ 46 Figura 19. SDS-PAGE 12% da purificação da GVBcp............................................................ 47 Figura 20. SDS-PAGE 12% da GVBcp expressa a 18 ºC. ....................................................... 47 Figura 21. Gel de poliacrilamida contendo SDS. ..................................................................... 48 Figura 22. Western blotting mostrando a detecção da GVBcp................................................. 49 Figura 23. Espectro de CD (190 a 250 nm) da proteína GVBcp .............................................. 50 Figura 24. Histograma dos resultados da análise de DLS da GVBcp ...................................... 51 Figura 25. Cristal da GVBcp obtido ......................................................................................... 52 Figura 26. Representação em cartoon da estrutura da GVBcp ............................................... 53 Figura 27. Gráfico de Ramachandran do modelo da proteína GVBcp . .................................. 54 Figura 28. Resultado do programa ProSA para o modelo da GVBcp ..................................... 54 Figura 29. Estrutura do dímero PapMV mostrada na forma de cartoon ................................. 55 Figura 30. Alinhamento das sequências de aminoácidos ......................................................... 56 Figura 31. Comparação da estrutura da GVBcp gerada pelo I-Tasser .................................... 56 8 Figura 32. Representação em cartoon do melhor modelo da GVBcp ...................................... 57 Figura 33. Representação em cartoon da estrutura da GVBcp ................................................ 58 Figura 34. Gráfico de Ramachandran do modelo da proteína GVBcp gerado pelo Quark. ..... 58 Figura 35. Resultado do programa ProSA para o modelo da GVBcp ...................................... 59 Figura 36. Comparação da estrutura da GVBcp gerada pelo Quark ....................................... 60 Figura 38. Representação em cartoon do modelo da GVBcp pelo Rosetta ............................. 61 Figura 39. Gráfico de Ramachandran do modelo da proteína GVBcp ..................................... 61 Figura 40. Resultado do programa ProSA para o modelo da GVBcp gerado pelo Rosetta ..... 62 Figura 41. Comparação da estrutura da GVBcp ....................................................................... 62 Figura 42. Representação em cartoon do alinhamento da estrutura do GVBcp ...................... 63 Figura 43. Gel de agarose a 1% mostrando o resultado da amplificação da ORF ................... 64 Figura 44. Gel de agarose a 1% mostrando o corte enzimático do plasmídeo pET28a ........... 65 Figura 45. Gel de agarose a 1% mostrando o resultado da PCR .............................................. 65 Figura 46. SDS-PAGE 12% mostrando o resultado da purificação ......................................... 66 Figura 47. Gel de poliacrilamida contendo SDS mostrando os resultados da purificação ....... 67 Figura 48. Cromatograma do resultado da purificação da GVAcp. ......................................... 68 Figura 49. Espectro de CD (200 a 240 nm) da proteína GVAcp ............................................. 69 Figura 50. Histograma do resultado do experimento de DLS da GVAcp ................................ 70 Figura 51. Gráfico do raio hidrodinâmico em função do tempo. ............................................. 70 Figura 52. Foto da gota de cristalização ................................................................................... 71 Figura 53. Foto da gota de cristalização. .................................................................................. 72 Figura 54. Cristais em forma de agulha da proteína capsidial do GVA ................................... 73 Figura 55. Cristais em forma de agulha da proteína capsidial do GVA ................................... 73 Figura 56. Cristais em forma de agulha da proteína capsidial do GVA ................................... 73 Figura 57. Cristais em forma de agulha da proteína capsidial do GVA ................................... 74 Figura 58. Cristais em forma de agulha da proteína capsidial do GVA ................................... 74 Figura 59. Cristais da proteína capsidial do GVA .................................................................... 75 Figura 60. Cristais em forma de agulha da proteína capsidial.................................................. 75 Figura 61. Cristais em forma de agulha da proteína capsidial do GVA. .................................. 76 Figura 62. Cristais em forma de agulha da proteína capsidial do GVA ................................... 76 Figura 63. Cristais em forma de agulha da proteína capsidial do GVA ................................... 77 Figura 64. Cristais em forma de agulha da proteína capsidial do GVA. .................................. 77 Figura 65. Cristais da proteína capsidial do GVA .................................................................... 78 Figura 66. Representação em cartoon da estrutura da GVAcp. ............................................... 79 9 Figura 67. Gráfico de Ramachandran do modelo da proteína GVAcp. ................................... 80 Figura 69. Alinhamento das sequências de aminoácidos. ........................................................ 81 Figura 70. Comparação da estrutura da GVAcp....................................................................... 82 Figura 71. Representação em cartoon do alinhamento da estrutura do GVAcp. ..................... 82 Figura 72. Representação em cartoon da estrutura da GVAcp ............................................... 83 Figura 73. Gráfico de Ramachandran do modelo da proteína GVAcp .................................... 84 Figura 74. Resultado do programa ProSA para o modelo da GVAcp. ..................................... 84 Figura 75. Comparação da estrutura da GVAcp gerada pelo Quark. ....................................... 85 Figura 76. Representação em cartoon do alinhamento da estrutura do GVAcp ...................... 85 Figura 77. Representação em cartoon do modelo da GVAcp .................................................. 86 Figura 78. Gráfico de Ramachandran do modelo da proteína GVAcp .................................... 87 Figura 80. Comparação da estrutura da GVBcp ....................................................................... 87 Figura 81. Representação em cartoon do alinhamento da estrutura do GVAcp....................... 88 10 LISTA DE ABREVIAÇÕES BCIP – 5-bromo-4 cloro-3 indolil fosfato CATH – acrônimo para os quatro principais níveis na classificação de proteínas – Class, Architecture, Topoly e Homologous Superfamily CD – Dicroísmo circular DLS – Espalhamento dinâmico de luz dNTP – Desoxirribonucleotídeos dsRNA – RNA de fita dupla DO – densidade óptica GVA – Grapevine virus A GVAcp – proteína capsidial do Grapevine virus A GVB – Grapevine virus B GVBcp – proteína capsidial do Grapevine virus B Hel – Helicase IPTG – Isopropil-β-D-tiogalactopiranosida kDa – Quilodalton LB - Luria Bertani Mda – Megadaltons MES - 2-morfolinoetanosulfónico monoidratado MP – Proteína do movimento mRNA – RNA mensageiro Mtr – Metiltransferase NBT – Nitroblue tetrazólio ORF – Open Reading Frame PapMV – Papaya mosaic virus PapMVcp – proteína capsidial do Papaya mosaic virus pb – pares de bases PCR – reação em cadeia da polimerase PEG – Polietilenoglicol RdRp – RNA polimerase dependente de RNA SDS-PAGE – Eletroforese em gel de poliacrilamida contendo dodecil sulfato de sódio sgRNA– RNA subgenômico 11 SCOP – Structural Classification of Proteins SOB – meio de cultura enriquecido para crescimento bacteriano (+)ssRNA – RNA de fita única de polaridade positiva TEV – Tobacco etch virus Tris – Hidroximetil-aminometano tRNA- RNA transportador UTR – região não traduzida UV - ultravioleta 12 RESUMO Introdução. O Grapevine virus A e B pertencem à família Betaflexiviridae, gênero Vitivirus. As partículas virais são filamentos flexuosos de 725 a 800 nm, contêm uma única molécula de (+)ssRNA de aproximadamente 7.6 kb, uma única proteína capsidial de aproximadamente 21.5 kDa, e são restritos ao floema da videira. O GVA é o agente etiológico da acanaladura do lenho de Kober, e o GVB do intumescimento dos ramos, componentes de um complexo de doenças, disseminados pelo material de propagação e por cochonilhas. Este complexo apresenta grande importância econômica para a viticultura e induz alterações no lenho de variedades sensíveis de videiras. Os sintomas gerais constituem no atraso da brotação da primavera, redução de vigor, baixa produção de uva, caneluras e acanaladuras no lenho. De acordo com Galiakparov e colaboradores, as proteínas capsidiais do GVA desempenham um papel no movimento do vírus célula-a-célula. Dessa forma, este trabalho teve como objetivos a expressão, purificação e a caracterização estrutural in silico da proteína capsidial do GVA e GVB (GVAcp e GVBcp). Métodos. As proteínas capsidias clonadas no vetor pET28a foram expressas em E. coli e purificadas por cromatografia de afinidade (Ni-NTA) e exclusão molecular. A técnica de dicroísmo circular foi utilizada para checar se estavam estruturadas e estimar o conteúdo de estruturas secundárias, e a técnica de espalhamento dinâmico de luz para verificar se as proteínas estavam agregadas ou adequadas para os ensaios de cristalização. Concomitantemente, devido à falta de estruturas de proteínas capsidiais homólogas, foram utilizados os programas I-Tasser, Rosetta e Quark, para gerar um modelo tridimensional das proteínas para obter informações importantes sobre suas estruturas. Resultados. As proteínas capsidiais expressas sob baixa temperatura (18 ºC) ficaram solúveis, foram purificadas obtendo-se um alto grau de pureza e concentradas para 5 mg/mL. A análise de dicroísmo circular mostrou que ambas estavam estruturadas, e a análise de espalhamento dinâmico de luz indicou que a GVBcp estava agregada e a GVAcp estava na forma de dímero. Obteve-se cristais iniciais de ambas as proteínas, porém somente os cristais da GVAcp foram obtidos após as tentativas de otimização. Analisando-se os modelos gerados pelo I-Tasser, observou-se que o melhor molde utilizado foi a proteína capsidial do vírus filamentoso flexuoso Papaya mosaic virus (PapMV), pertencente à família Alphaflexiviridae. Foi sugerido pelos autores que o mecanismo de polimerização das proteínas capsidiais na formação do capsídeo ocorre através de um domínio de troca, onde peptídeos da região N- terminal interagem com um “pocket” hidrofóbico da proteína vizinha. Selecionou-se os melhores modelos obtidos pelos programas e, então, foram alinhados com a estrutura cristalográfica do PapMV utilizando o programa TM-align. Os resultados dos alinhamentos mostraram que somente os melhores modelos gerados pelo I-Tasser possuíam semelhança estrutural, mas não semelhança funcional, pois a região responsável pelo mecanismo de troca não foi modelado. Conclusões. Com sucesso foi elaborado um protocolo para a expressão solúvel e purificação das proteínas capsidiais. As análises de dicroísmo circular indicaram que estavam estruturadas e adequadas para os testes de cristalização. Os cristais obtidos da GVAcp devem ser otimizados para se obter cristais difratáveis e de boa qualidade, a fim de se resolver sua estrutura cristalográfica e entender o mecanismo de polimerização do vírus. Palavras-chave: 1. GVA 2. GVB 3. Proteína capsidial 4. Expressão 5. Purificação 6. Cristalização 7. Caracterização estrutural in silico 13 ABSTRACT Introduction. Grapevine virus A and B (GVA and GVB) belong to the Betaflexiviridae family, Vitivirus genus. The virus particles of genus members are flexuous filaments of 725 to 800 nm in length, containing a (+)ssRNA of approximately 7.6 kb, coding for a single protein of 18 to 21.5 kDa, and are grapevine phloem-restricted. GVA is the etiological agent of Kober stem grooving and GVB is the etiological agent of Grapevine corky bark, both components of the rugose wood complex which are spread by the propagation materials and mealy bugs. This disease complex is of great economic impact to the viticulture causing alterations on wood of susceptible grapevine varieties. The general symptoms are spring delayed budding, reduced grape yield and quality, pits and grooves on the woody cylinder. According to Galikparov and others, GVA coat proteins (Vitivirus genus specie-type) play a role in virus cell-to-cell movement. Thus, this work aimed to express, purify and characterize in silico GVA and GVB capsid proteins (GVAcp and GVBcp). Methods. The coat proteins cloned in pET28a were expressed in E. coli and purified by metal affinity (Ni-NTA) and molecular exclusion chromatographies. Circular dichroism analysis was performed to check if proteins were structured and to estimate secondary structure content, and dynamic light scattering was used to check if proteins were aggregated or suitable for crystallization. Concomitantly, due to the lack of homologous coat protein structures, we used I-Tasser, Rosetta and Quark programs to predict the proteins 3D structures to obtain important information about their structures. Results. The coat proteins expressed in low temperature (18 ºC) remained soluble and were purified yielding high purity proteins concentrated to 5 mg/mL. Circular dichroism showed that both were structured and dynamic light scattering showed that GVBcp was aggregated and GVAcp remained a dimer after molecular exclusion chromatography. We obtained initial crystals of both coat proteins but only GVAcp crystals were obtained after crystals optimization attempts. Analyzing predicted structures generated by I-Tasser we observed that the best used template to model proteins was the crystal structure of the flexuous filamentous Papaya mosaic virus (PapMV) coat protein that belongs to the Alphaflexiviridae family. Yang and others suggested that the mechanism of coat proteins polymerization in the formation of the capsid occurs via N-terminal swapping, where N-terminal peptides interact with a hydrophobic pocket of the neighboring protein. We select the best models obtained by the programs and then were aligned with the PapMV crystallographic structure using TM-align program. The results of the alignments showed that only the best models generated by I- Tasser for GVAcp and GVBcp had structural similarity, but not functional similarity, because the region responsible for the swapping was not modeled on the predicted models. Conclusions. We successfully developed a protocol for soluble coat proteins expression and purification. Circular dichroism analysis indicated that the proteins were structured and suitable for crystallization trials. The GVAcp crystals must be optimized to obtain diffractable good quality crystals in order to solve its crystal structure and understand the virus coat proteins polymerization mechanism. Keywords: 1. GVA 2. GVB 3. Capsid proteins 4. Expression 5. Purification 6. Crystallization 7. Structural in silico characterization. 14 1. Introdução Doenças causadas por vírus na cultura da videira (Vitis spp.) são descritas nos países de tradição vitícola há mais de um século, entretanto os estudos desses patógenos começaram a evoluir há aproximadamente meio século (KHUN; FAJARDO, 2013). As principais viroses de videira descritas em outros países também foram constatadas no Brasil, e constituem um dos mais importantes problemas fitossanitários da viticultura nacional, pois estão associados a um decréscimo na produção e qualidade da uva (Figura 1) ou, até mesmo, perdas totais dependendo da variedade envolvida. Isto é devido ao cultivo da videira ser realizado pela multiplicação vegetativa (estaquia ou enxertia) de variedades tradicionais de copa e de porta- enxerto, deixando os vinhedos expostos a esses patógenos, que podem ser difundidos pelo material de propagação (AMORIM; KUNIYUKI, 1997). Figura 1. Uvas da cultivar Isabel colhidas de plantas com a doença do intumescimento dos ramos, mostrando a maturação incompleta (esquerda) e de plantas sadias (direita). Fonte: Embrapa Uva e Vinho. Disponível em , acessado em 15 de Fevereiro de 2014. No último trabalho, cerca de 55 vírus, distribuídos em 20 gêneros, foram registrados como causadores de doenças em videiras (MARTELLI, 2003). Entre as principais viroses que ocorrem no Brasil, destaca-se o complexo rugoso (“Grapevine Rugose Wood Complex”), que está associado à alterações no lenho de plantas infectadas (KUHN; FAJARDO, 2013). Neste complexo encontram-se os agentes etiológicos causadores do intumescimento dos ramos da videira (“Grapevine Corky Bark”) e da acanaladura do lenho de Kober (“Kober Stem Grooving”) (KUNIYUKI; COSTA, 1982; KUHN, 1992). 15 1.1 Lenho rugoso da videira (Grapevine Rugose Wood) O lenho rugoso da videira é o nome dado a um complexo de doenças que apresenta grande importância econômica para a viticultura, razão pela qual é objeto de constante atenção nos programas de seleção sanitária (KUHN; FAJARDO, 2013). Desde as primeiras descrições (GRANITI; CICCARONE, 1961), o lenho rugoso da videira vem sendo considerado um dos mais preocupantes complexos de doenças infecciosas da videira. Este complexo é caracterizado por induzir alterações no lenho de variedades sensíveis de videira, que ocorre na maioria dos países vitícolas (MARTELLI, 1993; KRAKE et al., 1999). Os sintomas gerais constituem no atraso da brotação da primavera, redução de vigor, baixa produção de uva, intumescência na região acima do ponto de enxertia, casca espessa e corticosa com textura esponjosa, caneluras (pittings) e acanaladuras (groovings) no lenho, ocorrendo em variedades de copa, porta-enxerto ou ambos (AMORIM; KUNIYUKI, 1997). O lenho rugoso da videira é constituído por pelo menos quatro doenças distintas: intumescimento dos ramos (“Grapevine Corky Bark”), acanaladura do lenho de Kober (“Kober Stem Grooving”), acanaladura do lenho de LN-33 (“LN-33 Stem Grooving”) e lenho estriado de rupestris ou cascudo (“Rupestris Stem Pitting”) (SAVINO et al., 1989; MINAFRA, 2000; MINAFRA; BOSCIA, 2003), sendo todas elas já constatadas no Brasil (KUNIYUKI, 1972; KUHN, 1992; KUNIYUKI et al., 1997; KUHN et al., 2002). As doenças que compõem este complexo não são facilmente distinguidas em campo, devido à ausência de sintomas específicos nas folhas e a intensidade destes sintomas dependerem da combinação copa/porta-enxerto. Desta maneira, a identificação das doenças é feita utilizando-se três indicadoras diferenciais: ‘Kober 5BB’, ‘LN-33’ e Vitis rupestris (AMORIM; KUNIYUKI, 1997; LIMA, 2002). 1.2 Intumescimento dos ramos da videira (Grapevine corky bark) O agente etiológico do intumescimento dos ramos da videira é denominado vírus B da videira (Grapevine virus B) (GVB), e está especificamente associado ao intumescimento dos ramos (KUHN; FAJARDO, 2013). O vírus é transmitido por material vegetativo, seja pela multiplicação por estacas ou gemas, como por enxertia. A dispersão do intumescimento dos ramos foi reportada em Israel e México, associado a um possível inseto vetor. Posteriormente, foi realizada a transmissão 16 experimental do GVB por cochonilhas das espécies Planococcus ficus, Planococcus citri, Pseudococcus affins e Pseudococcus longispinus (KUHN; FAJARDO, 2013). Os sintomas são facilmente observados nas cultivares americanas (Vitis labrusca), como Isabel, Niágara Rosada e Niágara Branca, caracterizados pelo intumescimento dos entrenós do ramo do ano (Figura 2A), com fendilhamento longitudinal do tecido afetado. Em algumas cultivares pode ser observado o avermelhamento das folhas, abrangendo toda a área foliar, inclusive os tecidos ao longo das nervuras (Figura 3). Outro sintoma associado à presença do vírus é o engrossamento na região da enxertia (Figura 2B) (KUHN; FAJARDO, 2013). Figura 2. Intumescimento dos ramos na cultivar. Isabel (ramo infectado evidenciado pela seta) (A); Região da enxertia de uma planta infectada com o intumscimento dos ramos (B). Fotos por Gilmar Barcelos Kuhn, Embrapa Uva e Vinho. Disponível em , acessado em 15 de Fevereiro de 2014. Figura 3. Planta da cultivar Petit Syrah sem a doença do intumescimento dos ramos (A); Planta da cultivar Petit Syrah com avermelhamento das folhas, quando afetada pela doença do intumescimento dos ramos (B). Fonte: Embrapa Uva e Vinho. Disponível em , acessado em 15 de Fevereiro de 2014. 17 1.3 Acanaladura do lenho de kober ("Kober stem grooving") Esta doença foi descrita pela primeira vez na Itália, com o nome de “legno riccio”, também conhecida como “stem-pitting” e “wood-pitting” (KUHN; FAJARDO, 2013). O Grapevine virus A (GVA) é transmissível para hospedeiros herbáceos (Chenopodium quinoa e Nicotiana spp.). A disseminação das caneluras do tronco ocorre por material vegetativo contaminado e a transmissão por enxertia. A transmissão entre videiras ou para hospedeiros herbáceos pelas conchonilhas das espécies Pseudococcus longispinus, Pseudococcus affins, Planococcus citri e Planococcus ficus foi comprovada, havendo ainda um relato de transmissão Neopulvinaria innumerabilis (KUHN; FAJARDO, 2013). Nos sintomas da doença em cultivares sensíveis, verifica-se a formação de reentrâncias longitudinais (caneluras), que prejudicam a formação dos vasos condutores de seiva. A casca do tronco é mais grossa e de aspecto corticento, podendo também ocorrer na região da enxertia uma diferença de diâmetro entre o enxerto e o porta-enxerto (Figura 4). As folhas de algumas cultivares apresentam um avermelhamento em plantas muito afetadas, em função da formação deficiente dos vasos condutores na região afetada (Figura 5) (KUHN; FAJARDO, 2013). Figura 4. A: Caneluras do tronco após a retirada da casca (esquerda) e com casca (direita), apresentando alterações. B: Corte transversal do tronco exibindo reentrâncias típicas das caneluras. Fotos por Gilmar Barcelos Kuhn, disponível em < http://www.cnpuv.embrapa.br/tecnologias/uzum/v_canel_tronco.html>, acessado em 15 de Fevereiro de 2014. 18 Figura 5. Aparência da copa de vinífera tinta infectada (direita), ao lado de planta sadia (esquerda) no outono. Foto por Gilmar Barcelo Kuhn, disponível em , acessado em 15 de Fevereiro de 2014. 1.4 Organização do genoma viral O GVA e GVB pertencem à família Betaflexiviridae, gênero Vitivirus (CARSTENS, 2010), e são restritos ao floema de sua única hospedeira natural, a videira (ADAMS et al., 2004; FAUQUET et al., 2005). Os vírions são filamentos flexuosos de 725 a 825 x 12 nm de tamanho, possuem uma única molécula de RNA de polaridade positiva de aproximadamente 7.6 kb, possui cap 5’ e é poliadenilada na região 3’ terminal (ADAMS et al., 2004; FAUQUET et al., 2005). Os genomas contêm cinco ORFs ligeiramente sobrepostas (Figura 6). As regiões 5’ do GVA e GVB iniciam-se com uma UTR de 47-86 nucleotídeos rica em A/T (60-68%). Além da proteína de 21.5 kDa, codificada pela ORF 4, o genoma viral expressa as proteínas não-estruturais. A replicação ocorre no citoplasma, possivelmente em associação com vesículas membranosas. A estratégia de replicação do GVA engloba a produção de conjuntos de sgRNAs, que servem para a expressão de todas as ORFs, exceto para a ORF5, que pode ser expressa via um mRNA bi ou policistrônico. A geração destes sgRNAs parece ser controlada por elementos internos cis-acting (FAUQUET et al., 2005). Os capsídeos são compostos de um único polipeptídeo de 18 a 21.5 kDa. As proteínas não estruturais são: 1) um polipeptídeo de 194 kDa, com motivos conservados de proteínas relacionadas à replicação (Mtr, Hel, RdRp); 2) um polipeptídeo de 19-20 kDa de função desconhecida, com homologia de sequência não significante para as proteínas conhecidas; 3) 19 um polipeptídeo de 31-36.5 kDa (MP, suposta proteína do movimento; 4) um peptídeo de 10 a 14 kDa, com propriedades de ligação ao RNA (ADAMS et al., 2004; FAUQUET et al., 2005). Figura 6. Organização e expressão do genoma da espécie-tipo do gênero Vitivirus (Grapevine virus A) mostrando relativa posição das ORFs, seus produtos de expressão, e conjuntos de sgRNA. Mtr: metiltransferase; Hel: helicase; RdRp: RNA polimerase dependente de RNA; 20k: proteína de aproximadamente 20 kDa de função desconhecida; MP: suposta proteína do movimento; CP: proteína capsidial; NB: proteína com propriedade de ligação ao ácido nucleio viral. Fonte: ViralZone Expasy, disponível em < http://viralzone.expasy.org/all_by_species/270.html>, acessado em 15 de Fevereiro de 2014. 1.5 Funções das proteínas capsidiais de vírus de plantas As proteínas capsidiais (CPs) de vírus de plantas são definidas pelos seus papéis estruturais na encapsidação. Entretanto, a encapsidação é somente uma das características de um conjunto de funções e papéis ecológicos desempenhados durante a infecção e disseminação viral (CALLAWAY, 2001; BOL, 2008). Para a maioria dos vírus de plantas, as proteínas capsidiais também desempenham um papel importante no movimento do vírus através de uma planta infectada, via movimento sistêmico (folha-a-folha via vasculatura) ou ambos movimentos célula-a-célula e sistêmico. (CARRINGTON et al., 1996; GHOSHROY, et al., 1997; LAZAROWITZ; BEACHY, 1999). Poucos vírus de RNA não requerem a proteína capsidial para infecção eficiente de uma planta hospedeira. Por exemplo os Umbravírus, nem mesmo codificam uma CP, e são capazes de infectar sistemicamente (RYABOV et al., 1998; RYABOV et al., 1999). 20 Alguns vírus de plantas adaptaram suas CPs para o transporte via vetores biológicos, incluindo artrópodes, nemátodos e fungos (GRAY, 1996). Outros vírus, podem ter sido vírus de artrópodes e, então, adaptaram suas CPs e outros genes para o transporte e propagação entre plantas (CALLAWAY, 20001). Em outros vírus, por exemplo os membros dos gêneros Alfamovirus e Ilarvirus (família Bromoviridae), a CP possui um papel adicional, denominado ativação genômica. O RNA genômico não é infeccioso, a menos que algumas CPs ou um transcrito subgenômico da CP são adicionados ao inóculo (BOL; VAN VLOTEN-DOTING; JASPARS, 1971; JASPARS,1985). Trabalhos envolvendo as funções das proteínas capsidiais dos vírus Grapevine virus A e Grapevine virus B, são escassos. Galiakparov e colaboradores (2003), com o objetivo de conduzir uma análise funcional do genoma do Grapevine virus A (GVA) (espécie-tipo do gênero Vitivirus, família Alphaflexiviridae), inseriram mutações em todas as ORFs, e estudaram os efeitos na replicação viral, expressão gênica, sintomas e movimento viral. Consequentemente, concluiu-se que a proteína capsidial, além da proteína do movimento (MP), é requerida para o movimento do vírus célula-a-célula, porém, não é requerida para a replicação do GVA. 1.6 Relevância e Justificativa As proteínas capsidiais (CPs) de vírus de plantas, além do precesso de encapsidação, podem desempenhar um conjunto de funções estruturais e papéis ecológicos durante a infecção e disseminação viral. Sabe-se que algumas CPs operam em praticamente todo aspecto da multiplicação e disseminação viral, incluindo assistência na replicação do ácido nucléico viral, movimento célula-a-célula e a longas distãncias, e transporte de plantas infectadas para as não infectadas via vetores biológicos. De acordo com Galiakparov (2003), as proteínas capsidiais do Grapevine virus A (GVA) e Grapevine virus B (GVB), além de desempenhar a função de encapsidação, é requerida para o movimento do vírus célula-a-célula, mas não é requerida para a replicação viral. Entretanto, o mecanismo de polimerização das proteínas capsidiais e, também, sua participação no movimento do vírus célula-a-célula é desconhecida. Considerando a relevância das proteínas capsidiais em diversas funções, e a ausência de dados estruturais das CPs do GVA e GVB na literatura, torna-se importante também, 21 elucidar as propriedades físico-químicas e estruturais das proteínas. Para tal finalidade, é necessário a elaboração de um de um protocolo de expressão para a obtenção de grandes quantidades de proteínas capsidiais, com alto grau de pureza e solubilidade, pois uma concentração muito baixa de vírus é obtida quando purificados a partir de plantas infectadas. Entretanto, devido ao vírus ser filamentoso e flexuoso, de aproximadamente 700 nm, torna-se inviável a sua utilização em alguns experimentos, como, por exemplo, nos ensaios de cristalização. Os vírus estão cada vez mais sendo usados na engenharia e nanotecnologia, como ferramentas e blocos de construção para a eletrônica, química e ciências biomédicas (SINGH; GONZALEZ; MANCHESTER, 2006; YOUNG et al, 2008; SOTO; RATNA, 2010). Por exemplo o sistema de expressão da CP do vírus filamentoso flexuoso Papaya mosaic virus, que foi utilizado para a engenharia de nanopartículas quiméricas recombinantes, e podem ser utilizados como adjuvante (DENIS et al., 2008, SAVARD et al., 2011) ou como plataforma de vacinas (DENIS et al., 2007, LACASSE et al., 2008). As nanopartículas parecem ser percebidas pelo sistema imune inato, sendo assim, excelentes moléculas imuno-modulatórias para melhorar a vacina da gripe sazonal (SAVARD et al., 2011) ou condidato à vacina da febre tifóide (ACOSTA-RAMIREZ et al., 2008). Assim, levando em consideração a ampla gama de funções desempenhadas pelas CPs, juntamente com um vasto campo de aplicações, é de grande importância elucidar as propriedades físico-químicas e estruturais das proteínas capsidiais. 22 2. Objetivo geral Este trabalho teve como objetivo principal a expressão, purificação e a caracterização estrutural in silico das proteínas capsidiais do Grapevine virus A e B. 2.1 Objetivos específicos  Caracterizar as proteínas capsidiais através da técnica de dicroísmo circular e espalhamento dinâmico de luz;  Caracterizar as proteínas capsidiais através das ténicas de threading e ab initio, utilizando os programas I-Tasser, Quark e Rosetta;  Conduzir ensaios preliminares de cristalização. 23 3. Materiais e Métodos 3.1 Plasmídeos contendo as ORFs codificadoras das proteínas capsidiais Foi utilizado o plasmídeo pET28a (Novagen) contendo os genes das proteínas capsidiais do Grapevine virus B e Grapevine virus A, cedidos pelo Prof. Dr. José Osmar Gaspar (Universidade Estadual Paulista Júlio de Mesquita Filho, campus de São José do Rio Preto), previamente sequenciado, proveniente de estudos anteriores (MOREIRA et al., 2004a; MOREIRA et al, 2004b). As ORFs clonadas no vetor foram inseridas utilizando-se as enzimas de restrição BamHI e HindIII. 3.2 Linhagem de bactéria utilizada para expressão das proteínas A E. coli BL21-CodonPlus-RIL (Novagen), possui cópias extras de genes de tRNA de argU, ileY, leuW. Esses genes codificam tRNAs, que reconhecem códons para arginina (AGA e AGG), isoleucina (AUA) e para leuceina (CUA), respectivamente. Esses tRNAs, frequentemente restringem a tradução heteróloga de proteínas de organismos que possuem genomas ricos em AT. Essa linhagem, tem disponível estes tRNAs, permitindo alto nível de expressão de proteínas, que são fracamente expressas em linhagens convencionais de E. coli BL21. 3.3 Transformação dos vetores em células competentes O vetor recombinante foi transformado em E. coli, linhagem TOP 10, para prograpação do plasmídeo, e BL21-RIL para expressão da proteína, utilizando-se 50L de células competentes e 100 ng do vetor clonado. Essa mistura foi incubada no gelo durante 30 minutos e, então, submetida ao choque térmico, a 42 ºC, por 30 segundos e, em seguida, incubada durante 2 minutos no gelo. Após o choque térmico, foram adicionados 250 L de meio líquido SOC (meio SOB + 200 mM de glicose) e as bactérias foram submetidas à regeneração (1 hora a 37 ºC, com agitação a 250 rpm). Posteriormente, as bactérias foram plaqueadas em meio sólido seletivo (LB + kanamicina 50 g/mL), e as colônias foram testadas para comprovar a existência do inserto através da técnica da reação em cadeia da polimerase (PCR). As colônias que apresentaram o inserto foram inoculadas em tubos 24 contendo 5 mL de meio líquido seletivo (LB + 50 g/ml de Kanamicina), sob agitação e aeração constantes a 37 ºC, para posterior extração do DNA plasmidial. 3.4 Confecção de oligonucleotídeos para adicionar o sítio de clivagem para a TEV protease Novos oligonucleotídeos forward foram desenhados para adicionar o sítio de clivagem para a TEV (Tobacco Etch Virus) protease entre as proteínas-alvo e a cauda de histidina, com o objetivo de removê-la após a purificação. Foi adicionado aos oligonucleotídeos do GVA e GVB, a sequência do sítio de clivagem da TEV (“GGT GAA AAT TTA TAT TTT CAA”) e uma glicina (“GGT”) entre a proteína alvo e o sítio de clivagem para conferir mobilidade e manter o sítio exposto, com o objetivo de aumentar a eficiência da enzima. O sítio ótimo de reconhecimento para esta enzima é a sequência Glu-Asn-Leu-Tyr-Phe-Gln-(Gly/Ser) (ENLYFQ(G/S)) e a clivagem ocorre entre os resídos Gln e Gly/Ser. Os oligonucleotídeos utilizados na amplificação podem ser visualizados no quadro 1 e o esquema da construção das proteínas capsidiais na figura 7. 25 Quadro 1. Oligonucleotídeos confeccionados utilizados na reação em cadeia da polimerase. Sítio de clivagem para a BamHI (vermelho), sítio de clivagem para a TEV protease (verde) e o aminoácido glicina (azul). Proteína capsidial do GVA Oligonucleotídeo forward – GVA fwd Oligonucleotídeo reverse – GVA rev Proteína capsidial do GVB Oligonucleotídeo forward – GVB fwd Oligonucleotídeo reverse – GVB rev Figura 7. Esquema da construção das proteínas capsidiais mostrando uma cauda de histidina N-terminal, sítio de clivagem para a TEV protease (em preto), o aminoácido glicina, e a proteína alvo (CP) (do aminoácido 2 ao 198 para GVAcp e do 2 ao 197 para GVBcp). ATA GAA TCC GGT GAA AAT TTA TAT TTT CAA GGT GCA CAC TAC GCC AAG AGG BamHI TEV protease Gly ATA AAG CTT CTA TAT CTC GAC AGC CTG HindIII ATA GGA TCC GGT GAA AAT TTA TAT TTT CAA GGT GAA AAT ATA TCC CGG ATG BamHI TEV protease Gly TAT AAG CTT CTA TAT CTC GAC AGA CTG HindIII 26 3.5 Reação em cadeia da Polimerase (PCR) As ORFs codificadoras das proteínas capsidiais, dos resíduos de aminoácidos 2 ao 198 (GVAcp) e 2 ao 197 (GVBcp), contendo sítios de restrição para as enzimas BamHI e HindIII, e sítio declivagem para a TEV protease (utilizada para a remoção da cauda de histidina), foram amplificadas utilizando a Taq Polimerase (Fermentas), de acordo com as condições recomendadas pelo fabricante, e adaptada para as temperaturas de anelamento dos oligonucleotídeos. Posteriormente, os produtos da PCR de 633 pb (GVAcp) e 630 pb (GVBcp), foram analisados em gel de agarose a 1%, corados com brometo de etídio, visualizando-se sob luz ultravioleta. O programa utilizado para a amplificação e as concentrações finais da reação de PCR, podem ser visualizadas na figura 8 e quadro 2, respectivamente. Figura 8. Ciclagem da temperatura utilizada na amplificação dos insertos. Inicialmente, o DNA foi desnaturado por 5 minutos a 95 ºC, posteriormente a amplificação foi realizada em 30 ciclos: desnaturação a 95 ºC por 1 minuto, anelamento dos primers a 60 ºC por 30 segundos e extensão a 72 ºC por 1 minuto. Ao final dos 30 ciclos, a amostra foi submetida a uma extensão adicional a 72 ºC por 10 minutos e, por fim, foi resfriada a 4 ºC até ser utilizada. 27 Quadro 2. Concentração final dos reagentes utilizados na amplificação dos insertos pela reação em cadeia da polimerase. Reagentes Concentração final 10x Taq Buffer dNTPs 0.2 mM Forward primer 0.2 µM Reverse primer 0.2 µM MgCl2 4 mM DNA 100 ng Taq polimerase 1.25 unidades Água q.s.p. 50 µl 50 µl 3.6 Corte enzimático Os fragmentos amplificados e o vetor pET28a foram digeridos, utilizando as enzima de restrição BamHI e HindIII (New England BioLabs). Primeiramente, foi realizada uma digestão utilizando a enzima HindIII, por 2 horas, a 37 ºC e inativada a 65 ºC, durante 20 minutos. Posteriormente, foi adicionado a enzima BamHI, as condições ideais para a sua atividade foram ajustadas, e a reação foi incubada por mais 2 horas, a 37 ºC. 3.7 Purificação dos vetores e dos insertos após o corte enzimático Os fragmentos e vetor pET28a, cortados enzimaticamente, foram submetidos a eletroforese em gel de agarose a 1%, corados com brometo de etídio e visualizados sob luz ultravioleta. A banda referente ao vetor e o fragmento foram excisados do gel e purificados utilizando o kit MinElute Gel Extraction Kit (Qiagen), seguindo as orientações do fabricante. 3.8 Reação de ligação dos insertos nos vetores Após a purificação do plasmídeo digerido, foi utilizada a T4 DNA Ligase (Fermentas), seguindo as orientações do fabricante. A reação foi incubada a 16 ºC, durante 16 horas. Para 28 tal reação, a proporção de 3:1 (inserto/vetor) usada foi calculada de acordo com a equação sugerida pelo fabricante: 𝑰 = 𝒕𝑰 𝒙 𝑷 𝒕𝑽 I = inserto em ng tI = tamanho do inserto em pb P = plasmídeo linearizado (100 ng) tV = tamanho do vetor em pb 3.9 Extração dos plasmídeos recombinantes Os plasmídeos propagados em E. coli (linhagem TOP 10), foram extraídos utilizando- se o kit de extraçao de plasmídeos GeneJet Plasmid MiniPrep kit, a partir de 5 mL de cultura de bactérias cultivadas durante 16 horas, seguindo-se as recomendações do fabricante. No passo final, o plasmídeo foi eluído em 50 uL de tampão TE (10 mM Tris pH 8.0, 1 mM EDTA) e estocado a -20 ºC. 3.10 Transformação do plasmídeo recombinante em células de linhagem de expressão Após a propagação dos plasmídeos recombinantes em E. coli (TOP 10), os plasmídeos foram extraídos, purificados e transformados em E. coli BL21 (DE3) CodonPlus-RIL, de acordo com o protocolo descrito no item 3.3. 3.11 Expressão e purificação da TEV protease O plasmídeo pRK793 foi cedido pelo Prof. Dr. Christian Betzel (Universität Hamburg, Alemanha) e foi utilizado para a produção da TEV protease mutante S219V, conduzida em nosso laboratório. O plasmídeo foi transformado em BL21 CodonPlus-RIL, a protease foi expressa e purificada de acordo com o protocolo descrito por Tropeae, Cherry e Waugh (2009). 29 3.12 Testes de expressão das proteínas capsidiais As colônias positivas selecionadas foram inoculadas em meio LB, incubadas durante 16 horas, a 30 ºC, com os antibióticos de seleção kanamicina e cloranfenicol (concentração final de 50 µg/mL cada), com agitação de 200 rpm. Posteriormente, vinte mililitros do pré- inóculo foi utilizado para inocular 2 L de meio de cultura Luria Bertani, contendo a mesma concentração final de antibióticos de seleção, que foi incubado a 30 ºC, a 200 rpm. Posteriormente, a temperatura foi abaixada até que o meio de cultura atingisse 18 ºC. A expressão da proteína foi induzida na fase logarítimica (DO600nm 0,4) do crescimento bacteriano, através da adição de 0,2 mM de IPTG (isopropil-β-tiogalactopiranosídeo), a 18 ºC, durante 16 horas. Também, foi utilizado o meio de cultura autoindutivo descrito por Studier (2005), a 18º C. Foi utilizado o meio ZYM-5052, que consiste em triptona e extrato de levedura (ZY), M (25 mM Na2HPO4, 25 mM KH2PO4, 50 mM NH4Cl, 5 mM Na2SO4, 2mM MgSO4) e 5052 ( 0,5% glicerol, 0,05% de glicose e 0,2% de α-lactose). Esta técnica permite uma varredura eficiente de muitos clones em paralelo para expressão e solubilidade, a medida que as culturas têm que ser inoculadas e crescer até a saturação, tendo como produto final muito mais proteínas que a obtida pela indução convencional com IPTG. Concomitantemente, foi utilizado o método descrito por Oganesyan et al. (2007), a 18 ºC, que consiste na adição de 0,5 M de NaCl ou Sorbitol ao meio de cultura Luria Bertani, acrescidos de 1 mM de Betaína. Segundo o autor, as bactérias adaptam à alta pressão osmótica externa, acumulando pequenos compostos orgânicos conhecidos como osmólitos. Estes osmólitos, agem como chaperonas químicas, aumentando a estabilidade de proteínas nativas e, possivelmente, ajudando no enovelamento de polipetídeos não enovelados. Além disso, a exposição das bactérias ao choque térmico dispara a expressão de proteínas heat- shock, muitas das quais agem como cheperonas e contribuem para o enovelamento, e rompem agregados de proteínas ou previnem a agregação. 30 3.13 Purificação das proteínas capsidiais sob condição desnaturante Sob condições desnaturantes, a proteína foi solubilizada do corpo de inclusão (expressa a 37 ºC, por 4 horas), utilizando o seguinte tampão: 8 M Uréia, 100 mM NaH2PO4, 10 mM de Tris-HCl, pH 8.0, 10mM 2-mercaptoetanol, durante duas horas a temperatura ambiente. A resina de níquel (Ni-NTA) (GE Healthcare Life Sciences) foi equilibrada utilizando o mesmo tampão de solubilização e a solução foi centrifugada a 34.540 x g, por 1 hora e o sobrenadante passado na coluna. A lavagem da resina para a remoção de contaminantes adsorvidos inespecificamente foi realizada utilizando o tampão descrito acima com pH 6.3 e outra lavagem com pH 6.0. As proteínas foram eluídas utilizando o mesmo tampão com pH 5.9. 3.14 Purificação das proteínas capsidiais sob condição nativa Após a expressão das proteínas capsidiais a 18 ºC, as células foram centrifugadas a 6000 x g, durante 10 minutos, a 4 ºC e o sobrenadante foi descartado. O pellet de bactérias foi ressuspendido em PBS 1X e centrifugado novamente por 10 minutos, a 4 ºC, para eliminar restos de meio de cultura. Em seguida, as células foram ressuspendidas em tampão de lise (20 mM de fosfato de sódio, 500 mM de NaCl, 40 mM de imidazol, 10% de glicerol, 1 mM de PMSF, pH 7.4) e foram intermitentemente sonicadas no gelo durante 10 segundos, com 10 segundos de descanso para o resfriamento da amostra. O tempo total de sonicação foi de 2 minutos. O lisado celular foi centrifugado a 34.540 x g, por 1 hora, a 4 ºC, e foi passado na coluna com resina de níquel (Ni-NTA), previamente equilibrada com o tampão de lise para que as proteínas fossem adsorvidas. Após a adsorção, a resina foi lavada utilizando gradiente de imidazol (10 mM a 80 mM) no seguinte tampão: 20 mM NaH2PO4, 500 mM NaCl, 10% glicerol e 1 mM PMSF, pH 7.4, com o objetivo de remover contaminantes adsorvidos inespecificamente. Por fim, as proteínas foram eluídas utilizando tampão de eluição (20 mM fosfato de sódio dibásico, 500 mM NaCl, 250 mM imidazol, 10% glicerol e 1 mM PMSF, pH 7.4). Logo após, utilizando-se o Äkta Purifier e a coluna (HiPrep 26/10), e o tampão da amostra foi trocado para 10 mM Tris HCl pH 7.4, 300 mM de NaCl, a fim de remover o glicerol e o imidazol. Nessa condição, o experimento de clivagem da cauda de histidina foi conduzido, adicionando-se TEV protease à solução de proteínas capsidiais, que posteriormente foi passada na coluna contendo resina de níquel para a remoção da protease e da cauda de histidina. 31 Por último, uma cromatografia de exclusão molecular foi conduzida, com o objetivo de remover proteínas capsidiais agregadas e trocar o tampão da amostra para 10 mM Tris HCl, 50 mM NaCl, utilizando-se a coluna Superdex 75 10/300 GL (GE Healthcare Life Sciences). Este método de purificação se baseia na massa molecular das proteínas, em que as proteínas que possuem maior massa molecular são eluídas primeiro. 3.15 Análise das proteínas purificadas em gel de poliacrilamida (SDS-PAGE) As amostras provenientes das etapas de purificação e do teste de expressão foram analisadas através da eletroforese em gel de poliacrilamida contendo SDS (SDS-PAGE). As proteínas foram desnaturadas por 3 minutos, a 100 °C em tampão de amostra (Tris-HCl 0,125 M, pH 6,8, contendo 4% de SDS, 20% de glicerol, 10% de 2-Mercaptoetanol e 1 mM de azul de bromofenol). As amostras foram centrifugadas por 5 minutos, a 16.000 x g e 10 L do sobrenadante de cada amostra aplicado no gel. Os géis foram fixados e corados em mistura contendo metanol, água, ácido acético (5:4:1) e Coomassie Brilliant Blue G-250 0,25%, durante 1 hora e descorados com metanol e água (1:1), durante 1 hora. 3.16 Western blotting Alíquotas contendo proteína recombinante purificada foram homogeneizadas com tampão de amostra (1:1), aquecidas a 100 ºC, por 5 minutos, para a desnaturação proteíca e aplicadas em gel SDS-PAGE 12%. Após a corrida, as proteínas foram transferidas para a membrana de nitrocelulose, operando sob voltagem constante (100V), durante 1 hora. O tampão de transferência utilizado foi o Tris-Glicina (0,025 M de Tris, 0,192 M de Glicina), contendo 20% de metanol. A membrana foi incubada em tampão de bloqueio (PBS pH 7.4, acrescido de 0,1% de Tween 20 e 10% de BSA). Posteriormente, a membrana foi incubada em tampão de bloqueio contendo anticorpo monoclonal Anti-Polihistidina (Sigma Aldrich) produzido em camundongo, na diluição de 1:1000. Em seguida, a membrana foi lavada três vezes durante 15 minutos com tampão PBS, contendo 0,3% de Tween 20, para a remoção de anticorpos não adsorvidos. Prosseguimos, então, com a incubação da membrana com o anticorpo secundário Anti-Mouse, marcado com peroxidase, na diluição de 1:3000, durante 1 hora em tampão de bloqueio. Após três lavagens com PBS-T para a retirada de anticorpos não adsorvidos, foi adicionado o substrato BCIP/NBT (5-bromo-4chloro-3- indolyl-phosphate/nitro-blue tetrazolium) para a revelação (cor púrpura). 32 3.17 Dicroísmo Circular A espectroscopia de luz polarizada ou dicroísmo circular (CD) é um método analítico amplamente utilizado para auxiliar a biologia estrutural na determinação da composição de estruturas secundárias de proteínas e peptídeos. A origem dos espectros destas macromoléculas na região do ultravioleta próximo (180 a 250 nm) são predominantemente originados por transições eletrônicas n* e * dos grupos amida, os quais são influenciados pela geometria da cadeia peptídica, sendo os espectros, reflexos dos diferentes tipos de estruturas secundárias descritas pelos ângulos diedros  e  (Figura 9A e 9B). Quando uma molécula é opticamente ativa, ela absorve luz circularmente polarizada à direita e à esquerda, com intensidades diferentes. Este efeito é denominado de Dicroísmo Circular (CD). Isto se deve à diferença de índices de refração das duas formas de luz, o que resulta na rotação do plano de polarização da luz. A intensidade e energia dessas transições dependem dos ângulos diedros  e  (i.e., da estrutura secundária). (Figura 9A). O espectro de CD de uma proteína com estrutura em hélice alfa, o acoplamento de éxitons das transições * produzem uma banda positiva em 192 nm (*), negativa em 209 nm (*) e negativa em 222 nm, deslocada para o vermelho (red shifted) (n*). Quando a estrutura secundária é aleatória ou random coil (RC), o espectro de CD apresenta banda positiva em 212 nm (*) e banda negativa em 195 nm (n*). Já no caso da estrutura ser folha beta, o espectro de CD apresenta banda negativa em 218 nm (*) e positiva em 196 nm (n*) (Figura 9B). 33 Figura 9. (A) Diagrama de ligação peptídica mostrando a orientação da transições n* e * (setas grosas). (B) Espectros padrões de CD correspondes a configurações hélice alfa (em preto), folha beta (em verde) e estrutura aleatória ou random coil (em vermelho). Como consequência destas propriedades dos espectros, foram desevolvidos métodos de análises dos espectros de CD, levando em consideração as contribuições espectrais dos diferentes tipos de estruturas secundárias presentes nas proteínas fornecendo, desta forma, informações sobre a estrutura secundária das mesmas. Os espectros de referência utilizando corrrespondentes aos espectos de estruturas puramente compostas de alfa hélice, folha beta, estrutura aleatória ou derivados de proteínas cuja estrutura terciaria é conhecida (proteínas cujas estruturas cristalinas foram determinadas), foram desenvolvidos um grande número de algoritmos empíricos que assumem a independência linear na aditividade dos espectros primários de estruturas secundárias no espectro final da proteina (GREENFIELD, 1969; BRAHMS, 1980; JOHNSON, 1999; SREERAMA, 2000; LEES, 2006). O princípio básico envolvido na análise dos espectros de CD de proteínas, e utilizado no cálculo da fração de estruturas secundárias, é que o espectro de CD da proteina, , pode ser expresso como uma combinação linear de espectros puros de estruturas secundárias: 190 200 210 220 230 240 250 -40000 -20000 0 20000 40000 60000 80000 n-->  -->  n-->  -->  n--> -->  -->   (nm) alfa RC beta A B 34    ,kkf Onde fk é a fração de estrutura secundária e k, é o espectro padrão da estrutura secundária k. Os espectros de Dicroísmo Circular (CD) foram obtidos com um espectropolarímetro Jasco 710, com cubeta de 1 cm de caminho óptico, termoestatizada a 25 ºC, utilizando uma amostra de concentração 0,5 mg/mL em tampão 10 mM de Fosfato de sódio pH 7.4, 100 mM de NaCl. Cada espectro representa a média de 5 varreduras realizadas entre 190 e 250 nm, com passos de 0,2 nm, na velocidade de 50 nm/mim, e largura de banda de 1 nm. A linha de base foi corrigida subtraindo o espectro da solução tampão obtido em condições idênticas. As intensidades dos espectros  em mDeg. foram convertidos para unidades de elipticidade [Φ] em deg cm2 decagrame-1. A fração de estruturas secundárias foi analisada utilizando o programa de deconvolução espectral CDPro (SREERAMA & WOODY, 2000). 3.18 Espalhamento dinâmico de luz (DLS) O aparelho Spectroscatter 201 (Molecular Dimensions, UK) é um instrumento que pode ser usado para determinar o perfil da distribuição do tamanho de partículas pequenas em suspensão ou polímeros em solução. Além disso, sabe-se que o sucesso da cristalização depende de vários fatores, entre eles, uma solução protéica homogênea. Dessa forma, a técnica de espalhamento dinâmico de luz também pode ser empregada para a seleção da solução protéica monodispersa candidata à cristalização. Espalhamento dinâmico de luz, também conhecido como espectroscopia de correlação de fóton ou espectroscopia de espalhamento de luz quasi-elástica, é a técnica para medir o coeficiente de difusão translacional de uma macromolécula através do movimento aleatório (Browniano) que as moléculas sofrem na solução (FERRÉ-D’ AMARÉ et al, 1997). O espalhamento da luz monocromática, ocasionado pelo movimento das partículas, mostrará a flutuação de intensidades que corresponde às partículas em movimento. Assim, o conhecimento dessas intensidades, permite obter informações a respeito do coeficiente de difusão e dimensões das macromoléculas (SANTOS; CASTANHO, 1996). A técnica de DLS permite determinar a função de autocorrelação dos fótons. A função de autocorrelação de um sinal para a intensidade de luz espalhada é utilizada para descrever a correlação entre a intensidade medida no tempo t = 0 e a mesma algum tempo após. A análise 35 do decaimento da função de autocorrelação do sinal de luz espalhada pode dar informação quantitativa sobre o comportamento das moléculas em solução. Cada população monodispersa de moléculas produz uma única curva de decaimento exponencial e uma mistura de mais de uma população de partículas produzem uma soma de exponenciais. Nos experimentos de DLS, o raio (R) da partícula é inferido a partir do coeficiente de difusão (D) e pela equação de Stokes Einstein: 𝑫 = 𝒌𝑻/ 𝟔𝝅𝜼𝒓𝒉 onde: rh é o raio hidrodinâmico, k é a constante de Boltzmann, T é a temperatura em Kelvin e η é a viscosidade do solvente. Na prática, as macromoléculas em solução não são esféricas e o raio calculado da forma citada acima, a partir do coeficiente de difusão das partículas, oferece uma estimativa do tamanho aparente da partícula hidratada/solvatada designada pela terminologia “raio hidrodinâmico” (SANTOS; CASTANHO, 1996). 3.19 Predição da estrutura tridimensional das proteínas capsidiais Foram realizadas buscas por homologia e similaridade de sequência primária (BLAST), utilizando o banco de dados PDB. Concomitantemente, foram utilizados os programas de predição de estrutura I-Tasser, Quark e Rosetta. Para a validação dos modelos, foram utilizados os programas RAMPAGE (LOVELL et al, 2002), ProSA-web (SIPPL, 1993; WIEDERSTEIN & SIPPL, 2007), TM-align (ZHANG & SKOLNICK, 2005) e o programa PyMol (The PyMOL Molecular Graphics System, Version 1.7.1.0, Schrödinger, LLC.) utilizado para a vizualização e análises gráficas das estruturas das proteínas. O I-Tasser (Iterative Threading ASSEmbly Refinement) (ROY et al., 2010; ZHANG, 2008) é uma plataforma para a predição de estrutura e função de proteínas. A predição de estrutura tridimensional é realizada utilizando-se a abordagem de threading. Todo o processo é realizado em três etapas: Primeiramente, a partir de uma sequência de aminoácidos, o servidor tenta recuperar templates de proteína de enovelamentos similares (ou estruturas secundárias super- conservadas) da biblioteca PDB pelo servidor LOMETS, uma abordagem meta-threading localmente instalada. 36 No Segundo passo, os fragmentos excisados dos templates PDB são remontados em modelos completos por simulações Monte Carlo com regiões desalinhadas (principalmente loops) construidas por modelagem ab initio. Em casos onde nenhum template apropriado é identificado por LOMETS, I-Tasser construirá toda estrutura por modelagem ab initio. Os estados de baixa energia livre são identificados pelo SPICKER e os centróides desses “clusters” são selecionados para a próxima etapa. No terceito passo, a simulação de montagem de fragmento é realizada novamente começando pelos centróides dos “clusters”, onde as restrições espaciais coletadas por ambos os templates LOMETS e estruturas PDB pelo TM-align são usados para guiar as simulações. O Propósito da segunda iteração é remover o choque estérico assim como refinar a topologia global dos centróides dos “clusters”. As estruturas geradas na segunda simulação são então agrupadas e as com menor energia são selecionadas. Os modelos atômicos completos finais são obtidos pelo REMO que constrói os detalhes atômicos das estruturas selecionadas através da otimização da energia das ligações de hidrogênio. Os modelos gerados pelo I-Tasser foram selecionados baseado no C-score (pontuação de confidência) para estimar a qualidade dos modelos. O C-score está tipicamente na gama de -5.2, onde pontuações mais altas significam um modelo com alta confidência. Para selecionar os 10 melhores moldes usados na predição dos modelos pelo I-Tasser, é utilizado o Z-score, que é o número de desvios padrão. Assim, um Z-score acima de 1 representa um bom alinhamento (dado acima da média). QUARK é um método de predição de estrutura ab initio baseado na web que foca no design do campo de força e no mecanismo de busca que usa um modelo semi reduzido para representar resíduos de proteínas pelo total de átomos da cadeia principal e o centro de massa da cadeia lateral. Inicialmente, QUARK prediz uma ampla gama de características estruturais cuidadosamente selecionadas usando rede neural para a sequência de entrada. Baseado na idéia do Rosetta e I-Tasser, o enovelamento global é criado por simulações Monte Carlo montando fragmentos pequenos gerados por threading através das bibliotecas de templates. Entretanto, os fragmentos possuem constantemente múltiplos tamanhos que variam de 1 a 20 resíduos. O método de predição QUARK ab initio pode ser dividido em três etapas principais: 1) Predições de características múltiplas e geração de fragmento a partir de uma sequência de entrada; 2) Construções estruturais utilizando-se simulaçoes Monte Carlo baseado no modelo de proteína semi reduzido; 3) Agrupamento de estruturas e refinamento atômico completo (ZHANG; XU, 2012). Como resultado, o programa utiliza o TM-align (item 3.20) para validar os modelos gerados. 37 O programa Rosetta utiliza um processo automático de predição de estrutura que constrói um modelo para uma sequência de proteína inteira se a homologia de sequência para proteínas de estrutura conhecida está disponível ou não. A sequência é quebrada em domínios, e modelos para domínios com homologia de sequência para proteínas de estrutura conhecida, são gerados usando modelagem comparativa, onde modelos para domínios sem tal homologia, são construídos utilizando-se o método ab initio. Rosetta gera bibliotecas de fragmentos de três e nove resíduos que correspondem a conformações locais vistas no PDB, e então monta os modelos por inserção de fragmento usando uma função de pontuação que favorece características de proteínas. As estruturas geradas são agrupadas baseado no RMSD do carbono alfa. Então, foram gerados 10.000 modelos, e o RMSD utilizado foi de 15 Å, pois com um “cutoff” menor, não foi observado a formação de clusters de estruturas. O modelo de menor energia do cluster contendo o maior número de modelos foi selecionado (KIM; CHIVIAN; BAKER, 2004; KAUFMANN, 2010). O RMSD ou desvio quadrático médio, é frequentemente usado para medir diferenças entre valores preditos por um modelo ou um valor observado. Basicamente, representa a amostra do desvião padrão das diferênças entre valores preditos e valores observados. 3.20 Validação dos modelos gerados O ProSA-web fornece uma interface para o programa ProSA que é frequentemente empregado na validação de estrutura de proteínas. O programa calcula uma qualidade global para uma estrutura específica selecionada. Se a pontuação está fora da gama característica de proteínas nativas, a estrutura provavelmente contém erros. Um Z-score também é retornado, e indica a qualidade global do modelo. Esta pontuação é plotada juntamente com os Z-scores de todas as cadeias de proteínas determinadas experimentalmente no PDB (raios-X, NMR), e são distinguidas por diferentes cores. Esta plotagem pode ser usada para checar se o Z-score da estrutura selecionada está dentro da gama de pontuações tipicamente encontrada para proteínas nativas de tamanhos similares (SIPPL, 1993; WIEDERSTEIN & SIPPL, 2007). O TM-align é um algorítimo altamente otimizado para comparação e alinhamento de estrutura de proteína. Para duas estruturas de equivalência desconhecida, o programa, primeiramente, gera um alinhamento resíduo a resíduo baseado na similaridade estrutural. Uma sobreposição das duas estruturas e o valor do TM-score que mede a semelhança estrutural serão retornados. Em geral, um TM-score menor que 0.2 indica que não há 38 semelhança entre as estruturas; um TM-score maior que 0.5 significa que as estruturas compartilham o mesmo enovelamento SCOP/CATH (ZHANG & SKOLNICK, 2005). O RAMPAGE (LOVELL et al, 2002) é um programa para gerar gráficos de Ramachandran. Descreve as rotações da cadeia principal de polipeptídeo em torno das ligações entre N-Cα (chamada Phi, φ) e Cα-C (chamada Psi, ψ). O gráfico de ramachandran fornece um modo simples para vizualizar a distribuição da torção dos ângulos de uma estrutura de proteína (RAMACHANDRAN, RAMAKRISHNAN, SASISEKHARAN, 1963). Também fornece uma visão geral dos valores dos ângulos das regiões permitidas e não permitidas, consistindo de um importante indicador da qualidade de estruturas tridimensionais. 3.21 Ensaios de cristalização Todos os métodos de cristalização envolvem uma transição de fase, na qual a proteína que está na solução no início do experimento, posteriormente, sai da solução para formar cristais, quando a solução é trazida para um estado de supersaturação. Uma vez que o núcleo está formado, a concentração de proteína na solução irá diminuir, conduzindo o sistema para a zona metaestável, onde o crescimento do cristal deve ocorrer sem a formação de mais núcleos (BERGFORS, 1999). Na técnica da difusão de vapor, uma mistura de solução de proteína e agentes de cristalização (gota) são colocados em um poço que contém um reservatório com a solução de cristalização em uma maior concentração que a gota. Neste sistema fechado, a água irá difundir por vapor, da gota para a solução do reservatório, aumentando a concentração da proteína e dos agentes de cristalização na gota. Na técnica da gota pendurada, a gota é colocado em uma lamínula siliconizada acima do reservatório. Já na técnica da gota sentada, a gota é colocada em uma plataforma do reservatório, que posteriormente é selado com um adesivo transparente. A priori, utilizamos o kit PCT (Pre-Crystallization Test) para determinar as concentrações otimizadas de proteínas para os screenings de cristalização. Amostras altamente concentradas resultam em precipitados amorfos, enquanto que amostras diluídas produzem gotas transparentes. Precipitados amorfos e gotas transparentes são evitados mudando a concentração de proteína conformemente. Os quatro reagents do kit PCT usados para avaliar a concentração de proteína para os ensaios de cristalização foram: 39 1) Reagente A1: 0.1M de Tris HCl pH 8.5, 2.0M de Sulfato de amônio 2) Reagente B1: 0.1M de Tris HCl pH 8.5, 1.0M de Sulfato de amônio 3) Reagente A2: 0.1M de Tris HCl pH 8.5, 0.2M de Cloreto de magnésio hexahidratado, 30% volume/volume de Polietilenoglicol 4,000 4) Reagente B2: 0.1M de Tris HCl pH 8.5, 0.2M Cloreto de magnésio hexahidratado, 15% volume/volume de Polietilenoglicol 4,000 Os ensaios de cristalização foram conduzidos utilizando-se o método da gota sentada (com o auxílio do robô de cristalização HoneyBee) e o método da gota pendurada, que foi executado manualmente. Os kits comerciais MORPHEUS (Molecular Dimensions), PACT suite II (Qiagen), JSCG+ (Qiagen), foram utilizados nos ensaios conduzidos utilizando-se o método da gota sentada, na proporção de 0,5 µl/0,5 µl e 0,7 µl/0,3 µl (proteína/precipitante). Para os ensaios conduzidos utilizando-se o método da gota pendurada, foram usados os kits de cristalização da Hamptom Research, CrystalScreen I, CrystalScreen II, CrystalScreen Lite, SaltRX I e II e PEG Ion, na proporção de 1 µl/1 µl (proteína/precipitante). 40 4. Resultados 4.1 Expressão e purificação da TEV protease Tradicionalmente, as enzimas comumente usadas para clivar as proteínas de fusão são: Fator Xa, enteroquinase (enteropeptidase) e trombina. Entretanto, tem sido observado que todas essas proteases podem clivar proteínas em outros locais além do sítio alvo designado (CHOI et al., 2001; JENNY; MANN; LUNDBLAD, 2003). A utilização da TEV protease foi adotada pois sua especificidade é muito mais rigorosa que as outras enzimas citadas acima. Além de ser facilmente produzida e purificada em larga escala, a TEV protease possui um perfil de atividade relativamente fixo em valores de pH entre 4 e 9. É cinquenta por cento ativa em 0.5 M de NaCl, assim como na ausência de sal. É maximamente ativa a 34 ºC, porém é aconselhado conduzir a reação de digestão à temperatura ambiente (20 ºC) ou 4 ºC. A atividade da enzima é aproximadamente trê vezes maior a 20 ºC que a 4 ºC (NALLAMSETTY et al., 2004). A enzima possui uma grande tolerância a uma gama de tampões, incluindo fostafo, MES (ácido 2-morfolinoetanosulfónico monoidratado) e acetato, e não é afetada pela adição de glicerol ou sorbitol (até 40%). A enzima é afetada pela adição de alguns detergentes (MOHANTY et al., 2003; LUNDBACK et al., 2008). A TEV protease foi produzida em nosso laboratório, com o objetivo de remover a cauda de histidina das proteínas capsidiais após a purificação, para posteriormente serem utilizadas nos ensaios de cristalização. O resultado da expressão e purificação da TEV protease pode ser visualizado na figura 10. A fim de estabelecermos uma proporção ideal de TEV protease em relação a proteína capsidial para removermos cem por cento da cauda de histidina, realizamos testes de clivagem utilizando uma proporção de 1:100, 1:50 e 1:25 (protease/proteína capsidial). Nas proporções citadas, não foi obtido cem por cento de remoção da cauda de histidina das proteínas (Figura 11), assim passamos a utilizar a proporção de 1:10 (Figura 12). 41 Figura 10. SDS-PAGE 12% mostrando o resultado da purificação da TEV protease. M: marcador de massa molecular; 1 a 5: TEV protease concentrada a 2,9; 2,0; 1,4; 1 e 0,9 mg/mL, respectivamente. Figura 11. Teste de clivagem da cauda de histidina da proteína capsidial do GVA. M: marcador de massa molecular; C: proteína concentrada para aproximadamente 5 mg/mL (controle); 1:100 - proporção de 1:100 utilizada (protease /proteína) na reação de clivagem; 1:50 - proporção de 1:50 utilzada (protease/proteína) na reação de clivagem; 1:25 - proporção de 1:25 utilzada (protease/proteína) na reação de clivagem. Seta vermelha e seta laranja indicam proteína com e sem cauda de histidina após o teste de clivagem, respectivamente. Figura 12. SDS-PAGE 12% mostrando o resultado do experimento de clivagem da cauda de histidina da proteína GVBcp. Utilizando-se a proporção de 1:10 (protease/proteína) foi possível remover cem por cento das caudas de histidina das proteínas. C: GVBcp concentrada para 5 mg/mL usada como controle. 1:10 : proporção de 1:10 utilizada na reação de clivagem. 42 4.2 Resultados da proteína capsidial do GVB 4.2.1 Clonagem da proteína capsidial no vetor pET28a Novos oligonucleotídeos foram desenhados para inserir o sítio de clivagem para a TEV protease na proteína GVB, e o fragmento que seria clonado foi amplificado a partir do vetor pET28a cedido pelo Prof. Dr. José Osmar Gaspar, e analisado por eletroforese em gel de agarose a 1%, corado com brometo de etídio, visualizando sob luz ultravioleta (Figura 13). O produto amplificado foi excisado, extraído do gel e purificado. Figura 13. Gel de agarose a 1% mostrando o resultado da amplificação da ORF que codifica a proteína capsidial do GVB. M: marcador molecular FastRuler Middle Range DNA ladder (Fermentas); 2: banda do produto da PCR amplificado (630 pb), referente à ORF codificadora da proteína capsidial do GVB (contendo cauda de histidina e sítio de clivagem para a TEV protease). Após a amplificação do fragmento, o mesmo e o vetor pET28a foram submetidos ao corte enzimático, utilizando-se as enzimas de restrição BamHI e HindIII. O fragmento foi purificado utilizando o kit PCR Cleanup (Qiagen) e o vetor foi analisado por eletroforese em gel de agarose a 1% (Figura 14), excisado, purificado, e defosforilado utilizando-se a enzima fosfatase alcalina FastAP (Fermentas). 43 Figura 14. Gel de agarose a 1,0% mostrando o corte enzimático do plasmídeo pET28a. 1: pET28a contendo inserto (usado como controle não digerido); 2: pET28a linearizado e digerido (banda mais forte) e o fragmento liberado (banda mais fraca), após o corte enzimático. O fragmento e o vetor linearizado foram purificados após o corte enzimático, quantificados e usados na reação de ligação na proporção de 3:1 (inserto/vetor). O fragmento foi ligado no vetor, utilizando-se a T4 DNA Ligase (Fermentas), a 16 ºC, durante 16 horas. O produto da reação de ligação foi transformado em E. coli DH5α e 100 µl da reação de transformação foi plaqueada em meio de cultura sólido, contendo kanamicina para a seleção do plasmídeo recombinante. Após a incubação das placas a 37 ºC, algumas colônias foram selecionadas, e a técnica da reação em cadeia da polimerase foi conduzida para verificar se elas possuiam os plasmídeos transformados. O produto da PCR foi analisado através da eletroforese em gel de agarose a 1%, corado com brometo de etídio e visualizado sob luz ultravioleta (Figura 15). 44 Figura 15. Gel de agarose a 1,0% mostrando o resultado da PCR utilizada para selecionar as colônias positivas. M: marcador de peso molecular FastRuler Low Range (Fermentas); 5 a 8: colônias positivas para a proteína capsidial do GVB (630 pb). As amostras positivas foram selecionadas, transferidas para 5 mL de meio de cultura líquido LB, contendo kanamicina, e incubadas a 37 ºC, durante 16 horas. O DNA plasmidial foi extraído e utilizado na reação de sequencimento para verificar se o inserto foi ligado em “frame”. Assim que foi constatado que o inserto foi inserido em “frame”, o plasmídeo pET28a contendo a ORF que codifica a proteína capsidial do GVB foi transformado em E. coli BL21(DE3) CodonPlus-RIL. Novamente, algumas colônias foram testadas por PCR para verificar se possuiam os plasmídeos e, posteriormente, uma colônia positiva foi utilizada para produzir estoque de bactérias transformadas e na expressão da proteína capsidial. 4.2.2 Testes de expressão e purificação Os experimentos de expressão e purificação foram realizados e estão apresentados neste tópico em ordem cronológica, de acordo com a necessidade de superar osbtáculos e otimizar os protocolos para a obtenção da GVBcp com alto grau de pureza (acima de 95%, de acordo com a Hampton Research, condição considerada ideal para os ensaios de cristalização) e solubilidade. Na primeira etapa, expressão da GVBcp foi conduzida a 37 ºC, durante 4 horas, em meio de cultura LB, induzida com 1 mM de IPTG. Analisando-se o resultado do SDS-PAGE 12% da purificação da proteína capsidial do GVB (aproximadamente 26 kDa, contendo a cauda de histidina e o sítio de clivagem para a TEV protease), expressa por 4 hora,s a 37 ºC, a proteína não é detectada na fração solúvel (sobrenadante) (Figura 16A, coluna 1) após a lise 45 celular e na purificação sob condição nativa, utilizando resina de níquel (Ni-NTA), estando presente em sua totalidade nos corpos de inclusão. Sendo assim, foi necessário a purificação sob condições desnaturates (Figura 16B) e, posteriormente, foram conduzidos os experimentos de renovelamento. Figura 16. A) SDS-PAGE 12% da purificação da GVBcp expressa a 37 ºC. 0h: fração celular não induzida; 4h: fração celular 4 horas após a indução com IPTG; 1: purificação da fração solúvel (sobrenadante). B) SDS-PAGE 12% GVBcp expressa a 37 ºC e purificada sob condição desnaturante (utilizando 8 M de uréia) para posterior tentativa de renovelamento por diluição. 1 a 7: eluição da proteína usando pH 5.9. Na segunda etapa, após exaustivas tentativas de renovelamento da GVBcp utilizando diversos protocolos, optou-se por tentar obtê-la solúvel e purificá-la sob condição nativa. Assim, para tal finalidade, algumas variáveis foram testadas: temperatura de expressão (37 ºC e 18 ºC), concentrações de IPTG, indução da expressão em diversas densidades ópticas. Além disso, foi utilizado o meio de cultivo autoindutivo (ZYM-5052) e a técnica do choque térmico e osmótico, descrito por Studier (2005) e Oganesyan et al. (2007), respectivamente. Foi observado um aumento significativo na solubilidade da proteína heteróloga, induzindo a expressão a 18 ºC com 0,2 mM de IPTG, densidade ótica (DO600nm 0,4), e agitação constante (200 rpm), durante 16 horas (Figura 17). Da mesma forma, resultados semelhantes foram observados utilizando-se os métodos descritos por Studier (2005) (Figura 18) e Oganesyan e colaboradores (2007) (Figura 19). Dessa forma, a purificação da GVBcp expressa a 18 ºC foi conduzida sob condição nativa, utilizando resina de níquel (Ni-NTA), concentrada para aproximadamente 2 mg/mL 46 (Figura 17), e o experimento de dicroísmo circular foi realizado para verificar se estava enovelada e estimar o conteúdo de estruturas secundárias. Observou-se, também, que as proteínas estocadas na geladeira eram instáveis e precipitavam após alguns dias. Também foi constatado que as mesmas são termoinstáveis e precipitam quando atingem temperatura superior a 18 ºC. Figura 17. SDS-PAGE 12% da GVBcp expressa a 18 ºC, purificada sob condição nativa, dialisada e concentrada para aproximadamente 2 mg/mL. Figura 18. SDS-PAGE 12% da purificação da GVBcp expressa utilizando o meio auto-indutivo (a 18 ºC). 1: Fração insolúvel (corpo de inclusão); 2: Fração solúvel (sobrenadante); 3: Primeira eluição. 47 Figura 19. SDS-PAGE 12% da purificação da GVBcp expressa usando o método de choque osmótico e térmico. 1 e 2: Fração insolúvel (corpo de inclusão) e fração solúvel (sobrenadante), respectivamente.; 3: Primeira eluição; 4: Proteína precipitada durante a diálise gradual. Após o estabelecimento de um protocolo adequado para a expressão e purificação da proteína, ela foi obtida com um alto grau de pureza (superior a 95%, corada com comassie) e concentrada para 7 mg/mL (Figura 20). Imediatamente, após verificarmos que a proteína estava pura, concentrada e estruturada, os ensaios de cristalização foram conduzidos. Figura 20. SDS-PAGE 12% da GVBcp expressa a 18 ºC, purificada sob condição nativa, dialisada e concentrada para 7 mg/mL. Na terceira etapa, a expressão da proteína a 18 ºC foi conduzida, induzida com 0,2 mM de IPTG, DO600nm 0,4, e a purificação foi realizada por cromatografia de afinidade, utilizando resina de níquel, como descrito na etapa anterior. Com a finalidade de se obter a proteína mais estável, a TEV protease foi utilizada para remover a cauda de histidina. 48 Novamente, uma cromatografia por afinidade (resina de níquel) foi utilizada para remover a cauda de histidina clivada e a TEV protease usada na reação de clivagem, pois a enzima também possui cauda de histidina. A reação de clivagem pode ser visualizada na figura 21. Somente após a segunda purificação para a remoção dos produtos da reação de clivagem da cauda de histidina, a proteína capsidial foi concentrada e submetida novamente aos testes de cristalização. Após esta etapa, abservou-se uma melhora na estabilidade da GVBcp, podendo ser estocada por períodos maiores, entretanto, continuava a precipitar-se quando manuseadas em temperaturas superiores a 18 ºC. Figura 21. Gel de poliacrilamida contendo SDS mostrando os resultados da purificação da GVBcp e clivagem da cauda de histidina, utilizando-se a TEV protease na proporção de 1:10. M: marcado de massa molecular (GE Healthcare); P: GVBcp purificada por cromatografia de afinidade (Ni-NTA) usada como controle; C: reação de clivagem (banda superior refere-se à TEV protease e banda inferior refere-se à GVBcp sem cauda de histidina). 4.2.3 Western Blotting Com o objetivo de verificar se a proteína capsidial estava sendo expressa após a indução da expressão, e se a proteína purificada sob condição nativa era a proteína de interesse, realizamos experimentos de western blotting. Para tal finalidade, foram utilizados o extrato total de proteínas a partir da cultura de bactérias (após 4 horas da adição de IPTG) e amostras provenientes da etapa de eluição da purificação das proteínas expressas (a 37 ºC e 18 ºC) sob condição nativa. De acordo com a metodologia descrita no item 3.16, as amostras foram submetidas a SDS-PAGE 12%, transferidas para membrana de nitrocelulose e, posteriormente, incubadas 49 com os anticorpos primário e secundário, Anti-Polihistidina e Anti-Mouse, respectivamente. Após a incubação com a mistura BCIP/NBT, foi observado o aparecimento de uma coloração púrpura nas canaletas onde foram aplicados o extrato total de proteínas (Figura 22B, coluna 4h) e a amostra proveniente da etapa de eluição da purificação sob condição nativa a 18 ºC (Figura 22B, coluna 1). Dessa forma, concluímos que a proteína purificada era a de interesse, uma vez que pode ser detectada após 4 horas da indução com IPTG, também quando expressa a 18 ºC e purificada sob condição nativa. Porém, quando expressa a 37 ºC, encontrou-se nos corpos de inclusão, pois não foram detectadas pela técnica de western blotting após a purificação sob condição nativa. Figura 22. Western blotting mostrando a detecção da GVBcp, utilizando-se o extrato total da bactéria após 4 horas de indução da expressão, com 1 mM de IPTG (B). Western blotting mostrando a detecção da GVBcp expressa a 18ºC e purificada sob condição nativa (A). 4.2.4 Dicroísmo Circular O conteúdo de estrutura secundária da GVBcp foi calculado através do espectro de CD (Figura 23). O espectro obtido indica que a proteína contém uma quantidade substancial de α-hélice. A análise do conteúdo de estrutura secundária obtido utilizando o programa CDPro, indica as seguintes porcentagens das principais estruturas secundárias: 71% de α-hélice, 5% de -folha e 24% de outras estruturas. Estes resultados sugerem que a proteína recombinante GVBcp pode ser expressa em E. coli e purificada a partir de simples métodos de 50 cromatografia das frações solúveis, mantendo sua forma nativa e adequada para os ensaios de cristalização. Figura 23. Espectro de CD (190 a 250 nm) da proteína GVBcp e a porcentagem de estruturas secundárias obtidas pela deconvolução do espectro utilizando-se o programa CDPro. ExpCD: espectro obtido experimentalmente; CalcCD: espectro calculado. 4.2.5 Experimento de espalhamento dinâmico de luz (DLS) Primeiramente, as análises de DLS foram conduzidas na solução de proteínas capsidiais do GVB (3 mg/mL) a 10 ºC no seguinte tampão: 20 mM Tris-HCl, 300 mM de NaCl, pH 7. Analisando-se o gráfico do resultado do experimento de DLS, observou-se claramente, que as proteínas capsdiais estavam agregadas e polidispersas (mais de uma população de agregados), pois a GVBcp possui massa molecular de 21,4 kDa (sem cauda de histidina) e no histograma foi observado agregados com massa molecular de aproximadamente, 291.8 kDa, 314.2 kDa, 2.209 Mda, 3.495 MDa, 4.848 MDa e 11.07 MDa (Figura 24). Dessa forma, concluiu-se que essa condição deveria ser otimizada para que os testes de cristalização pudessem ser conduzidos novamente. 51 Figura 24. Histograma dos resultados da análise de DLS da GVBcp. A solução de proteína estava polidispersa (várias populações de agregados). As populações de agregados estão representadas em vermelho. Posteriormente, como os resultados obtidos da proteína capsidial do GVA foram mais promissores, focou-se nos testes envolvendo a GVAcp, com o objetivo de otimizar os cristais obtidos com essa proteína. Como ambas as proteínas capsidiais dos vírus GVA e GVB pertencem à mesma família, mesmo gênero, e apresentam um alto grau de similaridade, a resolução da estrutura cristalográfica da proteína do GVA seria suficiente para resolvermos a estrutura da proteína capsidial do GVB através de modelagem por homologia. 4.2.6 Ensaios de cristalização Os ensaios de cristalização da GVBcp (7,96 mg/mL, tampão: 20 mM Tris HCl pH 7.4, 100 mM NaCl, 5% de glicerol) foram conduzidos a 18 ºC, utilizando os kits Crystal Screen I, Crystal Screen II e PEG-Ion da Hampton Research. Após duas semanas, foi obtido um único cristal na condição 21 do kit Cristal Screen I : 0.2 M de Acetato de magnésio tetraidratado, 0.1 M de Cacodilato de sódio triidratado pH 6.5, 30% volume/volume de (+/-)-2-Metil-2,4- pentanodiol (Figura 25). O cristal estava sob um precipitado do tipo skin, porém se dissolveu quando tentou-se remover o precipitado para recolhê-lo. Posteriormente, a cauda de histidina foi removida e os ensaios de cristalização foram conduzidos novamente. Nenhum cristal foi encontrado, somente foi observado após algumas semanas uma porcentagem menor de precipitação das proteínas nas gotas penduradas, 52 comparada à porcentagem de precipitação encontrada nos ensaios conduzidos com a proteína contendo cauda de histidina, indicando que houve uma melhora na estabilidade da mesma. Figura 25. Cristal da GVBcp obtido após duas semana na condição 21 do Crystal Screen I (0.2 M de Acetato de magnésio tetraidratado, 0.1 M de Cacodilato de sódio triidratado pH 6.5, 30% volume/volume de (+/-)-2-Metil- 2,4-pentanodiol). 4.2.7 Predição da estrutura tridimensional da GVBcp Foram realizadas buscas por homologia e similaridade de sequência primária utilizando a ferramenta BLAST e o banco de dados PDB e, apesar de haver 99.122 estruturas no banco de dados, somente a proteína Álcool Desidrogenase de Lactococcus lactis teve a melhor cobertura (38%) e similaridade (29%). Essa proteína não apresenta a mesma função que a proteína estudada, e a identidade era muito baixa para a modelagem por homologia. Dessa forma, foram utilizados os programas I-Tasser, Quark e Rosetta que são empregados na predição de estruturas de proteínas que não possuem homologia com proteínas conhecidas. Os modelos gerados foram validados utilizando-se os programas ProSA, TM- align e RAMPAGE. Utilizando-se o programa I-Tasser, o modelo da proteína GVBcp com a maior pontuação de confiabilidade (C-score -4.97) (Figura 26) foi selecionado, e possuía na maioria α-hélices. Além disso, o molde com maior pontuação (Z-score 1.84) utilizado na modelagem da GVBcp, foi a estutura cristalográfica da proteína capsidial do vírus Papaya mosaic virus (YANG et al., 2012) (Figura 29), um vírus filamentoso e flexuoso, pertencente à família Alphaflexiviridae. 53 Figura 26. Representação em cartoon da estrutura da GVBcp com maior C-score obtida pelo programa I- Tasser. N:região N-terminal; C: região C-terminal. A qualidade do modelo gerado pelo I-Tasser foi validada utilizando os programas descritos acima. O gráfico de Ramachandran apresentou 75,9% de resíduos na região favorável, 15,9% na região permitida e 8,2% na região não permitida (Figura 27). Analisando este modelo pelo ProSA, verificou-se que o mesmo se encontra dentro da gama de pontuação tipicamente encontrada para proteína nativas de tamanhos similares (Figura 28). Estes resultados indicam boa qualidade do modelo obtido. 54 Figura 27. Gráfico de Ramachandran do modelo da proteína GVBcp gerada pelo I-Tasser. Figura 28. Resultado do programa ProSA para o modelo da GVBcp gerado pelo I-Tasser retornando a pontuação Z-score de aproximadamente -5, indicando que o modelo está dentro da gama de pontuações tipicamente encontrada para proteínas nativas de tamanhos similares revolvidas experimentalmente (NMR em azul escuro e raio-X em azul claro). A estrutura da proteína capsidial do Papaya mosaic virus consiste de um enovelamento de somente alfa hélices. A interface subunidade-subunidade é formada pela 55 interação hidrofóbica, com um longo sulco em uma proteína, ocupada pelos resíduos de aminoácidos 11 a 26 da região N-terminal da proteína vizinha. Os resíduos importantes da região N-terminal incluem Ala12, Phe13, Ile16, Met21, Ile24 e Val26. Na estrutura tridimensional, Phe13 se encaixa dentro de uma bolsa hidrofóbica na molécula vizinha, formada pelos resíduos Leu39, Val42, Met46, Val56, Ala60, Phe106, Tyr109 e Phe110. Dessa forma, sugeriu-se que a interação hidrofóbica entre o peptídeo N-terminal e o sulco vizinho subjacente, é o mecanismo de polimerização do vírus filamentoso de planta (domínio de troca) (YANG et al., 2012). Foi proposto um mecanismo de montagem, domínio de troca N-terminal, pela qual as subunidades nos vírus helicoidais são, provavelmente, ligados às interfaces laterais pelos resíduos de aminoácidos salientes da região N-terminal. Esse mecanismo é compatível com a observação bioquímica, em que a proteínas capsidias sozinhas são propensas à agregação e são capazes de formar partículas similares a