UNIVERSIDADE ESTADUAL PAULISTA “JÚLIO DE MESQUITA FILHO” FACULDADE DE CIÊNCIAS FARMACÊUTICAS Curso de Graduação Engenharia de Bioprocessos e Biotecnologia CELSO DELLE PIAGE NETO CONSTRUÇÃO DE UM CIRCUITO DE REGULAÇÃO AUTÔNOMO E TEMPORAL DA EXPRESSÃO GÊNICA Araraquara, SP 2022 CELSO DELLE PIAGE NETO CONSTRUÇÃO DE UM CIRCUITO DE REGULAÇÃO AUTÔNOMO E TEMPORAL DA EXPRESSÃO GÊNICA Trabalho de Conclusão de Curso apresentado ao Curso de Graduação em Engenharia de Bioprocessos e Biotecnologia da Faculdade de Ciências Farmacêuticas de Araraquara, da Universidade Estadual Paulista “Júlio de Mesquita Filho”, para obtenção do grau de Engenheiro de Bioprocessos e Biotecnologia. Orientadora: Profa. Dra. Danielle Biscaro Pedrolli Araraquara, SP 2022 Diretoria do Serviço Técnico de Biblioteca e Documentação - Faculdade de Ciências Farmacêuticas UNESP - Campus de Araraquara Esta ficha não pode ser modificada Piage Neto, Celso Delle. P579c Construção de um circuito de regulação autônomo e temporal da expressão gênica / Celso Delle Piage Neto. – Araraquara: [S.n.], 2022. 63 f. : il. Trabalho de Conclusão de Curso (Graduação - Engenharia de Bioprocessos e Biotecnologia) – Universidade Estadual Paulista. “Júlio de Mesquita Filho”. Faculdade de Ciências Farmacêuticas. Área de Bioprocessos e Biotecnologia. Orientadora: Danielle Biscaro Pedrolli. 1. CRISPR-Cas. 2. Expressão gênica. 3. RNA fluorescente. 4. Circuito genético. 5. Controle transcricional. I. Pedrolli, Danielle Biscaro, orient. II. Título. Dedicatória Este trabalho é dedicado a todos que me acompanharam e me deram forças durante toda a trajetória. Aos meus pais, amigos e professores. Agradecimentos Agradeço aos meus colegas de laboratório, minha orientadora e a todos que lutam pela ciência pública de qualidade. RESUMO A complexa rede de interações que permeia os processos de regulação da expressão gênica vem sendo, há muito tempo, alvo de pesquisas, uma vez que o alcance da compreensão plena acerca desses fenômenos pode levar ao desenvolvimento de circuitos genéticos sintéticos com diversas finalidades, desde aplicações em diagnósticos até o aprimoramento de sistemas de armazenamento de dados não-dependentes de silício. Tais circuitos podem ser desenvolvidos e regulados a partir do conceito de portas lógicas, onde moléculas diversas, como açúcares, são utilizadas como inputs, desencadeando a expressão de genes e iniciando a interação entre os módulos genéticos. Baseando-se na versatilidade de uso desses circuitos, o presente projeto desenvolveu um circuito genético para controle temporal autônomo da expressão gênica em Escherichia coli, através do controle transcricional dos RNAs broccoli e corn pelo sistema CRIPSRa e CRISPRi Foram realizadas simulações do circuito no software iBioSim 3.0 e os resultados mostram que o sistema tem potencial de funcionar. Ainda, foram construídas três linhagens contendo o sistema de controle transcricional dos RNAs. Os cultivos in vivo mostraram que não há interferência na emissão do sinal entre os fluoróforos, porém a baixa emissão de fluorescência e o crescimento lento das linhagens mostra que os parâmetros de cultivo e o circuito genético precisam de ajustes. Palavras-chave: CRISPR-Cas; expressão gênica; RNA fluorescente; circuito genético; controle transcricional. ABSTRACT The complex network of interactions that permeates the processes of gene expression regulation has been the subject of research for a long time, since reaching a full understanding of these phenomena can lead to the development of synthetic genetic circuits with different purposes, from applications in diagnostics to the improvement of non-silicon-dependent data storage systems. Such circuits can be developed and regulated based on the concept of logic gates, where different molecules, such as sugars, are used as inputs, triggering the expression of genes and initiating the interaction between the genetic modules. Based on the versatility of use of these circuits the present project developed a genetic circuit for autonomous temporal control of gene expression in Escherichia coli through transcriptional control of broccoli and corn RNAs by CRIPSRa and CRISPRi systems. Circuit simulations were performed in the iBioSim 3.0 software and the results show that the system has operating potential. Furthermore, three strains containing the RNA transcriptional control system were constructed. The fluorescence signal and the slow growth of the strains show that the cultivation parameters and the genetic circuit need to be adapted. Keywords: CRISPR-Cas; gene expression; fluorescent RNA; genetic circuit; transcriptional control. LISTA DE FIGURAS Figura 1 – Esquema ilustrativo representando os módulos de controle e resposta que compõem este projeto................................................................................................17 Figura 2 – Simulação da produção de TetR.............................................................. 23 Figura 3 – Simulação da produção de SpdCas9_AsiA............................................. 24 Figura 4 – Simulação da produção de gRNA0.......................................................... 25 Figura 5 – Simulação da produção de Broccoli......................................................... 26 Figura 6 – Resultado gerado pela simulação para produção de gRNA0.................. 27 Figura 7 – Simulação da expressão de Broccoli e Corn no modelo ajustado........... 28 Figura 8 – Plasmídeo pSB1A3, com origem de replicação para E. coli, marca de resistência para ampicilina e as sequências PJ23100_tetR (sentido reverso) e Ptet_SpdCas9_asia com seus respectivos promotores.............................................. 29 Figura 9 – Eletroforese em gel de agarose mostrando os produtos de reação da PCR para amplificação da sequência Ptet_SpdCas9......................................................... 30 Figura 10 – Eletroforese em gel de agarose mostrando os produtos de reação da PCR para amplificação da sequência PJ23100_tetR............................................................ 30 Figura 11 – Eletroforese em gel de agarose mostrando as bandas correspondentes ao corte das enzimas EcoRI e PstI........................................................................... 31 Figura 12 – Eletroforese em gel de agarose da PCR de correção do gBlock AsiA........................................................................................................................... 32 Figura 13 – Eletroforese em gel de agarose para confirmação da amplificação da sequência do gene asiA no plasmídeo pSB1A3_tetR_SpdCas9_asia. ................................................................................................................................... 32 Figura 14 – Eletroforese em gel de agarose para confirmação da clonagem das sequências PT7-lacO_gRNA-0 (9.1), PT7-lacO_RiboJ_gRNA-0 (9.2), PT7-lacO_gRNA- 1(10.1) e PT7-lacO_RiboJ_gRNA- 1................................................................................................................................. 33 Figura 15 – Eletroforese em gel de agarose para confirmação da clonagem das sequências target-1a_PJ23117_target-0i_corn_PT7-lacO_gRNA-0 (9.1 + 11), target- 1a_PJ23117_target-0i_corn_PT7-lacO_RiboJ_gRNA-0 (9.2 + 11)..............................................................................................................................34 Figura 16 – Eletroforese em gel de agarose para confirmação da clonagem das sequências target-1a_PJ23117_target-0i_corn_PT7-lacO_gRNA-1 (10.1 + 11), target- 1a_PJ23117_target-0i_corn_PT7-lacO_RiboJ_gRNA-1 (10.2 + 11)..............................................................................................................................35 Figura 17 – Eletroforese em gel de agarose para confirmação da clonagem da sequência target-0a_PJ23117_target-1i_broccoli_target-1a_PJ23117_target-0i_corn_PT7- lacO_gRNA-0 (9.1 + 8, 877 bp)..............................................................................................................................36 Figura 18 – Eletroforese em gel de agarose para confirmação da clonagem da sequência target-0a_PJ23117_target-1i_broccoli_target-1a_PJ23117_target-0i_corn_PT7- lacO_RiboJ_gRNA-0 (9.2 + 8, 951 bp)..............................................................................................................................36 Figura 19 – Eletroforese em gel de agarose para confirmação da clonagem da sequência target-0a_PJ23117_target-1i_broccoli_target-1a_PJ23117_target-0i_corn_PT7- lacO_RiboJ_gRNA-1 (10.2 + 8, 951 bp)..............................................................................................................................37 Figura 20 – (a) e (c) Resultados de fluorescência para a linhagem contendo a sequência de ativação do RNA broccoli. (b) e (d) Resultados de fluorescência para a linhagem contendo a sequência de ativação para o RNA corn........................................................................................................................... 39 Figura 21 – (a) e (c) Crescimento das linhagens 9.1 e 9.2 ao longo de 4 horas de cultivo. (b) e (d) Resultados de fluorescência das linhagens 9.1 e 9.2 ao longe de 4 horas de cultivo, com leitura no comprimento de onda do fluoróforo DFHO.............40 LISTA DE TABELAS Tabela 1 – gBlocks utilizados nos experimentos Tabela 2 - Reações de digestão e respectivas enzimas Sumário Dedicatória ...............................................................................................................................................3 Agradecimentos .......................................................................................................................................4 RESUMO ...................................................................................................................................................5 Palavras-chave: CRISPR-Cas; expressão gênica; RNA fluorescente; circuito genético; controle transcricional. ...........................................................................................................................................5 ABSTRACT .................................................................................................................................................6 Keywords: CRISPR-Cas; gene expression; fluorescent RNA; genetic circuit; transcriptional control. .....6 LISTA DE FIGURAS.....................................................................................................................................7 LISTA DE TABELAS .................................................................................................................................. 10 INTRODUÇÃO ........................................................................................................................................ 13 Desenvolvimento .................................................................................................................................. 14 Revisão da Literatura......................................................................................................................... 14 Aptâmeros de RNA como repórteres ............................................................................................ 14 CRISPR-Cas ..................................................................................................................................... 15 CRISPRi .......................................................................................................................................... 16 CRISPRa ......................................................................................................................................... 16 Planejamento e descrição dos processos ......................................................................................... 16 Circuitos genéticos e módulos planejados .................................................................................... 16 Módulo de controle....................................................................................................................... 18 Módulo de resposta ...................................................................................................................... 18 Materiais e Métodos ............................................................................................................................. 19 Amplificação das sequências de DNA ............................................................................................... 19 Digestão e ligação ............................................................................................................................. 20 Transformação .................................................................................................................................. 21 Cultivos .............................................................................................................................................. 21 Cultivo 0: teste de crescimento e fluorescência – indução OD 0,1 ............................................... 21 Cultivo 1: teste de crescimento e fluorescência – indução OD 0,05 ............................................. 22 Cultivo 2: teste de volumes de leitura – indução OD 0,05 ............................................................ 22 Cultivo 3: teste de ligação cruzada ................................................................................................ 22 Simulações com o software iBioSim 3.0............................................................................................ 22 RESULTADOS E DISCUSSÃO ................................................................................................................... 23 Simulações computacionais com o software iBiosim 3.0 ................................................................. 23 Construção das sequências para montagem do circuito .................................................................. 28 12 Clonagens e construção dos plasmídeos .......................................................................................... 29 Cultivos das linhagens de BL21 ......................................................................................................... 38 CONCLUSÃO .......................................................................................................................................... 40 REFERÊNCIAS ......................................................................................................................................... 42 APÊNDICE .............................................................................................................................................. 44 13 INTRODUÇÃO A expressão gênica nas células é regulada de diversas formas, evolvendo processos de ativação e repressão, controlados por proteínas e RNAs reguladores. Esses processos, muitas vezes são alterados em função de variações no ambiente, tais como presença ou ausência de determinado composto químico, mudanças de temperatura e pH. A detecção do estímulo gera um produto, uma proteína ou um RNA, que irá regular a ativação ou repressão de outro gene, formando circuitos de interações complexas dentro da célula. Os circuitos sintéticos de controle da expressão gênica comumente usados envolvem controle de processos de ativação e repressão desencadeados por substâncias indutoras, tais como IPTG (isopropil β-d-1- tiogalactopiranosideo), anidrotetraciclina (aTc), arabinose, salicilato, homoserina lactona, entre outros (MEYER et al., 2019). Nestes casos, o processo desejado só é mantido na presença do indutor, e a reversão do processo é possível com a exaustão ou retirada completa do composto. Ou seja, os processos não são autônomos, tampouco podem ser alternados de forma rápida e fácil. Processos autônomos já foram implementados baseados em sistemas de quórum sensing bacteriano (CORRÊA et al., 2020; KIM et al., 2017). Estes, apesar de autônomos, permitem apenas uma transição de desligado a ligado (ou vice-versa) durante um cultivo, sendo ainda um controle pontual. O único circuito genético já desenvolvido que permite controle autônomo e facilmente reversível foi construído combinando o processo de quórum sensing com o processo de lise celular em cultivo com fluxo contínuo de meio em dispositivo de microfluídica. Neste sistema, a lise celular desencadeada pelo processo de quórum sensing leva a diminuição da população e consequentemente do indutor, fazendo com que o sistema seja reiniciado em ciclos (DANINO et al., 2010). Este sistema apresenta funcionamento autônomo, e reversível, mas permite apenas um padrão de respostas que alterna expressão e não-expressão do gene repórter (equivalente a 1 e 0 no sistema binário). Assim, um circuito gênico que opere de forma autônoma, rapidamente reversível e que seja capaz de alternar 14 respostas em diferentes ordens para criar diferentes mensagens, ainda não foi reportado na literatura. Recentes desenvolvimentos de técnicas de detecção de RNAs por fluorescência em tempo real e de controle da expressão gênica por CRISPR-Cas podem permitir o desenvolvimento deste tipo de circuito. Com isso, o presente trabalho desenvolveu linhagens geneticamente modificadas de E. coli contendo um circuito sintético de regulação da expressão gênica de dois RNAs fluorescentes, broccoli e corn, para aplicações futuras no controle temporal da expressão gênica. O desenvolvimento desse trabalho abre caminho para a futura criação de dispositivos biológicos com capacidade de armazenamento e leitura de dados em tempo real, com emprego de um código binário de DNA. Além disso, por conta de sua versatilidade e modularidade, pode ter outras aplicações como a criação de kits diagnósticos para detecção de doenças de forma rápida e em tempo real. Desenvolvimento Revisão da Literatura Aptâmeros de RNA como repórteres A construção de circuitos biológicos sintéticos pode auxiliar na compreensão de como a maquinaria celular funciona na regulação de genes. Algumas ferramentas já conhecidas podem ser utilizadas e combinadas para criar um sistema no qual a resposta gerada possa ser mensurada e controlada temporalmente. Como exemplo de uma resposta celular mensurável, está o da expressão heteróloga do gene da proteína verde fluorescente (GFP), muito utilizada como repórter na expressão gênica (SOUTHWARD; SURETTE, 2002). Apesar da facilidade de expressar essa proteína fluorescente e da sua alta estabilidade, por demorar cerca de 30 min para maturar e por acumular-se na célula, a GFP não é a melhor opção para estudar alterações temporais na expressão gênica. Em contrapartida, os RNAs bacterianos são sintetizados e maturados rapidamente, e possuem, em sua maioria, um tempo de meia-vida de 3 a 8 min (BERNSTEIN et al., 2002). Alguns RNAs sintéticos, os aptâmeros de RNA, tem a capacidade de se ligar a moléculas-alvo com alta especificidade e afinidade, por conta das estruturas secundárias que conseguem adquirir após a transcrição (LAKHIN et al., 2013; STOLTENBURG et al., 2007). Assim, a 15 utilização de aptâmeros de RNA, que se ligam a fluoróforos e emitem fluorescência, como os RNAs broccoli e corn, mostra-se vantajosa em relação à GFP, uma vez que não necessita da maquinaria de tradução, são rapidamente reciclados pela célula e podem ser quantificados por fluorescência em tempo real dentro da célula (CHANDLER et al., 2018). CRISPR-Cas O controle da expressão gênica para a síntese de proteínas ou RNAs, pode ser feito através do sistema CRISPR-Cas modificado. O CRISPR-Cas (Clustered Regularly Interspaced Short Palindromic Repeats associado à Cas) é o sistema encontrado em bactérias e arqueias que funciona como uma imunidade adaptativa contra vírus e plasmídeos. Nesse sistema, o DNA invasor é clivado e adicionado ao DNA do hospedeiro, que passa a reconhecer o material genético em caso de reinfecções. Assim, o CRISPS-Cas é formado pela endonuclease Cas9 e seu sgRNA (small guide RNA). O sgRNA, ou simplesmente gRNA, é formado pelo tracrRNA (trans-activating crRNA) e o crRNA (CRISPR RNA). Do ponto de vista da engenharia, o gRNA pode conter duas partes: uma parte constante, chamada de scaffold e uma parte que pode variar em até 20 nucleotídeos na extremidade 5’, a qual é complementar à sequência alvo, podendo ser reprogramada para diferentes sítios no DNA. Além disso, a Cas9 é uma proteína derivada de Streptococcus pyogenes (S. pyogenes) com atividade nucleolítica (CUI et al., 2018). Existem diversas variações do sistema CRISPR-Cas, sendo que em um deles, o sistema CRISPR-Cas tipo II, a proteína Cas9 inativa fagos que infectam S. pyogenes, utilizadno crRNAS como guias e introduzindo uma quebra dupla na fita de DNA no genoma viral (HELER et al., 2015). Para realizar a quebra, o sítio alvo no DNA deve conter um protoespaçador onde a sequência complementar do gRNA irá se ligar e uma sequência adjacente ao protoespaçador chamada PAM (protospacer adjacent motif), na qual a Cas9 se ligará (para Cas9-Sp, a PAM é 5’-NGG-3’). Além de promover a deleção de genes pela quebra dupla no DNA, o sistema CRISPR-Cas modificado pode ser utilizado para outras funções, como a repressão gênica (CRISPRi) e a ativação gênica (CRISPRa) (CUI et al., 2018). 16 CRISPRi A proteína Cas9 do sistema CRISPR-Cas tipo II abriga dois domínios nucleolíticos e a introdução de mutações pontuais em cada domínio D10A e H840A, bloqueia a atividade nucleolítica da Cas9, contudo, conserva sua capacidade de ligação ao alvo guiada pelo gRNA (BREZGIN et al., 2019). Essa capacidade de ligação pode ser usada para bloquear o progresso da RNA polimerase, durante a transcrição, a partir do design do gRNA, tendo como alvo a sequência de DNA entre as posições -10 e +1 do promotor bacteriano. Neste caso, o complexo dCas9-gRNA-DNA funciona como barreira física para o processo de transcrição (ZHAO et al., 2017; HO et al., 2020) CRISPRa CRISPRa é uma ferramenta utilizada na engenharia de circuitos genéticos, capaz de atuar no controle da ativação de genes específicos. Passiva de utilização tanto em Eucariotos quando em Procariotos e, similar ao CRISPRi, trata-se de um sistema onde a enzima Cas9 sem atividade nucleolítica (dCas9) é fusionada em sua porção C-terminal a uma ou mais proteínas ativadoras. Dessa forma, uma vez que o complexo dCas9-gRNA- DNA é formado, a ativadora é aproximada do promotor provendo assim a ativação. Ao contrário de outros modos de controle da expressão gênica mediado por proteínas ativadoras, devido a capacidade do sistema CRISPR em utilizar gRNA para reconhecimento de sequências de DNA, o sistema CRISPRa possui como vantagem uma facilidade em reprogramar as sequências alvo, promovendo assim uma maior gama de genes regulados (LIU et al., 2019; HO et al., 2020). Planejamento e descrição dos processos Circuitos genéticos e módulos planejados Os circuitos genéticos construídos neste projeto foram classificados em módulos, para facilitar o entendimento e a organização da construção das linhagens. Foram construídos dois módulos: controle e resposta (Figura 1). 17 g Figura 1. Esquema ilustrativo representando os módulos de controle e resposta que compõem este projeto. No módulo controle, a produção da dCas9 de Streptococcus pyogenes (SpdCas9) fusionada à proteína ativadora AsiA será produzida por indução com aTc, e o gRNA (0 ou 1) produzido por indução com lactose. Cores iguais indicam um par gRNA e seu alvo junto ao promotor. Os gRNAs -0 e -1, ativam e desativam os RNAs brocolli e corn no módulo resposta, de forma que, a cada passo, um é ativado e o outro reprimido pelo mesmo gRNA (novamente as cores dos gRNAs combinam com seus alvos nos promotores). PJ23117 PJ23117 PJ23117 PJ23117 PJ23117 PJ23117 PJ23100_tetR Ptet_SpdCas9-Asia PT7-lacO_gRNA-S PT7-lacO_gRNA-0 PT7-lacO_gRNA-1 target-0a_PJ23117_ target-1i_broccoli target-1a_PJ23117_ target-0i_corn target-Sa_ PJ23117_gRNA0