UNIVERSIDADE ESTADUAL PAULISTA FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CÂMPUS DE JABOTICABAL Modulação da expressão gênica em uma comunidade de bactérias em resposta aos metais Cobre e Cromo Julia Sandrini De Biasi JABOTICABAL – SP UNIVERSIDADE ESTADUAL PAULISTA FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CÂMPUS DE JABOTICABAL Modulação da expressão gênica em uma comunidade de bactérias em resposta aos metais Cobre e Cromo JULIA SANDRINI DE BIASI Orientador: Prof. Dr. Daniel Guariz Pinheiro Co-orientadora: Me. Michelli Inácio Gonçalves Funnicelli Trabalho apresentado à Faculdade de Ciências Agrárias e Veterinárias - UNESP, Câmpus de Jaboticabal, para obtenção do título de Bacharel em Ciências Biológicas. Jaboticabal – SP 1 ⁰ Semestre/2022 AGRADECIMENTOS Em primeiro lugar agradeço a Deus, Jesus e ao meu anjo guardião por toda força e oportunidade, por nunca me deixarem padecer em momentos difíceis e sempre estarem ao meu lado. Agradeço aos meus pais Ângelo Manoel e Cláudia por sempre me apoiarem e nunca desistirem de mim, me auxiliando e amparando, provavelmente, sem eles não conseguiria ter chego até aqui. Agradeço ao meu irmão André Luiz por toda inspiração e orgulho pelas minhas conquistas. Não poderia deixar de agradecer ao Professor Dr. Daniel Guariz Pinheiro por todas as oportunidades, ensinamentos, ajuda e paciência. Uma pessoa realmente inspiradora por seu trabalho, dedicação e atenção para com seus alunos. Gostaria também de agradecer à minha co-orientadora Michelli Inácio Gonçalves Funnicelli por sempre estar disposta a me auxiliar e tirar dúvidas, e aos meus colegas do Laboratório de Bioinformática. Aos meus amigos que o curso de Ciências Biológicas trouxe Ennie Rose, Fernanda, João Paulo e Lígia e a duas pessoinhas incríveis que em todos os momentos me apoiaram, me fizeram rir e ouviram minhas reclamações sempre dispostos a ajudar: Guilherme e Maria Julia. A todos os meus professores, desde o ensino infantil até a graduação, por todo conhecimento compartilhado e ensinamentos. Agradeço também a minha professora de biologia do ensino médio Rose por toda inspiração e apoio em seguir nesta carreira como futura bióloga. Agradeço ao Laboratório de Microrganismos e Plantas (LBMP) do Departamento de Biotecnologia Agropecuária e Ambiental (DBTAA) da FCAV, coordenado pela Profa. Eliana Gertrudes de Macedo Lemos e Profa. Lúcia Maria Carareto Alves, que gentilmente cederam os dados de sequenciamento para serem analisados. Por fim, gostaria de agradecer ao Programa Institucional de Bolsas de Iniciação Científica e Tecnológica da Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP) pela bolsa concedida durante o desenvolvimento deste trabalho (edital 2021/2022). I SUMÁRIO 1. INTRODUÇÃO ......................................................................................... 1 2. OBJETIVOS ............................................................................................. 4 3. REVISÃO DE LITERATURA.................................................................... 5 3.1 POLUIÇÃO DO AMBIENTAL ...................................................... 5 3.2 METAIS PESADOS OU POTENCIALMENTE TÓXICOS ............ 6 3.3 FONTES DE POLUIÇÃO POR METAIS POTENCIALMENTE TÓXICOS .................................................................................... 8 3.4 POSSÍVEIS DANOS CAUSADOS A ALGUNS SERES VIVOS 10 3.5 ESTRATÉGIAS DE REMEDIAÇÃO .......................................... 12 3.6 MICRORGANISMOS E BIORREMEDIAÇÃO ........................... 13 3.7 IMPORTÂNCIA DE ESTUDOS GENÉTICOS EM MICRORGANISMOS ................................................................ 14 3.8 TRANSCRIPTOMA E METATRANSCRIPTOMA ...................... 15 3.9 IMPORTÂNCIA EM SE ESTUDAR O METATRANSCRIPTOMA17 3.10 ANÁLISE DO GENE 16S rRNA ................................................. 17 3.11 DO SEQUENCIAMENTO DE SANGER AO NGS ..................... 18 3.12 ANÁLISE SHOTGUN DE TRANSCRIPTOMA COMPLETO - RNA- Seq ............................................................................................ 19 3.13 METATRANSCRIPTOMA E BACTÉRIAS RESISTENTES A METAIS ..................................................................................... 22 3.14 GENES BACTERIANOS EXPRESSOS NA PRESENÇA DE CROMO (Cr) ............................................................................. 23 3.15 GENES BACTERIANOS EXPRESSOS NA PRESENÇA DE COBRE (Cu) ............................................................................. 24 4. MATERIAIS E MÉTODOS ..................................................................... 26 4.1 COMUNIDADE BACTERIANA .................................................. 26 II 4.2 ENSAIOS DE CONCENTRAÇÃO MÍNIMA INIBITÓRIA (CMI) . 27 4.3 EXTRAÇÃO DE RNA, CONSTRUÇÃO DAS BIBLIOTECAS E SEQUENCIAMENTO ................................................................ 28 4.4 ISOLAMENTO DAS BACTÉRIAS DA COMUNIDADE E IDENTIFICAÇÃO ...................................................................... 28 4.5 ANÁLISE DOS DADOS DE RNA-SEQ DO METATRANSCRIPTOMA ......................................................... 29 4.5.1 PRÉ-PROCESSAMENTO DE DADOS ................................. 29 4.5.2 PROCESSAMENTO DOS DADOS ....................................... 31 4.5.3 MONTAGEM DO METATRANSCRIPTOMA ......................... 33 4.5.4 IDENTIFICAÇÃO DE PROTEÍNAS ....................................... 34 4.5.5 BUSCAS DE GENES ASSOCIADOS À RESISTÊNCIA A METAIS................................................................................. 34 4.5.6 ANOTAÇÃO FUNCIONAL DOS GENES .............................. 35 4.5.7 ANOTAÇÃO TAXONÔMICA DO METATRANSCRIPTOMA . 35 4.5.8 IDENTIFICAÇÃO DOS PRINCIPAIS TRANSCRIPTOMAS NO METATRANSCRIPTOMA ..................................................... 36 4.5.9 ANÁLISE DE ABUNDÂNCIA NO METATRANSCRIPTOMA . 36 4.5.10 ANÁLISE DE COMPOSIÇÃO E ABUNDÂNCIA NO METATRANSCRIPTOMA ..................................................... 37 4.5.12 ANÁLISES DE COMPONENTES PRINCIPAIS ..................... 38 4.5.13 SCRIPTS ............................................................................... 39 5. RESULTADOS E DISCUSSÃO ............................................................. 40 5.1 ENSAIOS DE CONCENTRAÇÃO MÍNIMA INIBITÓRIA ........... 40 5.2 IDENTIFICAÇÃO DOS ISOLADOS BACTERIANOS ................ 40 5.3 PROCESSAMENTO DE DADOS DE SEQUENCIAMENTO DO METATRANSCRIPTOMA ......................................................... 41 III 5.4 MONTAGEM DO METATRANSCRIPTOMA E ANOTAÇÃO FUNCIONAL ............................................................................. 43 5.5 ANÁLISES DE REPRESENTATIVIDADE DE TAXA NO METATRANSCRIPTOMA ......................................................... 43 5.6 IDENTIFICAÇÃO DOS GENES DIFERENCIALMENTE EXPRESSOS COM O BANCO DE DADOS BacMet ................ 47 5.7 IDENTIFICAÇÃO DOS GENES INDUZIDOS EXPRESSOS COM O PROGRAMA DESEq2............................................................... 48 5.8 IDENTIFICAÇÃO DOS GENES REPRIMIDOS EXPRESSOS COM O PROGRAMA DESEq2 ........................................................... 50 5.9 GENES DIFERENCIALMENTE EXPRESSOS (INDUZIDOS) ANOTADOS .............................................................................. 51 5.9.1 TRANSPORTADORES ABC ................................................. 54 5.9.2 PROTEÍNAS ATPases .......................................................... 56 5.9.3 GENES DE RESISTÊNCIA ESPECÍFICOS .......................... 58 5.9.4 ANÁLISE DE COMPONENTES PRINCIPAIS (PCA) DE DADOS DE RNA-Seq. .................................................................................. 59 6. CONCLUSÃO ........................................................................................ 59 7. REFERÊNCIAS ...................................................................................... 62 IV RESUMO Devido ao rápido desenvolvimento industrial e crescimento populacional, nosso planeta vem sofrendo a cada dia com problemas de poluição, principalmente devido a atividades antrópicas. O solo, assim como os corpos hídricos, acaba sendo um dos locais mais prejudicados pela poluição, onde, os metais potencialmente tóxicos têm se tornado um dos mais preocupantes poluentes. Metais potencialmente tóxicos são classificados como sendo substâncias que, mesmo presentes em pequenas concentrações, podem proporcionar diversos prejuízos aos seres vivos. Sendo assim, estratégias de remediação têm sido propostas, onde a biorremediação (processo remediativo realizado por organismos vivos) tem ganhado destaque por ser uma estratégia sustentável sob os pontos de vista econômico e ambiental. Dentre os potenciais organismos vivos usados em estudos de biorremediação, os microrganismos, principalmente as bactérias, acabam sendo ótimas escolhas devido à capacidade de sobreviverem a uma diversidade de ambientes graças à rapidez e facilidade com que enfrentam mecanismos evolutivos. Logo, com o intuito de estudar e compreender mais a respeito dos mecanismos genéticos bacterianos envolvidos na resistência a metais, um estudo envolvendo a análise do metatranscriptoma de uma comunidade bacteriana encontrada originalmente em amostras de raízes da leguminosa Arachis pintoi foi desafiada frente aos metais cromo (trivalente e hexavalente) e cobre. Com o isolamento e análises de marcadores moleculares (gene 16S), foram identificados quatro isolados bacterianos nessa comunidade, correspondentes às espécies Brevundimonas vesiculares, Stenotrophomonas maltophilia, Rhizobium tropici e Sinorhizobium (Ensifer) meliloti. A partir da análise do metatranscriptoma foram revelados genes diferencialmente expressos presentes na comunidade desafiada por esses metais. Foram identificados genes relacionados aos principais mecanismos de resistência e tolerância bacteriana a metais, entre eles transportadores ABC, bombas de efluxo e proteínas de membrana, concluindo-se a existência de uma intrínseca e complexa rede de interações entre genes expressos por essas bactérias quando na presença dos metais potencialmente tóxicos. Palavras-chaves: metais pesados, RNA-Seq, genes bacterianos de resistência a metais. V ABSTRACT Due to rapid industrial development and population growth, our planet is suffering from pollution problems every day, mainly due to human activities. Soil, as well as water bodies, end up being the places most affected by pollution, where potentially toxic metals have become one of the most worrying pollutants. Potentially toxic metals are classified as substances that, even present in small concentrations, can cause several damages to living beings. Thus, remediation strategies have been proposed, where bioremediation (remediation process carried out by living organisms) has gained prominence for being a sustainable strategy from an economic and environmental point of view. Among the potential living organisms used in bioremediation studies, microorganisms, especially bacteria, end up being great choices due to their ability to survive in a variety of environments thanks to the speed and ease with which they face evolutionary mechanisms. Therefore, in order to study and understand more about the bacterial genetic mechanisms involved in resistance to metals, a study involving the analysis of the metatranscriptome of a bacterial community originally found in the root samples ofleguminous plants Arachis pintoi, and it was challenged against the metals chromium ( trivalent and hexavalent) and copper. With the isolation and analysis of molecular markers (gene 16S), four bacterial isolates were identified in this community, corresponding to the species Brevundimonas vesiculares, Stenotrophomonas maltophilia, Rhizobium tropici and Sinorhizobium (Ensifer) meliloti. From the analysis of the metatranscriptome, differentially expressed genes present in the community challenged by these metals were revealed. Genes related to the main mechanisms of bacterial resistance and tolerance to metals were identified, including ABC transporters, efflux pumps and membrane proteins, concluding the existence of an intrinsic and complex network of interactions between genes expressed by these bacteria when in the presence of potentially toxic metals. Keywords: heavy metals, RNA-Seq, bacterial metal resistance genes. 1 1. INTRODUÇÃO Atualmente, o mundo passa por uma grande onda de desenvolvimento tecnológico e industrial que vem ocorrendo desde a Revolução Industrial a partir da segunda metade do século XVIII (PASQUINI, 2020). Tal desenvolvimento técnico-industrial é um dos responsáveis pelo aparecimento de outros problemas que nunca foram registrados, como o rápido aumento populacional e altos índices de poluição decorrente do consumismo intenso (MATOS, 2020). A poluição é um grande problema, atingindo diversos locais como o ambiente aquático, atmosférico e terrestre, o que tem preocupado diversas nações devido a elevados índices de acúmulo de substâncias químicas podendo levar a uma série de prejuízos aos organismos vivos (RODRÍGUEZ EUGENIO et al., 2018). As fontes de poluição podem ser divididas em pontuais ou difusas (RODRÍGUEZ EUGENIO et al., 2018) tendo os metais potencialmente tóxicos como poluentes em comum. Tais metais são assim denominados por representarem grupos de elementos inorgânicos com massas atômicas entre 63,5 e 200,6 e gravidade maior que 5,0 sendo capazes de ocasionar danos nos seres vivos mesmo em baixas concentrações (AFROZE; SEN, 2018). São exemplos desses elementos: zinco (Zn), níquel (Ni), mercúrio (Hg), cádmio (Cd), chumbo (Pb), arsênio (Ar), cobre (Cu) e cromo (Cr). A contaminação por metais potencialmente tóxicos no meio ambiente pode trazer inúmeros problemas à saúde humana assim como às plantas e aos demais seres vivos. Em relação aos humanos altas concentrações de cádmio podem ocasionar fraturas ósseas e problemas de cartilagem; o chumbo afeta o sistema imunológico, reprodutor, gastrointestinal, nervoso, respiratório e urinário; já o cobre, pode levar a sérios problemas cerebrais, irritação no estômago, cirrose e anemia crônica; e o cromo, dependendo da via de contaminação (nasal ou oral) pode ocasionar úlceras, coceiras nasais, danos renais e hepáticos, convulsões, e até mesmo levar o indivíduo a óbito (MISHRA et al., 2019). 2 Em relação às plantas, o acúmulo de metais potencialmente tóxicos pode prejudicar o desenvolvimento e crescimento vegetal, assim como interferir em mecanismos de reprodução, respiração, fotossíntese e inibição na síntese de diversos micronutrientes (MISHRA et al., 2019). Perante os perigosos problemas que o acúmulo de metais potencialmente tóxicos pode trazer ao meio ambiente, diversas tecnologias físicas, químicas e biológicas vêm sendo desenvolvidas e estudadas para promover a descontaminação de ambientes poluídos (LI et al., 2019). Todavia, os processos biológicos são os que mais se destacam, sendo a biorremediação o principal deles por representar uma alternativa mais econômica e ecologicamente eficaz além de viável (LI et al., 2019). A biorremediação pode ser definida como um processo no qual organismos vivos são empregados para reduzir, remover e/ou transformar poluentes. Nesse sentido, os microrganismos têm se apresentado como detentores dos melhores sistemas metabólicos capazes de biodegradar moléculas xenobióticas (moléculas de origem estranha ao meio ambiente), e recalcitrantes (PEREIRA, 2012). Logo, é possível notar a grande importância dos microrganismos no processo de biorremediação onde as bactérias podem ser uma ótima escolha por possuírem uma maquinaria genética que lhes permite sobreviver em ambientes poluídos por metais. As bactérias podem deter genes que, quando expressos são capazes de interagir com o metal tais como cadB e cadD (cádmio); chrA (cromo); cusF e cueO (cobre); pbrD (chumbo); merA e merB (mercúrio); niCoT (zinco), entre vários outros genes, sendo estes os mais conhecidos atualmente (DAS; DASH; CHAKRABORTY, 2016). Métodos de cultivos podem ser utilizados para um melhor entendimento sobre mecanismos bacterianos relacionados à resistência a metais potencialmente tóxicos, entretanto, uma grande parte dos microrganismos são difíceis de serem cultivados (VARTOUKIAN; PALMER; WADE, 2010). Sendo assim, o sequenciamento de alto rendimento, aliado aos métodos de Bioinformática, têm se revelado uma excelente abordagem para o entendimento de como os microrganismos conseguem tolerar concentrações elevadas de contaminantes, e, em determinados casos também reduzir a sua toxicidade nos ambientes. Tal abordagem independente de cultivo possibilita a realização de https://www.zotero.org/google-docs/?dsXHlp 3 investigações da composição de comunidades microbianas em termos de estruturação dos taxa e seu arsenal gênico (pool gênico), em relação à natureza e extensão do poluente assim como das condições ambientais (MALLA et al., 2018). Dentre as abordagens que mais podem contribuir para o estudo da maquinaria genética envolvida no processo de biorremediação está a Transcriptômica, área responsável por estudar as moléculas de RNA e, consequentemente, o processo de transcrição e expressão gênica frente a diferentes condições biológicas (LU et al., 2017). Neste contexto, a técnica de RNA-Seq pode ser uma ferramenta valiosa de sequenciamento de alto rendimento ao fornecer informações transcricionais para genes que podem ser diferencialmente expressos perante inúmeros estresses ambientais, tais como o acúmulo de metais potencialmente tóxicos (LU et al., 2017). 4 2. OBJETIVOS Neste trabalho o objetivo principal é obter uma maior compreensão e entendimento frente aos mecanismos bacterianos de resistência aos metais potencialmente tóxicos cromo trivalente (Cr+3), hexavalente (Cr+6) e cobre bivalente (Cu+2). Para tanto, propomos uma abordagem metatranscriptômica a fim de caracterizar a modulação do perfil de expressão gênica de uma comunidade bacteriana isolada de raízes da leguminosa Arachis pintoi Krapov. & W.C.Greg. após experimento de desafio com esses metais. Em um primeiro momento, a partir de ensaios de concentração mínima inibitória (MIC) dos metais frente ao crescimento da comunidade, as condições ideais para o desafio com os metais foram definidas. Utilizando-se a abordagem de sequenciamento RNA-Seq da comunidade, objetivamos realizar a montagem de novo do metatranscriptoma bacteriano, a fim de realizarmos análises comparando os genes expressos presentes na amostra da comunidade controle e desafiada. A partir do resultado dessas análises identificar genes diferencialmente expressos relacionados à presença do metal. Dessa forma, esperamos obter uma maior compreensão a respeito de genes responsivos (transcritos) perante a presença ou ausência dos metais, assim como contribuindo para um maior entendimento a respeito de prováveis vias metabólicas envolvidas em mecanismos de tolerância e resistência a Cr+3, Cr+6 e Cu+2 encontrados em certas espécies bacterianas. A fim de identificar quais espécies bacterianas estão compondo a comunidade em questão, o isolamento das bactérias e a análise do marcador molecular 16S rRNA desses isolados é necessário para a obtenção das prováveis identificações taxonômicas. 5 3. REVISÃO DE LITERATURA 3.1 POLUIÇÃO DO AMBIENTAL Com o advento da Revolução Industrial, muitos avanços técnico-científicos ocorreram principalmente no que diz respeito ao campo científico (XU; DAVID; KIM, 2018), todavia, muitos problemas ambientais tiveram início em grande parte devido ao exacerbado aumento da atividade industrial e ao crescimento exagerado da população urbana que contribuem para a poluição de corpos hídricos, atmosfera e solo (MATOS, 2020; PEREIRA, 2012). Quando falamos a respeito da poluição de corpos hídricos, estamos abordando um dos grandes problemas que a sociedade atual tem enfrentado. Através do lançamento de materiais residuais de indústrias e lixos domésticos, além de diversas substâncias químicas frequentemente empregues na agricultura, problemas como, eutrofização de mananciais, consumo de oxigênio, mau odor e gosto, além da adsorção de metais potencialmente tóxicos podem ser observados, sendo o último problema citado muito preocupante, uma vez que, os metais potencialmente tóxicos podem bioacumular ao longo das diferentes cadeias tróficas. Problemas ainda relacionados à estética das águas como mudanças na coloração e turbidez representam sérios problemas às Estações de Tratamento de Água (ETAs), enquanto sedimentos advindos de represas e assoreamento de rios interferem na diminuição da velocidade com que as águas cruzam seus cursos (PEREIRA, 2012). Quanto à poluição do ar, ou poluição atmosférica, é caracterizada pela emissão de gases provindos de automóveis, usinas termolétricas como fábricas, que usam energia de combustíveis fósseis, o que nos faz repensar e principalmente refletir a respeito dos grandes avanços tecnológicos que marcam nossa era, sendo extremamente dependentes do gasto de energia. Pode-se citar como principais fontes de poluição atmosférica a emissão de gases tóxicos, produzidos por indústrias e veículos, assim como os compostos tóxicos formados https://www.zotero.org/google-docs/?fMvnK6 6 a partir de reações químicas entre os citados primeiramente com a atmosfera (PEREIRA, 2012). Dentre os problemas ocasionados pela poluição, o solo é um dos ambientes mais prejudicados, uma vez que, muitas vezes, este é usado como escoadouro para diversos resíduos sólidos e líquidos, tornando-se um problema alarmante em diversas nações (RODRÍGUEZ EUGENIO et al., 2018). Segundo dados da Organização das Nações Unidas para a Alimentação e Agricultura (FAO - Food and Agriculture Organization) e o Painel Técnico Intergovernamental sobre o Solo (ITPS - Intergovernmental Technical Panel on Soils) de 2015, a poluição do solo foi considerada um dos mais alarmantes problemas ambientais na Europa e Eurásia, África do Norte e Subsaariana, Ásia, Pacífico Norte e nas Américas (Global assessment of soil pollution, 2021; RODRÍGUEZ EUGENIO et al., 2018). A poluição do solo diz respeito a substâncias e/ou produtos químicos presentes em concentrações elevadas no ambiente capazes de ocasionar danos em qualquer ser vivo (RODRÍGUEZ EUGENIO et al., 2018). Estes poluentes podem ter diversas origens sendo estas agrupadas em fontes de poluição naturais ou antropogênicas (ASAD et al., 2019). Sendo ainda possível classificar as fontes de poluição em pontual, de fácil identificação, ou difusa, quando não é possível estabelecer, com maiores precisões, as áreas poluídas (RODRÍGUEZ EUGENIO et al., 2018; TALABI; KAYODE, 2019). Os poluentes do solo estão divididos em duas classes principais, orgânicos: substâncias cloradas ou não cloradas; e inorgânicos: compostos metálicos ou não metálicos (AKRAM et al., 2018; Global assessment of soil pollution, 2021). Dentre os compostos metálicos, é possível encontrar os metais pesados ou potencialmente tóxicos, que, quando em elevadas concentrações, podem causar sérios danos ao solo como afetar plantas e animais, e prejudicar a saúde humana (YANG et al., 2018). 3.2 METAIS PESADOS OU POTENCIALMENTE TÓXICOS Os metais pesados podem apresentar dois tipos de definições distintas, sendo uma do ponto de vista químico, onde estes são classificados de acordo https://www.zotero.org/google-docs/?ULm10w https://www.zotero.org/google-docs/?vEKIcv https://www.zotero.org/google-docs/?vEKIcv https://www.zotero.org/google-docs/?vJmoHq 7 com uma gravidade específica maior que 5 e uma massa atômica superior a 20, tais como o cádmio, chumbo, cobre, cromo, níquel e zinco; ou do ponto de vista biológico onde o termo “pesado” é comumente empregado para referir-se a metais que, quando presentes no meio ambiente mesmo em baixas concentrações, podem causar danos aos organismos vivos (LI et al., 2019a). Essas diferentes definições levam, muitas vezes, a interpretações equivocadas sobre a relação entre um metal pesado e o ambiente onde ele é encontrado (POURRET; HURSTHOUSE, 2019). Isso ocorre porque nem sempre a presença de um metal pode ser realmente prejudicial ao meio ambiente, sendo alguns considerados essenciais para atividades fisiológicas, bioquímicas e metabólicas para diversos animais, incluindo os seres humanos (TCHOUNWOU et al., 2012). Os metais cobalto, cobre, ferro, manganês, molibdênio e zinco, por exemplo, são metais pesados considerados essenciais aos organismos vivos (ZORODDU et al., 2019). Entretanto, os mesmos metais pesados essenciais para os humanos podem não ser para os demais seres vivos e vice-versa uma vez que, a relação existente entre um metal pesado e um organismo vivo acaba sendo extremamente complexa, sendo que, a concentração encontrada irá interferir na toxicidade ou não do metal (ALI; KHAN, 2019). Alguns outros metais pesados não apresentam nenhum benefício aos seres humanos e podem ser responsáveis por diversas doenças estando intimamente relacionados ao desenvolvimento de cânceres, seja por inalação, absorção, ingestão ou via dérmica. Estes podem se acumular no organismo devido a sua natureza não biodegradável e meia-vida longa (LÜ et al., 2018). De acordo com Loomis e colaboradores (2017), os metais pesados como cádmio, cromo, níquel e arsênio (metaloide) estão classificados entre os principais agentes causadores de câncer em humanos e animais experimentais conforme dados obtidos através da revisão de monografias da Agência Internacional de Pesquisa em Câncer (IARC) nos períodos de 1971 á 2017 (LOOMIS et al., 2018). Pelos critérios da IARC, que levam em consideração dados epidemiológicos e experimentais em suas classificações, estes metais juntamente com outros elementos químicos, constituem o chamado “Grupo 1” de carcinógenos, ou seja, 8 já está comprovado suas ligações com diversos tipos de cânceres, principalmente de pulmão e vias aéreas (MATSUDA; OKUYAMA, 2018). O maior problema relacionado aos metais pesados reside em suas concentrações presentes no meio ambiente, independente da sua classificação, “essenciais ou não essenciais”, mesmo em concentrações consideradas baixas podem desencadear diversos problemas ambientais ao solo e a biodiversidade por serem bioacumulados ao longo da cadeia trófica, biomagnificados, recalcitrantes e não estarem sujeitos à quebra metabólica em diversos organismos (KAPAHI; SACHDEVA, 2019). Alguns exemplos de metais pesados mais comumente encontrados são: arsênio (As), cádmio (Cd), chumbo (Pb), cobalto (Co), cobre (Cu), cromo (Cr), mercúrio (Hg), níquel (Ni), selênio (Sn) e zinco (Zn). Porém há diversas controvérsias envolvem o uso do termo metais pesados sendo proposta uma substituição do termo por metais “potencialmente tóxicos”, uma vez que, a toxicidade de um elemento está intimamente relacionada à sua concentração presente no meio ambiente (POURRET; HURSTHOUSE, 2019). Segundo Duffus (2002), um dos primeiros pesquisadores a contestar o termo “pesado”, a maior parte dos metais classificados como pesados não estão biodisponíveis no ecossistema, não podendo, portanto, serem classificados como pesados (DUFFUS, 2002). Há ainda, alguns autores que apoiam a continuação da existência do termo por este estar extremamente difundido nas ciências ambientais e toxicologia (HÜBNER; ASTIN; HERBERT, 2010). Em virtude de tantas controvérsias relacionadas à dosagem de metais potencialmente tóxicos no ambiente, assim como características físicas, químicas e biológicas, devem ser levadas em consideração antes de classificar um metal como essencial ou não. Apesar disso o que fica claro é que qualquer substância, até mesmo a água, pode se tornar prejudicial à saúde dos seres vivos quando em excesso (MISHRA et al., 2019; POURRET; HURSTHOUSE, 2019). 3.3 FONTES DE POLUIÇÃO POR METAIS POTENCIALMENTE TÓXICOS Atualmente, as fontes de poluição por metais potencialmente tóxicos podem ser classificadas em fontes naturais ou antropogênicas, sendo a última a 9 principal contribuidora para a poluição ambiental por tais elementos (PAUL, 2017; WU et al., 2018). As fontes naturais destes metais são provenientes de processos erosivos, lixiviação e intemperismo rochoso, porém, quando comparadas às fontes de poluição antrópicas, acabam não sendo tão prejudiciais (PAUL, 2017). As fontes antropogênicas podem ser divididas em industriais tais como a manufatura, deposição residual, água residual e usinas geradoras de energia; fontes minerais como a extração de minérios, rejeitos e fundição; e atividades intimamente relacionadas à agricultura como o uso de fertilizantes, adubos de origem animal (estrume), irrigação e lodo de esgoto que também, em muitos lugares, acaba sendo usado como adubo para as plantações (Figura 1) (HOU et al., 2020). Figura 1 - Principais fontes antropogênicas responsáveis pela poluição de metais potencialmente tóxicos no meio ambiente. No quadro branco (lado esquerdo inferior da figura) as fontes de poluição encontram-se divididas em três classes principais: Agricultura, Indústria e Mineração. 10 Fonte: Adaptado de HOU e colaboradores (2020). 3.4 POSSÍVEIS DANOS CAUSADOS A ALGUNS SERES VIVOS Os metais potencialmente tóxicos não apresentam apenas um perigo para a qualidade do solo como também podem ser prejudiciais a humanos podendo afetar diversos sistemas do corpo como o respiratório, circulatório, reprodutor, endócrino e nervoso, isso ocorrer, por exemplo, graças à capacidade de óxido- redução (redox) dos metais que interferem em diversas reações celulares como também no material genético do organismo caso atinjam o núcleo celular (WU et al., 2018). A contaminação por metais potencialmente tóxicos em humanos pode ocorrer por três principais vias: ingestão (dieta), inalação e/ou contato dérmico (MISHRA et al., 2019). Elevadas concentrações de cádmio (Cd), podem causar diversos danos ao sistema esquelético e reprodutor, prejudicar o fígado, rins, visão, audição e, no caso de mulheres grávidas pode causar sérios danos embrionários levando a problemas placentários, parto prematuro e, até mesmo, a perda do feto/embrião (GENCHI et al., 2020a). Já o níquel, é capaz de causar dermatites, doenças cardiovasculares, asma, fibrose pulmonar, câncer intestinal e danos mitocondriais (GENCHI et al., 2020b). O chumbo (Pb) está relacionado à redução da memória, 11 danos ao sistema nervoso, inibição de cálcio entre outros problemas, assim como o metaloide arsênio (As) que também pode afetar a saúde mental humana, além de estar relacionado à pressão alta e diabetes, podendo levar a morte através da síndrome paralítica que afeta o sistema nervoso central (REHMAN et al., 2018). Outros dois metais potencialmente tóxicos que podem levar a sérios problemas à saúde humana são o cobre e o cromo. O cobre (Cu) é caracterizado por causar danos cerebrais, cirrose, irritação no estômago e intestino como também anemia crônica; já o cromo (Cr), quando inalado pode levar a danos nos septos nasais, coceiras no nariz, irritações graves e úlceras, mas, ao ser ingerido ou absorvido os problemas são ainda mais graves, podendo causar danos renais e hepáticos, convulsões, náuseas, irritação no trato gastrointestinal e até mesmo a morte (MISHRA et al., 2019). Não apenas os seres humanos são afetados pela poluição por metais potencialmente tóxicos como vários outros organismos vivos. As plantas, por exemplo, acabam tendo seu crescimento reduzido, como também pode ocorrer a diminuição nas taxas fotossintéticas e teores de clorofila, sendo que, os metais potencialmente tóxicos também podem gerar estresse hídrico e se acumular nos tecidos dos vegetais, sendo ingeridos por herbívoros que comem as plantas contaminadas (SARWAR et al., 2017). Muitas plantas medicinais também podem bioacumular diversos metais potencialmente tóxicos principalmente se cultivadas em zonas próximas a indústrias e fundição; do mesmo modo vegetais cultivados em estufa, quando comparados a aqueles cultivados em campos abertos, apresentam contaminação por metais como Cu, Zn, Mn, Pb e Cd (RAI et al., 2019). Um estudo conduzido por Maurya e colaboradores (2019) identificou sete espécies de peixes com elevados níveis de Zn, Pb, Cu, Cd e Cr no rio Gange, sendo que, tais espécies são comumente vendidas em diversos mercados populares da Índia (MAURYA et al., 2019). Uma grande preocupação em relação à poluição por metais potencialmente tóxicos é exatamente sua bioacumulação ao longo da cadeia trófica, onde, os metais presentes no ambiente abiótico como a água, sedimentos e solo, são facilmente transferidos e acumulados nos seres vivos, sendo assim, muitos alimentos ingeridos podem acabar apresentando sérios danos à saúde (ALI; KHAN, 2019). Não apenas os seres humanos e as 12 plantas são prejudicados pela poluição por metais como também organismos invertebrados (MIEDICO et al., 2016; ZIYAADINI et al., 2017), anfíbios (MAHMOOD et al., 2016), répteis (NILSEN et al., 2017), aves (BAUEROVÁ et al., 2017) e mamíferos (KORSTIAN et al., 2018; PÉREZ-LÓPEZ et al., 2016). Diante aos diversos problemas desencadeados pelo acúmulo de metais potencialmente tóxicos no meio ambiente, o homem vem buscando a cada dia desenvolver estratégias de remediação que, podem ser classificadas em estratégias de remediação in situ ou ex situ (SONG et al., 2017). 3.5 ESTRATÉGIAS DE REMEDIAÇÃO O termo remediação é frequentemente utilizado para denominar estratégias (sejam elas químicas, físicas ou biológicas) que possibilitam a remoção de poluentes presentes no meio ambiente podendo ser dividida em duas estratégias distintas: remediação in situ e ex situ. A estratégia in situ ocorre quando o processo de remediação acontece no próprio local da contaminação sem que haja a necessidade de mover os poluentes para outros locais. Já a remediação ex situ é um processo que não ocorre no local da poluição havendo a necessidade de transferência do poluente a outro local para que haja tratamento, como por exemplo, no caso de aterros sanitários (KUPPUSAMY et al., 2016). Dentre essas estratégias, a remediação in situ foi considerada mais econômica, oferecendo melhores vantagens técnicas e ambientais, mas, a escolha de qual técnica deve ser usada dependerá muito das características do solo, tipos de poluentes a serem removidos, suas concentrações e finalidades (LI et al., 2019a). De acordo com Liu e colaboradores (2018), as estratégias de remediação in situ podem ser físicas, elétricas, químicas ou biológicas, enquanto que as estratégias ex situ podem ser apenas físicas, químicas ou termais (LIU et al., 2018). Entretanto, as técnicas de remediação classificadas como físicas, químicas, termais e elétricas podem ser inviáveis economicamente e, em muitos casos, podem desencadear outros danos ao solo, como torná-lo impróprio para cultivo, e aos organismos vivos que ali habitam (KHALID et al., 2017). Assim sendo, muito vem se falando a respeito das técnicas de remediação biológicas, também conhecidas apenas pelo termo biorremediação, que são mais fáceis e 13 baratas de serem implantadas como ambientalmente mais amigáveis e corretas (LELLIS et al., 2019). A biorremediação é uma técnica que tem por objetivo promover a remoção e/ou conversão de substâncias tóxicas ao meio ambiente, empregando diversos organismos vivos ou biomassa morta (QUINTELLA; MATA; LIMA, 2019). Estes organismos podem, através de processos bioquímicos, fisiológicos e/ou metabólicos converter poluentes em substâncias menos prejudiciais tais como a água, dióxido de carbono e gás nitrogênio (KAPAHI; SACHDEVA, 2019). No caso dos metais potencialmente tóxicos estes podem ter seus estados químicos alterados, tornando-os menos tóxicos como é o caso do cromo hexavalente óxido- reduzido em cromo trivalente (WANG et al., 2017). Cientificamente, diversos seres vivos já tiveram suas habilidades biorremediadoras confirmadas tais como as algas (ficorremediação) (LEONG; CHANG, 2020); fungos (micorremediação) (QIAN et al., 2017), plantas (fitorremediação) (SARWAR et al., 2017) e bactérias (IRAVANI; VARMA, 2020). Logo, diversas estratégias biológicas de biorremediação puderam ser desenvolvidas, sendo estas a bioestimulação, bioatenuação, biolixiviação, biopilha, biofiltros, bioventilação, biossorção e compostagem (CRISTALDI et al., 2017). Entre os organismos possíveis de serem empregados em processos biorremediadores, os microrganismos representam uma das melhores escolhas, isso porque estão adaptados a uma série de ambientes diversos, mas, principalmente por conseguirem converter, modificar e usar os poluentes como forma de alimento para manutenção de energia e/ou produção de biomassa. 3.6 MICRORGANISMOS E BIORREMEDIAÇÃO Como é de conhecimento geral, os microrganismos foram os primeiros seres vivos a habitarem o planeta Terra, desde então milhões e até mesmo bilhões de anos se passaram permitindo que os microrganismos, principalmente bactérias, conseguissem se adaptar a diversos tipos de ambiente devido a suas 14 capacidades metabólicas (BAUM et al., 2017; SRISWASDI; YANG; IWASAKI, 2017). Em relação aos ambientes com altos níveis de poluição, e nestes incluímos principalmente os prejudicados por metais potencialmente tóxicos, as bactérias podem promover a quebra e/ou transformação de compostos tóxicos em menos tóxicos e até mesmo não tóxicos devido à produção de enzimas que possibilitam o uso destes poluentes como fonte de alimento atuando como biocatalizadores e promovendo uma série de reações bioquímicas que facilitam a degradação do contaminante (ABATENH et al., 2017). Utilizar microrganismos como possíveis organismos biorremediadores não é tarefa fácil, apenas o contato com o poluente não é sinônimo de que determinada comunidade bacteriana sobreviva e consiga quebrar/transformar contaminantes (ABATENH et al., 2017). Para tanto, é necessário à existência de microrganismos selvagens presentes no local poluído que sejam capazes de degradar o contaminante (KAPAHI; SACHDEVA, 2019). Outros fatores como pH, temperatura, solo, presença de oxigênio, aceptores de elétrons, nutrientes e fatores biológicos tais como interações antagônicas e predação entre microrganismos também devem ser considerados (AYANGBENRO; BABALOLA, 2017). Em relação aos metais potencialmente tóxicos, os microrganismos podem apresentar diversos mecanismos de resistência, tais como oxidação do metal, bombas de efluxo, metilação, desmetilação, degradação de ligante de metal, sequestro intra ou extracelular, exclusão por barreira de permeabilidade bem como produzir quelantes (metalotioneínas e biossurfactantes) (IGIRI et al., 2018). Todos esses mecanismos citados estão intimamente relacionados ao material genético microbiano propenso a diversas mudanças genéticas graças a mecanismos como transferência de genes por conjugação, transformação e transdução, além dos mecanismos de transposição (e.g. transposons), que contribuem para o surgimento de novas características (DAS; DASH; CHAKRABORTY, 2016). 3.7 IMPORTÂNCIA DE ESTUDOS GENÉTICOS EM MICRORGANISMOS 15 Uma das grandes vantagens em se estudar o material genético de microrganismos a fim de compreender possíveis mecanismos de resistência a metais potencialmente tóxicos, consiste no fato da maioria não ser passível de cultivo por métodos microbiológicos tradicionais ou até mesmo serem incultiváveis, logo, o uso de abordagens independentes de cultura acabam sendo uma alternativa viável para sobrepor esta questão (BERINI et al., 2017). Graças aos avanços das tecnologias de Sequenciamento de Nova Geração (NGS: Next Generation Sequencing) e análises de bioinformática, alguns autores como Malla e colaboradores (2018), acreditam que atualmente seja possível haver maiores “insights” sobre as comunidades microbianas em locais contaminados sendo possível estudar mecanismos fisiológicos, bioquímicos e metabólicos dos microrganismos, afirmando ainda, serem de grande auxílio às ferramentas “ômicas”, como genômica, transcriptômica e proteômica, para a compreensão da “black - box” microbiana (MALLA et al., 2018). Alguns microrganismos tais como Microbacterium spp. (CORRETTO et al., 2015), Alkaliphilus metalliredigens cepa QYMF (HWANG et al., 2016), Bacillus cereus (NAYAK et al., 2018), Serratia marcescens RSC-14 (KHAN et al., 2017) e os filos Chloroflexi, Acidobacteria, Planctomycetes e Bacteroidetes (JIANG et al., 2019) são alguns exemplos de grupos de bactérias que possuem genes que lhes garantem a sobrevivência em meio contaminado por metais potencialmente tóxicos, onde, apenas foi possível identificá-los através do sequenciamento de genomas. No entanto, apenas saber quais os possíveis genes presentes no genoma de um microrganismo, não é garantia de que estarão sendo expressos, porém, ao se utilizar a transcriptômica é possível identificar quais destes genes estão sendo realmente transcritos (CRAMER, 2019). 3.8 TRANSCRIPTOMA E METATRANSCRIPTOMA Através do dogma central da biologia molecular, hoje é possível entender como as informações genéticas presentes nos genes que constituem a molécula de DNA, são expressas caracterizando, juntamente com os fatores ambientais, o fenótipo de um organismo vivo (CRICK, 1970; KUKURBA; MONTGOMERY, 16 2015). A informação genética armazenada no DNA é transcrita em RNA e, posteriormente traduzida em proteínas (CRICK, 1970), porém, nem todos os genes presentes em um genoma são transcritos e alguns ainda, são transcritos em determinados momentos, o mesmo ocorre para as proteínas, não são todos os RNAs que serão traduzidos (CRAMER, 2019). Uma pergunta muito interessante diz respeito à diversidade de tipos celulares que constituem os mais variados tecidos e órgãos de um organismo vivo. Se o material genético é o mesmo, como há tantos tipos celulares diferentes? Isso se dá graças à expressão gênica diferencial que é extremamente dinâmica, não sendo afetada apenas pelo material genético como por questões multifatoriais, por exemplo, o ambiente (MCDERMAID et al., 2019). O RNA é o processo chave da expressão gênica por ser o grande responsável pela complexidade da vida, principalmente em eucariotos (STARK; GRZELAK; HADFIELD, 2019). As moléculas de RNA, portanto, são muito importantes para que seja possível compreender e interpretar os elementos funcionais de um genoma, a transcrição de um conjunto específico de genes caracteriza a identidade de um tipo celular como regula as atividades biológicas dentro destas. Ao conjunto completo de moléculas de RNA presentes em um organismo vivo é dado o nome de transcriptoma (MANZONI et al., 2016). Estes RNAs podem ser divididos em duas classes principais: os RNAs codificantes de proteínas (cRNA), tais como o RNA mensageiro (mRNA), ribossomal (rRNA) e RNA de transferência (tRNA) (WANG; FARHANA, 2022); e os RNAs não codificantes, chamados em inglês de Non-coding RNA (ncRNA), onde estão classificadas aquelas moléculas de RNA que não são traduzidas, mas são de extrema importância em outros processos biológicos como os pequenos RNAs nucleares (snRNA), pequenos RNAs nucleolares (snoRNA), microRNAs (miRNA), piwi RNA (piRNA), RNAs longos não-codificantes (lncRNA) e os RNAs circulares (circRNA) (ANASTASIADOU; JACOB; SLACK, 2018). Estudos de transcriptômica são geralmente empregados quando o intuito é investigar mudanças fenotípicas, processos de desenvolvimento, estresses ambientais ou doenças (DROST et al., 2018). Também é possível realizar estudos que envolvam o transcriptoma de mais de um indivíduo como, por exemplo, 17 pesquisas que buscam investigar a expressão de transcritos de uma microbiota, seja no solo, oceano ou até mesmo associadas a hospedeiros, como plantas, e animais. Dessa forma, é possível encontrar associações de perfis transcricionais em relação a um dado momento sob determinadas condições ambientais. Isso também possibilita alcançar uma maior compreensão acerca das funções de genes que estão sendo expressos (SHAKYA; LO; CHAIN, 2019). A esse tipo de estudo é dado o nome de metatranscriptômica, ou seja, conjunto de RNAs de diferentes organismos em um determinado ambiente ou meio de cultura (SHI; ZHANG; HOLMES, 2018). 3.9 IMPORTÂNCIA EM SE ESTUDAR O METATRANSCRIPTOMA A metatranscriptômica vem sendo constantemente usado em estudos a respeito do material genético coletivo de microrganismos que constituem os mais diversos microbiomas tais como o ambiente aquático (BERG et al., 2018), terrestres (HOLMES et al., 2017), atmosférico (AMATO et al., 2019) e o próprio organismo humano (HATTON et al., 2017; MARCELINO et al., 2019; MEHTA et al., 2018; SOLBIATI; FRIAS-LOPEZ, 2018), além de interações entre animais - micróbios (LI et al., 2019b; LI; GUAN, 2017) e plantas - micróbios (GONZALEZ et al., 2018; IGIEHON; BABALOLA, 2018; LLOYD et al., 2018). Comunidades bacterianas do solo são vitais em diversos processos envolvendo o ecossistema como ciclagem de nutrientes e de carbono, como também relacionadas ao crescimento vegetal. Com o auxílio de estudos de sequenciamento de alto rendimento, diversas comunidades bacterianas do solo puderam ter sua composição e diversidade identificadas sem precisar de métodos de cultivo laboratoriais (JANSSON; HOFMOCKEL, 2018). Para alcançar diferentes níveis de informação a respeito das comunidades bacterianas alguns métodos podem ser utilizados como a análise de RNA ribossômico (rRNA), análise shotgun de genoma completo (WGS; metagenômica) e análise shotgun de transcriptoma completo (metatranscriptômica) (NIU et al., 2018). 3.10 ANÁLISE DO GENE 16S rRNA 18 Segundo Niu e colaboradores (2018) a análise de dados de marcadores moleculares como o gene 16S rRNA pode ser considerada um dos métodos mais populares e baratos na identificação taxonômica até o nível de gênero de uma comunidade bacteriana (NIU et al., 2018). Isso ocorre devido a três pontos importantes: a função do gene 16S rRNA é extremamente conservada em bactérias não tendo se alterado muito ao longo do tempo onde, a presença de mudanças genéticas pode ser relacionada à evolução de determinado microrganismo, também é um gene presente em todas as bactérias e arqueas, além de ter tamanho suficiente para a realização de estudos de bioinformática (CAO et al., 2017; NIU et al., 2018). Com base nas semelhanças das sequências de nucleotídeos presentes no gene 16S rRNA é possível juntar estas sequências em OTUs (Unidade Taxonômicas Operacionais) que são submetidas a bancos de dados biológicos para a identificação taxonômica da comunidade bacteriana (CAO et al., 2017). Para a obtenção do gene 16S rRNA, é necessário o sequenciamento de Amplicons (produtos de amplificação por PCR - Reação em Cadeia da Polimerase) de um único isolado, onde, normalmente o método de sequenciamento de Sanger é utilizado. As sequências obtidas posteriormente devem ser comparadas entre si para a obtenção de uma sequência consenso. Esse procedimento inicia com a leitura das bases a partir dos cromatogramas gerados pelo equipamento sequenciador, passa pela identificação de possíveis artefatos, e segue até a montagem da sequência consenso. Nesta etapa, utiliza- se o pacote de programas denominado phredPhrap desenvolvido pelo Dr. Phil Green e colaboradores da Universidade de Washington (EWING et al., 1998) dividido nos programas Phrep, Phrap, Cross-match e Consed. Para uma possível identificação das sequências podemos usar certos bancos de dados que permitem como entrada a sequência montada de fragmentos do gene 16S rRNA, tais como o banco de dados RDP (WANG et al., 2007) e o SILVA (QUAST et al., 2013). 3.11 DO SEQUENCIAMENTO DE SANGER AO NGS 19 As tecnologias de sequenciamento de DNA existem desde os anos de 1970, porém, eram caras, complexas e, muitas vezes, necessitavam de reagentes tóxicos ou radioativos; no ano de 1977 foi desenvolvido por Frederick Sanger o método de sequenciamento de Sanger que formou a base para a primeira geração de sequenciadores automatizados de DNA, apesar do avanço era impossível sequenciar o genoma em sua totalidade, além de ser uma técnica complicada, demorada e custosa (BESSER et al., 2018). Foi no início da década de 1990, com o advento do Projeto Genoma Humano que a demanda por métodos mais sofisticados de sequenciamento se tornou ainda mais premente. Afinal, o objetivo final desse projeto foi sequenciar e interpretar os 3,2 bilhões de pares de bases de nucleotídeos que constituem o genoma humano (VINCENT et al., 2017). O sequenciamento de nova geração ou de próxima geração (NGS – Next- generation sequencing) surgiu no início dos anos 2000 proporcionando uma grande mudança nas tecnologias de sequenciamento, agora era possível sequenciar muito mais pares de base, tornando a tecnologia mais barata e rápida comparada ao método de Sanger (VAN DIJK et al., 2014). Segundo MacCannell (2016), essa nova abordagem de sequenciamento poderia, em termos de contribuição aos avanços científicos, ser comparada ao surgimento da PCR (Reação em Cadeia da Polimerase) desenvolvida por Kary Mullis na década de 1980 (MACCANNELL, 2016). Não apenas foi possível sequenciar genomas completos como também transcritos e proteínas. Em 1995 foi criado o primeiro método de sequenciamento de transcriptomas (em escala “ômica”) o sequenciamento SAGE (Análise serial de expressão gênica) baseado no método de Sanger (WANG et al., 2019); com o surgimento de NGS, técnicas de sequenciamento de transcritos ficaram mais rápidas e baratas possibilitando o sequenciamento de bilhões de pares de bases, tendo como principais métodos o RNA-Seq. Os métodos baseados em sequenciamento como o RNA-Seq tornaram obsoletos os microarranjos baseados em hibridização em larga-escala (LOWE et al., 2017). 3.12 ANÁLISE SHOTGUN DE TRANSCRIPTOMA COMPLETO - RNA-Seq 20 Atualmente é possível sequenciar todo genoma de um organismo, para tanto muito se adota o método de sequenciamento denominado de estratégia de shotgun, onde, enzimas de restrição são empregues com o intuito de fragmentar, em milhares ou milhões de “pedaços” (leituras ou reads) um cromossomo (SHARPTON, 2014). Após esta etapa é como se tivéssemos milhares de peças de um quebra-cabeça e devêssemos montá-lo, podendo utilizar duas abordagens distintas: montagem com referência ou montagem de novo (Figura 2). Na primeira abordagem às diversas leituras são comparadas a um genoma referência aonde irão se sobrepor a regiões similares do genoma (DIERCKXSENS; MARDULYN; SMITS, 2017); na analogia do quebra-cabeça é como se olhássemos para a imagem da caixa do jogo onde há uma figura da imagem que se deseja montar. Já na abordagem de novo, a montagem das sequências parte do zero, ou seja, não há um genoma no qual seja possível comparar às sequências, logo, as leituras serão comparadas entre si (LISCHER; SHIMIZU, 2017; SCHNEEBERGER et al., 2011); ou seja, não há nenhuma imagem de como seria a figura do quebra-cabeça devendo montá-lo apenas com base no encaixe das peças. A metodologia shotgun não é apenas usada em estudos genômicos como também em análises de transcriptômica, para tanto é empregue uma técnica denominada de RNA-Seq onde, após o isolamento das moléculas de RNA, é preciso criar bibliotecas de RNA-Seq (KUKURBA; MONTGOMERY, 2015). Porém, as tecnologias de sequenciamento requerem moléculas de DNA, logo, as moléculas de RNA devem ser transcritas em moléculas de cDNA através do processo de transcrição reversa. Às moléculas de cDNA, as quais durante o processo são fragmentadas, são adicionados adaptadores para que sejam amplificadas (HRDLICKOVÁ; TOLOUE; TIAN, 2016). Várias plataformas de sequenciamento podem ser usadas, entretanto, nos dias atuais, a empresa Illumina é a responsável por fornecer as plataformas mais usadas, aplicando uma abordagem de sequenciamento por síntese, onde a leitura das bases é realizada a partir da síntese de fita complementar as fitas moldes que previamente foram amplificadas diretamente em uma lâmina de fluxo, ou flow cell (LAHENS et al., 2017). 21 Após a etapa de sequenciamento das bibliotecas de RNA-Seq tem se início a análise dos dados brutos, ou seja, uma análise prévia de qualidade das sequências que ainda não passaram pela etapa de processamento, para este fim pode ser usado um programa denominado FastQC (LEGGETT et al., 2013). Estas sequências brutas passarão por uma etapa de processamento onde ocorrerá a remoção de adaptadores que pode ser realizada pelo programa Atropos (DIDION; MARTIN; COLLINS, 2017), e por uma remoção de bases e leituras que tenham baixa qualidade de acordo com o índice de qualidade Phred (“Q score”, relacionado à probabilidade P de a base ter sido lida incorretamente, ou seja, Q = –10*log10[P]), podendo ser utilizado o programa Prinseq (SCHMIEDER; EDWARDS, 2011). Em seguida a etapa de processamento, novamente o programa FastQC pode ser usado para a checagem de qualidade das sequências. Com as sequências processadas é possível realizar a montagem de um transcriptoma ou metatranscriptoma. No caso de uma abordagem baseada em referência, usando programas como o Cufflinks (TRAPNELL et al., 2010) o qual reconhece alinhamentos de leituras RNA-Seq com uma referência (genoma ou transcriptoma), obtidos a partir de programas como Bowtie2 (LANGMEAD et al., 2009), TopHat (TRAPNELL; PACHTER; SALZBERG, 2009) ou STAR (DOBIN; GINGERAS, 2015). No caso de abordagem que não possua ou utilize referências, utiliza-se normalmente o programa Trinity (HAAS et al., 2013) para a montagem de novo do transcriptoma. Figura 2 - RNA-Seq: Principais etapas. 22 Fonte: Adaptado de Kukurba e Montgomery (2015). 3.13 METATRANSCRIPTOMA E BACTÉRIAS RESISTENTES A METAIS Nosso ecossistema sofre grande influência de microrganismos que conseguem, devido ao seu ciclo de vida curto e organização genética, acumular rapidamente alterações genômicas provenientes de processos como mutação, recombinação gênica, elementos transponíveis (transposons) e duplicação gênica. Esses mecanismos garantem, através do desenvolvimento de novas características, que microrganismos possam sobreviver aos mais diversos habitats incluindo aqueles poluídos por metais potencialmente tóxicos (PRABHAKARAN; AQEEL ASHRAF; SYAIDATUL AQMA, 2016). A seleção 23 natural privilegia capacidades metabólicas que permitem a transformação ou remoção de poluentes, portanto, entender o metatranscriptoma de uma comunidade bacteriana nos permite compreender a expressão gênica específica em resposta aos mais diversos estímulos ambientais, dentre estes, a poluição por metais potencialmente tóxicos (CABRAL et al., 2016). Em ambientes poluídos por metais potencialmente tóxicos os microrganismos que ali vivem tendem a expressar genes específicos de resistência e detoxificação a determinados metais, por exemplo: os genes cadB e cadD são encontrados em muitas bactérias que sobrevivem em ambientes contaminados pelo cádmio sendo responsáveis por codificar proteínas de ligação ao cádmio e metalotioneínas (cadB) e ligantes de cádmio (cadD) (ABBAS et al., 2018; DAS; DASH; CHAKRABORTY, 2016). Muitos outros genes podem ser mencionados, tais como o gene pbrD, responsável por codificar proteínas de ligação ao chumbo; os genes merA e merB relacionados à resistência a mercúrio, onde, o primeiro codifica para enzima denominada de mercúrio-íon redutase e o segundo, para enzima organomercúrio liase; na presença do metal zinco, podem ser expressas pelo gene niCoT a enzima níquel-cobalto transferase (DAS; DASH; CHAKRABORTY, 2016). Este trabalho busca, por meio de análises de metatranscriptoma, compreender melhor genes transcritos por bactérias que conseguem sobreviver a ambientes contaminados por cromo hexavalente e trivalente e cobre bivalente. 3.14 GENES BACTERIANOS EXPRESSOS NA PRESENÇA DE CROMO (Cr) Segundo a revisão de literatura realizada por Pushkar e colaboradores (2021), muitos genes estão envolvidos no mecanismo de desintoxicação de cromo realizado por bactérias como forma de proteção ao metal sendo os principais chrA, chrB, chrR, chrB, chrC, chrT e yieF; além destes genes, outros ainda estão envolvidos no processo de oxido-redução de Cr+6 a Cr+3 como nfrA e nemA (PUSHKAR et al., 2021). O gene chrA e chrB são geralmente expressos quando as bactérias estão em um ambiente com alta concentração de cromo (Cr) e, quando expressos em conjunto possibilitam uma maior resistência ao metal quando expressos 24 individualmente (BRANCO; MORAIS, 2013; SHAW; DUSSAN, 2018). O gene chrA está envolvido no transporte de Cr pela célula por codificar proteínas pertencentes à família de transportadores de íons cromato (chr) (BAAZIZ et al., 2017; GU et al., 2020); já o gene chrB pode atuar como um regulador do operon chr, tendo forte papel na redução de Cr+6 a Cr+3 que, posteriormente é transportado pela célula via chrA. Além disso, o gene chrB também atua como um modulador para a codificação da proteína chrA e é extremamente importante na conferência de resistência ao Cr; em conjunto, esses dois genes também reduzem a toxicidade ao cromato (BRANCO et al., 2008; DONG et al., 2018a). O produto gênico oriundo da expressão dos genes yieF e chrR está relacionado à transferência de elétrons para Cr+6 gerando, concomitantemente, espécies reativas de oxigênio (ROS) por meio de dois mecanismos que recebem o nome de classe I (tight) e classe II (semi-tight) (BALDIRIS et al., 2018); todavia, o dano oxidativo induzido por Cr ao material genético é superado através da ativação dos sistemas Rec e de reparo (THORGERSEN et al., 2017). Cada um desses genes possui um mecanismo distinto na redução de Cr+6: yieF reduz Cr+6 a Cr+3 de maneira direta por transferência de três elétrons; chrR promove a redução de Cr combinando etapas de transferência de um ou dois elétrons o que gera mais ROS em comparação com YieF que detém apenas uma etapa de redução (BAAZIZ et al., 2017). Outro gene envolvido na redução de cromo hexavalente a trivalente recebe o nome de chrT que codifica proteínas pertencentes à família FMN-redutase (ALHEBSHI; EL-BESTAWY, 2018; GU et al., 2020). Também há genes que promovem a redução catalítica de Cr+6 para Cr+3 como o gene nfrA relatado como tendo capacidade elevada de aceitação de elétrons que, posteriormente são empregues em reações de redução codificando proteínas pertencentes à família nitro/flavoredutase; outros genes envolvidos na redução catalítica do cromo são os genes nfsA, nemA e lpDh (AL HASIN et al., 2010; ZHENG et al., 2014). Segundo um estudo realizado por Ma e colaboradores (2019) os genes nfsA e nemA estão mais expressos em bactérias que acabaram de serem expostas ao metal cromo (MA et al., 2019). 3.15 GENES BACTERIANOS EXPRESSOS NA PRESENÇA DE COBRE (Cu) 25 Os mecanismos de resistência ao cobre foram muito estudados em Escherichia coli, onde um mecanismo regulador duplo de resistência acabou sendo identificado (HIGGINS et al., 2020). O primeiro desses reguladores é controlado pela expressão de dois genes: cusR e cusS que, em união formam um par de sensores reguladores da expressão gênica do operon cusCFBA (CHEN et al., 2020). A partir dos genes cusCBA uma proteína é sintetizada funcionando de forma similar ao complexo antiportador presente em membranas celulares onde ocorre o efluxo de íons metálicos em troca do influxo de H+ (DAS; DASH; CHAKRABORTY, 2016); o gene cusF, por sua vez, aumenta o acúmulo de cobre no interior celular através da ligação ao metal na região periplasmática, a proteína produzida a partir deste gene detém aminoácidos aspartato, histidina e metionina que necessitam de ligações com átomos de cobre (CUBILLAS et al., 2017; DAS; DASH; CHAKRABORTY, 2016). O segundo regulador de resistência é chamado de cue ou sistema de efluxo de cobre, neste podemos encontrar o gene cueR responsável por regular outros dois genes que também participam deste mecanismo, copA e cueO (HIGGINS et al., 2020). O gene copA produz uma ATPase do tipo P, já o gene cueO produz uma oxidase que consegue oxidar o Cu(I) em Cu(II) que é bem menos tóxico (HE et al., 2021). Outros genes relacionados a mecanismos de resistência a cobre são csoR, um gene regulador que na presença de Cu(II) acaba reprimindo a expressão de genes resistentes ao metal cobre (FAKHOURY et al., 2021); o operon copYAZ, identificado em uma cepa de Streptococcus, sendo copY e copZ genes codificadores de proteínas de ligação a metais potencialmente tóxicos (PURVES et al., 2018); operon copRSCD identificado em Pseudomonas fluorescens (HU et al., 2009; NOVOA-APONTE et al., 2020), operon hpcopA, responsável por exportar cobre e operon hpcolP, responsável por importar cobre em Helicobacter pylori (PRASAD, 2020). Em Bacillus subtilis, outro sistema regulador de cobre foi identificado sendo mediado por yanJ e regulado por ycnK e csoR, onde estes genes unidos garantem a homeostase de cobre na célula (PRASAD, 2020). 26 4. MATERIAIS E MÉTODOS 4.1 COMUNIDADE BACTERIANA 27 A comunidade bacteriana (C04) utilizada no presente trabalho faz parte da coleção de microrganismos do Laboratório de Bioquímica de Microrganismos e Plantas (LBMP) do Departamento de Biotecnologia Agropecuária e Ambiental (DBTAA) da FCAV, coordenado pela Profa. Eliana Gertrudes de Macedo Lemos e Profa. Lúcia Maria Carareto Alves. Tal amostra foi coletada em março de 2016 a partir de raízes da leguminosa Arachis pintoi, popularmente conhecida por amendoim forrageiro, encontrada em um canteiro logo à frente do Departamento de Produção Vegetal (Fitotecnia), da Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP) - Faculdade de Ciências Agrárias e Veterinárias (FCAV), localizada na cidade de Jaboticabal (SP) sob as coordenadas geográficas: Latitude 21,243070S e Longitude 48,29939O. Após a coleta, a comunidade foi cultivada em meio NB (Nutrient Broth) composto por 3,0 g.L-1 de extrato de levedura; 15,0 g.L-1 de peptona de soja; e 1,0 g.L-1 de glicose (Sigma Aldrich, St Louis EUA). O trabalho de isolamento também foi realizado pelo grupo de pesquisa do LBMP do DBTAA da FCAV/UNESP (BONALDI, 2021). 4.2 ENSAIOS DE CONCENTRAÇÃO MÍNIMA INIBITÓRIA (CMI) A capacidade de tolerar os metais cromo hexavalente (Cr+6), cromo trivalente (Cr+3) e cobre bivalente (Cu+2), foram avaliadas por meio do ensaio de Concentração Mínima Inibitória (CIM), cujo objetivo é determinar a concentração mínima do metal que inibe o crescimento bacteriano. Foram preparadas soluções estoques dos metais potencialmente tóxicos na concentração de 0,02M dos sais CrCl3.6H2O (empregado na dissolução de Cr+3), K2Cr2O7 (aplicado na dissolução de Cr+6) e CuSO4.5H2O (usado na dissolução de Cu+2), que foram dissolvidos em água deionizada e posteriormente foram filtradas (0,22 μm Satorius Millipore) e armazenadas a 4 oC. A comunidade bacteriana foi cultivada em meio de cultura NB suplementado com concentrações diferentes de metais potencialmente tóxicos entre a faixa de 0,25 a 405 mM. O meio de cultura foi previamente tamponado com Tris-HCl a um pH de 7,5. A concentração celular inicial foi baseada na absorção de 0,1 de DO600nm que equivale a 108 células mL-1. Os cultivos foram incubados a uma temperatura de 30 oC sob agitação constante de 150 rpm 28 por 5 dias. Os cultivos nas diferentes concentrações foram realizados em triplicatas. Este trabalho também foi realizado pelo grupo de pesquisa do LBMP (BONALDI, 2021). 4.3 EXTRAÇÃO DE RNA, CONSTRUÇÃO DAS BIBLIOTECAS E SEQUENCIAMENTO O processo de extração de RNA foi realizado, a partir do cultivo da comunidade em meio NB para a condição controle e em NB suplementada com metais nas concentrações 4,0 mM para Cr+3, 0,5 mM para Cr+6 e 2,0 mM para Cu+2 para as condições de tratamento, durante 24 horas, sob agitação constante a 30 ºC. Após o período de incubação, o cultivo foi centrifugado a 4000 xg por 30 min a 4 °C, e em seguidas os pellets, foram submetidos ao processo de extração de RNA total com o auxílio do kit Illustra RNA spin Mini RNA Isolation Kit (GE Healthcare). O material obtido das extrações foi quantificado com Qubit® 2.0 Fluorometer (Life Technologies) empregando-se o kit QubitTM RNA Assay Kit (Invitrogen®). Em seguida, foi executada a remoção dos RNA ribossomais (rRNA) com RiboMinusTM Transcriptome Isolation Kit for Bacteria (Life Technologies) seguindo, todos os procedimentos mencionados, as devidas recomendações dos fabricantes. Durante o sequenciamento de RNA-Seq, as bibliotecas de cDNA construídas foram montadas com base no protocolo TruSeq® RNA Sample Preparation v2 (illumina®) e para o sequenciamento destas bibliotecas utilizou-se a plataforma Illumina®, equipamento MiSeq aplicando-se kits Paired-End Cluster Generation Kit v3 (Illumina®) e TruSeqTM SBS Kit v3 - 200 Cycles (Illumina®). Um total de 12 bibliotecas foram obtidas, uma vez que, para o devido estudo, consideramos 3 réplicas para cada uma das quatro condições. Todos os métodos adotados nesta etapa, também seguiram as recomendações dos fabricantes. 4.4 ISOLAMENTO DAS BACTÉRIAS DA COMUNIDADE E IDENTIFICAÇÃO 29 Para o isolamento das bactérias, realizamos diluições seriadas 10-4 a 10-7 a partir do cultivo da comunidade bacteriana e as diluições foram plaqueadas em meio NA. Após 24 horas de cultivo, as placas foram avaliadas com o auxílio de uma lupa. As colônias que apresentaram características morfológicas distintas foram coletadas e cultivadas isoladamente em meio de cultura NB. Após o cultivo dos isolados uma alíquota de 1 uL foi centrifugada e os pellets foram submetidos ao processo de extração de DNA com o kit QIAmp DNA Mini Kit da Quiagen®. Em seguida, foi realizada a amplificação do gene 16S do rRNA com os primers RD1 e FD1. O produto derivado da PCR passou por um processo de purificação, para isso utilizamos o kit da Zymoclean Gel DNA Recovery. Em seguida as amostras da comunidade da comunidade foram ao sequenciamento na plataforma ABI 3130XL. Ao final foram realizados o sequenciamento de nove amplicons obtidos com primers diferentes (FD1, RD1(WEISBURG et al., 1991), 8F (SUN et al., 2014), 362, 786, 907, 1203 (MENNA et al., 2006), V3-V4F e V4 (MUNYAKA et al., 2015) para cada uma das amostras da comunidade, sendo assim, possível obter o gene 16S quase em sua totalidade. Com a finalidade de montarmos as sequências do gene 16S, foi empregado o pacote phredPhrap (phred v.0.071220.c, phrap v.1.090518) (EWING et al., 1998). As sequências montadas foram analisadas com o programa RDP Classifier training set 18 (WANG et al., 2007), SILVA ACT (Alignment, Classification and Tree Service) com banco de dados v138 SSU (QUAST et al., 2013) e BLASTn, do NCBI (National Center for Biotechnology Information), usando o banco de dados padrão com sua coleção de nucleotídeos (Nucleotide – Nucleotide BLAST v.2.2.29). 4.5 ANÁLISE DOS DADOS DE RNA-SEQ DO METATRANSCRIPTOMA 4.5.1 PRÉ-PROCESSAMENTO DE DADOS 30 Foram obtidas doze bibliotecas de cDNA contendo, cada qual, um par de sequências fragmentadas denominadas de read 1 (R1) e read 2 (R2), cada uma sequenciada a partir de sentidos opostos a fita de cDNA (forward e reverse). Todas as amostras da comunidade, assim como suas réplicas biológicas, receberam uma denominação de acordo com o tratamento submetido, sendo as amostras da comunidade controle denominadas por CTL_RB1, CTL_RB2 e CTL_RB3, as amostras da comunidade com a adição de cromo trivalente (Cr+3) por CR3_RB1, CR3_RB2 e CR3_RB3, as amostras da comunidade de cromo hexavalente (Cr+6) por CR6_RB1, CR6_RB2 e CR6_RB3, e as amostras da comunidade de cobre bivalente (Cu+2) por CU2_RB1, CU2_RB2 e CU2_RB3. As sequências de cDNA são constituídas por arquivos brutos (raw), ou seja, de sequências que ainda não passaram pela etapa de processamento de dados. As sequências são manipuladas em um formato denominado FASTQ. Em um primeiro momento utilizamos o programa FastQC v0.11.5 (LEGGETT et al., 2013) para verificarmos a qualidade das leituras brutas, gerando relatórios pré- processamento para cada arquivo R1 e R2 referentes às bibliotecas. Figura 3 - Fluxograma ilustrando as principais etapas utilizadas na metodologia de processamentos de dados. 31 Fonte: Autoria própria. 4.5.2 PROCESSAMENTO DOS DADOS 32 Para a realização da montagem do metatranscriptoma bacteriano, as leituras brutas passaram por uma etapa de processamento de dados para remover sequências de adaptadores e bases de baixa qualidade. Utilizamos o programa Atropos v1.1.21 (DIDION; MARTIN; COLLINS, 2017) para a remoção/poda dos adaptadores (adapter trimming) empregados no preparo das bibliotecas (Tabela 1). Foi considerado inicialmente o Atropos no modo insert (--aligner insert) com duas passadas (--times 2), tamanho mínimo de 1 par de base (pb) (--minimum- length 1), sobreposição entre as sequências da leitura e adaptador de 3 pb (-- overlap 3), eliminando bases de baixa qualidade (Phred Score) abaixo de 10, no modo de correção de bases conservativo (--correct-mismatches conservative) e na seguinte ordem de operações (--op-order GAWCQ): poda de bases específicas do sequenciador NextSeq [poli(G) na extremidade] (não utilizada); poda de adaptadores; sobreposição de bases de baixa qualidade (correção de bases); poda incondicional (não utilizada); poda por baixa qualidade. Por fim, há a eliminação das leituras aos pares em tal etapa, caso uma delas corresponda aos critérios de filtragem. Posteriormente, consideramos o Atropos no modo adapter (- -aligner adapter) com os mesmos valores dos parâmetros na execução anterior. As leituras que passaram desta etapa seguiram no processo. O programa Prinseq-lite v0.20.4 (SCHMIEDER; EDWARDS, 2011) foi utilizado em seguida para a remoção das bases de baixa qualidade das leituras (low-quality trimming). Esse processo foi configurado para considerar uma janela de tamanho 3 pb deslizando 1 pb a partir da extremidade 3’ em direção à extremidade oposta, caso a média de qualidade da base fosse menor que 30. A cada deslizamento havia a remoção da base fora da janela. Com o mesmo programa, caso a leitura apresentasse menos que 20 pb após as podas ela era eliminada. Além disso, também eliminamos as leituras de baixa complexidade, considerando as leituras com escore DUST maior que 50. Com as sequências processadas, novamente realizamos uma avaliação de qualidade com o programa FastQC gerando desta vez relatórios pós- 33 processamento. Para esta etapa prévia de processamento de dados (pré- processamento) foi criado um bash script1 a fim de automatizar este processo. Tabela 1 – Parâmetros para a definição das sequências dos adaptadores usados no programa Atropos. Atropos - Adaptadores -a GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNNNNNATCTCGTATGCCGTCTTCTGCTTG -g AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT -A AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT -G CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT 4.5.3 MONTAGEM DO METATRANSCRIPTOMA As leituras processadas foram renomeadas adicionando o sufixo 1 e 2 para todos os arquivos fastq (formato das sequências) para que fosse possível dar início a etapa de montagem de novo do metatranscriptoma. O programa Trinity v2.13.1 (GRABHERR et al., 2011) foi usado para a montagem de novo do metatranscriptoma, onde, não apenas diversos transcritos foram montados como também foi fornecido uma relação gene-transcrito. O programa Trinity é subdividido em três outros programas que recebem o nome de Inchworm (lagarta), Chrysalis (crisálida) e Butterfly (borboleta). O programa Inchworm realiza o corte de leituras em K-mers (leituras de tamanho “k”), realizando uma sobreposição e extensão, com base na cobertura das sequências promovendo a montagem de sequências contíguas (contigs) lineares e sem vínculo; o programa Chrysalis realiza um agrupamento das contigs que compartilhem, pelo menos, K-1 mers promovendo a construção de grafos de Bruijin (Bruijin graphs) e mapeando as leituras aos componentes; por fim, o programa Butterfly constrói grafos de Bruijin independentes para cada componente que corresponderá a um gene. O programa Trinity realiza a montagem de contigs que, neste caso, referem-se a cada um dos transcritos. Os parâmetros do Trinity modificados para esta montagem foram para tornar um pouco mais rigoroso o requisito de extensão 1 preprocess.sh 34 de um caminho na etapa do Butterfly, considerando um mínimo de 3 leituras se sobrepondo (--path_reinforcement_distance 3) e aumentamos o tamanho máximo esperado de 600 pb entre as leituras pareadas do fragment (-- group_pairs_distance 600). No caso do Inchworm, aumentamos para 3 o número mínimo de cobertura de K-mers exigido para o processo de montagem (-- min_kmer_cov 3). Por fim, contigs de tamanho menor que 300 foram desconsiderados (--min_contig_length 300). Para uma maior aproximação da realidade é preciso selecionar contigs mais coerentes segundo critérios de aderência a um modelo ideal de amostragem e montagem de um transcriptoma, neste sentido, o programa Transrate v1.0.3 (SMITH-UNNA et al., 2016) foi utilizado. Esse programa permite a seleção dos contigs de melhor qualidade, ou seja, aquelas com um valor de pontuação (score) positivo foram automaticamente classificadas como good contigs, maximizando assim, a pontuação da montagem do metatranscriptoma como um todo. Um bash script2 também foi desenvolvido para automatizar este processo. 4.5.4 IDENTIFICAÇÃO DE PROTEÍNAS Utilizando-se o programa Transdecorder v.5.5.0 (HAAS et al., 2013) foi possível realizar a predição de proteínas a partir da tradução teórica dos transcritos onde são reconhecidos Open Reading Frames (ORFs) para a condição de proteínas. Para tanto, foi empregado na predição a correspondências das proteínas sequências proteicas do UniRef100 (SUZEK et al., 2007) usando o alinhador DIAMOND v2.0.8 (BUCHFINK; XIE; HUSON, 2015) e com modelos HMM para famílias de proteínas do Pfam-A usando hmmscan (EDDY, 2011). 4.5.5 BUSCAS DE GENES ASSOCIADOS À RESISTÊNCIA A METAIS As sequências proteicas obtidas posteriormente foram alinhadas contra sequências presentes no banco de dados BacMet v2.0 (PAL et al., 2014) por meio do script BacMet-Scan v1.1.pl com modificações. O BacMet-Scan utiliza o 2 runTransrate.sh 35 alinhador Diamond v2.0.8 (BUCHFINK; XIE; HUSON, 2015) e foi modificado para filtrar as correspondências (“hits”) de acordo com o método de Rost (ROST, 1999), que considera uma relação entre tamanho e identidade da correspondência. O banco de dados BacMet (Antibacterial Biocida & Metal Resistance Genes Database) fornece informações de genes que relacionados à resistência a metais pesado e biocidas. Há uma divisão no banco de dados, organizando-os de acordo com o nível de credibilidade na associação, ou seja, há aquelas relações que passaram por uma curadoria manual e a função de resistência associada ao gene já foi confirmada experimentalmente, e outras, onde há essa relação de função de resistência associada ao gene é predita e ainda não possuem comprovação experimental (PAL et al., 2014). 4.5.6 ANOTAÇÃO FUNCIONAL DOS GENES As mesmas proteínas obtidas pelo programa Transdecoder foram empregados para a anotação funcional. Neste caso a ferramenta utilizada foi o eggnog-mapper v2.1.2 (que também usa como alinhador o Diamond) e o banco de dados para o alinhamento foi o EggNOG v.5.0 (HUERTA-CEPAS et al., 2017) que fornece a anotação funcional dos genes, bem como suas ontologias gênicas, referentes ao banco de dados Gene Ontology (GO) (ASHBURNER et al., 2000; THE GENE ONTOLOGY CONSORTIUM, 2021). Essa anotação baseia-se no reconhecimento de similaridade com os ortólogos do EggNOG e na conjectura a respeito da conservação de função entre genes ortólogos (ALTENHOFF et al., 2012). Foram consideradas as anotações funcionais dos genes a partir do resultado de anotação das sequências proteicas preditas a partir dos transcritos montados. Nos casos em que haviam mais de uma anotação por gene, as que possuíam a maior pontuação e menor e-value foram recuperadas, no caso de empate, apenas a primeira anotação associada ao gene foi recuperada. 4.5.7 ANOTAÇÃO TAXONÔMICA DO METATRANSCRIPTOMA 36 As sequências dos transcritos (arquivo no formato fasta) foram submetidas à análise com o programa Kraken v2.0.8 (WOOD; SALZBERG, 2014), utilizando- se o próprio default (padrão) do programa como parâmetro, para realizar atribuições ou anotações taxonômicas, baseadas no algoritmo LCA (Lowest Commons Ancestor). A partir dos “NCBI taxonomy IDs” (identificador de um táxon no banco de dados de taxonomia do NCBI) obtidos pelo Kraken, usamos a ferramenta TaxonKit v0.4.0 (SHEN; REN, 2021) para obter a linhagem taxonômica completa. Um outro script3 foi utilizado para a automatização das análises com Kraken e TaxonKit, gerando uma tabela4. 4.5.8 IDENTIFICAÇÃO DOS PRINCIPAIS TRANSCRIPTOMAS NO METATRANSCRIPTOMA Com a relação gene-transcrito fornecida pelo Trinity (e selecionados apenas os good contigs) e representada pelo arquivo “gene_trans_map” juntamente com o resultado da anotação taxonômica (resultante da análise com Kraken), foram adicionadas informações de gênero aos genes do metatranscriptoma5. O arquivo gerado foi chamado de genus_genes_trans_map. Esse arquivo permitiu a separação dos genes associados aos três principais gêneros identificados e coincidentes com a análise dos marcadores 16S rRNA (Rhizobium, Sinorhizobium (Ensifer), e Brevundimonas). 4.5.9 ANÁLISE DE ABUNDÂNCIA NO METATRANSCRIPTOMA O arquivo gene_trans_map também foi usado para a geração da matriz de expressão de genes do metatranscriptoma e também para os três principais transcriptomas identificados (Rhizobium, Sinorhizobium (Ensifer) e Brevundimonas). A partir de outro script6 foi possível invocar scripts do pacote Trinity para a realização do alinhamento e estimação de abundância de genes e 3 mkTaxTable.sh 4 TaxonomyTable.tsv 5 addGenus2Gene.sh 6 getAbundanceMatrix.sh 37 transcritos7 para cada biblioteca de amostras da comunidade, e, organização dos resultados em uma única matriz de abundância8. Para a estimativa de abundância o programa SALMON v0.14.1 (PATRO et al., 2017) foi considerado. O programa SALMON é uma ferramenta que realiza pseudo-alinhamentos através do mapeamento de K-mers no transcrito. Essa matriz gerada pelo SALMON foi usada no programa DESeq2 v1.28.1 (LOVE; HUBER; ANDERS, 2014), para a obtenção de uma matriz de expressão de genes normalizada. 4.5.10 ANÁLISE DE COMPOSIÇÃO E ABUNDÂNCIA NO METATRANSCRIPTOMA Para a obtenção e visualização do perfil taxonômico do metratranscriptoma associado às amostras da comunidade controle e desafiadas pelos metais Cr+3, Cr+6 e Cu+2, os dados de associação taxonômica por gene, juntamente com a matriz de contagens de expressão gênica/abundância normalizada, foram submetidos a análise de composição taxonômica na plataforma do MicrobiomeAnalyst (CHONG et al., 2020) 9. Os dados foram filtrados usando as opções default da plataforma, desabilitando apenas a transformação dos dados. 4.5.11 GENES DIFERENCIALMENTE EXPRESSOS Com um script desenvolvido em Perl 10 a partir da matriz de abundância (expressão) de genes do metatranscriptoma e do resultado da identificação e separação dos genes para cada um dos três principais transcriptomas, foi possível a geração de três matrizes distintas. Essas matrizes foram submetidas ao programa DESeq2 v1.28.1 (LOVE; HUBER; ANDERS, 2014, p. 2) para a normalização e identificação dos Genes Diferencialmente Expressos, ou Differentially Expressed Genes (DEGs). Para essa etapa de normalização foram utilizados genes com expressão constitutiva (Tabela 2) (ROCHA; SANTOS; PACHECO, 2015). Os genes constitutivos são genes constantemente expressos, 7 align_and_estimate_abundance.pl 8 abundance_estimates_to_matrix.pl 9 https://www.microbiomeanalyst.ca 10 splitMatrixByGenusGenePrefix.pl https://www.microbiomeanalyst.ca/ 38 afinal possuem promotores reguladores que possibilitam uma expressão constante e sem uma forte dependência da condição (PAPATHEODOROU et al., 2018). Isso foi realizado a fim de considerarmos o fato de poder haver maior abundância de uma determinada espécie na condição controle (CTL) ou nos tratamentos (CU2, CR3 e CR6) e isso poder afetar a expressão do gene. Tabela 2 - Genes constitutivos empregados para a normalização da contagem dos genes diferencialmente expressos Nome do gene Descrição do gene rpoA Subunidade alfa de RNA polimerase direcionada por DNA rpoB Subunidade beta de RNA polimerase direcionada por DNA gyrA DNA girase A gyrB DNA girase B secA Subunidade de proteína translocase secA Fonte: Adaptado de Rocha e colaboradores (2015). A composição de expressão gênica diferencial entre as condições biológicas foi realizada utilizando log2-fold-change absoluto (Log2FC) ≥ 2 e o nível descritivo de significância (p-value) ≤ 0,05 ajustado para múltiplos testes de hipóteses via método de Benjamini-Hochberg (BENJAMINI; HOCHBERG, 1995) pela estimativa de False Discovery Rate (FDR) (adjusted p-value). 4.5.12 ANÁLISES DE COMPONENTES PRINCIPAIS Uma Análise de Componentes Principais, ou Principal Component Analysis (PCA) foi obtida para os gêneros Rhizobium, Sinorhizobium (Ensifer) e Brevundimonas além do metatranscriptoma, utilizando-se os dados de expressão gênica normalizados e transformados por rlog (regularized logarithm transformation) (LOVE; HUBER; ANDERS, 2014) com o auxílio da função plotPCA do pacote DESeq2 (LOVE; HUBER; ANDERS, 2014) para o ambiente estatístico R. 39 4.5.13 SCRIPTS Todos os scripts utilizados durante a execução de nossas análises mencionados durante o discorrer da seção “Materiais e Métodos”, podem ser encontrados no repositório GitHub do Laboratório de Bioinformática, o qual é coordenado pelo Prof. Dr. Daniel Guariz Pinheiro, e pode ser acessado por meio endereço https://github.com/bioinfo-fcav/metatransapps. https://github.com/bioinfo-fcav/metatransapps 40 5. RESULTADOS E DISCUSSÃO 5.1 ENSAIOS DE CONCENTRAÇÃO MÍNIMA INIBITÓRIA A partir dos ensaios de concentração mínima inibitória (CMI) foram determinadas quais as concentrações dos metais Cr3+, Cr+6 e Cu+2 que inibiram o crescimento bacteriano na placa de petri, que foram de 12,0 mM, 9,0 mM e 14,0 mM, respectivamente. 5.2 IDENTIFICAÇÃO DOS ISOLADOS BACTERIANOS Na comunidade bacteriana estudada foram identificados quatro isolados bacterianos distintos por meio de análises do gene 16S rRNA, sendo nomeados por C04 (1), C04 (2), C04 (3) e C04 (4) possuindo um comprimento total, respectivamente, de 1.353, 1.460, 1.459 e 382 bases nitrogenadas. Utilizando-se os programas RDP-Classifier e SILVA ACT, que leva em consideração o algoritmo de LCA em suas análises e atribuições taxonômicas de acordo com as sequências do gene 16S, foi possível identificar cada um dos isolados até o nível de gênero, sendo o programa BLASTn usado posteriormente para identificação das prováveis espécies (Tabela 3). Com RDP-Classifier obtivemos um valor de confidence score de 100% para os gêneros Stenotrophomonas [C04 (1)], Sinorhizobium (Ensifer) [C04 (2)] (YOUNG, 2003), Rhizobium [C04 (3)], e Brevundimonas [C04 (4)]. Dessa forma, tivemos sucesso em obter uma classificação taxonômica com um mínimo de segurança, ao menos no nível de gênero. O programa SILVA ACT também nos forneceu as mesmas atribuições, com valores de identidade de 100% para o gênero Stenotrophomonas, 99,95% para Sinorhizobium (Ensifer), 99,57 para Rhizobium e 98,67 para Brevundiomonas. Realizando-se o alinhamento das sequências com BLASTn identificamos as prováveis espécies correspondentes a cada isolado: Stenotrophomonas maltophilia [C04 (1)], com cobertura e identidade de 100%; Sinorhizobium (Ensifer) meliloti [C04 (2)], com cobertura de 99% e identidade de 99,65%; 41 Rhizobium tropici CIAT 899 [C04 (3)], com cobertura de 98% e identidade de 99,38%; e Brevundimonas vesiculares [C04 (4)], com 100% de identidade e 99,65% de cobertura. Na Tabela 3 podem ser visualizadas cada uma das classificações taxonômicas obtidas pelos três programas assim como os valores de confiança (RDP-Classifier confidence score), cobertura e identidade. Tabela 3 - Identificação taxonômica dos isolados bacterianos C04 (1), C04 (2), C04 (3) e C04 (4) utilizando-se os programas RDP-Classifier, SILVA ACT e BLASTn. Programas utilizados Isolados C04 (1) C04 (2) C04 (3) C04 (4) RDP- Classifier Stenotrophomonas Sinorhizobium (Ensifer) Rhizobium Brevundimonas Confiança CS (%) 100 100 100 100 SILVA Stenotrophomonas Sinorhizobium (Ensifer) Rhizobium Brevundimonas Identidade (%) 100 99,65 99,57 98,69 BLASTn St. maltophilia Si. meliloti R. tropici CIAT 899 B. vesiculares Cobertura (%) 100 99 98 100 Identidade (%) 100 99,65 99,38 99,95 Legenda: CS – Confidence Score Fonte: Autoria própria. 5.3 PROCESSAMENTO DE DADOS DE SEQUENCIAMENTO DO METATRANSCRIPTOMA Após a etapa de processamento das leituras geradas a partir do sequenciamento de cada uma das bibliotecas (CTL, CR3, CR6 e CU2) e suas réplicas técnicas (RB1, RB2 e RB3) houve uma redução média de 11,99% das 42 leituras em detrimento da remoção dos adaptadores realizados pelo programa Atropos e a exclusão das leituras com baixa qualidade pelo programa Prinseq. Na Tabela 4 é possível visualizar a quantidade de sequências brutas obtidas pelo sequenciamento de RNA-Seq (Pré-processamento) e o total, em porcentagem, das leituras que foram processadas por cada programa, e usadas posteriormente nas análises de dados. Foram geradas um total de doze bibliotecas de cDNA onde cada qual encontrava-se aos pares (read 1 e read 2), totalizando vinte e quatro arquivos. Calculando-se uma média geral de leituras removidas obtivemos um total de 17,07% de leituras removidas com o programa Atropos e 0,20% com o programa Prinseq para as amostras da comunidade controles (CTL); 4,61% com Atropos e 0,16% com Prinseq para as amostras da comunidade desafiadas por cromo trivalente (CR3); 16,60% com Atropos e 0,14% com Prinseq para as amostras da comunidade desafiadas por cromo hexavalente (CR6) e 9,34% com Atropos e 0,16% com Prinseq para as amostras da comunidade desafiadas por cobre bivalente (CU2). Tabela 4 – Resultados das etapas de pré-processamento das leituras de cada biblioteca. Os números presentes nesta tabela correspondem aos pares de reads (R1 + R2) de cada clone de fragmentos provenientes do sequenciamento de RNA-Seq. Amostras Processamento Pré (input) Atropos Prinseq Leituras % de bases filtradas Leituras % de bases filtradas 1 CTL_RB1 16.129.423 12.755.527 79,08 12.730.273 78,93 2 CTL_RB2 15.746.905 12.282.051 78,00 12.229.906 77,67 3 CTL_RB3 19.203.734 17.610.903 91,71 17.587.822 91,59 4 CR3_RB1 15.678.549 14.493.748 92,44 14.467.991 92,28 5 CR3_RB2 17.442.094 17.081.012 97,93 17.048.537 97,74 6 CR3_RB3 14.525.828 13.917.846 95,81 13.895.860 95,66 7 CR6_RB1 16.074.532 14.567.152 90,62 14.550.437 90,52 8 CR6_RB2 14.960.855 11.272.944 75,35 11.254.284 75,22 43 9 CR6_RB3 13.996.144 11.787.008 84,22 11.760.768 84,03 10 CU2_RB1 24.310.681 23.606.747 97,10 23.581.557 97,00 11 CU2_RB2 10.748.948 8.469.237 78,79 8.450.896 78,62 12 CU2_RB3 18.692.160 17.958.674 96,08 17.921.158 95,88 Fonte: Autoria própria. 5.4 MONTAGEM DO METATRANSCRIPTOMA E ANOTAÇÃO FUNCIONAL Ao realizar a montagem do metatranscriptoma obtivemos um total de 6.760 transcritos onde, após a filtragem com Transrate, 5.980 transcritos foram considerados como bons (good contigs), os demais foram desconsiderados. A predição de sequências proteicas obtidas a partir de transcritos com ORFs a partir dos transcritos considerados como bons com o programa Transdecoder revelou um total de 5.853 proteínas para o metatranscriptoma. Dessas proteínas preditas, um total de 5.306 foram anotadas com ortólogos do banco de dados EggNOG por meio do programa eggnog-mapper. 5.5 ANÁLISES DE REPRESENTATIVIDADE DE TAXA NO METATRANSCRIPTOMA Na plataforma MicrobiomeAnalyst foi possível identificar todos os possíveis gêneros microbianos presentes em nossas amostras da comunidade (Figura 4), inclusive os mesmos já identificados na análise dos isolados. Reconhecemos nesta análise os gêneros Rhizobium, Sinorhizobium (Ensifer) e Brevundimonas como os mais representativos. Como se trata de um metatranscriptoma essa representatividade se dá pela contagem da abundância de transcritos associados a um determinado táxon, e isso pode ser resultado tanto da expressão dos genes como também da abundância do táxon. O gênero Rhizobium foi o mais representativo em todas as condições com metais. Enquanto que na condição controle essa representatividade foi muito similar à de Brevundimonas. No entanto, o gênero Brevundimonas apresenta um perfil oposto em comparação com o de Rhizobium, apresentando uma representatividade menor nas bibliotecas associadas a metais, o que reflete sua capacidade de tolerar os metais considerados no experimento de desafio. 44 Dessa forma, é possível que o gênero Rhizobium detenha alguma espécie de mecanismo de resistência aos metais Cr+3, Cr+6 e Cu+2 o que reflete a sua maior representatividade nas amostras da comunidade desafiadas pelos metais, em contrapartida, devido ao decaimento da representatividade de Brevundimonas, é provável que o gênero não possua mecanismos eficientes de resistência aos metais ou não possua a mesma adaptabilidade às condições em que foi submetida. O gênero Stenotrofomonas não foi identificado nestas análises muito provavelmente por estar em menor abundância ou estar sendo comprometido pelos demais gêneros bacterianos, portanto, não utilizamos este gênero em nossos estudos posteriores devido à falta de dados. 45 Figura 4 - Resultados obtidos com MicrobiomeAnalyst. Fonte: Autoria própria. O gênero Rhizobium corresponde a bactérias gram-negativas pertencentes ao grupo das Alfaproteobactérias sendo extremamente conhecidas por sua habilidade em promover o crescimento de plantas, principalmente àquelas pertencentes à família Fabaceae (leguminosas), devido à atividade de fixação de nitrogênio (LINDSTRÖM; MOUSAVI, 2020). A fixação de nitrogênio pode ser considerada como um ponto chave para o crescimento e desenvolvimento vegetal podendo ocorrer no solo por microrganismos rizosféricos ou no interior das raízes de plantas através da formação de nódulos radiculares (IGIEHON; BABALOLA, 2018). Plantas leguminosas são capazes de estabelecer relações de simbiose com bactérias fixadoras de nitrogênio, principalmente com rizóbios. Esse 46 processo de simbiose resulta na formação de nódulos radiculares nas raízes das plantas, sendo considerado um processo infeccioso a partir da adesão dos rizóbios nos pêlos radiculares, os quais em seu interior podem promover a fixação de nitrogênio. A grande vantagem em tal simbiose consiste na capacidade que bactérias fixadoras de nitrogênio detêm em capturar o nitrogênio atmosférico (N2) e convertê-lo em amônia (NH3) que pode ser utilizada pelas plantas. Apesar de o nitrogênio ser um elemento químico essencial, são poucos os seres vivos que conseguem utilizá-lo diretamente como N2 (dinitrogênio) como é encontrado presente na atmosfera (WANG; LIU; ZHU, 2018). Os nódulos radiculares passam por diversas etapas de desenvolvimento tais como formação, manutenção e senescência onde alguns metais são de extrema importância. Por exemplo, os metais manganês e cálcio podem facilitar a colonização por bactérias fixadoras de nitrogênio nas raízes das plantas enquanto que o cobre pode promover um maior crescimento radicular, aumentando assim, a quantidade de nitrogênio fixado (GONZÁLEZ-GUERRERO et al., 2014). A principal enzima responsável pela conversão de dinitrogênio em amônia é chamada de nitrogenase. Segundo Fagorzi e colaboradores (2018) a enzima nitrogenase necessita de alguns metais como cofatores, tais como o ferro, molibdênio, vanádio e até mesmo o níquel (FAGORZI et al., 2018). Além disso, a proteína leg-hemoglobina, principal responsável por proteger a enzima nitrogenase do excesso de oxigênio ao mesmo tempo em que promove uma quantidade ideal dessas bactérias formadoras de nódulos radiculares (SINGH; VARMA, 2017), necessita de ferro hemínico para proteger a enzima nitrogenase contra o contato com moléculas de oxigênio (FAGORZI et al., 2018). De acordo com Atieno e Lesueur (2019) espécies de Rhizobium produzem polímeros denominados de exopolissacarídeos (EPSs) importantes na formação de nódulos de fixação de nitrogênio em leguminosas detendo como estratégias a imobilização e ligação de metais a fim de promover a neutralização de efeitos tóxicos ocasionados por metais potencialmente tóxicos além de mecanismos de precipitação extracelular e acúmulo intracelular, o que pode aumentar a capacidade de resistência a metais por parte destas bactérias (ATIENO; LESUEUR, 2019). 47 5.6 IDENTIFICAÇÃO DOS GENES DIFERENCIALMENTE EXPRESSOS COM O BANCO DE DADOS BacMet No total o metatranscriptoma teve 120 genes identificados como sendo relacionados a resistência a metais e biocidas provenientes do banco de dados do BacMet. Destes, 65 genes correspondem ao conjunto de genes experimentalmente confirmados e 55 correspondem a genes com funções preditas. Dentre os 120 genes anotados 51 correspondem a genes presentes no transcriptoma de Rhizobium, 46 para Sinorhizobium (Ensifer) e 16 para Brevundiomonas. Dentre os DEGs identificados para Rhizobium, um total de 9 genes encontravam-se induzidos: 3 na presença de Cr+3, 2 na presença de Cr+6 e 5 na presença de Cu+2; para o gênero Sinorhizobium (Ensifer) um total de 2 genes foram identificados como induzidos na presença de Cu+2 e um único gene reprimido relacionado à Cr+6; e para o gênero Brevundimonas, apenas um único gene estava diferencialmente expresso induzido na presença do metal Cu+2 (Tabela 5). Tabela 5 – Genes diferencialmente expressos identificados pelo programa BacMet perante as comunidades desafiadas pelos metais Cr+3, Cr+6 e Cu+2. Tratamento Gêneros Trinity ID Log2FC FDR Gene- name Cu+2 Brevundimonas TRINITY_DN576_c0_g2 2,05 0,0339 nccA Cr+3 Rhizobium TRINITY_DN1362_c0_g2 3,27 0,0032 fbpC TRINITY_DN357_c0_g3 2,69 0,0181 actP TRINITY_DN440_c0_g1 2,29 0,0466 adeG Cr+6 Rhizobium TRINITY_DN357_c0_g3 2,69 0,0000 actP TRINITY_DN440_c0_g1 4,90 0,0000 adeG Cu+2 Rhizobium TRINITY_DN1362_c0_g2 3,31 0,0025 fbpC TRINITY_DN357_c0_g3 3,30 0,0030 actP TRINITY_DN3704_c0_g1 3,80 0,0036 fecE TRINITY_DN440_c0_g1 3,54 0,0016 adeG TRINITY_DN800_c0_g1 3,12 0,0019 actA Cu+2 Sinorhizobium (Ensifer) TRINITY_DN2518_c0_g2 4,32 0,0001 czcC TRINITY_DN1238_c0_g2 -2.13 0,0134 sdeB 48 Cr+6 Sinorhizobium (Ensifer) TRINITY_DN3913_c0_g1 -2.12 0,0099 bepC Fonte: Própria autoria. 5.7 IDENTIFICAÇÃO DOS GENES INDUZIDOS EXPRESSOS COM O PROGRAMA DESEq2 Para determinar e identificar os genes diferencialmente expressos frente à exposição aos metais realizamos a avaliação do perfil de expressão focando nos três principais gêneros presentes no metatranscriptoma da comunidade bacteriana. Para tanto, o programa DESeq2 e BacMet foram utilizados onde, para a identificação de genes diferencialmente expressos (DEGs) induzidos foi realizado uma filtragem dos valores de FDR e posteriormente de Log2FC. Para FDR o filtro utilizado foram valores ≤ 0,05, enquanto que para Log2FC foram selecionados genes que detinham valores ≥ 2. Logo, foram obtidos um total de 2.220, 2.328 e 751 DEGs para os gêneros Rhizobium, Sinorhizobium (Ensifer) e Brevundimonas, respectivamente (independente das condições de controle ou desafiada pelos metais), antes de serem empregados os filtros de FDR e Log2FC. Após a filtragem um total de 425 DEGs induzidas para Rhizobium, 68 DEGs induzidas para Sinorhizobium (Ensifer) e 18 DEGs induzidas para Brevundimonas foram selecionadas. Do total de DEGs induzidas filtradas por gênero, ainda foram identificadas a quais metais pertenciam, ou seja, no caso do gênero Rhizobium, 109, 77 e 239 DEGs estavam presentes, respectivamente, nas amostras da comunidade desafiadas pelos metais Cr+3, Cr+6 e Cu+2. Em Sinorhizobium (Ensifer) um total de 6, 29 e 33 DEGs foram identificadas para as amostras da comunidade desafiadas por Cr+3, Cr+6 e Cu+2. Para Brevundiomanas das 18 DEGs filtradas apenas 1 en