RESSALVA Atendendo solicitação do(a) autor(a), o texto completo desta dissertação será disponibilizado somente a partir de 03/03/2024. INSTITUTO DE BIOCIÊNCIAS DE BOTUCATU Papel dos pseudogenes na evolução dos cromossomos supranumerários em Psalidodon (Teleostei, Characiformes) Lucas Fortino Lasmar Botucatu, SP 2022 INSTITUTO DE BIOCIÊNCIAS DE BOTUCATU Universidade Estadual Paulista "Júlio de Mesquita Filho" Instituto de Biociências de Botucatu Papel dos pseudogenes na evolução dos cromossomos supranumerários em Psalidodon (Teleostei, Characiformes) Aluno: Lucas Fortino Lasmar Orientador: Prof. Dr. Fausto Foresti Co-orientador: Dr. Duílio M. Z. A. Silva Dissertação apresentada ao Instituto de Biociências, Campus de Botucatu, UNESP, para qualificação de Mestrado no Programa de Pós-Graduação em Ciências Biológicas (Zoologia). Botucatu, SP 2022 Palavras-chave: Astyanax; Cromossomo B; Psalidodon; Retrogene; Retrotransposão. Lasmar, Lucas Fortino. Papel dos pseudogenes na evolução dos cromossomos supranumerários em Psalidodon (Teleostei, Characiformes) / Lucas Fortino Lasmar. - Botucatu, 2022 Dissertação (mestrado) - Universidade Estadual Paulista "Júlio de Mesquita Filho", Instituto de Biociências de Botucatu Orientador: Fausto Foresti Coorientador: Duílio Mazzoni Zerbinato de Andrade Silva Capes: 20400004 1. Astyanax (Peixe). 2. Cromossomos. 3. Sequenciamento de nucleotídeo. 4 DNA. 5. Characiformes. 6. Pseudogenes. DIVISÃO TÉCNICA DE BIBLIOTECA E DOCUMENTAÇÃO - CÂMPUS DE BOTUCATU - UNESP BIBLIOTECÁRIA RESPONSÁVEL: ROSEMEIRE APARECIDA VICENTE-CRB 8/5651 FICHA CATALOGRÁFICA ELABORADA PELA SEÇÃO TÉC. AQUIS. TRATAMENTO DA INFORM. INSTITUTO DE BIOCIÊNCIAS DE BOTUCATU Agradecimentos Agradeço primeiramente ao meu orientador Professor Fausto Foresti, por aceitar me orientar e servir de fonte de inspiração. Ao meu Co-Orientador e amigo Duílio Mazzoni Zerbinato de Andrade Silva, por me incentivar, direcionar sempre ao caminho e me apoiar nos momentos difíceis. Ao Professor Cláudio Oliveira, por todo o apoio fornecido para o desenvolvimento deste trabalho. Aos meus pais, Ana Lúcia Fortino Lasmar e Luiz Antônio Menezes Lasmar, minhas irmãs Sarah Fortino Lasmar Cunha e Samira Fortino Lasmar e cunhados Helder Teixeira Cunha e Gustavo Henrique Silva Ferreira por todo o apoio e incentivo, todo o carinho e suporte todos esses anos, sem vocês eu não teria conseguido. Ao meu amigo e companheiro de laboratório Mateus Rossetto Vidal, pela colaboração neste trabalho, por sempre estar disposto a me ajudar e por toda amizade. Aos meus colegas de republica, por toda amizade e parceria. A todos os colegas do Laboratório de Biologia e Genética de Peixes, por todo o acolhimento e pelos momentos de descontração. Ao Professor Rafael Henrique Nóbrega e a colega Maira da Silva Rodrigues membros do Laboratório de Biologia Molecular e Reprodutiva da UNESP de Botucatu, pelo suporte. À Professora Maeli Dal Pai e a colega Bruna Tereza T. Zanella membros do Laboratório de Biologia do Músculo Estriado Esquelético da UNESP Botucatu, pelo suporte. Ao Professor Erick José Ramo da Silva e ao colega Alexandre Dorth de Andrade membros do Laboratório de Farmacologia da Reprodução e Andrologia da UNESP de Botucatu, pelo suporte Ao Professor Fábio Porto Foresti e a todos os colegas do Laboratório de Genética de Peixes da UNESP Bauru, pelo apoio no desenvolvimento deste projeto. Ao Instituto de Biociências de Botucatu. Ao programa de Pós-graduação em Zoologia. Aos funcionários do Departamento de Biologia Estrutural e Funcional e da seção técnica de Pós-Graduação que, pelo seu trabalho, permitiram que este estudo fosse realizado. A CAPES, FAPESP, e ao CNPq pelo financiamento deste projeto. Esta pesquisa foi financiada com recursos da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) Processo: 2020/01775-0 “A sabedoria é um paradoxo. O homem que mais sabe é aquele que mais reconhece a vastidão da sua ignorância.” Friedrich Nietzsche Resumo Cromossomos B são elementos genômicos adicionais ao complemento de cromossomos padrão presentes em cerca de 15% dos organismos eucariotos e são dispensáveis para sua sobrevivência. Estes elementos são compostos principalmente por sequências de DNA repetitivo, mas podem também possuir genes codificadores de proteínas e pseudogenes. Os pseudogenes podem desempenhar diversos papéis regulatórios no organismo, o que poderia levar a um interessante efeito funcional quando associados aos cromossomos B. Desta forma, o presente estudo visou caracterizar os pseudogenes sbno2-B e simc1-B encontrados previamente no cromossomo B de Psalidodon paranae, visando identificar os processos evolutivos envolvidos na sua formação, além de verificar se estes pseudogenes estão presentes nos cromossomos B de outras espécies de peixes do gênero Psalidodon e comparar suas estruturas genômicas, bem como sua expressão. Para isso foram coletadas amostras de indivíduos das espécies P. paranae, P. bockmanni e P. fasciatus (duas populações), às quais foram aplicadas e utilizadas técnicas de sequenciamento de reads curtos de DNA e RNA e reads longos de DNA. As análises bioinformáticas foram validadas por PCR e qPCR. Adicionalmente, foram padronizados genes de referência para futuras análises de expressão gênica por RT-qPCR. Com isso, foi possível verificar que os genes sbno2 e simc1 apresentam junções éxon-éxon em bibliotecas genômicas 1B das quatro espécies analisadas, o que pode indicar que estas sequências sofreram processo de retrotransposição para um cromossomo B ancestral em Psalidodon. A análise comparativa das variantes de cromossomos B de Psalidodon mostrou que ambos os pseudogenes possuem estrutura altamente conservada, com algumas exceções em que sofreram degeneração. A análise de RNAseq mostrou que ambos os genes sbno2 e simc1 apresentam subexpressão em gônadas de indivíduos de P. paranae com cromossomos B, o que poderia indicar que alterações na expressão da cópia canônica seriam decorrentes de alterações determinadas pela presença dos pseudogenes. Ainda, a presença de SNPs-B específicos em regiões de baixa cobertura indica que cópias com diferentes estruturas existam no cromossomo B, o que sugere que provavelmente os genes sbno2-B e simc1-B se inseriram no cromossomo B durante sua origem, e posteriormente sofreram processo de retrotransposição para o próprio cromossomo B. Abstract B chromosomes are genomic additional elements to the complement of standard chromosomes present in about 15% of eukaryotic organisms and are dispensable for their survival. These elements are mainly composed of repetitive DNA, but may also have protein-coding genes and pseudogenes. Pseudogenes can play several regulatory roles in the organism, which could lead to an interesting functional effect when associated with B chromosomes. Thus, the present study aimed to characterize the sbno2-B and simc1-B pseudogenes previously found in the B chromosome of Psalidodon paranae, in order to identify the evolutionary processes involved in their formation, in addition to verifying whether these pseudogenes are present in the B chromosomes of other fish species of the genus Psalidodon and comparing their genomic structures, as well as their expression. For this, individuals of the species P. paranae, P. bockmanni and P. fasciatus (two populations) were collected. Sequencing techniques of short DNA and RNA reads and long DNA reads were used. Bioinformatic analyzes were validated by PCR and qPCR. Additionally, reference genes were standardized for future gene expression analysis by RT-qPCR. Thus, it was possible to verify that the sbno2 and simc1 genes present exon-exon junctions in 1B genomic libraries in the four analyzed species, which indicates that these sequences underwent a retrotransposition process to an ancestral B chromosome in Psalidodon. Comparative analysis of the B chromosome variants of Psalidodon showed that both pseudogenes have a highly conserved structure, with some exceptions where they suffered degeneration. RNAseq analysis showed that both genes sbno2 e simc1 are underexpressed in the gonads of individuals with B chromosomes, which could indicate that alterations in the expression of the canonical copy would be due to alterations determined by the presence of pseudogenes. The presence of B-specific SNPs in low coverage regions indicates that copies with different structures exists in the B chromosome, which suggests that probably sbno2-B and simc1-B were acquired by the B chromosome in its origin, and after these copies went to retrotransposition processes to the B chromosome. Sumário Introdução..................................................................................................................................................... 10 Pseudogenes e sua presença em cromossomos B ........................................................................................ 10 Objetivos ....................................................................................................................................................... 12 Referências ................................................................................................................................................... 13 Capítulo 1 – Análise estrutural dos pseudogenes sbno2-B e simc1-B em Psalidodon paranae (Characiformes, Characidae). ........................................................................................................................ 16 1.1 Introdução ........................................................................................................................................ 16 1.2 Material e Métodos .......................................................................................................................... 18 1.2.1 Obtenção dos cromossomos metafásicos mitóticos ........................................................................ 18 1.2.2 Coloração convencional com Giemsa............................................................................................... 18 1.2.3 Detecção da heterocromatina constitutiva (Banda-C) ..................................................................... 18 1.2.4 Extração do DNA genômico .............................................................................................................. 19 1.2.5 Bibliotecas de DNA e RNA de reads curtos ...................................................................................... 19 1.2.6 Bibliotecas de DNA de reads longos ................................................................................................. 19 1.2.7 Análise de junções éxon-éxon em reads curtos ............................................................................... 19 1.2.8 Análise de cobertura em RNAseq ..................................................................................................... 20 1.2.9 Analise da vizinhança das regiões genicas – sbno2 e simc1 ............................................................. 20 1.3 Resultados ........................................................................................................................................ 21 1.3.1 Análise cariotípica de P. paranae - Ribeirão Cascatinha .................................................................. 21 1.3.2 Identificação de junções éxon-éxon por análise de reads curtos .................................................... 21 1.3.3. Análise de cobertura dos transcritos dos genes simc1 e sbno2 ....................................................... 24 1.3.4 Análise do sequenciamento de reads longos e análise da vizinhança das regiões gênicas – sbno2 e simc1 25 1.3.5 PCR com primers de junção éxon-éxon para os genes sbno2 e simc1 ............................................. 26 1.4 Discussão .......................................................................................................................................... 27 1.5 Conclusões ........................................................................................................................................ 29 1.6 Referências ....................................................................................................................................... 30 Capítulo 2 – Análise da origem e estrutura dos pseudogenes sbno2-B e simc1-B em espécies do gênero Psalidodon (Characiformes, Characidae). ..................................................................................................... 36 2.1 Introdução ........................................................................................................................................ 36 2.2 Materiais e Métodos ........................................................................................................................ 37 2.2.1 Obtenção dos cromossomos metafásicos mitóticos ........................................................................ 38 2.2.2 Coloração convencional com Giemsa............................................................................................... 38 2.2.3 Detecção da heterocromatina constitutiva (banda-C) ..................................................................... 38 2.2.4 Extração do DNA genômico .............................................................................................................. 38 2.2.5 Sequenciamento de DNA e RNA por reads curtos ........................................................................... 38 2.2.6 Análise de cobertura em DNAseq .................................................................................................... 39 2.2.7 Análise de junções éxon-éxon em reads curtos ............................................................................... 39 2.3 Resultados ........................................................................................................................................ 41 2.3.1 Análise cariotípica de P. fasciatus - Córrego Alambari ..................................................................... 41 2.3.2 Análise cariotípica de P. fasciatus - Córrego das Araras .................................................................. 41 2.3.3 Análise cariotípica de P. bockmanni - Cachoeira Segredo ................................................................ 41 2.3.4 Identificação de junções éxon-éxon por análise de reads curtos .................................................... 41 2.3.5 Análise de cobertura dos genes simc1 e sbno2 em P. fasciatus e P. bockmanni ............................. 42 2.3.6 Busca de SNPs B-específicos em espécies de Psalidodon ................................................................ 44 2.3.7 Validação por qPCR dos genes sbno2 e simc1 na variante BfMa de P. fasciatus ............................. 45 2.4 Discussão .......................................................................................................................................... 47 2.5 Conclusões ........................................................................................................................................ 49 2.6 Referências ....................................................................................................................................... 50 3 Considerações finais ......................................................................................................................... 52 Material suplementar ................................................................................................................................... 53 ________________________________________________________________________________10 Introdução Cromossomos B, também chamados de cromossomos supranumerários, são elementos adicionais encontrados em diversas espécies de eucariotos que foram descritos pela primeira vez em percevejos Metapodius a cerca de um século atrás (Wilson, 1907). Estes cromossomos caracterizam-se por não possuírem par homólogo e por disseminarem comportando-se como elementos parasitas do genoma. De maneira geral, esses elementos são dispensáveis para a sobrevivência, uma vez que não são encontrados em todos os indivíduos de uma população. Esses cromossomos possuem diversos morfotipos, sendo encontrados desde microcromossomos, macrocromossomos, a isocromossomos B, aqueles que apresentam uma similaridade quanto ao conteúdo de ambos os braços (Houben et al., 2001; Rubtsov et al., 2004; Silva et al., 2014). A respeito da origem desses elementos, é sabido que podem surgir a partir de cromossomos do complemento padrão, também denominados de cromossomos A (Camacho, 2005) ou serem adquiridos através de processos de hibridização entre espécies próximas (Tosta et al., 2015). Após sua origem, os cromossomos B que apresentam maiores taxas de transmissão, através de um mecanismo chamado de drive, persistem nas populações por um longo período de tempo e se tornam verdadeiros cromossomos B. Esse mecanismo é o fator responsável pelo sucesso evolutivo dos cromossomos B, e pode ocorrer em diferentes maneiras, como drive meiótico, aumento de número por indivíduo e aumento de indivíduos portadores de B na população (Jones, 2018). Os primeiros estudos realizados com cromossomo B que visaram descobrir a composição desses elementos, revelaram que estes apresentavam um alto grau de condensação da cromatina, o que fez surgir a ideia de que esses elementos eram elementos inertes (Rhoades e McClintock, 1935). Entretanto, com o avanço dos estudos de cromossomos B, foi possível verificar que esses cromossomos apresentam uma alta diversidade de sequências, como elementos repetitivos, DNAs ribossomais, DNAs satélite e elementos transponíveis (Camacho et al., 2000; Camacho, 2005) bem como genes codificadores de proteínas e pseudogenes (Navarro-Dominguéz et al., 2017a; Carmello et al., 2017; Clark e Kocher, 2019). Pseudogenes e sua presença em cromossomos B Pseudogenes são sequências de DNAs oriundas de genes funcionais que passaram por importantes mutações como deleções, inserções e mutações pontuais. Pseudogenes podem ser classificados quanto aos seus mecanismos de origem (Pink et al., 2011), sendo divididos em ________________________________________________________________________________11 pseudogenes não processados e processados (Garewal et al., 2021). Pseudogenes não processados são divididos em pseudogenes unitários, quando a sequência original sofre processos de mutação, causando a perda da função gênica; e duplicados, quando a sequência de um gene passa por um processo de duplicação e esta cópia sofre os efeitos de mutações (Garewal et al., 2021). Pseudogenes processados, por sua vez, surgem através de processos de retrotransposição de uma sequência de DNA. Este processo se inicia com a transcrição de um segmento de mRNA a partir de determinadas sequências do genoma e, em seguida, estes mRNA são processados para remoção dos introns pelo processo de splicing. Finalmente, o mRNA processado é transcrito reversamente gerando sequências de cDNA que se inserem em novos sítios no genoma. Dessa forma, pseudogenes retroinseridos não possuem introns, sendo caracterizados pela presença de junções éxon-éxon no DNA (Yusuf Tutar, 2012). Pseudogenes podem desempenhar um grande papel evolutivo e regulatório, uma vez que essas sequências são passíveis de sofrerem alterações e ganharem novas funções, enquanto a sequência do gene original é mantida conservada (Yusuf Tutar, 2012). Com relação aos mecanismos regulatórios, os pseudogenes podem formar pequenos siRNAs ou competirem por fatores de transcrição (Pink et al., 2011), o que pode levar a alteração na expressão das cópias canônicas. É interessante destacar que a presença de pseudogenes vem sendo notada em diversas espécies com cromossomos B, assim como em centeio (Banaei-Moghaddam et al., 2013), em que 15% dos pseudogenes no cromossomo B possuem transcrição ativa, no gafanhoto Eyprepocnemis plorans, em que a presença de pseudogenes foi encontrada no cromossomo B24, (Navarro Domínguez et al., 2017), e por fim a presença de pseudogene retroinserido, evidenciado pela ausência de íntrons, em cromossomo B do peixe ciclídeo Astatotilapia latifasciata (Carmello et al., 2017). Os peixes do gênero Psalidodon representam um ótimo modelo de estudos para cromossomos B, devido à alta diversidade de cromossomos B presentes em 8 espécies das 33 descritas atualmente (Fricke et al., 2020; Moreira-Filho et al., 2004; Oliveira et al., 2009). Silva et al. (2021) descreveram a presença de genes codificadores de proteínas nos cromossomos B de quatro espécies em Psalidodon, sendo que o compartilhamento de genes revelou uma origem em comum para o cromossomo B dessas espécies. Alguns destes genes possuem regiões codificadoras incompletas, assim indicando a presença de pseudogenes nos cromossomos B. Sendo assim o presente projeto visou caracterizar sequências pseudogenicas encontradas em quatro variantes de cromossomos B presentes em três espécies, bem como analisar o histórico evolutivo desses pseudogenes dentro do gênero. ________________________________________________________________________________12 Objetivos O presente projeto se insere no programa geral de estudos citogenéticos de peixes Neotropicais que vem sendo desenvolvido no Laboratório de Biologia e Genética de Peixes do Departamento de Biologia Estrutural e Funcional, Instituto de Biociências da UNESP, Botucatu-SP, visando um melhor conhecimento do genoma e da estrutura cromossômica dos peixes e, em particular, das células eucariontes. Como já demonstrado, as espécies do gênero Psalidodon constituem um interessante modelo para o estudo dos cromossomos B, uma vez que estes elementos genômicos ocorrem em diferentes espécies, apresentando expressiva variação morfológica e estrutural, bem como uma estrutura molecular específica, constituída principalmente por regiões repetidas, genes funcionais e pseudogenes. Dessa forma, o presente estudo tem como objetivos gerais a identificação dessas regiões e caracterizar possíveis atividades funcionais determinadas pela sua presença. De modo específico, pretende-se: - caracterizar os pseudogenes sbno2 e simc1 encontrados no cromossomo B de P. paranae, visando identificar os processos evolutivos envolvidos na sua formação; - investigar se esses pseudogenes são expressos a partir dos cromossomos B que os portam em P. paranae; - verificar se os pseudogenes sbno2 e simc1 estão presentes nos cromossomos B de outras espécies de Psalidodon, bem como comparar a estrutura genômica dessas sequências entre as espécies. Materiais e Métodos Os materiais e os métodos utilizados, juntamente com os resultados obtidos e sua discussão, estão organizados na forma de artigos em dois capítulos e deverão ser publicados após as correções e aprimoramento do texto. ________________________________________________________________________________13 Referências BANAEI-MOGHADDAM, A.M.; MEIER, K.; KARIMI-ASHTIYANI, R.; Houben, A. American Society of Plant Biologists. Formation and expression of pseudogenes on the B chromosome of rye. The Plant Cell v. 25, n. 7, p. 2536–2544, 2013. CAMACHO, J. P. M. The Evolution of the Genome: CHAPTER 4 - B Chromosomes. Burlington: Academic Press, 2005. CAMACHO, J.P., SHARBEL, T.F., BEUKEBOOM, L.W., B-chromosome evolution. Philos Trans R Soc Lond B Biol Sci v.355, n.1394, p.163-178, 2000. CARMELLO, B.O., et al. The hnRNP Q-like gene is retroinserted into the B chromosomes of the cichlid fish Astatotilapia latifasciata. Chromosome Res. v. 25, n. 3-4, p. 277-290, 2017. CLARK, F.E., KOCHER, T.D. Changing sex for selfish gain: B chromosomes of Lake Malawi cichlid fish. Sci Rep v.9, n.20213, p. 1-10, 2019. FRICKE R., ESCHMEYER W.N., VAN DER LAAN, R. (2021). Eschmeyer's Catalog of fishes: genera, species, references. Disponível em: https://researcharchive.calacademy. org/research/ichthyology/catalog/fishcatmain.aspAcesso em: 06 Jan 2022 FRICKE R., ESCHMEYER W.N., VAN DER LAAN, R. (2021). Eschmeyer's Catalog of fishes: genera, species, references. Disponível em: https://researcharchive. calacademy.org/research/ichthyology/catalog/fishcatmain.asp Acesso em: 06 Jan 2022. GAREWAL, N.; GOYAL, N.; PATHANIA, S.; KAUR, J.; SINGH, K. Gauging the trends of pseudogenes in plants. Crit Rev Biotechnol. v.41, n.7, p.1114-1129, 2021. HOUBEN, A et al. The genomic complexity of micro B chromosomes of Brachycome dichromosomatica. Chromosoma v.110, n.7, p 451–459, 2001. JONES, R N. Transmission and Drive Involving Parasitic B Chromosomes. Genes v.9, n.388, p.1-9, 2018. MOREIRA-FILHO, O.; GALETTI, P.M. JR.; BERTOLLO, L.A. B chromosomes in the fish Astyanax scabripinnis (Characidae, Tetragonopterinae): an overview in natural populations. Cytogenet Genome Res. V.106, n.2-4, p.230-234, 2004. NAVARRO-DOMÍNGUEZ, B. et al. Protein-coding genes in B chromosomes of the grasshopper Eyprepocnemis plorans. Scientific Reports v.7, n. 45200 p.1–12, 2017a OLIVEIRA, C.; FORESTI, F.; HILSDORF, A.W.S. Genetics of Neotropical fish: From chromosomes to populations. Fish Physiol Biochem v.35, p.81–100, 2009. PINK, R.C.; WICKS, K.; CALEY, D.P.; PUNCH, E.K.; JACOBS, L.; CARTER, D.R. Pseudogenes: Pseudo-functional or key regulators in health and disease? RNA. v.17, n.5, p.792-798, 2011. RHOADES, M. M., MCCLINTOCK, B. The Cytogenetics of maize. Botanical Review, v.1, n.8, p. 292–325, 1935. RUBTSOV, N B et al. Comparative analysis of micro and macro B chromosomes in the Korean field mouse Apodemus peninsulae (Rodentia, Murinae) performed by chromosome microdissection and FISH. Cytogenetic and genome research v.106, n.2-4 p289-294, 2004. https://researcharchive.calacademy/ ________________________________________________________________________________14 SILVA, D. M., et al. Delimiting the origin of a B chromosome by FISH mapping, chromosome painting and DNA sequence analysis in Astyanax paranae (Teleostei, Characiformes). PloS one, v.9, n.4, 2014. TOSTA, V.C. et al., Possible Introgression of B Chromosomes between Bee Species (Genus Partamona). Cytogenetic and Genome Research, v.144, n.3, p.220–226, 2015. WILSON, E. B. The supernumerary chromosomes of Hemiptera. Science, v.12, n.5, p.303-313, 1907. YUSUF TUTAR. Pseudogenes. International Journal of Genomics. v.2012, p.1-4, 2012. Resultados As informações obtidas nos estudos citogenéticos e moleculares efetuados sobre a presença e estrutura genômica dos pseudogenes sbno2 e simc1 nos cromossomos B de espécies do gênero Psalidodon, resultaram na proposta de artigos científicos que são apresentados a seguir, na forma de capítulos: Capítulo I – Análise estrutural dos pseudogenes sbno2-B e simc1-B em Psalidodon paranae (Characiformes, Characidae). Capítulo II – Análise da origem e estrutura dos pseudogenes sbno2-B e simc1-B em espécies do gênero Psalidodon (Characiformes, Characidae).