UNIVERSIDADE ESTADUAL PAULISTA – UNESP CÂMPUS DE JABOTICABAL ESTUDO GENÔMICO COMPARATIVO EM Theobroma AMAZÔNICOS: IDENTIFICAÇÃO DE GENES ASSOCIADOS À QUALIDADE DOS FRUTOS EM T. grandiflorum, T. cacao E T. umbraticum Rafaely Pantoja Oliveira Engenheira Florestal 2025 UNIVERSIDADE ESTADUAL PAULISTA – UNESP CÂMPUS DE JABOTICABAL ESTUDO GENÔMICO COMPARATIVO EM Theobroma AMAZÔNICOS: IDENTIFICAÇÃO DE GENES ASSOCIADOS À QUALIDADE DOS FRUTOS EM T. grandiflorum, T. cacao E T. umbraticum Rafaely Pantoja Oliveira Orientador: Prof. Dr. Alessandro de Mello Varani 2025 Tese apresentada à Faculdade de Ciências Agrárias e Veterinárias – Unesp, Câmpus de Jaboticabal, como parte das exigências para a obtenção do título de Doutora em Agronomia (Genética e Melhoramento de Plantas) Registro de Impacto Este estudo genômico comparativo em espécies amazônicas de Theobroma contribui para o avanço da agricultura sustentável, ao identificar genes associados à qualidade dos frutos, com potencial aplicação em programas de melhoramento genético. Dados Curriculares do Autor Rafaely Pantoja Oliveira, nascida em Castanhal, PA. É graduada em Engenharia Florestal pela Universidade Federal Rural da Amazônia (UFRA), onde concluiu seu curso em 2018. Durante a graduação, realizou estágio no Laboratório de Biotecnologia e Recursos Vegetais da Embrapa Amazônia Oriental, em Belém, atuando na área de propagação de plantas. Desenvolveu trabalhos com Piper nigrum L. por meio de cultura de tecidos, utilizando métodos de micropropagação. Após a graduação, ingressou no programa de pós-graduação em Ciências Florestais na mesma instituição, UFRA, onde obteve o título de mestra em 2021 com a pesquisa "Estudo Comparativo da Anatomia e Densidade Básica da Madeira das Variedades de Schizolobium parahyba (Vell.) S. F. Blake em um Plantio na Amazônia". Em termos de publicações científicas, é coautora do artigo de alto impacto intitulado "Genomic decoding of Theobroma grandiflorum (cupuassu) at chromosomal scale: evolutionary insights for horticultural innovation," publicado na GigaScience, v. 13, p. 1-19, em 2024, ao lado de importantes pesquisadores. Ao longo da sua trajetória acadêmica, contribuiu para projetos de pesquisa voltados para a sustentabilidade e o manejo florestal, promovendo técnicas e práticas que visam a conservação dos recursos naturais na região amazônica. Além disso, sua atuação em pesquisas de genômica comparativa entre espécies do gênero Theobroma tem auxiliado na identificação de genes relacionados à qualidade dos frutos e características agronômicas, ampliando o conhecimento sobre a biodiversidade e o potencial produtivo dessas espécies amazônicas. Dedico esta tese à minha avó, Maria Conceição, que, em seus momentos de lucidez, sonhou junto comigo esta conquista. Seu amor, força e fé silenciosa seguem sendo minha inspiração mais profunda. Agradecimentos Agradeço à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo apoio financeiro por meio da concessão da bolsa de estudos, fundamental para a realização da pesquisa. À Universidade Estadual Paulista “Júlio de Mesquita Filho” (UNESP) e ao Programa de Pós-Graduação em Agronomia (Genética e Melhoramento de Plantas), pela sólida formação acadêmica e pelas oportunidades que contribuíram para meu crescimento profissional e intelectual. À minha família, minha base e meu alicerce, deixo minha gratidão mais profunda: à minha mãe Natalina e ao meu pai Antônio, por todo o amor, apoio incondicional e incentivo em cada etapa da minha vida acadêmica; aos meus irmãos, Rafaela e Rafael, pelo carinho, parceria e palavras de encorajamento; e às minhas sobrinhas, Maria Cecília e Júlia, que alegram meus dias com afeto e doçura. Ao meu orientador, Dr. Alessandro Varani, agradeço imensamente pela orientação dedicada, pela confiança depositada em meu trabalho e por todo o aprendizado compartilhado ao longo desta jornada. Sou profundamente grata por ter sido acolhida em seu laboratório como sua aluna de doutorado, pelas trocas de conhecimentos valiosas e, principalmente, pela paciência e humanidade com que sempre me guiou — demonstrando empatia, sensibilidade e respeito em cada etapa do caminho. Agradeço aos meus amigos e colega de laboratório, João Victor e Mauro, pela colaboração direta neste trabalho, pela parceria diária e pelo companheirismo. A todos os demais amigos e colegas de laboratório, deixo meu sincero reconhecimento pelo convívio, pelo apoio mútuo e pelas trocas que tornaram este percurso mais leve e significativo. Agradeço profundamente a todos os professores da UNESP-FCAV pelo conhecimento compartilhado, pela dedicação ao ensino e pelo ambiente acadêmico inspirador que proporcionaram ao longo da minha formação. Em especial, expresso minha sincera gratidão ao Prof. Dr. Vitor Fernandes Oliveira de Miranda, por suas valiosas contribuições acadêmicas, e à Pós-Doutoranda Saura Rodrigues da Silva, pelas trocas enriquecedoras de conhecimento. Agradeço à Embrapa Amazônia Oriental, em nome do Dr. Rafael Moysés Alves, e à Universidade Federal do Pará (UFPA), em nome do Prof. Dr. Vinicius Augusto Carvalho de Abreu, pelas contribuições fundamentais no desenvolvimento do projeto do genoma do cupuaçu. Suas colaborações científicas, apoio institucional e compromisso com a pesquisa foram essenciais para a realização do sequenciamento genômico de uma das espécies frutíferas mais importantes da Amazônia, o cupuaçu, com grande relevância para a biodiversidade e o desenvolvimento sustentável da região. O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001. SUMÁRIO CAPÍTULO 1 - Considerações Gerais ...................................................................... 8 1. INTRODUÇÃO ........................................................................................................ 8 2. REVISÃO DE LITERATURA ................................................................................. 14 2.1. Introdução à família Malvaceae e a importância dos frutos de Theobroma grandiflorum, T. cacao e T. umbraticum ................................................................ 14 2.2. Aspectos de doença e controle: Moniliophthora perniciosa e Moniliophthora roreri ...................................................................................................................... 18 2.2.1. Mecanismos de resistência e suscetibilidade das plantas do gênero Theobroma em relação a M. perniciosa e M. roreri.................................................................................... 23 2.3. Domesticação de Theobroma ......................................................................... 28 2.4. Genômica do Theobroma ............................................................................... 33 2.5. Genes relacionados à qualidade dos frutos e sua importância ....................... 49 2.6. A família de genes COBRA-LIKE (COBLs) e seu provável papel na regulação da parede celular ................................................................................................... 61 2.7. Justificativa e hipótese .................................................................................... 66 3 REFERÊNCIAS ...................................................................................................... 68 CAPÍTULO 2 - Diversificação Funcional dos Genes COBRA-LIKE (COBLs) em Theobroma Amazônicos: Estudo Comparativo entre T. grandiflorum, T. cacao e T. umbraticum ................................................................................................................ 85 1. INTRODUÇÃO ...................................................................................................... 87 2. MATERIAIS E MÉTODOS..................................................................................... 91 2.1 Genoma selecionado para estudo ................................................................... 91 2.2. Busca por genes e mapeamento dos genes nos cromossomos ..................... 92 2.3. Expressão gênica em transcritos por milhão (TPM) ....................................... 93 2.4. Visualização da estrutura gênica e análise de domínios ................................ 94 2.5. Análises Filogenéticas .................................................................................... 94 2.6. Modelagem molecular e análise estrutural das proteínas COBRA-Like nas espécies estudadas ............................................................................................... 95 3. RESULTADOS E DISCUSSÃO ............................................................................. 96 3.1. Padrões de distribuição e expressão (TPM) de genes COBRA-Like em T. grandiflorum, T. cacao e T. umbraticum: predominância de duplicações em tandem sugerindo adaptação funcional .............................................................................. 96 3.2. Domínio e estrutura da família gênica COBRA-Likes: conservação evolutiva e variação no tamanho das proteínas ..................................................................... 105 3.3. Análises filogenéticas indicam que genes COBRA-Like exclusivos de Theobroma apresentam padrões estruturais distintos e possíveis adaptações funcionais ............................................................................................................. 108 4. REFERÊNCIAS ................................................................................................... 115 CAPÍTULO 3 – Considerações finais e perspectivas ......................................... 122 APÊNDICES ............................................................................................................ 124 ESTUDO GENÔMICO COMPARATIVO EM Theobroma AMAZÔNICOS: IDENTIFICAÇÃO DE GENES ASSOCIADOS À QUALIDADE DOS FRUTOS EM T. grandiflorum, T. cacao E T. umbraticum RESUMO - O cupuaçuzeiro (Theobroma grandiflorum), membro da família Malvaceae, é uma das espécies mais populares da Amazônia brasileira. A polpa dos frutos do cupuaçu é muito apreciada para o preparo de sucos, doces, licores, geleias, sorvetes e outros produtos alimentícios. As sementes são utilizadas na fabricação de chocolate em pó, tabletes (cupulate) e na indústria de cosméticos. Apesar dos produtores da fruta aproveitarem cada vez mais de seus recursos, incentivando uma cadeia produtiva na região Amazônica, a cultura do cupuaçu ainda é pouco explorada e seus produtos são pouco conhecidos em abrangência nacional. Em adição, diversas doenças afetam a cultura, dentre elas a vassoura-de-bruxa, ocasionada pelo fungo Moniliophthora perniciosa e a monilíase, causada pelo fungo Moniliophthora roreri, causando grandes perdas de produtividade. Nesse sentido, programas de melhoramento já alcançaram genótipos resistentes e mais produtivos, porém a base molecular de resistência a estes patógenos, bem como a exploração de genes relacionados a qualidade dos frutos ainda são incipientes. Por exemplo, embora o cupuaçu pertença ao mesmo gênero do cacaueiro (Theobroma cacao), espécie da qual se obtém o chocolate, e que foi amplamente estudada sob o ponto de vista molecular, genômico e funcional no decorrer da última década, o cupuaçu ainda carece de estudos aprofundados que explorem sua base molecular e genômica, sendo esses conhecimentos fundamentais para subsidiar estratégias de melhoramento genético mais eficientes e direcionadas para a qualidade dos frutos e valorização de características agronômicas e industriais. O cacaueiro, por outro lado, é amplamente cultivado e sua importância econômica global está atrelada à produção de cacau, fundamental para a indústria do chocolate. Os esforços científicos no estudo do Theobroma cacao resultaram no sequenciamento completo de seu genoma, revelando uma riqueza de informações sobre genes relacionados à qualidade do fruto, resistência a doenças, e processos de maturação, o que tem fornecido uma base sólida para o melhoramento genético dessa espécie. Isso torna o cupuaçu um excelente candidato para estudos moleculares e de genômica comparativa, principalmente frente à sua espécie congênere, o cacaueiro. Além dessas espécies, outro membro relevante da família Malvaceae é Theobroma umbraticum, uma espécie menos conhecida e que, assim como o cupuaçu e o cacau, tem potencial para estudos comparativos. Theobroma umbraticum também pertence à subfamília Byttnerioideae, e seus frutos compartilham características semelhantes com T. cacao, embora a espécie seja subutilizada e pouco explorada em termos econômicos e científicos. A análise comparativa entre Theobroma grandiflorum, Theobroma cacao e Theobroma umbraticum pode contribuir para a compreensão da evolução e diversificação dos genes responsáveis por características importantes referentes a qualidade de frutos, podendo oferecer novas informações para a conservação e exploração sustentável da biodiversidade amazônica. Palavras-chave: Biodiversidade amazônica, Sequenciamento genômico, Melhoramento genético, Cobra-likes, Domesticação de espécies. COMPARATIVE GENOMIC STUDY OF AMAZONIAN Theobroma SPECIES: IDENTIFICATION OF GENES ASSOCIATED WITH FRUIT QUALITY IN T. grandiflorum, T. cacao, AND T. umbraticum ABSTRACT - The cupuaçu tree (Theobroma grandiflorum), a member of the Malvaceae family, is one of the most popular species in the Brazilian Amazon. The pulp of cupuaçu fruits is highly valued for the preparation of juices, sweets, liqueurs, jams, ice creams, and other food products. The seeds are used to produce cocoa powder, chocolate bars (cupulate), and in the cosmetics industry. Despite the increasing utilization of its resources by fruit producers, encouraging a productive chain in the Amazon region, the cultivation of cupuaçu remains underexplored, and its products are little known on a national scale. In addition, various diseases affect the crop, including witches’ broom, caused by the fungus Moniliophthora perniciosa, and moniliasis, caused by the fungus Moniliophthora roreri, leading to significant productivity losses. In this context, breeding programs have already achieved more resistant and productive genotypes. However, the molecular basis of resistance to these pathogens, as well as the exploration of genes related to fruit quality, remains in its infancy. For example, although cupuaçu belongs to the same genus as cacao (Theobroma cacao), a species from which chocolate is derived and which has been extensively studied from molecular, genomic, and functional perspectives over the past decade, cupuaçu still lacks in-depth studies exploring its moleculares and genomic bases. Such knowledge is crucial for supporting more efficient genetic improvement strategies aimed at enhancing fruit quality and valuing agronomic and industrial traits. Cacao, on the other hand, is widely cultivated, and its globais economic importance is tied to cocoa production, which is fundamental to the chocolate industry. Scientific efforts in studying Theobroma cacao have resulted in the complete sequencing of its genome, revealing a wealth of information on genes related to fruit quality, disease resistance, and ripening processes, providing a solid foundation for the genetic improvement of this species. This makes cupuaçu an excellent candidate for molecular and comparative genomic studies, particularly in relation to its congener, cacao. In addition to these species, another notable member of the Malvaceae family is Theobroma umbraticum, a lesser-known species that, like cupuaçu and cacao, has potential for comparative studies. Theobroma umbraticum also belongs to the subfamily Byttnerioideae, and its fruits share similar characteristics with T. cacao, although the species is underutilized and remains economically and scientifically underexplored. Comparative analyses of Theobroma grandiflorum, Theobroma cacao, and Theobroma umbraticum could contribute to understanding the evolution and diversification of genes responsible for important traits related to fruit quality, offering new insights for the conservation and sustainable use of Amazonian biodiversity. biodiversity.Keywords: Amazonian biodiversity, genomic sequencing, genetic improvement, Cobra-likes, species domestication. 8 CAPÍTULO 1 - Considerações Gerais 1. INTRODUÇÃO Theobroma (Malvaceae: Byttnerioideae), um gênero Neotropical de ampla distribuição nas florestas tropicais, especialmente na Amazônia, representa um componente significativo da biodiversidade regional. Atualmente, são descritas cerca de 40 espécies para o gênero, compreendendo 23 espécies de árvores de sub-bosque nativas de florestas neotropicais (Colli-Silva; Richardson; Pirani, 2023; Colli-Silva et al., 2024), das quais 17 espécies são oficialmente reconhecidas em território brasileiro, conforme a revisão taxonômica mais recente (Flora e Funga do Brasil, 2024). Dois trabalhos taxonômicos clássicos no estudo do grupo dos cacaus são a revisão de Theobroma (Cuatrecasas, 1964) e a sinopse de Herrania (Schultes, 1958), tradicionalmente considerado seu gênero-irmão (Figura 1), com 17 espécies descritas. Dentre elas, destacava-se Herrania umbratica, recentemente reclassificada como Theobroma umbraticum (R.E.Schult.) Colli-Silva (Colli-Silva et al., 2024), a espécie que compartilha a maioria das proteínas e genes com T. cacao, apresentando mais de 96% de similaridade (Villamar-Torres et al., 2024). O gênero Herrania distingue-se de Theobroma por apresentar folhas compostas palmadas (ao contrário das folhas simples de Theobroma), um cálice predominantemente trímero (diferindo do cálice pentâmero usual em Theobroma) e uma porção superior da pétala unguiculada consideravelmente mais longa em Herrania do que em seu gênero-irmão (Bossa-Castro et al., 2024; Colli-Silva et al., 2024; Flora e Funga do Brasil, 2024). Porém, estudos recentes propõem uma reavaliação taxonômica, sugerindo a sinonimização do gênero Herrania em Theobroma com base em análises morfológicas e filogenéticas (Bossa-Castro et al., 2024; Colli-Silva et al., 2024). Com base em dados moleculares, os estudos demonstram que o gênero Theobroma é parafilético, uma vez que não inclui todos os descendentes de um ancestral comum (Figura 1). Esse padrão decorre da posição filogenética de Herrania, que emerge como um grupo monofilético intimamente relacionado a Theobroma e compartilha com Theobroma importantes características 9 morfológicas, como o hábito arbóreo, a morfologia das inflorescências e os tipos de frutos. Esses resultados levam à proposta de reclassificar Herrania como uma seção dentro de Theobroma, restaurando uma circunscrição clássica do gênero e promovendo uma melhor compreensão das relações evolutivas dentro da família Malvaceae (Bossa-Castro et al., 2024; Colli-Silva et al., 2024). Figura 1. Árvore filogenética inferida para os gêneros Theobroma e Herrania (Malvaceae), com destaque para a parafilia de Theobroma. O gênero Theobroma é parafilético, com Herrania posicionado em um ramo interno de Theobroma. Isso indica que a definição tradicional de Theobroma exclui descendentes críticos de seu ancestral comum. Fonte: Bossa-Castro et al., 2024. 10 Muitas espécies de Theobroma, especialmente as espécies comercializadas (Theobroma cacao L. – o cacau comercial – e Theobroma grandiflorum (Willd. ex Spreng.) K.Schum – o cupuaçu) são amplamente cultivadas no Brasil (Mar et al., 2024). A fruticultura e a diversidade de cultivares na região amazônica são muito ricas, sendo o cacau a espécie mais conhecida e cultivada, considerada a principal fonte de matéria-prima para a indústria de chocolate. Por outro lado, o cupuaçuzeiro uma das suas frutas mais populares da região norte e nordeste do Brasil, apresenta diversas aplicações em sua utilização, desde fins alimentícios, a usos industriais. Vários produtos são fabricados a partir da polpa do cupuaçu, como sucos, sorvetes, licores, geleias, doces e cosméticos (Calzavara, 1987; Venturieri; Aguiar, 1988; Nazare; Barbosa; Viegas, 1990; Silva; Silva, 1999; Salgado et al., 2011; Costa et al., 2015; Alves et al., 2017). Porém, ao contrário do cacau, que é cultivado em outros continentes, o cupuaçu tem cultivo restrito à região Amazônica, sendo tradicionalmente plantado com maior frequência em pequenas propriedades, ocupando mão-de-obra familiar e, geralmente, consorciado com outras culturas (Alves; Chaves, 2023). A produção de cupuaçuzeiro (Figura 2-A) está concentrada principalmente no estado do Pará, que se destaca como o maior produtor, seguido pelos estados do Amazonas, Rondônia, Acre e Bahia (Idam, 2021). A produção anual de cupuaçu no estado do Pará alcançou, em média, 1,6 milhão de toneladas em uma área de 224 mil hectares. Esses dados ressaltam a importância econômica da cultura na região Norte do Brasil, particularmente no Pará, que lidera a produção nacional da espécie (SEDAP, 2024). Dentro do gênero Theobroma, o fruto do cupuaçu é o que apresenta o maior tamanho, sendo a polpa o principal produto (Figura 2-C). As análises de polpa revelam excelentes características e teores médios de fósforo e de vitamina C, superiores aos de muitas outras polpas de frutas (Calzavara, 1987; Mar et al., 2024). As características organolépticas de sua polpa e propriedades favoráveis como matéria- prima para industrialização, têm sido responsáveis por um interesse cada vez maior na sua exploração por parte dos diversos segmentos da cadeia produtiva. Dentre as possibilidades de ampla comercialização, a melhor opção para a comercialização em 11 larga escala encontra-se principalmente na polpa, o que pode ser viabilizado por meio de ações estratégicas do setor privado e da esfera governamental (SUFRAMA, 2017; Mar et al., 2024). Por outro lado, a partir das sementes do cupuaçu são fabricados chocolate branco, ao leite e meio amargo de ótima qualidade (também chamado de “cupulate”) (Nazare; Barbosa; Viegas, 1990). As sementes também são utilizadas para produção da manteiga de cupuaçu feita a partir de seu óleo, proveniente de processos mais econômicos em relação à manteiga de cacau, podendo ser empregada na produção de cupulate em tabletes e na indústria de cosméticos; portanto, trazendo benefícios Figura 2. (A) Árvore de T. grandiflorum com frutos em desenvolvimento. (B) Detalhe de um fruto de cupuaçu. (C) Fruto de cupuaçu aberto, mostrando a polpa interna. Extraído de Alves et al., 2024 12 sociais e econômicos interessantes, além do desenvolvimento de produtos para a área de saúde estética devido à riqueza de compostos bioativos presentes em sua polpa e sementes (Nazare; Barbosa; Viegas, 1990; Purcell, 2019; Mar et al., 2024). As sementes do cupuaçu também são ricas em gordura e, quando fermentadas, secas e torradas adequadamente, podem ser utilizadas na elaboração de produtos análogos aos oriundos das amêndoas de cacau (Mar et al., 2024). Nos últimos anos, os produtores da fruta vêm aproveitando cada vez mais seus recursos, incentivando uma cadeia produtiva na região Amazônica. Como consequência, o fruto e sua diversidade de produtos derivados se encontram cada vez mais presentes no mercado nacional e internacional (Mar et al., 2024). O aumento da industrialização da polpa de cupuaçu, tem proporcionado também um incremento significativo no volume de sementes, que correspondem a 20% do peso do fruto (Cohen; Jackix, 2005). Porém, o interesse do setor industrial pela polpa e sementes do cupuaçu é acompanhado da necessidade de se obter novas formas para sua produção, melhores estratégias de conservação e redução das perdas pós-colheita, geralmente provocadas pelo tempo demandado no transporte, visto que muitas regiões potencialmente produtoras de cupuaçu estão afastadas de polos industriais, e por doenças que afetam a sua produtividade (Cohen; Jackix, 2005; Gondim, et al., 2021). As principais doenças que acometem o cupuaçuzeiro e o cacaueiro são causadas por fungos, com destaque para a vassoura-de-bruxa, provocada por Moniliophthora perniciosa, e a monilíase, causada por Moniliophthora roreri (Bailey et al., 2018). A vassoura-de-bruxa induz hipertrofia dos meristemas ativos, seguida pelo secamento de frutos, ramos e folhas, sendo dispersada principalmente pelo vento e pela chuva (de Souza et al., 2014). Já a monilíase é uma doença devastadora que compromete severamente a produção e a qualidade dos frutos caracterizada pelo escurecimento, enrugamento e murcha dos frutos, que acabam secando e tornando- se inadequados para consumo ou processamento (Bailey et al., 2018). Ambos os patógenos são intimamente relacionados e representam uma ameaça significativa às culturas de cupuaçu e cacau (Ploetz, 2016; Bailey et al., 2018). 13 Com a finalidade de contornar esses problemas e melhorar a produtividade, programas de melhoramento genético do cupuaçuzeiro, conduzidos pela EMBRAPA Amazônia Oriental em Belém, PA, Brasil, desenvolveram diversos genótipos para seleção de clones elites de cupuaçu, sendo, por exemplo o C174 resistente a vassoura-de-bruxa, e C1074 suscetível a vassoura-de-bruxa (Alves et al., 2017). Porém, apesar da sua importância comercial e estratégica, principalmente para a Região Norte do Brasil, ainda são incipientes os estudos nas áreas de genética molecular e genômica; como também em áreas de pesquisa mais aplicadas, como, nutrição, seleção de cultivares adaptados às condições edafoclimáticas das regiões produtoras e estudo de mercados. Porém, os esforços científicos têm se concentrado principalmente no cacaueiro, devido ao seu impacto econômico global na produção de chocolate, evidenciando uma lacuna no desenvolvimento de tecnologias para espécies como o cupuaçu. Portanto, para aproveitar plenamente o potencial do cupuaçu, é essencial intensificar pesquisas em genética molecular e genômica, com foco na identificação de genes ligados a características agronômicas e qualidade dos frutos. Esses estudos podem viabilizar uma seleção mais eficiente, práticas de manejo aprimoradas e maior resistência a doenças, promovendo a sustentabilidade e competitividade do cupuaçu no mercado nacional e internacional como uma alternativa viável ao cacau. A caracterização de genes relacionados à qualidade dos frutos em cupuaçu, que possam ser identificados através de estudos genômicos é de extrema importância para o melhor conhecimento e aproveitamento da espécie. Por exemplo, estudos de Alves et al. (2024) revelam que o genoma do cupuaçu possui genes exclusivos e padrões únicos de expansão e contração em famílias de genes relacionados a características de qualidade dos frutos e mecanismos de defesa. Em T. grandiflorum, foram identificadas 282 famílias de genes exclusivas. Além disso, 730 famílias de genes são compartilhadas entre T. grandiflorum e T. cacao, enquanto 297 são comuns a T. grandiflorum e T. umbraticum. Indicando que entre as famílias de genes exclusivas e compartilhadas e singletons, muitas estão ligadas à qualidade da fruta, maturação, desenvolvimento de características organolépticas, desenvolvimento geral da planta e resistência a patógenos. 14 Essas variações genômicas identificadas podem explicar as diferenças morfológicas, de amadurecimento e resistência a doenças observadas entre o cupuaçu e outras espécies da família Malvaceae, como o cacau e T. umbraticum. Portanto, o sequenciamento do genoma do cupuaçu pode apresentar grande potencial para contribuir com o aprimoramento das características agrícolas e industriais do cupuaçu, como produtividade e resistência a patógenos, sendo um recurso valioso para futuros estudos e inovações no setor (Alves et al., 2024). Partindo desse contexto, o objetivo principal desta tese de doutorado foi de realizar uma análise genômica comparativa do cupuaçu em relação aos genomas sequenciados de outras espécies da família Malvaceae, especificamente cacau e T. umbraticum, com foco em identificar, caracterizar, comparar e avaliar filogeneticamente genes relacionados às qualidades comerciais dos produtos derivados do fruto do cupuaçu. 2. REVISÃO DE LITERATURA 2.1. Introdução à família Malvaceae e a importância dos frutos de Theobroma grandiflorum, T. cacao e T. umbraticum A família Malvaceae é considerada uma das linhagens botânicas mais diversificadas (Christenhusz e Byng, 2016). Essa família apresenta mais de 200 gêneros e mais de 4.000 espécies amplamente encontradas nas regiões tropicais do planeta, com destaque para as Américas, África e Ásia (Bayer e Craene, 2003; Flora e Funga do Brasil, 2024). Essas plantas estão globalmente distribuídas, exceto no Ártico, na Antártida e no Deserto de Gobi (Christenhusz et al., 2017). No entanto, apresentam predominância em regiões tropicais e subtropicais, como a Amazônia (Veldkornet, 2023). Historicamente, a família Malvaceae é conhecida por plantas de grande importância econômica e ecológica, incluindo herbáceas, arbustos e árvores (Xu e Deng, 2017). Dentre os vários representantes de importância econômica, destacam- 15 se espécies como o quiabo (Abelmoschus spp.), o algodão (Gossypium spp.), o cacau e cupuaçu (Theobroma spp.), além de hibiscos e malvaviscos (gêneros Hibiscus e Malvaviscus), e árvores emblemáticas como os baobás e as barrigudas, pertencentes à subfamília Bombacoideae, incluindo os gêneros Ceiba Mill., Adansonia L. e Pseudobombax Dugand (Flora e Funga do Brasil, 2024). Uma característica notável dessa família é a presença de tricomas estelares na superfície de muitas espécies, que auxiliam na proteção contra a perda de água e herbivoria (Silva, Gallão e De Arruda, 2023). Morfologicamente, as Malvaceae apresentam caules robustos, frequentemente com fibras de líber e cavidades mucilaginosas, funcionando na defesa contra herbívoros e retenção hídrica (Solereder, 1908; Craene, 2003). As folhas são geralmente simples, alternadas, com margens serradas ou palmatamente divididas, e apresentam uma venação frequentemente palmada (Rocha e Machado, 2009). Outro aspecto distintivo é a presença de estípulas e pecíolos que suportam as lâminas foliares, flexibilidade na captação de luz solar (Celka, 2005). As flores são, em sua maioria, bissexuais e actinomórficas, podendo ser encontradas tanto isoladas quanto cimas, panículas ou fascículos (Silva et al., 2018). Um traço comum é a presença de um epicálice, que forma um envoltório ao redor do cálice, frequentemente dividido em três ou mais lóbulos, adicionando uma camada extra de proteção à flor (Pereira e Souza, 2020). As sépalas são cinco, podendo ser livres ou parcialmente fundidas, com prefoliação valvar (Costa et al., 2017). As pétalas também são cinco, dispõem-se de forma rotativa e frequentemente ligadas à base da coluna estaminal, destacando a forma característica das flores dessa família (Almeida e Ferreira, 2019). Os estames são numerosos e possuem os filamentos se fundem para formar um tubo, uma característica conhecida como condição adelfo (Chalk, 1950). O ovário é superior, variando de dois a muitos lóculos, sendo mais comum a presença de cinco lóculos formados por dois ou mais carpelos (Chalk, 1950; Walks, 1984; Bayer e Craene, 2003). Os estiletes são únicos, mas frequentemente ramificados na parte superior, com ramificações correspondentes ou múltiplas ao número de carpelos presentes (Rocha e Machado, 2009). 16 O fruto das Malvaceae pode variar significativamente entre as espécies, indo desde cápsulas loculicidas até esquizocarpos, e, em raros casos, podendo ser semelhantes a bagas (El-khiat et al., 2023). As sementes são geralmente reniformes, podendo ser glabras ou cobertas por tricomas, e apresentam endosperma abundante que nutre o embrião (Heywood, 1971; Fawzi, 2018). O embrião é frequentemente curvado, com cotilédones planos, dobrados ou convolutos, adaptando-se ao espaço dentro da semente (Masullo et al., 2020). Na Amazônia, a diversidade da família Malvaceae é notável, abrangendo gêneros como Theobroma, Ceiba, Hibiscus e Helicteres. No entanto, espécies como Theobroma cacao e Theobroma grandiflorum se destacam por sua importância econômica e cultural (Richardson et al., 2015). T. cacao é amplamente cultivado para a produção de chocolate, enquanto T. grandiflorum (cupuaçu) é valorizado por seus frutos, utilizados na produção de sucos, doces e cosméticos (Purcell, 2019; Matos Andrade et al., 2023). Além disso, T. umbraticum, uma espécie menos conhecida, contribui para a biodiversidade regional e representa a variabilidade genética do grupo (Schultes, 1943). Tanto Herrania quanto Theobroma apresentam frutos que podem ser usados para fins alimentícios (Figura 3). Figura 3. A: Fruto de Theobroma umbraticum. B: Theobroma grandiflorum e C: Theobroma cacao. Fonte: Adaptado de trade winds fruit, 2025 e Alves et al., 2024 O cacau e o cupuaçu são árvores perenes, com alturas variáveis, sendo o cacau de 4–8 m de altura e raramente cresce até 20 m, com casca marrom- acinzentada escura, enquanto o cupuaçu pode crescer 5–15 m de altura e tem um tronco de casca marrom. Morfologicamente próximas, suas folhas são simples e alternas, variando de estreitamente ovadas a obovadas-elípticas. As nervuras são pinadas em direção à extremidade com uma nervura principal bem marcada e 17 nervuras secundárias proeminentes. Elas variam de 20 a 35 cm de comprimento e 6 a 10 cm de largura (Jean-Marie et al., 2022). Para o cacau, as sementes são ovoides, elipsoides, amigdaloides, mais ou menos complanados ou redondos, variando de 20 a 40 mm de comprimento e 12 a 20 mm de largura com uma polpa envolvida branca ou amarelo-clara. Enquanto o cupuaçu, as sementes são ovoides ou elipsoide-ovoides, mais ou menos achatadas e variam de 20 a 30 mm de comprimento e 20 a 25 mm de largura com uma polpa amarelada (Cuatrecasas, 1964). No contexto econômico o cupuaçu e o cacau têm um papel importante para as comunidades locais na Amazônia e para o mercado global. O cacau é a base da produção de chocolate, cuja demanda mundial tem crescido de forma constante. Em 2023, estima-se que a produção global de cacau alcançou 5,3 milhões de toneladas, gerando receitas superiores a 131 bilhões de dólares, segundo a Organização Internacional do Cacau (ICCO, 2023). No Brasil, a produção de cacau movimentou cerca de 3 bilhões de reais em 2022, com a maior parte concentrada na região norte e no sul da Bahia, configurando-se como uma importante atividade econômica para pequenos agricultores e cooperativas regionais (IBGE, 2022). Além do cacau, o cupuaçu vem ganhando relevância tanto nos mercados de alimentos quanto de cosméticos. Os frutos do cupuaçu são amplamente utilizados para a produção de polpas, sucos, geleias e chocolates alternativos, além de serem apreciados na indústria cosmética por suas propriedades antioxidantes (Calzavara, 1987; Venturieri; Aguiar, 1988; Nazare; Barbosa; Viegas, 1990; Silva; Silva, 1999; Salgado et al., 2011; Costa et al., 2015; Alves et al., 2017). Em 2021, a estimativa de produção de cupuaçu no Brasil atingiu cerca de 13 mil toneladas, provenientes em grande parte de pequenos agricultores que adotam Sistemas Agroflorestais (SAFs) na Amazônia, onde o cultivo do cupuaçu é frequentemente combinado com outras espécies nativas, como açaí e castanha-do-pará (AgroMap, 2021). Enquanto cacau e o cupuaçu já são amplamente cultivados, T. umbraticum apresenta um potencial ainda a ser explorado (Whitlock e Baum, 1999). Presente em áreas de floresta na Amazônia, essa espécie possui frutos que se assemelham aos frutos do cacau, sendo importantes na alimentação da fauna local (Nousias et al., 18 2024). O cultivo de Herrania em SAFs poderia seguir os modelos bem-sucedidos já aplicados para cacau e cupuaçu, diversificando ainda mais a produção agrícola na Amazônia e fornecendo novas fontes de renda para agricultores familiares (Rocha et al., 2020). 2.2. Aspectos de doença e controle: Moniliophthora perniciosa e Moniliophthora roreri A sustentabilidade das culturas tropicais, especialmente aquelas suscetíveis a doenças fúngicas, enfrenta sérios desafios. Entre essas doenças, a vassoura-de- bruxa, provocada pelo fungo Moniliophthora perniciosa e monilíase, causada pelo fungo Moniliophthora roreri, destacam-se como as mais devastadoras (Meinhardt et al., 2008; Ploetz, 2016; Bailey et al., 2018). Estes patógenos são responsáveis por perdas significativas na produção de culturas como cacaueiro e cupuaçuzeiro, devido ao seu impacto direto na morfologia da planta e, consequentemente, na sua produtividade (Evans, 1981; Ploetz, 2016; Bailey et al., 2018). A vassoura-de-bruxa é caracterizada pelo crescimento anômalo de brotações, levando à formação de estruturas que se assemelham a vassouras, o que resulta em uma drástica redução na qualidade e na quantidade da produção (Figura 4) (Mendonça et al., 2019), enquanto a monilíase provoca sintomas conhecidos como "inchaços ou caroços, ilhas verdes, mancha chocolate, pontos oleosos", levando ao escurecimento, enrugamento e murcha dos frutos, que acabam por secar e se tornam inapropriados para o consumo e para o processamento (Figura 5) (Leite et al., 2023). Afetando tanto Theobroma quanto Herrania (Figura 4; Figura 5 e Figura 6). 19 Figura 4. Sintomas da vassoura-de-bruxa (Moniliophthora perniciosa) em Theobroma cacao. A: Frutos afetados pela doença. B: Frutos infectados e necrosados no solo. C: Estruturas reprodutivas do fungo (basidiocarpos). D: Fruto cortado mostrando infecção interna e sementes necrosadas. E: ramos e folhas secas com presença do fungo. F: Fruto com sintomas característicos da doença. Fonte: Adaptado de Mendonça et al., 2019. Figura 5. Frutos de cacau e cupuaçu infectados por M. roreri. A: sintomas conhecidos como caroços decorrentes da infecção em cacau. B: ilhas verdes causadas pela infecção em cacau. C: mancha chocolate e formação de pseudoestroma em cacau. D: sintomas denominados pontos oleosos em cacau. E, F: fruto recobertos por pseudoestroma em cacau (massa de hifas). G: lesões necróticas em cupuaçu. H: formação de psoudoestroma em cupuaçu. I: cupuaçu recoberto por pseudoestroma (massa de hifas). Fonte: Adaptado de Leite et al., 2023. 20 Figura 6. Frutos de Theobroma umbraticum afetados por Moniliophthora roreri. A: Detalhe da frutificação da espécie com flores e frutos jovens. B: Fruto saudável aderido ao tronco. C: Fruto infectado por M. roreri, apresentando os sintomas característicos da monilíase, como necrose e recoberto por pseudoestroma (massa de hifas). Fonte: Leite et al., 2023. A M. perniciosa é um basidiomiceto que se reproduz tanto de forma assexuada quanto sexuada, dependendo das condições ambientais (Tavares et al., 2021). O ciclo de vida desse fungo é complexo e envolve a produção de esporos que se dispersam pelo vento, água ou insetos, estabelecendo novas infecções em plantas suscetíveis. A infecção ocorre predominantemente em condições de alta umidade, que favorecem a germinação dos esporos (Rocha et al., 2020). À medida que a infecção progride, as plantas afetadas apresentam não apenas deformidades nas folhas e ramos, mas também a morte das partes afetadas, o que pode resultar em perdas de até 70% na produção (Cruz et al., 2021). Os mecanismos de patogenicidade do M. perniciosa envolvem a indução de estresses fisiológicos nas plantas hospedeiras, incluindo a inibição do crescimento e a alteração da estrutura da planta. Estudos demonstram que a infecção por M. perniciosa resulta em um aumento na produção de fitoalexinas e na ativação de respostas de defesa, embora essas respostas muitas vezes não sejam suficientes para conter a progressão da doença (Almeida et al., 2021; Silva et al., 2022). A interação entre a planta e o patógeno é complexa e multifatorial, envolvendo a regulação de genes relacionados ao estresse e à defesa, além de alterações na composição química das folhas infectadas, que podem afetar a herbivoria e a interação com outros patógenos (Nascimento et al., 2023). 21 O manejo integrado da vassoura-de-bruxa requer uma abordagem multifacetada, combinando práticas culturais, controle biológico e químico. A remoção de ramos infectados, podas regulares, densidades adequadas de plantio e melhoria da circulação de ar reduzem a umidade, desfavorecendo o fungo (Tavares et al., 2021). Além disso, a utilização de variedades resistentes, aplicação de fungicidas e estratégias de manejo cultural têm demonstrado eficácia para reduzir a incidência da doença (Cruz et al., 2020). Contudo, a resistência genética das plantas é desafiada pela evolução do patógeno, exigindo contínua pesquisa e desenvolvimento de novas estratégias (Kato et al., 2021). O controle biológico, empregando fungos antagonistas, também é uma alternativa promissora (Rocha et al., 2020). No que diz respeito ao controle químico, o uso de fungicidas específicos pode ser necessário em situações de surtos severos. No entanto, a resistência a fungicidas é uma preocupação crescente, o que torna fundamental a rotação de produtos químicos para mitigar esse risco e garantir a eficácia do controle (Mendonça et al., 2019). Esse aspecto é particularmente relevante considerando a importância econômica do cacau, que não só impulsiona a economia local, mas também desempenha um papel significativo no mercado global de chocolates. Com receitas anuais que ultrapassam bilhões de dólares, o Brasil se destaca como o quarto maior produtor mundial de cacau (FAO, 2022). Estudos indicam que a vassoura-de-bruxa pode causar perdas de até 50% na produção em áreas afetadas, levando a uma redução significativa na oferta de grãos de cacau (Pereira et al., 2020). Essas perdas não se limitam à quantidade; a qualidade dos grãos também é comprometida, resultando em um declínio nos preços de mercado. Em alguns casos, as plantações severamente afetadas podem apresentar grãos de qualidade inferior, fazendo com que os agricultores enfrentem uma queda de 30% a 40% nos preços que recebem por seus produtos (Marcelino et al., 2021). Além das perdas diretas, o controle da vassoura-de-bruxa impõe custos adicionais aos agricultores. O investimento em fungicidas, práticas de manejo integrado de doenças (MID) e a adoção de variedades resistentes exigem um aporte financeiro significativo, que pode ser inviável para pequenos agricultores. Estudos apontam que o custo médio de controle da doença pode variar de 300 a 1.000 dólares 22 por hectare, dependendo da severidade da infestação e das práticas adotadas (Cruz et al., 2021). Outra preocupação diz respeito a Moniliophthora roreri, que é um fungo hemibiotrófico, assim como M. perniciosa, ou seja, passa por duas fases no ciclo de infecção: primeiro como biotrófico, convivendo no hospedeiro sem causar danos aparentes, e depois como necrotrófico, matando o tecido vegetal e se alimentando dele, com hospedeiros limitada a todas as espécies dos gêneros intimamente relacionados Herrania e Theobroma (Evans; Holmes; Reid, 2003). Nativo da América do Sul e com centro de origem na Colômbia, este fungo é o agente causador da monilíase, uma das doenças mais devastadoras para o cacaueiro em regiões tropicais da América Latina (Phillips‐Mora; Aime; Wilkinson, 2007). Em áreas onde o fungo foi introduzido, como em países da América Central e outros da América do Sul, as perdas podem chegar a 90% da produção, com sérios impactos econômicos e sociais para as comunidades que dependem do cacau (Alvarez; Martínez; Coy, 2014). Em 2021, a situação se agravou no Brasil quando o Laboratório Federal de Defesa Agropecuária de Goiânia (LFDA/GO) confirmou a presença de M. roreri no município de Cruzeiro do Sul, no estado do Acre ( https://www.gov.br/agricultura ). Esta confirmação indicou que a doença ultrapassou as barreiras fitossanitárias do país, possivelmente devido à proximidade com regiões infestadas no Peru e Bolívia. A disseminação do fungo no Brasil representa uma ameaça não apenas para o estado do Acre, mas também para toda a produção cacaueira nacional, especialmente no Pará, estados que são grandes produtores de cacau e cupuaçu (Idam, 2021; Alves and Chaves 2023). Os danos econômicos causados pela monilíase têm motivado o desenvolvimento de estudos moleculares sobre a interação T. cacao  ×  M. roreri (Zugaib et al., 2023). Estudos transcriptômicos dessa interação identificaram genes que podem estar relacionados à defesa e ao estresse do cacau e à biossíntese, regulação e ação de hormônios vegetais possivelmente envolvidos na via de patogenicidade do fungo durante as diferentes fases da doença (Bailey et al., 2014; Zugaib et al., 2023). https://www.gov.br/agricultura 23 A doença pode ser controlada por uma combinação de métodos culturais, por exemplo, manutenção da altura da árvore (o que facilita o manejo, a aplicação de produtos fitossanitários e melhora o arejamento e a incidência de luz, condições que inibem o desenvolvimento de fungos) e remoção dos frutos infectadas (essencial para reduzir a fonte de inóculo, interrompendo o ciclo do patógeno e limitando a propagação da doença), além de controle químicos (uso de fungicidas específicos) (Leite et al., 2023). Esses métodos se beneficiam da aplicação regional, mas podem ter um custo proibitivo. A reprodução para resistência a doenças oferece o maior potencial para o gerenciamento monilíase e novos materiais tolerantes estão se tornando disponíveis (Hebbar, 2007; Torres de la Cruz et al., 2011; Zugaib et al., 2023). 2.2.1. Mecanismos de resistência e suscetibilidade das plantas do gênero Theobroma em relação a M. perniciosa e M. roreri. A interação entre os fungos do gênero Moniliophthora e as plantas do gênero Theobroma, como o cacau e o cupuaçu, exemplifica uma relação patógeno- hospedeiro altamente complexa, marcada por uma constante batalha evolutiva, onde os fungos desenvolvem mecanismos de virulência para superar as defesas das plantas, enquanto estas, por sua vez, ativam respostas de defesa para limitar a infecção e minimizar os danos aos tecidos vegetais (Falcão et al., 2022). As plantas do gênero Theobroma possuem uma série de mecanismos de defesa sofisticados para se proteger contra infecções fúngicas. Um dos primeiros passos na defesa imunológica das plantas é o reconhecimento de PAMPs (Pathogen- Associated Molecular Patterns), que são moléculas conservadas presentes nos patógenos, como flagelina, lipopolissacarídeos e componentes das paredes celulares fúngicas, como a quitina. Esses PAMPs são detectados por PRRs (Pattern Recognition Receptors) localizados na superfície celular da planta, desencadeando a PTI (PAMP-Triggered Immunity), uma resposta imune basal que inclui a produção de espécies reativas de oxigênio (EROs), o reforço da parede celular e a ativação de genes relacionados com a defesa (Junior et al., 2012; dos Santos et al., 2020). 24 No entanto, Moniliophthora perniciosa e Moniliophthora roreri desenvolveram estratégias para evadir essa resposta inicial. Eles secretam efetores, que são proteínas capazes de interferir nos processos celulares da planta hospedeira, suprimindo a resposta imune basal e facilitando a colonização (Falcão et al., 2022; da Silva Estrela Junior et al., 2023). Em resposta a essa tentativa de evasão, as plantas ativam a ETI (Effector-Triggered Immunity), uma resposta mais robusta e específica mediada por NLRs (Nucleotide-binding Leucine-rich repeat Receptors). Os NLRs reconhecem diretamente ou indiretamente os efetores dos patógenos, levando à ativação de uma série de respostas que incluem a resposta hiperssistêmica (HR), caracterizada pela morte celular localizada para impedir a disseminação do patógeno. Além dessas respostas imunológicas, estas plantas utilizam também uma variedade de mecanismos fisiológicos e moleculares para se defender. A produção de quitinase e osmotina desempenha um papel crucial na defesa contra infecções fúngicas (Santana Silva et al., 2020). A quitinase é uma enzima que degrada a quitina, um componente estrutural das paredes celulares fúngicas, dificultando a proliferação do patógeno, enquanto a osmotina é uma proteína que contribui para a resistência ao estresse osmótico e possui atividade antifúngica, ajudando a planta a inibir o crescimento do fungo e a fortalecer as suas defesas celulares (Gomes et al., 2016; Hakim et al., 2018; Santana Silva et al., 2020). 25 Figura 7. Estratégias de evasão do reconhecimento imunológico de plantas por bactérias e fungos. As plantas detectam padrões moleculares associados a microrganismos (Microbe-Associated Molecular Patterns – MAMPs), também chamados de padrões moleculares associados a patógenos (Pathogen- Associated Molecular Patterns – PAMPs), por meio de receptores de reconhecimento de padrões (Pattern Recognition Receptors – PRRs), desencadeando uma resposta imune. Na parte superior direita, um fungo adota diversas estratégias para evitar a detecção de sua quitina, como: Prevenção da liberação de MAMPs, através de enzimas como Mep1 e Sep1, que degradam hidrolases vegetais responsáveis por expor quitina na parede celular fúngica. Sequestro de MAMPs, onde a proteína Ecp6 captura moléculas de quitina antes que possam ser reconhecidas pelos PRRs vegetais. Proteção dos MAMPs contra degradação, utilizando efetores como Avr4, que se liga à quitina e a protege de enzimas vegetais que poderiam modificá-la. Avr4 é um efetor de avirulência (Avr), ou seja, pode desencadear uma resposta imune se a planta possuir genes de resistência correspondentes. Modificação de MAMPs, por meio de enzimas como PDA1, que convertem quitina em quitosana, uma forma estruturalmente diferente e menos imunogênica, reduzindo sua detecção pelos receptores de quitina da planta. Os efetores representados na figura estão divididos em duas categorias: Efetores apoplásticos (Apoplastic Effectors – AE) e Efetores intracelulares (Intracellular Effectors – IE) Fonte: Wang et al., 2022. Os fungos, utilizam estratégias altamente sofisticadas para evitar o sistema imunológico das plantas durante o processo de infecção (Figura 7). Um dos principais mecanismos envolve uma modulação de moléculas associadas à sua parede celular, 26 como a quitina, que é um componente estrutural crucial e um padrão molecular associado a patógenos (MAMP). Normalmente, fragmentos de quitina liberados durante o crescimento ou manipulação fúngica são reconhecidos pelos receptores de quitina nas plantas, ativando respostas de defesa. Para evitar esse reconhecimento, os fungos adotam diferentes táticas (Wang et al., 2022). Uma estratégia importante é a proteção de proteínas como Avr4, sendo um efetor de avirulência (Avr), ou seja, pode desencadear uma resposta imune se a planta possuir genes de resistência correspondentes, se ligando à quitina, protegendo-a da ação das enzimas hidrolíticas produzidas pela planta. Isso impede que fragmentos de quitina sejam liberados e reconhecidos pelos receptores. Além disso, os fungos produzidos por enzimas como PDA1, que convertem quitina em quitosana, são uma forma modificada que é menos imunogênica e, portanto, mais difícil de ser detectada pelos receptores da planta. Outra tática crucial é o sequestro de moléculas de quitina por proteínas como Ecp6. Essas proteínas "capturam" os fragmentos de quitina antes que possam interagir com os receptores da planta, neutralizando a ativação da resposta imune. Em conjunto, os fungos podem modificar ou evoluir seus MAMPs, alterando sua estrutura química para dificultar ainda mais o reconhecimento pelas plantas. Essas estratégias permitem que os fungos contornem a imunidade basal das plantas, conhecida como imunidade disparada por padrões (PTI), criando condições adequadas para sua colonização. Esse tipo de interação é central em patossistemas como os causados por Moniliophthora perniciosa e M. roreri, que infectam espécies de Theobroma (Santana Silva et al., 2020). Ao manipular os sistemas de defesa da planta hospedeira, esses fungos promovem infecções bem-sucedidas, causando sérios danos às culturas agrícolas (Gomes et al., 2016; Hakim et al., 2018; Santana Silva et al., 2020). No caso do cupuaçu, estudos têm demonstrado que a expressão de genes codificadores de quitinase e osmotina é significativamente aumentada durante a infecção por M. perniciosa (Santana Silva et al., 2020). Essas proteínas atuam de forma sinérgica para degradar a parede celular do fungo e reforçar a integridade das células vegetais, limitando assim a progressão da doença. Além disso, a sinalização 27 hormonal mediada por hormônios como o ácido salicílico (SA), o ácido jasmônico (JA) e o etileno (ET) é fundamental para regular a resposta de defesa (Van Loon et al., 2006; Kilaru; Bailey; Hasenstein, 2007; Anil Kumar et al., 2015; Falcão et al., 2022). O SA está geralmente associado à defesa contra patógenos biotróficos (Kilaru; Bailey; Hasenstein, 2007), enquanto o JA e o ET estão mais relacionados à defesa contra patógenos necrotróficos e herbívoros (Van Loon et al., 2006; Anil Kumar et al., 2015; Falcão et al., 2022). Moniliophthora perniciosa e Moniliophthora roreri possuem estratégias sofisticadas para superar as defesas das plantas hospedeiras. Além da penetração inicial facilitada pela formação de estruturas especializadas e pela secreção de enzimas degradativas como celulases, pectinases e lignases, esses patógenos manipulam o metabolismo da planta para redirecionar recursos que favorecem seu próprio crescimento (Barbosa et al., 2018; da Silva Estrela Junior et al., 2023). A M. perniciosa, por exemplo, estabelece uma fase biotrófica inicial onde mantém as células vegetais vivas para obtenção de nutrientes, transitando posteriormente para uma fase necrotrófica que causa a morte celular e libera nutrientes adicionais para sustentar seu crescimento patogênico (Mondego et al., 2008). A M. roreri, por sua vez, apresenta uma estratégia semelhante em termos de fases biotrófica e necrotrófica, mas com características distintas em sua interação com o hospedeiro. Este fungo se especializa em infectar diretamente os frutos em desenvolvimento, iniciando uma fase biotrófica em que coloniza os tecidos sem causar danos visíveis imediatos, enquanto manipula o metabolismo do fruto para favorecer sua nutrição. Com a transição para a fase necrotrófica, M. roreri induz a morte celular, resultando em necroses severas, deformações e o colapso completo do tecido afetado. Essa fase é acompanhada por uma intensa produção de esporos, o que contribui para sua alta capacidade de disseminação (Meinhardt et al., 2014). A interação dinâmica entre Theobroma e Moniliophthora é resultado de uma coevolução contínua, onde a planta desenvolve novas estratégias de defesa e o patógeno adapta suas táticas de ataque (Falcão et al., 2022). A eficácia das defesas da planta depende de fatores genéticos, ambientais e do estágio da infecção, tornando o manejo dessas doenças um desafio complexo para os agricultores. A compreensão detalhada dos mecanismos de reconhecimento e resposta imune, bem como das 28 estratégias de ataque dos patógenos, é essencial para o desenvolvimento de variedades de Theobroma mais resistentes e para a implementação de métodos de controle mais eficazes. 2.3. Domesticação de Theobroma A domesticação de plantas exerceu uma influência determinante na composição florística atual das florestas amazônicas (Levis et al., 2017). Espécies vegetais domesticadas e manejadas por populações indígenas da Amazônia ao longo de milênios apresentam uma probabilidade cinco vezes superior de serem encontradas em altas densidades – caracterizando-se como hiperdominantes – em relação às espécies não domesticadas (Levis et al., 2017). A maior abundância e riqueza dessas espécies ocorrem em regiões próximas a sítios arqueológicos, particularmente no sudoeste e leste da Amazônia, áreas associadas a antigas ocupações humanas (Levis et al., 2017). A distribuição atual dessas espécies domesticadas sugere que o manejo e a domesticação humana deixaram uma marca duradoura na estruturação das comunidades arbóreas amazônicas, refletindo práticas culturais e agrícolas de povos antigos. A distribuição geográfica e a provável origem da domesticação do cacau na Amazônia (Figura 8-E), representada pelo símbolo “+++” na região noroeste aponta para uma origem conhecida de domesticação do cacau, sugerindo que essa área foi fundamental no início do processo de domesticação, abrangendo uma parte da região norte do Brasil, Amazonas e Acre, além de áreas fora do Brasil, como Colômbia e Peru. As sombras em cinza, indica a estimativa da presença do cacau, sendo que áreas mais escuras refletem maior concentração ou densidade da espécie em determinadas regiões. Os pontos pretos representam parcelas de amostragem onde o cacau foi registrado, e o tamanho desses pontos está relacionado à abundância relativa da espécie nesses locais. Por outro lado, os pontos vermelhos indicam parcelas onde o cacau não foi detectado, destacando áreas da Amazônia em que a espécie está ausente. A Amazônia foi subdividida em seis regiões geológicas (Figura 8) — NWA (Amazônia Noroeste), SWA (Amazônia Sudoeste), SA (Amazônia Sul), CA (Amazônia Central), GS (Escudo das Guianas) e EA (Amazônia Oriental). 29 Figura 8. Mapas de distribuição de cinco espécies domesticadas hiperdominantes em florestas amazônicas e suas prováveis origens de domesticação (A a E). “+++” para origem conhecida. “++” para origem hipotética. pontos pretos: abundância. Pontos vermelhos: parcelas onde cada espécie domesticada não foi registrada. Fonte: Levis et al., 2017 30 O processo inicial de domesticação de plantas envolve a seleção e o cultivo de variedades com características morfológicas desejáveis, como o aumento do tamanho dos frutos, visando o aprimoramento das gerações subsequentes, além de favorecer a dispersão das populações vegetais de seus habitats selvagens originais para novas paisagens antropogênicas, resultando frequentemente em um evento fundador – um fenômeno no qual novas populações se originam a partir de uma amostra reduzida da população parental, ocasionando uma redução na variabilidade genética e morfológica (Clement, 1999; Zohary, 2004). Em populações arbóreas, as mudanças genéticas e morfológicas derivadas desse processo são tipicamente sutis, especialmente em cenários de manejo dentro de florestas (Clement, 1999). A domesticação do cacau é um processo complexo que se estende por milênios. O cacau passou por forte domesticação ~3.600 anos atrás, com a introdução de alguns indivíduos da Amazônia Ocidental na Mesoamérica (Cornejo et al., 2018). Há também evidências arqueogenômicas do consumo de cacau na Amazônia Ocidental por volta de 5.300 anos por diferentes grupos indígenas (Zarrillo et al., 2018). Inicialmente, o cacau foi domesticado em florestas úmidas localizadas no noroeste da Amazônia, uma região caracterizada por solos ricos em nutrientes, que são ideais para o crescimento da planta. No entanto, ao longo do tempo, a área de cultivo e ocorrência do cacau mudou, e hoje a planta é mais abundante nas florestas do sudoeste e sul da Amazônia (Thomas et al., 2012). O autor destaca ainda que embora o cacau seja endêmico da bacia amazônica, acredita-se que seu processo de domesticação visando a produção de bebida de chocolate ocorreu na Mesoamérica. Contudo, a distribuição da diversidade genética do cacau na América do Sul é influenciada não apenas por processos naturais de diferenciação genética, mas também por intervenções humanas pré-colombianas (Levis et al., 2017). Tradicionalmente, o cacau foi classificado em dois grandes grupos genéticos: “Criollo” e “Forastero”, baseados em características morfológicas e origens geográficas. Um terceiro grupo, “Trinitario”, representa híbridos “Criollo × Forastero” (Cheesman, 1944). Análises moleculares identificaram 10 grandes grupos genéticos no cacau: Amelonado, Contamana, Criollo, Curaray, Guiana, Iquitos, Maraňón, Nanay, 31 Nacional e Purús (Motamayor et al., 2002), refletindo com mais precisão a diversidade genética útil para melhoristas. Recentemente, a pesquisa genômica identificou mais grupos, com destaque para as populações de cacau selvagens do Alto Amazonas, como Contamana, Iquitos e Nanay, que não são domesticados, mas desempenham um papel crucial ao fornecer novos recursos genômicos para o melhoramento da espécie. Estudos de sequenciamento de genomas de alta qualidade dessas populações selvagens, utilizando a tecnologia PacBio Hi-Fi, revelaram que a divergência entre os grupos genéticos de cacau ocorreu entre 1,83 e 0,69 milhões de anos atrás, durante o período Pleistoceno inicial e médio (Nousias et al., 2024). O cacau Criollo é amplamente considerado um dos primeiros genótipos domesticados, possivelmente originado na América Central, onde há registros arqueológicos do uso e do consumo de cacau em culturas como a dos maias e astecas (Motamayor et al., 2002). Este genótipo é conhecido por sua alta qualidade e sabor refinado, com uma baixa presença de taninos, o que resulta em um sabor menos amargo, e foi intensamente selecionado por essas características, que eram desejáveis para a produção de bebidas e produtos rituais e de prestígio, contudo por ser um genótipo altamente domesticado, o cacau Criollo apresenta menos diversidade genética e uma maior vulnerabilidade a doenças, uma consequência de sua seleção intensiva (Bartley, 2005; Motamayor et al., 2008). O cacau Matina, originário da América do Sul, pertence ao grupo Forastero, caracterizado por maior resistência e produtividade. O cultivar Matina 1-6 exibe fenótipo Amelonado, com menos diversidade genética, sendo amplamente cultivado no mundo (Motamayor et al., 2003). Enquanto o Criollo foi selecionado pelo sabor, o Matina foi favorecido por resistência e produtividade, refletindo contextos culturais e ecológicos distintos (Motamayor et al., 2002; Motamayor et al., 2003). Este grupo apresenta pouca diversidade genética em comparação com os outros nove grupos sendo o tipo de cacau mais comumente cultivado em todo o mundo (Motamayor et al., 2003). As árvores Forastero também são classificadas de acordo com a morfologia do fruto, como o tipo Amelonado, caracterizado pelo formato de melão da fruta e que possui um sabor mais intenso e amargo devido a níveis mais altos de compostos 32 fenólicos e taninos, características que o tornam adequado para o cultivo em larga escala e para misturas com outros cacaus (Motamayor et al., 2003). A domesticação dos dois genótipos mostra diferentes estratégias de manejo e seleção, com o Criollo tendo surgido cerca de 1,83 milhões de anos atrás e o Matina por volta de 1,34 milhões de anos atrás (Nousias et al., 2024). Isso indica o momento em que cada uma dessas variedades se separou geneticamente de suas populações ancestrais. Enquanto o Criollo foi selecionado principalmente pelo sabor e qualidade, o Matina foi favorecido por sua resistência e produtividade (Motamayor et al., 2002; Motamayor et al., 2003). Essa seleção diferencial reflete os contextos culturais e ecológicos de cada região, onde as populações humanas moldaram geneticamente as variedades de cacau com base em suas necessidades e preferências locais. Quanto ao cupuaçu, estudos genômicos indicam que esta espécie é uma variante domesticada de Theobroma subincanum (cupuí), encontrado na bacia do Médio-Alto Rio Negro (Colli-Silva et al., 2023). A domesticação do cupuaçu remonta a 5.000-8.000 anos, durante o Holoceno, refletindo manejo intensivo por populações indígenas (Colli-Silva et al., 2023). Esse período apresentou gargalo genético significativo, possivelmente resultante da seleção de frutos maiores e polpa de melhor qualidade. Uma segunda fase de domesticação mais recente, relacionada à era moderna dos séculos XIX e XX, e à expansão comercial do cultivo, promoveu nova redução na diversidade genética (Colli-Silva et al., 2023). O cupuaçu foi domesticado antes do cacau (Cornejo et al., 2018; Colli-Silva et al., 2023), sendo o cacau usado pela primeira vez por sua polpa por sociedades indígenas (Zarrillo et al., 2018) e só mais tarde foi domesticado para produzir uma bebida semelhante ao chocolate a partir das sementes. O uso inicial da polpa em ambas as espécies teria tornado o cupuaçu mais atraente do que o cacau se uma maior quantidade e/ou qualidade de polpa fosse encontrada no primeiro ou em representantes de seu progenitor cupuí (Colli-Silva et al., 2023). O processo de domesticação do cupuaçu é extraordinário porque a seleção artificial aplicada ao seu parente silvestre, o cupuí, foi tão intensa e eficaz que resultou em mudanças significativas nas características morfológicas da planta (Cuatrecasas, 1964; Colli-Silva et al., 2023). Essas alterações foram tão pronunciadas que os 33 taxonomistas, ao estudarem o cupuaçu, o classificaram como uma espécie distinta do seu ancestral selvagem (Cuatrecasas, 1964). Isso indica um grau elevado de intervenção e seleção pelos humanos, que moldaram o cupuaçu para ter características desejáveis, como frutos maiores e com mais polpa. Já T. umbraticum não apresenta processo significativo de domesticação, mantendo-se predominantemente em estado selvagem (Colli-Silva; Richardson; Pirani, 2023). A especiação de Theobroma cacao e Theobroma umbraticum ocorreu há cerca de 10 milhões de anos, conforme sugerido por estudos genéticos. T. cacao é amplamente cultivado ao contrário de T. umbraticum (Nousias et al., 2024). 2.4. Genômica do Theobroma Um dos primeiros passos para se estudar a estrutura genômica de uma espécie de planta é primeiramente obter-se a sequência genômica em escala cromossômica. Este processo vem se tornando cada vez mais simplificado através da utilização de técnicas de sequenciamento de leituras longas e Hi-C. As leituras longas, fornecidas por tecnologias como PacBio e Oxford Nanopore, permitem a geração de sequências contínuas que cobrem grandes regiões do genoma sem as quebras típicas das leituras curtas. Isso facilita a montagem de genomas mais completos e precisos, reduzindo as lacunas e melhorando a resolução das regiões complexas, como aquelas ricas em repetições ou estruturas estruturais intricadas (Soto-Serrano et al., 2024; Alves et al.,2024). Por outro lado, a técnica de Hi-C é uma metodologia de sequenciamento que captura a interação física entre diferentes regiões do genoma dentro do núcleo celular. Basicamente, Hi-C envolve a fixação das interações cromossômicas com formaldeído, seguida pela digestão do DNA, ligadura dos fragmentos proximais e sequenciamento das ligações resultantes. Isso gera um mapa tridimensional das interações genômicas, permitindo a organização das sequências de DNA em suas posições cromossômicas corretas. A combinação de leituras longas com dados de Hi-C possibilita a montagem de genomas em escala cromossômica, onde cada cromossomo é representado de 34 forma completa e linear, refletindo sua verdadeira organização dentro da célula (Alves et al.,2024; Pladevall et al., 2025). Somente com genomas em escala cromossômica é possível conhecer sua história de paleopoliploidia, ou seja, os eventos evolutivos que moldaram seu genoma ao longo do tempo. Assim como a uva (Vitis vinifera), o gênero Theobroma passou por apenas um evento de duplicação de genoma inteiro (WGD), correspondente à triplificação gama (gamma triplication), que foi originada há aproximadamente 125 milhões de anos (mya) (Doyle; Hotton, 1991; Jiao et al., 2011). Este evento de triplificação é compartilhado por todas as eudicotiledoneas e é fundamental para a diversificação e complexidade dos genomas dessas plantas (Jiao et al., 2011; Jiao et al., 2012). Com os genomas completos, em escala cromossômica, também é possível realizar análises detalhadas de sintenia e colinearidade, que são essenciais para comparar a organização genômica entre diferentes espécies (Richardson et al., 2015; Kumar et al., 2022; Alves et al., 2024). A bioinformática desempenha um papel crucial nesse processo, fornecendo as ferramentas e métodos necessários para a montagem, anotação e análise dos genomas sequenciados. Com genomas em escala cromossômica devidamente montados e anotados, a bioinformática permite a realização de análises comparativas que elucidam a evolução genômica, identificam regiões de conservação e divergência, e detectam eventos de duplicação e perda gênica ao longo da história evolutiva das espécies. Essas análises são fundamentais para entender como diferentes espécies de plantas, se relacionam e divergem em termos de genética e funcionalidade. Portanto, o estudo genômico por métodos de bioinformática é reconhecido como uma das principais ferramentas para o avanço do conhecimento da biologia de uma espécie cultivável, podendo levar a médio e longo prazo a inúmeras aplicações na agroindústria, desde as relacionadas à conservação, melhoramento e biotecnologias (Diniz; Canduri, 2017). Diversas pesquisas envolvendo genômica e bioinformática foram aplicados nas últimas décadas, levando a um grande avanço do conhecimento de diversos cultivares de interesse comercial, como por exemplo o abacate (Rendón-Anaya et al., 2019), morango (Edger et al., 2019), uva (Zharkikh et al., 2008), milho (Haberer et al., 2005), abacaxi (Chen et al., 2019), maça (Zhang et al., 2019), melancia (Guo et al., 2013), banana (D’Hont et al., 2012), mamão (Ming et 35 al., 2008), laranja (Xu et al., 2013), pêssego (Verde et al., 2013), arroz (Eckardt, 2000), feijão (Schmutz et al., 2014), cana-de-açucar (Garsmeur et al., 2018; Zhang et al., 2018), eucalipto (Myburg et al., 2014), algodão (Huang et al., 2020) e outros. Todos esses projetos geraram conhecimentos que são aplicados em programas de melhoramento, tanto para favorecer a produtividade destes cultivares, melhorar a resistência a doenças, como também de criar frutas com novos sabores e texturas (Tabela 1). Tabela 1. Exemplos de pesquisas genômicas e bioinformáticas realizadas em diversas espécies de interesse comercial, incluindo sequenciamento do genoma e estudos relacionados a melhorias na produtividade, resistência a doenças e características sensoriais, como sabor e textura. A tabela inclui a espécie, a abordagem realizada e a referência de cada trabalho. Espécie Trabalho realizado Referência Abacate Sequenciou e analisou os genomas de abacates mexicanos, Hass e espécies relacionadas, identificando sua diversidade genética, eventos evolutivos como poliploidia e introgressão, além de características adaptativas relevantes para o melhoramento genético, resistência a doenças e otimização de características desejáveis. Ele também avançou na compreensão das relações filogenéticas dos magnoliídeos com outros clados de angiospermas e na função diferencial de genes duplicados. Rendón-Anaya et al., 2019 Morango Decifrou a origem e evolução do genoma octoplóide do morango cultivado, revelando a origem norte-americana, a dinâmica entre seus subgenomas e a dominância de um subgenoma associado à expressão gênica e características chave, fornecendo uma base para estudos evolutivos e melhoramento molecular. Edger et al., 2019 Uva Sequenciou e montou o genoma altamente heterozigoto de Vitis vinifera, fornecendo informações sobre estrutura genômica, polimorfismos, SNPs, inserções e deleções, além de insights sobre a dinâmica evolutiva de elementos repetitivos em plantas. Zharkikh et al., 2008 Milho Analisou sistematicamente sequências do genoma do milho, destacando a alta densidade de genes, a predominância de retroelementos repetitivos (66%) e a contribuição desses elementos para o aumento do genoma em relação a outras plantas modelo, como arroz e Arabidopsis . Haberer et al., 2005 Abacaxi O trabalho sequenciou e analisou o genoma do abacaxi bracteatus, elucidando a base genômica de características como produção de fibras e acúmulo de açúcar, e forneceu evidências de uma domesticação híbrida com mistura genética e uma operação de uma etapa em cultivares como 'Singapore Spanish'. Chen et al., 2019 Maçã trabalho montou um genoma de alta qualidade da maçã, revelando variações genômicas significativas atribuídas a elementos transponíveis e identificando uma inserção de retrotransposon associada à coloração vermelha da fruta, proporcionando resultados importantes sobre os mecanismos moleculares da coloração. Zhang et al., 2019 36 Melancia Sequenciou o genoma de alta qualidade da melancia e realizou resequenciamento de 20 acessos para mapear a diversidade genética e estrutura populacional, identificando regiões selecionadas durante a domesticação e genes importantes para características de qualidade da fruta. Guo et al., 2013 Banana sequenciou o genoma de Musa acuminata, revelando duplicações genômicas e proporcionando uma base para o melhoramento genético da banana, além de esclarecer as relações filogenéticas das monocotiledôneas e identificar sequências não codificantes conservadas antes da divergência monocotiledônea- eudicotiledônea. D’Hont et al., 2012 Mamão O trabalho sequenciou o genoma do mamão, uma árvore frutífera transgênica resistente a vírus, e identificou características genômicas únicas, como a ausência de duplicações recentes e amplificações de genes relacionados à adaptação tropical, oferecendo uma base para estudos de genômica funcional e melhoria da fruta. Ming et al., 2008 Laranja O trabalho sequenciou o genoma da laranja, identificando a origem híbrida entre pummelo e tangerina, e destacando genes envolvidos no metabolismo da vitamina C, fornecendo uma base genômica valiosa para estudos e melhoramento das características da fruta. Xu et al., 2013 Pêssego O estudo sequenciou o genoma do pêssego, revelando padrões de diversidade genética e processos de domesticação, além de indicar a ausência de duplicações genômicas recentes e identificar blocos ancestrais triplicados fragmentados, proporcionando novas perspectivas sobre sua evolução. Verde et al., 2013 Arroz O sequenciamento do genoma do arroz revelou a complexidade e o tamanho relativamente compacto de sua estrutura, com aproximadamente 430 Mb. Considerado um modelo ideal devido ao seu tamanho menor em comparação com outros cereais como o trigo, o arroz compartilha alta sintenia com outras gramíneas, facilitando estudos genéticos e melhoramento molecular. Eckardt, 2000 Feijão O sequenciamento do genoma do feijão, revelou uma estrutura genômica de 473 Mb ancorada em 11 cromossomos, com 98% da sequência mapeada. A análise identificou duas domesticações independentes no feijão, uma nas regiões mesoamericanas e outra nas andinas, e revelou genes relacionados ao aumento do tamanho das folhas e sementes, fundamentais para o melhoramento das variedades cultivadas. Schmutz et al., 2014 Cana-de- açúcar O estudo do genoma da cana-de-açúcar produziu uma sequência de referência monoploide de 382 Mb, gerada a partir de 4660 BACs, para superar os desafios de seu genoma altamente complexo. A análise revelou 25.316 genes, com 17% apresentando divergências significativas em relação ao sorgo, e forneceu insights sobre os rearranjos cromossômicos e elementos transponíveis nas linhagens S. officinarum e S. spontaneum, explicando as diferenças em seus tamanhos genômicos e número de cromossomos. Garsmeur et al., 2018; Zhang et al., 2018 Eucalipto O sequenciamento do genoma do Eucalyptus grandis cobriu mais de 94% de seu genoma de 640 Mb, identificando 36.376 genes codificadores de proteínas, dos quais 34% estão em duplicações em tandem. A análise também revelou uma diversidade significativa de genes relacionados a terpenos, essenciais para a defesa química e Myburg et al., 2014 37 produção de óleos farmacêuticos. Comparações com o genoma de E. globulus e genomas consanguíneos de E. grandis mostraram uma evolução dinâmica do genoma e pontos críticos de depressão por endogamia. Este estudo fornece uma base sólida para o melhoramento genético e biotecnologia do eucalipto. Algodão O sequenciamento do genoma de Gossypium herbaceum (A1) e as atualizações dos genomas de Gossypium arboreum (A2) e Gossypium hirsutum ((AD)1) revelaram que todos os genomas A podem ter se originado de um ancestral comum, mais próximo de A1 do que de A2. A formação alotetraploide precedeu a especiação de A1 e A2, com variações estruturais abundantes nas regiões gênicas que impactaram a expressão de genes essenciais para a evolução das células de fibra em (AD)1. Este estudo resolve questões sobre as origens do genoma A e oferece recursos para o melhoramento genético do algodão. Huang et al., 2020 Em relação ao gênero Theobroma, um consórcio coordenado por cientistas franceses sequenciou em 2011, utilizando tecnologias de sequenciamento de alto rendimento de segunda geração, com curtos fragmentos de sequências de DNA. A principal tecnologia empregada foi a plataforma Illumina (Solexa), que era uma das mais avançadas da época. Ela usava o sequenciamento por sintese (sequencing by synthesis), que gerava fragmentos de DNA curtos (em torno de 100-150 pares de bases). A plataforma produz grande quantidade de dados, mas com um limite de leitura de fragmentos curtos, o que dificultava a montagem do genoma completo de organismos complexos. Esse sequenciamento do genoma do cultivar B97-61/B2 - Criollo de cacau, gerou 326 megabases (Mb), abrangendo 76% do tamanho total do genoma estimado por citometria de fluxo (Argout et al., 2011). Durante o processo, foram identificados 10 pseudomoléculas, que representam cada um dos cromossomos da planta, além de uma grande quantidade de genes e outros elementos genéticos, como 25.912 genes, 6 rRNAs (RNA ribossomal), 473 tRNAs (RNA transportador), 83 ncRNAs (RNA não codificante) e 65.575 regiões associadas a elementos transponíveis (TEs), que são sequências de DNA móveis no genoma (Argout et al., 2011). Este mesmo estudo revelou informações importantes sobre a evolução genética do genoma Criollo de cacau. Por exemplo, uma descoberta relevante foi a expansão de uma família de genes ligados aos flavonoides, compostos que estão potencialmente relacionados à qualidade do fruto, como sabor e propriedades antioxidantes (Argout et al., 2011). 38 Além disso, este estudo identificou genes que conferem resistência da planta a patógenos, especialmente fungos e oomicetos, que são organismos prejudiciais à saúde da planta, como exemplo, NBS-LRR (Nucleotide-Binding Site - Leucine-Rich Repeat), NBS (Nucleotide-Binding Site), LRR-LRK (Leucine-Rich Repeat - Leucine- Rich Repeat Kinase) e NPR1-like (Nonexpresser of PR genes 1-like) e mapeamento de QTLs (Quantitative Trait Locus). Por fim, foram encontrados genes e vias metabólicas que influenciam diretamente a qualidade das sementes do cacau, envolvendo compostos como terpenos aromáticos (responsáveis por aromas), teobromina (um alcaloide presente no cacau, conhecido por suas propriedades estimulantes), além de outros metabólitos secundários, como flavonoides, ácidos fenólicos, cacáoína, lipídios e ácidos graxos, alcaloides, glutamato, asparagina e alanina de importância para o sabor e as características do cacau. Isso tudo contribui para entender melhor a base genética que afeta tanto a resistência da planta quanto a qualidade dos frutos e sementes (Argout et al., 2011). Posteriormente, em 2017, um grupo de cientistas franceses realizou uma nova versão do sequenciamento do genoma do cacau – cultivar B97-61/B2 Criollo, aprimorando o trabalho anterior de 2011. Usando tecnologias de terceira geração, com leituras longas proporcionadas pelo sequenciamento SMRT (Single Molecule, Real-Time), a nova abordagem permitiu uma análise mais detalhada e precisa do genoma, superando limitações das tecnologias de segunda geração. As leituras longas possibilitaram a montagem de um genoma mais completo, especialmente em regiões repetitivas e complexas do DNA, que eram difíceis de sequenciar com tecnologias mais antigas. Essa inovação não só melhorou a precisão da anotação dos genes, mas também facilitou a identificação de variantes genéticas associadas a características importantes, como sabor, resistência a doenças e produtividade do cacau. A combinação de sequenciamento de terceira geração com outras tecnologias complementares, como o sequenciamento de alta precisão da Illumina, também ajudou a corrigir erros, garantindo uma cobertura de genoma mais robusta e aprofundada (Argout et al., 2017). O destaque deste aperfeiçoamento foi a reconstrução completa de telômero a telômero dos 10 cromossomos do cacau, o que representou um avanço significativo na compreensão detalhada da organização genética da planta (Argout et al., 2017). 39 Isso significa que os cientistas conseguiram mapear com mais precisão o material genético, o que está sendo considerado crucial para estudos genéticos e programas de melhoramento do cacau. Paralelamente a estes estudos, em 2013, um consórcio de cientistas norte- americanos sequenciou o genoma do genótipo Matina 1-6 de cacau, utilizando tecnologias ilumina de segunda geração, assim como foi feito anteriormente com o genótipo Criollo. O cultivar Matina é um dos mais amplamente cultivados, o que torna seu sequenciamento relevante para a agricultura e o melhoramento genético (Motamayor et al., 2013). Esse estudo, além de mapear o genoma, também focou em aspectos semelhantes aos explorados no genoma do Criollo, como a evolução genômica, a identificação de genes relacionados à qualidade dos frutos, a presença de elementos transponíveis (TEs), e as expansões ou contrações de famílias gênicas (Motamayor et al., 2013). O estudo também realizou comparações entre os genomas dos cultivares Matina 1-6 e B97-61/B2 - Criollo, oferecendo resultados sobre as diferenças genéticas que podem influenciar características como a qualidade dos frutos e a resistência da planta. Estas comparações genômicas revelaram que os dois cultivares são muito parecidos, apresentando longos trechos de macrosintenia, e apenas pequenas variações em escala microsintênica (Figura 9), sendo essas diferenças relacionadas a características exclusivas de cada cultivar (Motamayor et al., 2013). Portanto, assim como para outros cultivares, o estudo genômico também avançou os conhecimentos em relação à biologia de cacau, gerando diversos resultados aplicados em programas de melhoramento, como para estudos de associação genômica e seleção genômica (McElroy et al., 2018). 40 Figura 9. Relação de alta sintenia entre os genomas de T. cacao, cultivar B97-61/B2 - Criollo e Matina 1-6. Cada cromossomo de Matina recebeu uma cor e as regiões ortólogas correspondentes no Criollo são conectadas com linhas da mesma cor. As linhas coloridas ligam regiões ortólogas. Extraído de Motamayor et al., 2013. Em 2024, foi publicado o estudo que reconstruiu o genoma, sem a utilização de uma sequência de referência pré-existente, de três genomas de cacau selvagem de alta qualidade no Alto Amazonas, utilizando tecnologias modernas como leituras longas HiFi e Hi-C, permitindo alcançar resolução cromossômica (Nousias et al., 2024). Esses genomas em escala cromossômica representaram três grupos genéticos fundamentais (Contamana, Iquitos e Nanay) de cacau selvagem e foram comparados com genomas domesticados (Criollo - B97-61/B2 e Matina - Matina 1–6). Foi inferido que os cinco grupos genéticos de cacau, criollo, forasteiro, trinitário, amelonado e 41 nacional divergiram durante o Pleistoceno, há 1,83–0,69 milhões de anos, e o estudo forneceu recursos cruciais para compreender a diversidade genética e avançar no melhoramento genético (Nousias et al., 2024). Ainda em 2024, uma pesquisa arqueogenômica analisou resíduos cerâmicos de culturas pré-colombianas para entender a domesticação do cacau em tempos pré- colombianos (Lanaud et al., 2024). Esses resíduos cerâmicos designam traços de substâncias orgânicas, como alimentos, bebidas ou outros materiais que foram absorvidos ou ficaram incrustados nas paredes das cerâmicas utilizadas por culturas pré-colombianas. Foi utilizada a extração de DNA antigo com o Qiagen DNeasy PowerLyzer PowerSoil Kit, seguida de construção de bibliotecas com o kit NEXTflex™ Rapid DNA-Sequencing, e sequenciamento em plataforma Illumina NovaSeq 6000. Além disso, foi aplicada a captura direcionada com Mybaits para sequenciamento de SNPs específicos do cacau. O estudo revelou o uso do cacau fora de sua área nativa amazônica, especificamente na América do Sul e Central, abrangendo cerca de 5.000 anos. Foi identificada uma mistura genética entre populações de cacau distantes já no Holoceno médio (Criollo, o Amelonado e o Forasteiro, entre outros), impulsionada por interações humanas, o que favoreceu a adaptação do cacau a novos ambientes (Lanaud et al., 2024). Este trabalho destacou a complexa história de domesticação do cacau e sua importância para a formação das populações de cacau atuais. Em relação ao cupuaçu, na última década, o conhecimento sobre a sua biologia avançou significativamente por meio de estudos moleculares e genômicos. Um exemplo é o trabalho de da Silva et al. (2017), o estudo revelou semelhanças entre o cupuaçu e o cacau. Este estudo indicou que o cupuaçu, assim como o cacau, possui 10 cromossomos, medindo aproximadamente 1,5 micrômetros de comprimento, sendo em sua maioria meta ou submetacêntricos (tipos de cromossomos com base na posição do centrômero). Embora a coloração na imagem não evidencie diretamente os centrômeros (Figura 10 - e), a disposição dos cromossomos dispersos na prometáfase sugere essa organização característica. De modo geral, tanto o cacau quanto o cupuaçu são espécies diploides (2n=20) e majoritariamente meta ou submetacêntricos, com regiões CMA+ conservadas, 42 indicando estabilidade cariotípica no gênero Theobroma (Figura 10). Esse padrão conservado no gênero Theobroma indica uma estabilidade cariotípica ao longo da evolução, o que pode ter implicações na regulação genômica e nos processos adaptativos dessas espécies amazônicas. Figura 10. Análise citogenética de espécies do gênero Theobroma utilizando coloração com CMA (marcação em amarelo, indicando regiões ricas em GC) e DAPI (marcação em azul, indicando regiões ricas em AT). (a-a’) Metáfase e cariograma de Theobroma cacao ssp leucocarpum, evidenciando bandas CMA+ (setas). (b-b’) Metáfase e cariograma de T. cacao cv. Scavina 6, com padrões similares de marcação CMA+ (setas). (c) Metáfase de Theobroma bicolor com bandas CMA+ (setas). (d) Diacinese de T. bicolor, mostrando a organização dos 10 bivalentes cromossômicos. (e) Prometáfase de Theobroma grandiflorum, destacando a organização cromossômica característica do gênero. Barras de escala = 5 μm. Fonte: da Silva et al. 2017 O estudo mencionado também revelou que o genoma do cupuaçu tem um tamanho estimado de 448 megabases (Mb), bastante próximo ao genoma do cacau, que foi estimado em 456 Mb. Além disso, por meio de análises de marcadores moleculares do tipo EST (Expressed Sequence Tag) -SSR (Simple Sequence Repeat), que são marcadores moleculares baseados em repetições curtas dentro de sequências expressas, foi constatado que o cupuaçu apresenta baixa heterozigosidade, ou seja, uma baixa diversidade genética em termos de variabilidade alélica (Na: 1,1, He: 0,04, HO: 0), quando comparado ao cacau (Na: 2,4, He: 0,31, HO: 0,12) (da Silva et al., 2017), onde Na (número de alelos), He (heterozigosidade 43 esperada), HO (heterozigosidade observada). Isso significa que o cupuaçu possui menos variação genética, o que pode impactar sua capacidade de adaptação e resistência, enquanto o cacau apresenta uma maior diversidade genética. Portanto, a baixa diversidade genética observada no cupuaçu pode representar um desafio significativo para programas de melhoramento genético da espécie, especialmente no que se refere à sua capacidade de adaptação a mudanças ambientais e resistência a pragas e doenças. Essa baixa variabilidade genética pode limitar a disponibilidade de alelos favoráveis que poderiam ser utilizados para introduzir características desejáveis na planta. Em contraste, o cacau, com sua maior diversidade genética, oferece um estoque gênico mais amplo, permitindo maior flexibilidade nos programas de melhoramento e maior potencial de desenvolvimento de cultivares adaptados a diferentes condições ou com resistência aprimorada (da Silva et al., 2017). De uma forma geral os resultados de da Silva et al. (2017) sugerem que os genomas do cupuaçu e cacau apresentam muita similaridade, portanto, permitindo que abordagens comparativas sejam utilizadas para aprofundamento do conhecimento entre essas espécies. Recentemente, o sequenciamento do genoma do cupuaçu, em nível de cromossomos, trouxe novos conhecimentos sobre sua evolução e oferece oportunidades para inovações na horticultura. Ao decodificar o genoma do cupuaçu, os pesquisadores identificaram informações genéticas detalhadas que permitem entender melhor a biologia dessa planta, suas características de frutos e sementes, bem como sua resistência a doenças (Alves et al., 2024). Os autores exploram como as variações genômicas específicas do cupuaçu, como expansões e contrações de famílias gênicas, além de retrotransposons (que são um tipo de TEs) e duplicações de genes, moldaram sua evolução. Essas variações genéticas ajudam a explicar as diferenças entre o cupuaçu e outras espécies de Malvaceae relacionadas, como o cacau e T. umbraticum, em aspectos como a forma e o tamanho dos frutos, o amadurecimento e as defesas contra doenças (Alves et al., 2024). Além disso, o estudo destaca como a compreensão desses processos evolutivos pode ser usada para melhorar o cultivo e o manejo do cupuaçu, abrindo caminho para novas estratégias de melhoramento genético e inovações na produção agrícola. A pesquisa, portanto, oferece uma base sólida para aplicar esses 44 conhecimentos em práticas hortícolas e no desenvolvimento de novas variedades com características desejáveis para o mercado e para os produtores. A exemplo disso, a identificação de dois loci de autoincompatibilidade no cacau, CH1 e CH4, sendo este último fortemente associado à queda de frutos, e a comparação desses loci em T. grandiflorum e T. umbraticum revelou padrões distintos: CH1 é altamente conservado entre as três espécies, exceto pela ausência de um gene regulador em T. umbraticum (histona metilase H3K4 semelhante ao COMPASS), enquanto CH4 apresenta maior variação, por exemplo, no cacau, esse locus contém duas cópias truncadas adicionais do gene GEX1, além de elementos transponíveis (TEs) e um retrotransposon de LTR-RT da linhagem Copia/Tork, próximo à GEX1, o que pode afetar sua expressão e a formação dos frutos. A hipótese proposta pelo autor é que as múltiplas cópias truncadas do gene GEX1 no cacau, somadas à presença de elementos transponíveis próximos ao locus CH4, podem influenciar a expressão desse gene ou resultar em proteínas GEX1 não funcionais. Esse efeito poderia estar ligado à ausência de abscisão natural nos frutos do cacau. No entanto, essa hipótese ainda precisa ser confirmada experimentalmente (Alves et al., 2024). Contudo, apesar de algumas diferenças, os autores relatam que as análises genômicas comparativas revelaram que o genoma do cupuaçu compartilha uma alta sintenia e similaridade de nucleotídeos com o cacau, aproximadamente 65% de sintenia (Figura 11), indicando que existem regiões no genoma dessas duas espécies que são conservadas ao longo da evolução (Alves et al., 2024). A análise genômica revelou que T. grandiflorum possui 282 famílias de genes exclusivas e 1.160 singletons (genes que não possuem cópias semelhantes em outras espécies analisadas), enquanto compartilha 730 famílias de genes com T. cacao e 297 com T. umbraticum (Alves et al., 2024). No total, as três espécies dividem 1.816 famílias de genes, das quais apenas duas categorias funcionais apresentaram enriquecimento significativo: uma relacionada ao reconhecimento de pólen (GO:0048544) e outra à localização de proteínas na superfície celular (GO:0034394). As demais famílias de genes exclusivas e compartilhadas incluem muitas associadas à qualidade dos frutos, maturação, características organolépticas, desenvolvimento da planta e resistência a patógenos (Alves et al., 2024). 45 Figura 11. Padrões macrossintênicos entre cupuaçu e cacau, revelando estruturas genômicas conservadas nos 10 cromossomos. Extraído de Alves et al., 2024 Porém, o estudo de Alves et al. (2024) investigou apenas o genoma do clone C1074 suscetível à doença vassoura-de-bruxa, restando ainda futuras análises para o clone C174 (cultivar BRS Coari) resistente à mesma doença. Análises comparativas entre esses clones estão previstas como próximos passos para futuros estudos. Dentre as perguntas que se pretendem responder, destacam-se quais são os genes específicos que conferem resistência ao Moniliophthora perniciosa e M. roreri no clone C174, como diferem os padrões de expressão gênica entre os clones C1074 e C174 durante a infecção pelo fungo, quais vias metabólicas e mecanismos de defesa estão ativados no clone resistente e ausentes ou menos ativos no clone suscetível, se existem variantes genéticas ou polimorfismos associados à resistência que possam ser utilizados como marcadores genéticos para a seleção de cultivares resistentes e como a resistência observada no clone C174 pode ser integrada em programas de melhoramento para desenvolver novas variedades de cupuaçu com maior resistência a doenças (comunicação pessoal). Essas perguntas visam elucidar os mecanismos genéticos e moleculares subjacentes à resistência, proporcionando subsídios valiosos para estratégias de melhoramento genético mais eficazes e sustentáveis. Com a resposta a essas questões, será possível identificar e manipular genes-chave que aumentem a resistência das plantas às doenças, otimizar práticas de manejo e desenvolver cultivares que não apenas mantenham a produtividade, mas também garantam a 46 qualidade dos frutos em condições adversas. Além disso, a integração dessas descobertas em programas de melhoramento pode acelerar o desenvolvimento de variedades mais robustas, reduzindo a dependência de métodos químicos de controle e promovendo uma agricultura mais sustentável e ambientalmente amigável. Em relação a T. umbraticum, o estudo sobre a sequência do seu genoma revela informações importantes sobre sua relação com o gênero Theobroma. Sendo T. umbraticum um gênero irmão de Theobroma dentro da família Malvaceae, mais especificamente na subfamília Byttnerioideae e na tribo Theobromateae (Colli-Silva; Richardson; Pirani, 2023). Essa espécie, que exibe uma morfologia única, apresenta uma rica composição em ácidos graxos insaturados e de cadeia longa, similar ao que é observado em cupuaçu (Alves et al., 2024). Em análises comparativas de genomas de plantas, uma técnica que pode ser utilizada está relacionada à análise topográfica ou espacial dos genes, que podem estar distribuídos na forma de duplicados dispersos, tandem, próximos ou derivados de eventos WGD (segmentais). Essas duplicações podem originar-se de diferentes eventos evolutivos, como duplicações de genoma inteiro (WGD), onde todo o conjunto de cromossomos é duplicado, resultando em múltiplas cópias de cada gene; duplicações tandem, onde genes são duplicados adjacentes uns aos outros no mesmo cromossomo; duplicações proximais, onde genes duplicados estão próximos, mas não necessariamente em sequência direta; e duplicações dispersas, onde genes duplicados estão espalhados por diferentes regiões do genoma (Hanada et al., 2008; Zou et al., 2009; Wang et al., 2016; Sangi et al., 2021; Alves et al., 2024). Essa diversidade de padrões de duplicação permite a expansão e diversificação das famílias gênicas, contribuindo para a adaptação e evolução das espécies. No caso do cupuaçu, a identificação desses padrões de duplicação é crucial para compreender como determinados genes relacionados à resistência a patógenos, foram mantidos e diversificados ao longo do tempo (Alves et al., 2024). Por exemplo, genes duplicados através de WGD podem fornecer redundância funcional, permitindo que algumas cópias possam desenvolver novas funções, pelo mecanismo de divergência funcional, sem comprometer a sobrevivência da planta. Já duplicações 47 tandem e proximais podem facilitar a co-regulação de genes envolvidos em respostas específicas a estresses bióticos e abióticos (Hanada et al., 2008; Zou et al., 2009). Neste sentido, análises baseadas em Ontologias Gênicas (Gene Ontology do inglês, ou GO) podem contribuem para elucidar como eventos de duplicação e seleção podem influenciar rotas metabólicas fundamentais, revelando potenciais alvos para estudos de melhoramento e aplicações biotecnológicas. O GO apresenta um vocabulário padronizado que permite descrever funções gênicas de maneira consistente, agrupando-as em três categorias principais: processos biológicos, funções moleculares e componentes celulares. Nesse contexto, o enriquecimento do termo “processo biossintético de flavonoides” (GO:0009813) em T. grandiflorum está vinculado a uma duplicação gênica em tandem de um gene que codifica a enzima naringenina 2-oxoglutarato 3-dioxigenase, evidenciada em dois loci (TgrandC1074G00000004751 e TgrandC1074G00000004753), ambos sob seleção positiva (Alves et al., 2024). Duplicações em tandem, co