Sequenciamento de nova geração em Myracrodruon urundeuva Allemão LC (Anacardiaceae) de diferentes biomas do Brasil

Carregando...
Imagem de Miniatura

Data

2023-12-06

Orientador

Marino, Celso Luis

Coorientador

Rossini, Bruno Cesar

Pós-graduação

Ciências Biológicas (Genética) - IBB 33004064026P9

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A variabilidade genética intrínseca às espécies é vital para sua adaptação ambiental e o Brasil, detentor de seis biomas terrestres distintos, se destaca neste panorama. Entretanto, muitas espécies nativas brasileiras, como Myracrodruon urundeuva, carecem de descrição do genoma, dificultando a busca por marcadores SNPs e um maior entendimento da espéice. O Double Digest Restriction Associated DNA Sequencing (ddRADseq) por sua vez, emerge como uma abordagem valiosa, não dependendo de informações genômicas prévias, oferecendo potencial para futuros estudos genéticos, mesmo sem um genoma de referência. Tendo em vista este panorama, o presente trabalho tem como objetivos estabelecer um panorama biológico e histórico-social de M. urundeuva, conhecida como Aroeira, destacando sua distribuição geográfica, utilização e pesquisa. Em seguida, utilizando o sequenciamento por ddRADseq, busca-se construir uma biblioteca genômica a partir de amostras coletadas em quatro biomas e em um ecótono entre Cerrado e Mata-Atlântica. O foco está na compreensão da diversidade genética, distâncias entre populações e possível relação entre Marcadores SNPs e variáveis climáticas nos biomas de ocorrência da espécie. Para o estudo, foram coletadas amostras foliares de 115 indivíduos de M. urundeuva de quatro biomas, incluindo Caatinga, Cerrado, Mata-Atlântica e Pantanal, além do ecótono entre Cerrado e Mata-Atlântica. A extração do DNA genômico seguiu o protocolo adaptado de Doyle & Doyle (1990). A construção das bibliotecas de sequenciamento foi realizada conforme o protocolo de ddRAD proposto por Campos et al. (2017) e Peterson et al. (2012). O software STACKS v2.71 foi utilizado para identificar loci SNP nos indivíduos sequenciados. Análises estatísticas, incluindo DAPC, PCA, AMOVA, Teste de Mantel, Fis e Fst foram conduzidas utilizando pacotes R específicos. A estrutura populacional foi identificada pelo software fineRAD. A Rede de Haplótipos, Coeficiente de Endogamia (Fis) e a identificação de loci com potencial envolvimento em adaptação foram analisados usando pacotes especializados como 'poppr', 'hierfstat', 'pcadapt' e Análise de Redundância (RDA) com 'psych' e 'vegan' em ambiente R. O Sequenciamento resultou em 86,040,542 milhões de reads, com variação entre 264 e 2,667,829 milhões de reads por amostra. Após a criação do catálogo de marcadores, 88 amostras foram selecionadas, resultando em 1427 marcadores SNPs. A população de Seridó, Caatinga, apresentou 134 alelos privados, e a média de riqueza alélica foi 1.227 para as populações avaliadas. O Coeficiente de Endogamia (Fis) variou de 0.001 a 0.196. A diversidade genética revelou estruturação distinta entre as populações dos biomas Caatinga, Mata-Atlântica e Pantanal, enquanto Cerrado e transição de biomas formaram um único cluster. As populações mostraram diferenças significativas no Coeficiente de Fixação de Wright (Fst) e distância genética, indicando diferenciação entre a Caatinga e as demais populações. A significativa divergência genética das populações da Caatinga destaca a necessidade de maior investigação neste bioma. O estudo enfatiza a importância da preservação da diversidade genética de M. urundeuva, sugerindo estratégias de conservação e manejo sustentável. Abordagens moleculares inovadoras são pertinentes para garantir um futuro promissor para esta espécie nativa de relevância econômica e ambiental.

Resumo (inglês)

The intrinsic genetic variability of species is crucial for their environmental adaptation, and Brazil, with its six distinct terrestrial biomes, stands out in this panorama. However, many native Brazilian species, such as Myracrodruon urundeuva, lack genome descriptions, hindering the search for SNP markers and a deeper understanding of the species. Double Digest Restriction Associated DNA Sequencing (ddRADseq), in turn, emerges as a valuable approach, independent of prior genomic information, offering potential for future genetic studies even without a reference genome. In view of this context, this study aims to establish a biological and socio-historical overview of M. urundeuva, known as Aroeira, highlighting its geographical distribution, use, and research. Subsequently, using ddRADseq sequencing, the goal is to build a genomic library from samples collected in four biomes and in an ecotone between the Cerrado and the Atlantic Forest. The focus is on understanding genetic diversity, distances between populations, and the potential relationship between SNP markers and climatic variables in the species' occurrence biomes. For the study, leaf samples were collected from 115 individuals of M. urundeuva from four biomes, including Caatinga, Cerrado, Atlantic Forest, and Pantanal, as well as the ecotone between Cerrado and Atlantic Forest. Genomic DNA extraction followed the adapted protocol of Doyle & Doyle (1990). Library construction was carried out following the ddRAD protocol proposed by Campos et al. (2017) and Peterson et al. (2012). The STACKS v2.71 software was used to identify SNP loci in the sequenced individuals. Statistical analyses, including DAPC, PCA, AMOVA, Mantel Test, Fis, and Fst, were conducted using specific R packages. Population structure was identified using the fineRAD software. Haplotype Network, Coefficient of Inbreeding (Fis), and identification of loci with potential involvement in adaptation were analyzed using specialized packages such as 'poppr,' 'hierfstat,' 'pcadapt,' and Redundancy Analysis (RDA) with 'psych' and 'vegan' in the R environment. Sequencing resulted in 86,040,542 million reads, ranging from 264 to 2,667,829 million reads per sample. After creating the marker catalog, 88 samples were selected, resulting in 1427 SNP markers. The population of Seridó, Caatinga, presented 134 private alleles, and the average allelic richness was 1.227 for the populations evaluated. The Inbreeding Coefficient (Fis ) ranged from 0.001 to 0.196. Genetic diversity revealed distinct structuring among populations from the Caatinga, Atlantic Forest, and Pantanal biomes, while the Cerrado and biome transition formed a single cluster. Populations showed significant differences in the Wright's Fixation Coefficient (Fst) and genetic distance, indicating differentiation between the Caatinga and other populations. The significant genetic divergence of Caatinga populations highlights the need for further investigation in this biome. The study emphasizes the importance of preserving the genetic diversity of M. urundeuva, suggesting strategies for conservation and sustainable management. Innovative molecular approaches are relevant to ensuring a promising future for this native species with economic and environmental significance.

Descrição

Idioma

Português

Como citar

Alcantara, M. A. M. Sequenciamento de nova geração em Myracrodruon urundeuva Allemão LC (Anacardiaceae) de diferentes biomas do Brasil. 2023. Tese (Doutorado em Genética). Instituto de Biociências, Universidade Estadual Paulista, Botucatu, 2023.

Itens relacionados