Detection and functional assessment of structural variants using whole genome re-sequencing data in Nellore cattle

dc.contributor.advisorAlbuquerque, Lucia Galvão de
dc.contributor.authorMarin-Gazon, Natália Andrea
dc.contributor.coadvisorVargas, Giovana
dc.date.accessioned2024-01-23T16:35:40Z
dc.date.available2024-01-23T16:35:40Z
dc.date.issued2023-10-31
dc.description.abstractOngoing advances in genome sequencing technologies have enabled the unravelling of many structural variants (SVs) in livestock genomes. Association of SVs with complex traits are promising targets for animal breeding because of their effects on gene expression. The aims of this study were: i). to detect structural variants using whole genome resequencing data of 151 representative Nellore bulls by combining calling algorithms ii) to discover non redundant and highly frequent regions of structural variants (SVR) in the analyzed bulls. iii). to search for positional candidate genes, and quantitative trait loci (QTL) overlapping the most frequent SVR in the population. iv) to assess the functional impact of positional candidate genes overlapping SVR trough enriched gene ontology terms (GO terms) related to biological process (BP), molecular function (MF), cellular component (CC), and biochemical pathways. The whole genome re-sequencing (WGS) data from 151 representative Nellore bulls was used to conduct genome-wide structural variation calling, as well as detection of common SVRs for the analyzed bulls. The gene content and nearby QTLs of SVRs were retrieved from publicly available genomic databases, and functional enrichment analysis of positional candidate genes overlapping the most frequent SVRs were conducted using PANTHER. A total of 215,031 high-confidence SV was obtained, most of them corresponding to copy number variants (CNV) (183,032 deletions-DEL, and 14,013 duplications-DUP), and 17,986 inversions (INV). Total structural variation encompasses, on average, 4.81% of the individual autosomal genome extension. A total of 3,752 non-redundant SVR frequent in more than 5% of bulls were obtained, corresponding in more than 97% to regions of copy number variants (CNVR), and 3% to regions of inversions (INVR). All SVR comprises 13.13% of total autosomal genome extension, which were attributed in 11.4% to CNVR and 1.7% to INVR. Among all SVRs, 532 were shared by more than 50% of bulls and overlapped a total of 130 QTL distributed into 6 QTL types: exterior, health, meat and carcass, milk, production, and reproduction, which are related to a total of 50 economically important traits. Most SVR overlapped QTLs related to residual feed intake, structural soundness, multiple birth, clinical mastitis, and milk energy yield. Regarding gene content, 204 SVRs, overlapped a total of 1,164 positional candidate genes, which were significatively overrepresented into GO terms related to BP, MF, CC and one biochemical pathway. Among the significantly enriched genes, we highlight members of the olfactory receptor (OR) gene family, which play essential roles in mechanisms for adaptation to the environment. These genes were mainly found into regions of inversion and mixed events. Similarly, genes from the defensin family (DEFB), that play important roles in the innate immune system of multicellular organisms, and which are known to be caused by duplication events that mammalian genomes have undergone. Other important genes were found in this study, such as the members of the secretory phospholipase A2 family, adhesion G protein-coupled receptors, and zinc finger binding proteins. Most of the genes found in this study have been described as potential candidates for feed efficiency indicator traits, which reflects the biochemical mechanisms in which they are involved that have led to the improved fitness. The results of this study provide important knowledge about the mechanisms driving changes in the genome in Nellore cattle, the contributed to adaptation to environment.en
dc.description.abstractOs avanços contínuos nas tecnologias de sequenciamento do genoma permitiram o desvendamento de diferentes variantes estruturais (SVs) nos genomas dos animais de interesse zootécnico. A associação de SVs com características complexas são alvos promissores para o melhoramento animal devido aos seus efeitos na expressão gênica. Os objetivos deste estudo foram: i). detectar variantes estruturais usando dados de res-sequenciamento do genoma completo de 151 touros Nelore representativos combinando diferentes algoritmos; ii) descobrir regiões não redundantes e altamente frequentes de variantes estruturais (SVR) nos touros analisados. procurar genes candidatos posicionais e locos de características quantitativas (“QTL”) em sobreposição às SVRs mais frequentes na população. iv) avaliar o impacto funcional de genes candidatos posicionais abrigados pelas SVRs através de enriquecimento funcional de termos de ontologia genética (GO terms) relacionados a processo biológico (BP), função molecular (MF), componente celular (CC) e vias bioquímicas. Dados de re-sequenciamento do genoma completo de 151 touros Nelore representativos foram usados para conduzir a detecção de variantes estruturais, bem como para identificar SVRs comuns aos touros analisados. O conteúdo genético e os QTLs próximos de SVRs foram recuperados de bancos de dados genômicos disponíveis publicamente, e a análise de enriquecimento funcional de genes candidatos posicionais que se sobrepõem aos SVRs mais frequentes foi conduzida usando PANTHER. Foram obtidas 215.031 SVs de alta confiança, a maioria correspondendo a variantes de número de cópias (CNV) (183.032 deleções-DEL, e 14.013 duplicações-DUP, e 17.986 inversões (INV). A variação estrutural total abrange, em média, 4,81% da extensão do genoma autossômico individual. Foram obtidos um total de 3.752 SVRs frequentes em mais de 5% dos touros, correspondendo em mais de 97% a regiões de variantes de número de cópias (CNVR) e 3% a regiões de inversões (INVR). Todos os SVRs compreendem 13,13% da extensão total do genoma autossômico, que foram atribuídos em 11,4% a CNVRs e 1,7% a INVRs. Entre todos as SVRs, 532 foram compartilhados por mais de 50% dos touros e sobrepuseram um total de 130 QTL distribuídos em 6 tipos: exterior, saúde, carne e carcaça, leite, produção e reprodução, que estão relacionados a um total de 50 características de importância económica. A maioria dos QTLs sobrepostos às SVRs estão relacionados a consumo residual, solidez estrutural, nascimentos múltiplos, mastite clínica, e produção de energia do leite. Em relação ao conteúdo gênico, 204 SVRs das mais frequentes se sobrepuseram a um total de 1.164 genes candidatos posicionais, que foram significativamente super-representados em termos GO relacionados a BP, MF, CC e uma via bioquímica. Dentre os genes significativamente enriquecidos, destacamos os membros da família de genes dos receptores olfativos (OR), com funções importantes nos mecanismos de adaptação ao ambiente. Esses genes foram encontrados principalmente dentre de regiões com ocorrência de eventos de inversões e eventos mistos, que podem explicar a prevalência nos genomas ao longo da evolução dos mamíferos. De forma similar, os genes da família das defensinas (DEFB) que desempenham papéis importantes no sistema imunológico inato de organismos multicelulares, e que são conhecidos por serem causados por eventos de duplicação que sofreram os genomas dos mamíferos. Destacam-se também membros da família da fosfolipase A2 secretora, os receptores acoplados à proteína G de adesão e as proteínas de ligação aos dedos de zinco. A maioria dos genes encontrados neste estudo são candidatos potenciais para características indicadoras de eficiência alimentar, o que reflete os mecanismos bioquímicos nos quais estão envolvidos e que levaram à melhoria do valor adaptativo. Os resultados deste estudo fornecem conhecimento importante sobre os mecanismos que impulsionam as mudanças no genoma de bovinos Nelore, as causas dos processos de adaptação e a caracterização das consequências da variação estrutural em relação à diversidade genética.pt
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipIdFAPESP# 2009/16118-5
dc.description.sponsorshipIdFAPESP #2017/10630-2
dc.description.sponsorshipIdFAPESP #2018/20026-8
dc.identifier.citationMARIN-GAZON, N. A. Detection and functional assessment of structural variants using whole genome re-sequencing data in Nellore cattle. 2023 - 110f - Tese (Doutorado em Genética e Melhoramento Animal). Universidade Estadual Paulista, Jaboticabal. 2024.en
dc.identifier.urihttps://hdl.handle.net/11449/252970
dc.language.isoeng
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso restrito
dc.subjectDNAen
dc.subjectCopy number variationpt
dc.subjectmobile elementspt
dc.subjectnext generation sequencingpt
dc.subjectsequence gains and lossespt
dc.subjectZebuspt
dc.titleDetection and functional assessment of structural variants using whole genome re-sequencing data in Nellore cattleen
dc.title.alternativeDetecção e avaliação funcional de variantes estruturais usando dados de re-sequenciamento de genoma completo em gado Nelore.pt
dc.typeTese de doutorado
dcterms.impactO presente estudo permitiu identificar variantes genéticas no genoma de 151 touros representativos da raça Nelore, conhecidas como variações estruturais. Essas variações são compostas por diferentes tipos, dos quais conseguiram-se identificar deleções, duplicações, e inversões de fragmentos de DNA. Também foram identificadas as regiões do genoma onde há maior ocorrência dessas variações na população avaliada, bem com os genes localizados dentre dessas regiões, que estão envolvidos em funções biológicas e moleculares, que são importantes para processos adaptativos, e que também estão associados a características de importância económica em gado de corte, como a eficiência alimentar. Esses resultados contribuem a desvendar os mecanismos genéticos que promoveram a adaptação ambiental do gado Nelore, causado potencialmente por mudanças estruturais e rearranjos de segmentos de DNA funcionalmente importantes.pt
dcterms.impactThe present study allowed the identification of genetic variants in the genome of 151 representative Nellore bulls, known as structural variations. These variations correspond to different types, from which deletions, duplications, and inversions of DNA fragments were identified. Genomic regions with the highest occurrence of these variations in the evaluated population were also identified, as well as the genes located within these regions, which are involved in biological and molecular functions that are important for adaptive processes, and which are also associated with economically important traits in cattle, such as feed efficiency. These results contribute to unveiling the genetic mechanisms driving the environmental adaptation of Nellore cattle, potentially caused by structural changes and rearrangements of functionally important DNA segments.en
unesp.campusUniversidade Estadual Paulista (Unesp), Faculdade de Ciências Agrárias e Veterinárias, Jaboticabal
unesp.embargo6 meses após a data da defesa
unesp.examinationboard.typeBanca pública
unesp.graduateProgramCiência Animal - FCAV 33004102002P0
unesp.knowledgeAreaGenética e melhoramento animalpt
unesp.researchAreaGenética e melhoramento dos animais domésticos.en

Arquivos

Pacote Original
Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
marin-gazon_na_dr_jabo_par.pdf
Tamanho:
876.49 KB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Nome:
marin-gazon_na_dr_jabo_int.pdf
Tamanho:
3.26 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
3.01 KB
Formato:
Item-specific license agreed upon to submission
Descrição: