Detection and functional assessment of structural variants using whole genome re-sequencing data in Nellore cattle

Carregando...
Imagem de Miniatura

Data

2023-10-31

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

Ongoing advances in genome sequencing technologies have enabled the unravelling of many structural variants (SVs) in livestock genomes. Association of SVs with complex traits are promising targets for animal breeding because of their effects on gene expression. The aims of this study were: i). to detect structural variants using whole genome resequencing data of 151 representative Nellore bulls by combining calling algorithms ii) to discover non redundant and highly frequent regions of structural variants (SVR) in the analyzed bulls. iii). to search for positional candidate genes, and quantitative trait loci (QTL) overlapping the most frequent SVR in the population. iv) to assess the functional impact of positional candidate genes overlapping SVR trough enriched gene ontology terms (GO terms) related to biological process (BP), molecular function (MF), cellular component (CC), and biochemical pathways. The whole genome re-sequencing (WGS) data from 151 representative Nellore bulls was used to conduct genome-wide structural variation calling, as well as detection of common SVRs for the analyzed bulls. The gene content and nearby QTLs of SVRs were retrieved from publicly available genomic databases, and functional enrichment analysis of positional candidate genes overlapping the most frequent SVRs were conducted using PANTHER. A total of 215,031 high-confidence SV was obtained, most of them corresponding to copy number variants (CNV) (183,032 deletions-DEL, and 14,013 duplications-DUP), and 17,986 inversions (INV). Total structural variation encompasses, on average, 4.81% of the individual autosomal genome extension. A total of 3,752 non-redundant SVR frequent in more than 5% of bulls were obtained, corresponding in more than 97% to regions of copy number variants (CNVR), and 3% to regions of inversions (INVR). All SVR comprises 13.13% of total autosomal genome extension, which were attributed in 11.4% to CNVR and 1.7% to INVR. Among all SVRs, 532 were shared by more than 50% of bulls and overlapped a total of 130 QTL distributed into 6 QTL types: exterior, health, meat and carcass, milk, production, and reproduction, which are related to a total of 50 economically important traits. Most SVR overlapped QTLs related to residual feed intake, structural soundness, multiple birth, clinical mastitis, and milk energy yield. Regarding gene content, 204 SVRs, overlapped a total of 1,164 positional candidate genes, which were significatively overrepresented into GO terms related to BP, MF, CC and one biochemical pathway. Among the significantly enriched genes, we highlight members of the olfactory receptor (OR) gene family, which play essential roles in mechanisms for adaptation to the environment. These genes were mainly found into regions of inversion and mixed events. Similarly, genes from the defensin family (DEFB), that play important roles in the innate immune system of multicellular organisms, and which are known to be caused by duplication events that mammalian genomes have undergone. Other important genes were found in this study, such as the members of the secretory phospholipase A2 family, adhesion G protein-coupled receptors, and zinc finger binding proteins. Most of the genes found in this study have been described as potential candidates for feed efficiency indicator traits, which reflects the biochemical mechanisms in which they are involved that have led to the improved fitness. The results of this study provide important knowledge about the mechanisms driving changes in the genome in Nellore cattle, the contributed to adaptation to environment.
Os avanços contínuos nas tecnologias de sequenciamento do genoma permitiram o desvendamento de diferentes variantes estruturais (SVs) nos genomas dos animais de interesse zootécnico. A associação de SVs com características complexas são alvos promissores para o melhoramento animal devido aos seus efeitos na expressão gênica. Os objetivos deste estudo foram: i). detectar variantes estruturais usando dados de res-sequenciamento do genoma completo de 151 touros Nelore representativos combinando diferentes algoritmos; ii) descobrir regiões não redundantes e altamente frequentes de variantes estruturais (SVR) nos touros analisados. procurar genes candidatos posicionais e locos de características quantitativas (“QTL”) em sobreposição às SVRs mais frequentes na população. iv) avaliar o impacto funcional de genes candidatos posicionais abrigados pelas SVRs através de enriquecimento funcional de termos de ontologia genética (GO terms) relacionados a processo biológico (BP), função molecular (MF), componente celular (CC) e vias bioquímicas. Dados de re-sequenciamento do genoma completo de 151 touros Nelore representativos foram usados para conduzir a detecção de variantes estruturais, bem como para identificar SVRs comuns aos touros analisados. O conteúdo genético e os QTLs próximos de SVRs foram recuperados de bancos de dados genômicos disponíveis publicamente, e a análise de enriquecimento funcional de genes candidatos posicionais que se sobrepõem aos SVRs mais frequentes foi conduzida usando PANTHER. Foram obtidas 215.031 SVs de alta confiança, a maioria correspondendo a variantes de número de cópias (CNV) (183.032 deleções-DEL, e 14.013 duplicações-DUP, e 17.986 inversões (INV). A variação estrutural total abrange, em média, 4,81% da extensão do genoma autossômico individual. Foram obtidos um total de 3.752 SVRs frequentes em mais de 5% dos touros, correspondendo em mais de 97% a regiões de variantes de número de cópias (CNVR) e 3% a regiões de inversões (INVR). Todos os SVRs compreendem 13,13% da extensão total do genoma autossômico, que foram atribuídos em 11,4% a CNVRs e 1,7% a INVRs. Entre todos as SVRs, 532 foram compartilhados por mais de 50% dos touros e sobrepuseram um total de 130 QTL distribuídos em 6 tipos: exterior, saúde, carne e carcaça, leite, produção e reprodução, que estão relacionados a um total de 50 características de importância económica. A maioria dos QTLs sobrepostos às SVRs estão relacionados a consumo residual, solidez estrutural, nascimentos múltiplos, mastite clínica, e produção de energia do leite. Em relação ao conteúdo gênico, 204 SVRs das mais frequentes se sobrepuseram a um total de 1.164 genes candidatos posicionais, que foram significativamente super-representados em termos GO relacionados a BP, MF, CC e uma via bioquímica. Dentre os genes significativamente enriquecidos, destacamos os membros da família de genes dos receptores olfativos (OR), com funções importantes nos mecanismos de adaptação ao ambiente. Esses genes foram encontrados principalmente dentre de regiões com ocorrência de eventos de inversões e eventos mistos, que podem explicar a prevalência nos genomas ao longo da evolução dos mamíferos. De forma similar, os genes da família das defensinas (DEFB) que desempenham papéis importantes no sistema imunológico inato de organismos multicelulares, e que são conhecidos por serem causados por eventos de duplicação que sofreram os genomas dos mamíferos. Destacam-se também membros da família da fosfolipase A2 secretora, os receptores acoplados à proteína G de adesão e as proteínas de ligação aos dedos de zinco. A maioria dos genes encontrados neste estudo são candidatos potenciais para características indicadoras de eficiência alimentar, o que reflete os mecanismos bioquímicos nos quais estão envolvidos e que levaram à melhoria do valor adaptativo. Os resultados deste estudo fornecem conhecimento importante sobre os mecanismos que impulsionam as mudanças no genoma de bovinos Nelore, as causas dos processos de adaptação e a caracterização das consequências da variação estrutural em relação à diversidade genética.

Descrição

Palavras-chave

DNA, Copy number variation, mobile elements, next generation sequencing, sequence gains and losses, Zebus

Como citar

MARIN-GAZON, N. A. Detection and functional assessment of structural variants using whole genome re-sequencing data in Nellore cattle. 2023 - 110f - Tese (Doutorado em Genética e Melhoramento Animal). Universidade Estadual Paulista, Jaboticabal. 2024.