Comparação de métodos de construção de haplótipos em estudo de associação genômica ampla com dados simulados

Carregando...
Imagem de Miniatura

Data

2018-02-27

Autores

Arce, Cherlynn Daniela da Silva

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Resumo

Com o avanço dos estudos em genética e da tecnologia aplicada à genotipagem de marcadores moleculares, a identificação de polimorfismos associados às características de interesse econômico se tornou mais acessível, possibilitando a sua utilização aumentar a acurácia de modelos de predição do mérito genético dos animais. Esse avanço também possibilitou aumentar a acurácia dos estudos para identificação de QTLs para características de interesse econômico. Entretanto, os marcadores comumente utilizados para tal fim são os SNPs, que por serem bi-alélicos podem não ser muito eficientes na identificação dos QTLs. Os haplótipos, multi-alélicos, apresentam maior possibilidade de estarem em desequilíbrios de ligação (DL) com os QTLs. Dessa forma, objetivou-se no presente trabalho identificar o melhor método de construção de haplótipos para utilização em estudos de detecção de QTLs, a partir da comparação dos três métodos mais comumente utilizados para este fim. Foram utilizadas três populações simuladas representando características com três diferentes valores de herdabilidade, para as quais foram armazenados os dados fenotípicos, genotípicos e de pedigree dos 6.000 animais da população mais recente: Pop1 com herdabilidade baixa (0,10); Pop2 com herdabilidade moderada (0,25); e, Pop3 com herdabilidade alta (0,35). Os genomas simulados consistiram de 750.000 marcadores do tipo SNP, e 750 QTLs, com dois a quatro alelos, dispostos aleatoriamente em 29 cromossomos com tamanho total de 2.333 centimorgans (cM). A partir da simulação foram eliminados os SNPs cuja frequência do menor alelo foi menor que 0,1, restando 576.027, 577.189 e 576.675 marcadores para as populações Pop1, Pop2 e Pop3, respectivamente. A variação fenotípica foi de 1,0 e a variação dos QTLs foi de 50% das herdabilidades, para cada população. As médias dos DL para cada cromossomo, medidas pela estatística D', variaram de 0,20 até 0,30 para todas as populações, na última geração. Foram construídos haplótipos utilizando três métodos: Intervalo de Confiança (IC), Regra de Quatro Gametas (RQG) e Janelas Sobrepostas (JS). Para Pop1, no cromossomo 15, os métodos IC, RQG e JS identificaram cinco, oito e sete QTLs, respectivamente. Somente um QTL foi identificado nos cromossomos 19 e 29. Para a característica de herdabilidade alta, foi identificado um QTL no cromossomo 11. Em relação às análises de associação utilizando SNPs individuais, foram identificados quatro QTLs no cromossomo 15. Para a característica de herdabilidade moderada, não foram encontrados haplótipos ou SNPs isolados significativos. A metodologia de formação de haplótipos baseado na RQG foi considerada a mais eficiente para detecção de QTLs em relação aos métodos IC e JS, bem como ao uso dos SNPs isolados.
With the advancement of genetic studies and the technology applied to the genotyping of molecular markers, the identification of polymorphisms associated with the characteristics of economic interest became more accessible, allowing its use to increase the accuracy of prediction models of the genetic merit of the animals. This advance also made it possible to increase the accuracy of studies to identify QTLs for characteristics of economic interest. However, the commonly used markers for this purpose are SNPs, which because they are bi-allelic may not be very efficient in identifying QTLs. The haplotypes, multi-allelic, are more likely to be in linkage disequilibrium (LD) with QTLs. Thus, the objective of this work was to identify the best haplotype construction method for use in QTLs detection studies, by comparing the three methods most commonly used for this purpose. Three simulated populations representing characteristics with three different heritability values were used for which the phenotypic, genotypic and pedigree data of the 6,000 animals were stored: Pop1 with low heritability (0.10); Pop2 with moderate heritability (0.25); and, Pop3 with high heritability (0.35). The simulated genomes consisted of 750,000 SNP-type markers, and 750 QTLs, with two to four alleles, arranged randomly on 29 chromosomes with a total size of 2,333 centimorgans (cM). From the simulation the SNPs whose frequency of the lowest allele was less than 0.1 were eliminated, leaving 576,027, 577,189 and 576,675 markers for Pop1, Pop2 and Pop3 populations, respectively. The phenotypic variation was 1.0 and the variation of QTLs was 50% of the heritabilities, for each population. The mean LD for each chromosome, measured by the D' statistic, ranged from 0.20 to 0.30 for all populations in the last generation. Haplotypes were constructed using three methods: Confidence Interval (CI), Four Gametes Rule (FGR) and Sliding-Window (SW). For Pop1, on chromosome 15, CI, FGR and SW methods identified five, eight and seven QTLs, respectively. Only one QTL was identified on chromosomes 19 and 29. For the high heritability characteristic, a QTL was identified on chromosome 11. Regarding the association analyzes using individual SNPs, four QTLs were identified on chromosome 15. For the moderate heritability characteristic, no significant isolated haplotypes or SNPs were found. The methodology of haplotype formation based on the FGR was considered the most efficient for the detection of QTLs in relation to CI and SW methods, as well as to the use of isolated SNPs.

Descrição

Palavras-chave

estudos de associação, haplótipos, intervalo de confiança, janelas sobrepostas, regra de quatro gametas, snp, association study, confidence interval, haplotypes, four gamete rule, sliding-window, snp

Como citar