Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana
Carregando...
Data
Autores
Orientador
Castelli, Erick da Cruz
Coorientador
Pós-graduação
Ciências Biológicas (Genética) - IBB
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Tese de doutorado
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Os marcadores genéticos STRs (do inglês, short tandem repeats) são considerados padrão-ouro para as análises forenses. Apesar de amplamente utilizados, os STRs apresentam limitações relevantes especialmente em casos complexos, tais como amostras degradadas ou compostas por múltiplos perfis genéticos. Dessa forma, outros marcadores têm despertado interesse na genética forense, com o objetivo de serem complementares aos STRs e superar suas limitações. Os polimorfismos de inserção/deleção, ou InDels, estão amplamente presentes no genoma humano e reúnem algumas características importantes e vantajosas. Eles podem ser amplificados por reação em cadeia da polimerase (PCR) e detectados por eletroforese capilar (CE), tecnologias amplamente presentes nos laboratórios forenses, e podem ser organizados em sistema multiplex. Além de apresentarem baixa taxa de mutação, favorável para análises de vínculo genético e da possibilidade de gerar produtos de amplificação (amplicons) menores, facilitando a análise de amostras degradadas. Ademais, os InDels não produzem artefatos de amplificação denominados stutters, sendo favorável para casos contendo misturas de perfis genéticos de dois ou mais indivíduos. Entretanto, a maioria dos InDels são bi-alélicos, o que reduz seu poder de discriminação. Para contornar essa limitação, novos marcadores genéticos, como os multi-InDels, têm ganhado destaque, pois, preservam as características individuais dos InDels e ainda proporcionam um aumento do polimorfismo. Os marcadores multi-InDels são classificados de forma generalizada como microhaplótipos, constituídos por dois ou mais loci InDels, localizados em um segmento curto de DNA. Atualmente, há painéis de multi-InDels propostos na literatura, todos validados apenas em populações asiáticas. O objetivo deste trabalho foi construir e validar, por meio de abordagens computacionais, um novo conjunto de marcadores multi-InDels autossômicos, que seja capaz identificar os indivíduos da população brasileira e de outras populações do mundo. Previamente, nós avaliamos três conjuntos anteriormente propostos e validados em populações asiáticas, com o objetivo de verificar a sua aplicabilidade em indivíduos brasileiros. Foram utilizados dados públicos de sequenciamento de alta cobertura de genoma completo do projeto 1000 Genomes, que compreende 26 populações mundiais, e a amostras de brasileiros (Projeto Saúde, Bem-estar e Envelhecimento - SABE), tanto para avaliar os painéis existentes quanto para selecionar novos marcadores. Concluiu-se que a maioria dos marcadores anteriormente propostos é informativa para indivíduos brasileiros, uma vez que apresentam mais de três haplótipos frequentes com diferentes tamanhos. Entretanto, 64,8% destes marcadores são propensos a erros de amplificação e/ou sequenciamento, devido à presença de regiões repetitivas, de baixa complexidade, homopolimérica ou STRs. Desse modo, neste trabalho, selecionamos e propusemos um novo conjunto de marcadores multi-InDels para identificação humana, organizado em sistema multiplex e baseado na plataforma de CE, composto por 28 marcadores, além de dois marcadores para determinação do sexo. O painel apresentou alto polimorfismo em cinco superpopulações, bem como em indivíduos brasileiros. A probabilidade de match combinada (PMC) variou de 5,66 x 10-20 a 2,66 x 10-17, enquanto o poder de exclusão combinado (PEC) variou de 0,99958 a 0,99998. Além disso, 94,4% dos amplicons gerados foram menores que 250 pares de base (pb). Portanto, o painel proposto pode ser uma ferramenta complementar útil para a identificação humana, aplicável para população brasileira e em outras populações ao redor do mundo, especialmente em casos complexos.
Resumo (inglês)
Short tandem repeat (STR) markers are considered the gold standard in forensic genetics. Although widely used, STRs present relevant limitations, especially in complex cases involving degraded samples or mixtures of multiple genetic profiles. Therefore, alternative genetic markers have gained interest in forensic applications, aiming to complement STRs and overcome their limitations. Insertion/deletion polymorphisms (InDels) are widely distributed throughout the human genome and exhibit several advantageous characteristics. They can be amplified by polymerase chain reaction (PCR) and detected by capillary electrophoresis (CE), both techniques routinely available in forensic laboratories, and can be organized into multiplex systems. InDels also display low mutation rates, which is favorable for kinship analyses, and can generate short amplification products (amplicons), facilitating the analysis of degraded samples. Moreover, InDels do not produce stutter artifacts, which is advantageous in the analysis of mixtures containing DNA from two or more contributors. However, most InDels are biallelic, which limits their discrimination power. To overcome this limitation, new genetic markers such as multi-InDels have gained prominence, as they preserve the individual characteristics of InDels while providing increased polymorphism. Multi-InDels are generally classified as microhaplotypes, consisting of two or more closely linked InDel loci within a short DNA segment. Currently, all multi-InDel panels described in the literature have been validated only in Asian populations. The aim of this study was to develop and validate, through computational approaches, a novel set of autosomal multi-InDel markers capable of distinguishing individuals from the Brazilian population as well as from other global populations. Previously, we evaluated three panels proposed and validated in Asian populations to assess their applicability to individuals from Brazil. Public high-coverage whole-genome sequencing data from the 1000 Genomes Project, which encompasses 26 worldwide populations, and from Brazilian individuals (Projeto Saúde, Bem-estar e Envelhecimento - SABE) were utilized to both evaluate existing panels and select new markers. Our results showed that most previously proposed markers were informative for the Brazilian population, as they presented more than three frequent haplotypes of different lengths. However, 64.8% of these markers were prone to amplification and/or sequencing errors due to the presence of repetitive, low-complexity, homopolymeric, or STR-like regions. Thus, in this study, we propose a new multiplex CE-based panel composed of 28 autosomal multi-InDel markers and two sex-determination markers. The panel exhibited high polymorphism across five superpopulations, as well as in Brazilian individuals. The combined match probability (CMP) ranged from 5.66 x 10⁻²⁰ to 2.66 x 10⁻¹⁷, while the combined power of exclusion (CPE) ranged from 0.99958 to 0.99998. Additionally, 94.4% of the generated amplicons were shorter than 250 base pairs (bp). Therefore, the proposed panel represents a useful complementary tool for human identification, suitable for the Brazilian population and globally, particularly in complex forensic cases.
Descrição
Palavras-chave
Genética Humana, Biologia forense, Marcadores genéticos, Microhaplótipo, Multi-InDel, Microhaplotype
Idioma
Português
Citação
RAMOS, Livia Carla Ramos. Construção e validação computacional de um conjunto de marcadores multi-InDels autossômicos para identificação humana. 2025. Tese (Doutorado em Genética) – Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, 2025.


