Logo do repositório

Comparação de ferramentas convencionais e modelos de Deep Learning na análise de RNA Velocity em sequenciamento de RNA Single-cell

Carregando...
Imagem de Miniatura

Orientador

Valente, Guilherme Targino

Coorientador

Pós-graduação

Ciências Biológicas (Genética) - IBB

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

A técnica de single-cell RNA sequencing (scRNA-Seq) modernizou a biologia molecular ao possibilitar a análise da expressão gênica em nível de célula individual, revelando a heterogeneidade e a complexidade funcional dos tecidos. Nesse contexto, a análise de RNA velocity se destaca por permitir a inferência da direção e da velocidade das trajetórias celulares com base nas proporções de transcritos processados (spliced) e não processados (unspliced), fornecendo uma visão dinâmica dos estados celulares ao longo do tempo. Essa abordagem é especialmente útil em estudos de diferenciação, transição entre estados e plasticidade celular. Tradicionalmente, métodos como o scVelo utilizam modelos cinéticos baseados em taxas de transcrição e degradação específicas para cada gene. Recentemente, porém, modelos de deep learning vêm sendo aplicados a essa etapa, explorando variational autoencoders (VAEs) para capturar relações não lineares e complexas nos dados de scRNA-Seq. Tais modelos, como DeepVelo, VeloVI e LatentVelo, apresentam-se como alternativas promissoras às abordagens tradicionais na reconstrução de trajetórias celulares. Neste estudo, foram comparadas abordagens clássicas e baseadas em deep learning para a inferência de RNA velocity, utilizando dois conjuntos de dados públicos (GSE149689 de humano, e GSE203233 de camundongo). Após o pré-processamento com Cell Ranger e Scanpy, os dados foram analisados com o scVelo e com os modelos de deep learning mencionados. As comparações foram realizadas por meio da similaridade cosseno entre os vetores de velocidade e da análise do erro quadrático médio (MSE) para avaliar a continuidade das trajetórias celulares. Os resultados demonstraram que os métodos baseados em deep learning geraram inferências mais consistentes e biologicamente plausíveis em comparação ao modelo clássico. Em especial, o DeepVelo apresentou o menor erro de continuidade entre as abordagens de deep learning. Apesar das vantagens em precisão e coerência biológica, essas metodologias exigem maior poder computacional e dependem de uma quantificação precisa dos transcritos spliced e unspliced. Assim, conclui-se que os modelos baseados em VAEs representam um avanço promissor para a análise de RNA velocity em dados de scRNA-Seq, oferecendo novas perspectivas para o estudo de processos celulares complexos.

Resumo (inglês)

The Single-Cell RNA Sequencing (scRNA-Seq) technique offers superior resolution compared to other methods such as Bulk RNA-Seq, enabling a detailed analysis of cellular heterogeneity and gene expression variability among individual cells within a tissue. This approach is crucial for identifying new cell types and discovering specific molecular markers, such as surface proteins, which aid in characterizing previously unknown cell populations. The scRNA-Seq analysis workflow comprises key steps, including Pre-processing, Normalization, Data Correction, Dimensionality Reduction, and Downstream Analysis. These steps ensure that the data, often noisy and subject to biological variations, are properly processed, resulting in coherent and reproducible information. In the Downstream Analysis stage, RNA Velocity analysis stands out for its ability to infer the direction and speed of cellular trajectories based on gene expression dynamics. This technique quantifies unspliced and spliced transcripts, allowing the prediction of cells’ future states over time. Therefore, this inference is essential for studying complex biological processes such as cell differentiation, state transitions, and cellular plasticity. Given the high volume and complexity of scRNA-Seq data, Deep Learning-based models have emerged as alternatives to conventional methods. With multiple layers of artificial neurons, these models can capture nonlinear relationships in the data, providing greater accuracy and robustness in the analysis of large datasets. Specifically, in the RNA Velocity stage, deep learning models present a potential advantage over traditional approaches. This study proposes the application of Deep Learning models in RNA Velocity analysis of scRNA-Seq data and the comparison of their results with widely used classical methods. The reanalysis of public datasets will allow for an evaluation of the advantages and limitations of each approach, highlighting new perspectives that the application of deep learning can bring to this field of study.

Descrição

Palavras-chave

Single-cell RNA sequencing, RNA Velocity, Deep learning (Machine learning), Benchmarking (Management)

Idioma

Português

Citação

SAUDA, Matheus Rodrigues. Comparação de ferramentas convencionais e modelos de Deep Learning na análise de RNA Velocity em sequenciamento de RNA Single-cell. 2026. Dissertação (Mestrado em Genética) – Instituto de Biociências, Universidade Estadual Paulista (UNESP), Botucatu, 2025.

Itens relacionados

Unidades

Item type:Unidade,
Instituto de Biociências
IBB
Campus: Botucatu


Departamentos

Cursos de graduação

Programas de pós-graduação

Item type:Programa de pós-graduação,