Logo do repositório
 

Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina

Carregando...
Imagem de Miniatura

Orientador

Zafalon, Geraldo Francisco Donegá

Coorientador

Yano, Inacio Henrique

Pós-graduação

Ciência da Computação - FC/FCT/IBILCE/IGCE

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Dissertação de mestrado

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

Sítios ativos, também chamados de sítios catalíticos, são estruturas presentes na superfície de proteínas responsáveis pelas interações das mesmas com os compostos correspondentes, ajudando a determinar sua função. A identificação dos mesmos é objeto de intenso estudo na área de biologia computacional por servir de base para o desenvolvimento e reposicionamento de drogas. Diversas técnicas de aprendizado de máquina e aprendizado profundo vem sendo aplicadas para esse fim, utilizando desde sequências de aminoácidos e modelos tridimensionais até descritores estruturais e físico-químicos obtidos experimentalmente, os quais se mostraram mais eficazes para tal de acordo com estudos estado-da-arte, uma vez que caracterizam os sítios ativos com maior precisão. Desse modo, o presente trabalho realiza a comparação entre métodos de aprendizado de máquina tradicionais e aprendizado profundo utilizando os descritores da base de dados STING (Neshich et al., 2006) a fim de avaliar qual das duas abordagens oferece melhores resultados e boa capacidade de generalização. Os resultados obtidos demonstraram que modelos tradicionais de aprendizado possuem maior capacidade de identificar os padrões presentes nos descritores físico-químicos, enquanto a rede profunda se mostrou de difícil adaptação aos dados e às características do problema.

Resumo (inglês)

Active sites, also known as catalytic sites, are structures located on the surface of proteins responsible for their interactions with ligands compounds, helping to determine their function. Identifying these sites is a subject of intensive research in computational biology as it plays a fundamental role in drug development and repositioning studies. Several machine learning and deep learning techniques have been applied for this purpose, using input data that goes from amino acid sequences and three-dimensional models to structural and physicochemical descriptors obtained experimentally, which have proven to be the most effective according to state-of-the-art studies, as they characterize active sites with greater precision. Accordingly, the present work compares traditional machine learning and deep learning methods using descriptors from the STING database (Neshich et al., 2006) in order to evaluate which of the two approaches provides better results along with good generalization ability. The results obtained showed that traditional learning models have a greater ability to identify the patterns present in the physicochemical descriptors, while the deep network proved to be less adaptable to the data and characteristics of the problem.

Descrição

Palavras-chave

Biologia computacional, Proteínas, Sítios ativos, Aprendizado de máquina, Aprendizado profundo, STING, Computational biology, Proteins, Active sites, Machine learning, Deep learning

Idioma

Português

Citação

FOLA, Anderson Junio de Souza. Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina. Dissertação (Mestrado em Ciência da Computação). 2025 – Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2025.

Itens relacionados

Financiadores

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação