Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina
Carregando...
Arquivos
Data
Autores
Orientador
Zafalon, Geraldo Francisco Donegá 

Coorientador
Yano, Inacio Henrique
Pós-graduação
Ciência da Computação - FC/FCT/IBILCE/IGCE
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Dissertação de mestrado
Direito de acesso
Acesso aberto

Resumo
Resumo (português)
Sítios ativos, também chamados de sítios catalíticos, são estruturas presentes na superfície de proteínas responsáveis pelas interações das mesmas com os compostos correspondentes, ajudando a determinar sua função. A identificação dos mesmos é objeto de intenso estudo na área de biologia computacional por servir de base para o desenvolvimento e reposicionamento de drogas. Diversas técnicas de aprendizado de máquina e aprendizado profundo vem sendo aplicadas para esse fim, utilizando desde sequências de aminoácidos e modelos tridimensionais até descritores estruturais e físico-químicos obtidos experimentalmente, os quais se mostraram mais eficazes para tal de acordo com estudos estado-da-arte, uma vez que caracterizam os sítios ativos com maior precisão. Desse modo, o presente trabalho realiza a comparação entre métodos de aprendizado de máquina tradicionais e aprendizado profundo utilizando os descritores da base de dados STING (Neshich et al., 2006) a fim de avaliar qual das duas abordagens oferece melhores resultados e boa capacidade de generalização. Os resultados obtidos demonstraram que modelos tradicionais de aprendizado possuem maior capacidade de identificar os padrões presentes nos descritores físico-químicos, enquanto a rede profunda se mostrou de difícil adaptação aos dados e às características do problema.
Resumo (inglês)
Active sites, also known as catalytic sites, are structures located on the surface of proteins responsible for their interactions with ligands compounds, helping to determine their function. Identifying these sites is a subject of intensive research in computational biology as it plays a fundamental role in drug development and repositioning studies. Several machine learning and deep learning techniques have been applied for this purpose, using input data that goes from amino acid sequences and three-dimensional models to structural and physicochemical descriptors obtained experimentally, which have proven to be the most effective according to state-of-the-art studies, as they characterize active sites with greater precision. Accordingly, the present work compares traditional machine learning and deep learning methods using descriptors from the STING database (Neshich et al., 2006) in order to evaluate which of the two approaches provides better results along with good generalization ability. The results obtained showed that traditional learning models have a greater ability to identify the patterns present in the physicochemical descriptors, while the deep network proved to be less adaptable to the data and characteristics of the problem.
Descrição
Palavras-chave
Biologia computacional, Proteínas, Sítios ativos, Aprendizado de máquina, Aprendizado profundo, STING, Computational biology, Proteins, Active sites, Machine learning, Deep learning
Idioma
Português
Citação
FOLA, Anderson Junio de Souza. Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina. Dissertação (Mestrado em Ciência da Computação). 2025 – Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2025.