Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina
dc.contributor.advisor | Zafalon, Geraldo Francisco Donegá [UNESP] | |
dc.contributor.author | Fola, Anderson Junio de Souza [UNESP] | |
dc.contributor.coadvisor | Yano, Inacio Henrique | |
dc.contributor.institution | Universidade Estadual Paulista (Unesp) | |
dc.date.accessioned | 2025-07-31T20:23:20Z | |
dc.date.issued | 2025-03-31 | |
dc.description.abstract | Sítios ativos, também chamados de sítios catalíticos, são estruturas presentes na superfície de proteínas responsáveis pelas interações das mesmas com os compostos correspondentes, ajudando a determinar sua função. A identificação dos mesmos é objeto de intenso estudo na área de biologia computacional por servir de base para o desenvolvimento e reposicionamento de drogas. Diversas técnicas de aprendizado de máquina e aprendizado profundo vem sendo aplicadas para esse fim, utilizando desde sequências de aminoácidos e modelos tridimensionais até descritores estruturais e físico-químicos obtidos experimentalmente, os quais se mostraram mais eficazes para tal de acordo com estudos estado-da-arte, uma vez que caracterizam os sítios ativos com maior precisão. Desse modo, o presente trabalho realiza a comparação entre métodos de aprendizado de máquina tradicionais e aprendizado profundo utilizando os descritores da base de dados STING (Neshich et al., 2006) a fim de avaliar qual das duas abordagens oferece melhores resultados e boa capacidade de generalização. Os resultados obtidos demonstraram que modelos tradicionais de aprendizado possuem maior capacidade de identificar os padrões presentes nos descritores físico-químicos, enquanto a rede profunda se mostrou de difícil adaptação aos dados e às características do problema. | pt |
dc.description.abstract | Active sites, also known as catalytic sites, are structures located on the surface of proteins responsible for their interactions with ligands compounds, helping to determine their function. Identifying these sites is a subject of intensive research in computational biology as it plays a fundamental role in drug development and repositioning studies. Several machine learning and deep learning techniques have been applied for this purpose, using input data that goes from amino acid sequences and three-dimensional models to structural and physicochemical descriptors obtained experimentally, which have proven to be the most effective according to state-of-the-art studies, as they characterize active sites with greater precision. Accordingly, the present work compares traditional machine learning and deep learning methods using descriptors from the STING database (Neshich et al., 2006) in order to evaluate which of the two approaches provides better results along with good generalization ability. The results obtained showed that traditional learning models have a greater ability to identify the patterns present in the physicochemical descriptors, while the deep network proved to be less adaptable to the data and characteristics of the problem. | en |
dc.identifier.capes | 33004153073P2 | |
dc.identifier.citation | FOLA, Anderson Junio de Souza. Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina. Dissertação (Mestrado em Ciência da Computação). 2025 – Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas (Ibilce), São José do Rio Preto, 2025. | |
dc.identifier.lattes | 2013182476661119 | |
dc.identifier.orcid | 0009-0007-2603-8970 | |
dc.identifier.uri | https://hdl.handle.net/11449/312600 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso aberto | pt |
dc.subject | Biologia computacional | pt |
dc.subject | Proteínas | pt |
dc.subject | Sítios ativos | pt |
dc.subject | Aprendizado de máquina | pt |
dc.subject | Aprendizado profundo | pt |
dc.subject | STING | pt |
dc.subject | Computational biology | en |
dc.subject | Proteins | en |
dc.subject | Active sites | en |
dc.subject | Machine learning | en |
dc.subject | Deep learning | en |
dc.title | Identificação de sitios ativos em proteínas utilizando abordagens de aprendizado de máquina | pt |
dc.title.alternative | Identification of active sites in proteins using machine learning approaches | en |
dc.type | Dissertação de mestrado | pt |
dspace.entity.type | Publication | |
relation.isAuthorOfPublication | 249a54ed-e7b7-4a4a-a4eb-43b8fbb84aaa | |
relation.isAuthorOfPublication.latestForDiscovery | 249a54ed-e7b7-4a4a-a4eb-43b8fbb84aaa | |
unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Biociências, Letras e Ciências Exatas, São José do Rio Preto | pt |
unesp.embargo | Online | pt |
unesp.examinationboard.type | Banca pública | pt |
unesp.graduateProgram | Ciência da Computação - FC/FCT/IBILCE/IGCE | pt |
unesp.knowledgeArea | Computação aplicada | pt |
unesp.researchArea | Inteligência Computacional | pt |
Arquivos
Pacote original
1 - 1 de 1
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 2.14 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: