Publicação: Utilização de inteligência artificial e quimioinformática no desenvolvimento de ferramentas computacionais para o estudo da microdiversidade molecular em exsudatos da fermentação de cacau (Theobroma cacao L.).
Carregando...
Data
Autores
Orientador
Castro-Gamboa, Ian
Coorientador
Sousa, Kally Alves de
Pós-graduação
Química - IQAR 33004030072P8
Curso de graduação
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Estadual Paulista (Unesp)
Tipo
Tese de doutorado
Direito de acesso
Acesso restrito
Resumo
Resumo (português)
Este trabalho está subdividido em seis capítulos. O capítulo 1 tem por objetivo explorar a variabilidade metabólica de produtos de síntese microbiana, provenientes da fermentação natural de sementes de cacau (Theobroma cacao L.), na identificação de bioativos de interesse industrial e/ou biotecnológico. Para isso, desenvolveu-se o aplicativo multitarefas LUMIOS, um sistema inteligente que consolida algoritmos para desreplicação, integrando modelos de machine learning e abordagens computacionais, o que inclui a docagem molecular, que visam o reconhecimento de feições moleculares em produtos naturais que possam atuar em alvos moleculares associados a doenças respiratórias, como asma e SARS-CoV-2. O capítulo 2 destaca a exploração das misturas complexas do inventário da diversidade metabólica dos exsudatos das sementes fermentadas (e não fermentadas), utilizando o aplicativo LUMIOS, com o intuito de realizar a identificação de sinais oriundos de moléculas de interesse comercial através de ferramentas de desreplicação. O algoritmo LUMIOS efetua comparações com mais de um milhão e duzentos mil espectros de massas, o qual possibilitou a identificação de 13 anotações moleculares, sendo que 10 delas (catequina, trealose, teobromina, procianidina, adenina, indol-3-acetamida, ácido ftálico, anidrido ftálico, fenilalanina e tirosina) apresentaram potenciais para atuarem em alvos de doenças respiratórias. O capítulo 3 apresenta o desenvolvimento e a testagem do aplicativo Chemistika, que, aliado às anotações fornecidas pelo LUMIOS, permite a automatização e tratamento de dados do planejamento de misturas do tipo Simplex- Lattice, do tipo 3x3. Os capítulos 4 e 5 apresentam a utilização do Chemistika para construir modelos que possam prever a intensidade relativa de cada anotação oriunda nas matrizes complexas de cacau e explorar a variabilidade metabólica nas diferentes fases do complexo processo fermentativo. Por fim, o capítulo 6 explora cada anotação molecular apontada pelo LUMIOS à luz da dinâmica molecular (utilizando o algoritmo Gromacs), em um estudo de trajetória de 100 nanossegundos, e faz uso da plataforma CHEIC para analisar os resultados ofertados pelo Gromacs. Os produtos computacionais desenvolvidos neste
trabalho, LUMIOS, Chemistika e CHEIC, representam avanços significativos na exploração de matrizes de produtos naturais. Essas ferramentas não apenas automatizam e agilizam o processo de análise, mas também proporcionam uma compreensão mais profunda das complexas interações moleculares presentes nos produtos naturais. A capacidade de identificar rapidamente moléculas de interesse comercial e biotecnológico, prever a intensidade relativa de anotações moleculares e explorar a dinâmica molecular de compostos promissores tem o potencial de acelerar a descoberta de novos bioativos e otimizar o processo de desenvolvimento de novos produtos. Além disso, ao facilitar a exploração racional da microdiversidade presente em sementes de cacau, essas ferramentas podem contribuir para a valorização deste recurso natural e para o desenvolvimento de iniciativas biotecnológicas inovadoras.
Resumo (português)
This work is divided into six chapters. Chapter 1 aims to explore the metabolic variability of microbial synthesis products, derived from the natural fermentation of cocoa seeds (Theobroma cacao L.), in the identification of bioactive compounds of industrial and/or biotechnological interest. For this purpose, the multi-tasking application LUMIOS was developed, an intelligent system that consolidates algorithms for dereplication, integrating machine learning models and computational approaches, which includes molecular docking, aimed at recognizing molecular features in natural products that may act on molecular targets associated with respiratory diseases, such as asthma and SARS-CoV-2. Chapter 2 highlights the exploration of the complex mixtures of the metabolic diversity inventory of the exudates of fermented (and non-fermented) seeds, using the LUMIOS application, with the aim of identifying signals originating from molecules of commercial interest through dereplication tools. The LUMIOS algorithm performs comparisons with more than one million two hundred thousand mass spectra, which enabled the identification of 13 molecular annotations, 10 of which (catechin, trehalose, theobromine, procyanidin, adenine, indole-3-acetamide, phthalic acid, phthalic anhydride, phenylalanine, and tyrosine) showed potential to act on targets of respiratory diseases. Chapter 3 presents the development and testing of the Chemistika application, which, together with the annotations provided by LUMIOS, allows the automation and data processing of the Simplex-Lattice mixture design, 3x3 type. Chapters 4 and 5 present the use of Chemistika to construct models that can predict the relative intensity of each annotation originating in the complex matrices of cocoa and explore the metabolic variability in the different phases of the complex fermentation process. Finally, chapter 6 explores each molecular annotation pointed out by LUMIOS in the light of molecular dynamics (using the Gromacs algorithm), in a 100 nanosecond trajectory study, and makes use of the CHEIC platform to analyze the results provided by Gromacs. The computational products developed in this work, LUMIOS, Chemistika, and CHEIC, represent significant advances in the exploration of natural product matrices. These tools not
only automate and speed up the analysis process but also provide a deeper understanding of the complex molecular interactions present in natural products. The ability to quickly identify molecules of commercial and biotechnological interest, predict the relative intensity of molecular annotations, and explore the molecular dynamics of promising compounds has the potential to accelerate the discovery of new bioactives and optimize the process of developing new products. Furthermore, by facilitating the rational exploration of the microdiversity present in cocoa seeds, these tools can contribute to the valorization of this natural resource and the development of innovative biotechnological initiatives.
Descrição
Palavras-chave
Aprendizado de máquina, Docagem molecular, Redes neurais convolucionais, Dinâmica molecular, Produtos naturais
Idioma
Português