Publicação: Utilização de inteligência artificial e quimioinformática no desenvolvimento de ferramentas computacionais para o estudo da microdiversidade molecular em exsudatos da fermentação de cacau (Theobroma cacao L.).
dc.contributor.advisor | Castro-Gamboa, Ian | |
dc.contributor.author | Vieira, Rafael | |
dc.contributor.coadvisor | Sousa, Kally Alves de | |
dc.date.accessioned | 2023-11-06T12:53:05Z | |
dc.date.available | 2023-11-06T12:53:05Z | |
dc.date.issued | 2023-10-11 | |
dc.description.abstract | Este trabalho está subdividido em seis capítulos. O capítulo 1 tem por objetivo explorar a variabilidade metabólica de produtos de síntese microbiana, provenientes da fermentação natural de sementes de cacau (Theobroma cacao L.), na identificação de bioativos de interesse industrial e/ou biotecnológico. Para isso, desenvolveu-se o aplicativo multitarefas LUMIOS, um sistema inteligente que consolida algoritmos para desreplicação, integrando modelos de machine learning e abordagens computacionais, o que inclui a docagem molecular, que visam o reconhecimento de feições moleculares em produtos naturais que possam atuar em alvos moleculares associados a doenças respiratórias, como asma e SARS-CoV-2. O capítulo 2 destaca a exploração das misturas complexas do inventário da diversidade metabólica dos exsudatos das sementes fermentadas (e não fermentadas), utilizando o aplicativo LUMIOS, com o intuito de realizar a identificação de sinais oriundos de moléculas de interesse comercial através de ferramentas de desreplicação. O algoritmo LUMIOS efetua comparações com mais de um milhão e duzentos mil espectros de massas, o qual possibilitou a identificação de 13 anotações moleculares, sendo que 10 delas (catequina, trealose, teobromina, procianidina, adenina, indol-3-acetamida, ácido ftálico, anidrido ftálico, fenilalanina e tirosina) apresentaram potenciais para atuarem em alvos de doenças respiratórias. O capítulo 3 apresenta o desenvolvimento e a testagem do aplicativo Chemistika, que, aliado às anotações fornecidas pelo LUMIOS, permite a automatização e tratamento de dados do planejamento de misturas do tipo Simplex- Lattice, do tipo 3x3. Os capítulos 4 e 5 apresentam a utilização do Chemistika para construir modelos que possam prever a intensidade relativa de cada anotação oriunda nas matrizes complexas de cacau e explorar a variabilidade metabólica nas diferentes fases do complexo processo fermentativo. Por fim, o capítulo 6 explora cada anotação molecular apontada pelo LUMIOS à luz da dinâmica molecular (utilizando o algoritmo Gromacs), em um estudo de trajetória de 100 nanossegundos, e faz uso da plataforma CHEIC para analisar os resultados ofertados pelo Gromacs. Os produtos computacionais desenvolvidos neste trabalho, LUMIOS, Chemistika e CHEIC, representam avanços significativos na exploração de matrizes de produtos naturais. Essas ferramentas não apenas automatizam e agilizam o processo de análise, mas também proporcionam uma compreensão mais profunda das complexas interações moleculares presentes nos produtos naturais. A capacidade de identificar rapidamente moléculas de interesse comercial e biotecnológico, prever a intensidade relativa de anotações moleculares e explorar a dinâmica molecular de compostos promissores tem o potencial de acelerar a descoberta de novos bioativos e otimizar o processo de desenvolvimento de novos produtos. Além disso, ao facilitar a exploração racional da microdiversidade presente em sementes de cacau, essas ferramentas podem contribuir para a valorização deste recurso natural e para o desenvolvimento de iniciativas biotecnológicas inovadoras. | pt |
dc.description.abstract | This work is divided into six chapters. Chapter 1 aims to explore the metabolic variability of microbial synthesis products, derived from the natural fermentation of cocoa seeds (Theobroma cacao L.), in the identification of bioactive compounds of industrial and/or biotechnological interest. For this purpose, the multi-tasking application LUMIOS was developed, an intelligent system that consolidates algorithms for dereplication, integrating machine learning models and computational approaches, which includes molecular docking, aimed at recognizing molecular features in natural products that may act on molecular targets associated with respiratory diseases, such as asthma and SARS-CoV-2. Chapter 2 highlights the exploration of the complex mixtures of the metabolic diversity inventory of the exudates of fermented (and non-fermented) seeds, using the LUMIOS application, with the aim of identifying signals originating from molecules of commercial interest through dereplication tools. The LUMIOS algorithm performs comparisons with more than one million two hundred thousand mass spectra, which enabled the identification of 13 molecular annotations, 10 of which (catechin, trehalose, theobromine, procyanidin, adenine, indole-3-acetamide, phthalic acid, phthalic anhydride, phenylalanine, and tyrosine) showed potential to act on targets of respiratory diseases. Chapter 3 presents the development and testing of the Chemistika application, which, together with the annotations provided by LUMIOS, allows the automation and data processing of the Simplex-Lattice mixture design, 3x3 type. Chapters 4 and 5 present the use of Chemistika to construct models that can predict the relative intensity of each annotation originating in the complex matrices of cocoa and explore the metabolic variability in the different phases of the complex fermentation process. Finally, chapter 6 explores each molecular annotation pointed out by LUMIOS in the light of molecular dynamics (using the Gromacs algorithm), in a 100 nanosecond trajectory study, and makes use of the CHEIC platform to analyze the results provided by Gromacs. The computational products developed in this work, LUMIOS, Chemistika, and CHEIC, represent significant advances in the exploration of natural product matrices. These tools not only automate and speed up the analysis process but also provide a deeper understanding of the complex molecular interactions present in natural products. The ability to quickly identify molecules of commercial and biotechnological interest, predict the relative intensity of molecular annotations, and explore the molecular dynamics of promising compounds has the potential to accelerate the discovery of new bioactives and optimize the process of developing new products. Furthermore, by facilitating the rational exploration of the microdiversity present in cocoa seeds, these tools can contribute to the valorization of this natural resource and the development of innovative biotechnological initiatives. | pt |
dc.description.sponsorship | Não recebi financiamento | |
dc.identifier.orcid | 0000-0001-9003-3209 | |
dc.identifier.uri | https://hdl.handle.net/11449/251212 | |
dc.language.iso | por | |
dc.publisher | Universidade Estadual Paulista (Unesp) | |
dc.rights.accessRights | Acesso restrito | |
dc.subject | Aprendizado de máquina | pt |
dc.subject | Docagem molecular | pt |
dc.subject | Redes neurais convolucionais | pt |
dc.subject | Dinâmica molecular | pt |
dc.subject | Produtos naturais | pt |
dc.title | Utilização de inteligência artificial e quimioinformática no desenvolvimento de ferramentas computacionais para o estudo da microdiversidade molecular em exsudatos da fermentação de cacau (Theobroma cacao L.). | pt |
dc.title.alternative | Utilization of artificial intelligence and chemoinformatics in the development of computational tools for the study of molecular microdiversity in cocoa (Theobroma cacao L.) fermentation exudates. | en |
dc.type | Tese de doutorado | |
dcterms.impact | Os resultados alcançados nesta pesquisa de doutorado têm potencial em inserir uma série de repercussões importantes no campo da química de produtos naturais e nas ciências ômicas contemporâneas, tais como: • Identificação de novos compostos terapêuticos: A identificação de 10 moléculas distintas em diferentes fases do processo de fermentação do cacau, com potencial atividade contra alvos biomacromoleculares associados a doenças respiratórias, é um avanço significativo. Isso poderia levar ao desenvolvimento de novos tratamentos para doenças como asma e covid-19, que são grandes desafios de saúde global. • Automatização e eficiência: A oferta de produtos em forma de web plataformas inteligentes que fazem uso de inteligência artificial e técnicas computacionais avançadas, como o LUMIOS, Chemistika e CHEIC, auxiliam na automatização do processamento de dados espectrais e na análise de dinâmica molecular. Ferramentas que permitem não apenas economizar tempo e esforço, mas também minimizar o risco de erros humanos, permitindo que os pesquisadores se concentrem em interpretações e aplicações mais avançadas dos dados. • Interdisciplinaridade: A integração de técnicas de química de produtos naturais, quimioinformática, estatística, docagem e dinâmica molecular na análise de matrizes complexas demonstra a natureza interdisciplinar da pesquisa. Contribuindo de maneira fundamental para as ciências ômicas do século XXI, onde a complexidade dos sistemas biológicos (e das matrizes complexas) requerem uma abordagem integrada. • Aplicabilidade: As ferramentas desenvolvidas são altamente aplicáveis a outras áreas de pesquisa em ciências ômicas e química de produtos naturais. Isso poderia facilitar a descoberta de novos compostos bioativos em outras matrizes biológicas complexas, acelerando o desenvolvimento de novos fármacos e tratamentos. • Democratização do acesso: Ao tornar as plataformas gratuitas, permite-se que pesquisadores, independentemente de seus recursos financeiros ou institucionais, tenham acesso a ferramentas avançadas de análise. Isso é especialmente importante para pesquisadores em países em desenvolvimento ou instituições com recursos limitados. • Promoção da colaboração: A disponibilidade de plataformas gratuitas desenvolvidas durante a elaboração desta tese pode facilitar a colaboração entre pesquisadores de diferentes áreas e instituições, uma vez que todos podem acessar e utilizar as mesmas ferramentas. Isso pode levar a uma maior integração e cooperação na comunidade acadêmica. • Contribuição para a economia local: A exploração da cadeia produtiva, por meio dos processos fermentativos, como os do cacau, para a identificação de moléculas com atividade terapêutica, é um exemplo de economia circular. Isso não apenas contribui para a saúde humana, mas também para a sustentabilidade ambiental e econômica de regiões menos favorecidas, como os estados do centro-norte do país. • Aceleração da pesquisa: As ferramentas computacionais podem processar grandes volumes de dados muito mais rapidamente do que seria possível manualmente. Ao disponibilizar essas ferramentas gratuitamente, pode-se acelerar significativamente o progresso da pesquisa em várias áreas. • Inovação: Ao disponibilizar tais plataformas de maneira gratuita, cria-se um ambiente propício para a inovação, pois permite que pesquisadores de diferentes áreas e perspectivas tenham acesso e contribuam para o desenvolvimento e aprimoramento das ferramentas. • Educação: Plataformas gratuitas são recursos valiosos para a educação e treinamento de estudantes e jovens pesquisadores, o quais podem aprender e praticar novas técnicas e métodos de análise sem a barreira de custos associados ao software proprietário. • Transparência e reprodutibilidade: A disponibilidade de plataformas gratuitas pode ajudar a aumentar a transparência e a reprodutibilidade na pesquisa, pois permite que outros pesquisadores testem e validem os resultados uns dos outros usando as mesmas ferramentas. Portanto, esta pesquisa não apenas contribui para a química de produtos naturais, fornecendo novos compostos potencialmente terapêuticos e ferramentas para sua identificação e análise, mas também para as ciências ômicas do século XXI, fornecendo uma abordagem interdisciplinar e integrada para a análise de sistemas biológicos complexos, promovendo também a colaboração e a inovação, com intuito de acelerar a pesquisa, melhorar a educação, e aumentar a transparência e a reprodutibilidade na pesquisa. | pt |
dspace.entity.type | Publication | |
unesp.campus | Universidade Estadual Paulista (UNESP), Instituto de Química, Araraquara | |
unesp.embargo | 24 meses após a data da defesa | |
unesp.examinationboard.type | Banca pública | |
unesp.graduateProgram | Química - IQAR 33004030072P8 | |
unesp.knowledgeArea | Química | |
unesp.researchArea | Produtos Naturais de Plantas e Organismos Marinhos |
Arquivos
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 3.1 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: