Camila Gonçalves Garcia Busca por flavonoides como potencial ligante ao domínio RBD da proteína S para combate da Covid-19 por meio da plataforma DockThor São José do Rio Preto 2022 Câmpus de São José do Rio Preto Camila Gonçalves Garcia Busca por flavonoides como potencial ligante ao domínio RBD da proteína S para combate da Covid-19 por meio da plataforma DockThor Dissertação apresentada como parte dos requisitos para obtenção do título de Mestre em Biofísica Molecular, junto ao Programa de Pós-Graduação em Biofísica Molecular, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CAPES Orientador: Prof. Dr. Marcelo Andrés Fossey Coorientadora: Profa. Dra. Gabriela Campos de Araújo São José do Rio Preto 2022 Camila Gonçalves Garcia Busca por flavonoides como potencial ligante ao domínio RBD da proteína S para combate da Covid-19 por meio da plataforma DockThor Dissertação apresentada como parte dos requisitos para obtenção do título de Mestre em Biofísica Molecular, junto ao Programa de Pós-Graduação em Biofísica Molecular, do Instituto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CAPES Banca Examinadora Prof. Dr. Marcelo Andres Fossey UNESP – São José do Rio Preto Orientador Prof. Dr. Ícaro Putinhon Caruso UNESP – São José do Rio Preto Profa. Dra. Ingrid Bernardes Santana Martins UFRJ – Instituto de Biofísica Carlos Chagas Filho São José do Rio Preto 15 de Junho de 2022 AGRADECIMENTOS O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - 88887.506475/2020-00 001. Esta pesquisa contou com a colaboração direta ou indireta de diversas pessoas. Agradeço à minha família e amigos pelo apoio, suporte e paciência durante esse período. Ao meu orientador Prof. Dr. Marcelo Andrés Fossey pelo incentivo, apoio e disponibilidade durante esse percurso. À minha coorientadora Profa. Dra. Gabriela Campos de Araújo por toda ajuda, paciência e apoio para o desenvolvimento desse trabalho. À CAPES pelo suporte financeiro. E a todos professores que participaram desse percurso e disponibilizaram algum tempo para auxiliar a minha caminhada em uma nova área de conhecimento. “A verdade é uma coisa bela e terrível, e, portanto, deve ser tratada com grande cautela.” J. K. Rowling RESUMO O enfrentamento da pandemia, iniciada no ano de 2019 e ocasionada pelo novo coronavírus, o SARS-CoV-2, tem provocado muitos desafios para a ciência do mundo todo. É inédito o modo acelerado, pelo qual vem ocorrendo a busca por potenciais tratamentos de combate ao vírus. Na esteira dessa preocupação, esta pesquisa tem como objetivo buscar flavonoides com potencial de ligantes ao domínio RBD da proteína S, para o combate da Covid-19. A busca tem como objeto seis farmacológicos originados da flora brasileira. Trata-se de flavonoides, compostos com considerável capacidade de promover benefícios à saúde. A definição da estrutura do domínio RBD, da proteína Spike (S) do SARS-CoV-2, que foi utilizada nesta pesquisa, se deu a partir de uma busca em bancos de dados, por estruturas do SARS-CoV-2 com e sem inibidores complexados. A seleção dos seis flavonoides aplicados na busca por novos inibidores, junto ao SARS-CoV-2, foi realizada a partir do estudo de alguns trabalhos que pesquisaram os diferentes tipos desses compostos fenólicos. Em seguida, realizou-se o docking molecular dos compostos e estruturas selecionados na proteína alvo. Foram realizados dockings utilizando a estrutura RBD da proteína S, com o receptor ACE2 humano e sem a ACE2, permitindo a comparação entre os resultados encontrados. Essa comparação entre os dockings, com e sem a ACE2, permitiu observar por exemplo diferenças nas quantidades de aminoacidos encontrados e na qualificação posicional da genisteína. Desse modo, teve-se como resultado a determinação de um conjunto de compostos promissores, sendo possível destacar que a melhor correlação foi verificada nas áreas próximas às folhas β antiparalelas da estrutura analisada. Palavras chaves: Proteína S. Triagem. Docking molecular. Covid-19. DockThor. ABSTRACT Facing the pandemic, which began in 2019 and caused by the new coronavirus, SARS-CoV-2, has caused many challenges for science around the world. The accelerated way in which the search for potential treatments to combat the virus has been taking place is unprecedented. In the wake of this concern, this research aims to seek flavonoids with potential as S-protein ligands to combat Covid-19. The search has as its object six pharmacological products originated from the Brazilian flora. These are flavonoids, compounds with considerable capacity to promote health benefits. The use of the Spike (S) protein of SARS- CoV-2 as a target was defined from a search in databases, for structures of SARS-CoV-2 with and without complexed inhibitors. The definition of the six flavonoids used in the search for new inhibitors, together with SARS-CoV-2, was carried out from the study of some works that researched the different types of these phenolic compounds. Then, the molecular docking of the selected compounds and structures in the target protein was performed. Dockings were performed using the RBD structure of protein S, with the human ACE2 receptor and without the ACE2, allowing the comparison between the results found. This comparison between the dockings, with and without ACE2, allowed us to observe, for example, differences in the amounts of amino acids found and in the positional qualification of genistein. Thus, the result was the determination of a set of promising compounds, being possible to highlight that the best correlation was verified in the areas close to the antiparallel β sheets of the analyzed structure. Keywords: Protein S. Screening. Molecular Docking. Covid-19. DockThor. LISTA DE ILUSTRAÇÕES Figura 1: Probabilidade de contagio do vírus relacionada a utilização de máscaras...................................................................................................16 Figura 2: Quadro com casos mundiais de contaminação e mortes de COVID-19 datado de 14/11/2020 .............................................................17 Figura 3: Quadro com casos mundiais de contaminação, mortes e aplicações de vacinas datado de 21/10/2021 ..........................................17 Figura 4: Ilustração da cepa da SARS-CoV-2..........................................18 Figura 5: Constituição do vírus..................................................................23 Figura 6: O genoma do coronavírus de RNA de cadeia simples, de aproximadamente 26 a 32 kb. Organizado na ordem de 5ʹ o trecho de leitura aberto (ORF1a/b) que representa dois terços do genoma de CoV e codifica a grande poliproteína, que posteriormente será clivada em PP1a e PP1ab . O terço de 3ʹ do genoma do CoV codifica as proteínas estruturais (S, E, M e N), essenciais para ligação vírus na célula hospedeira e montagem do virion.............................................................24 Figura 7: ciclo SARS-CoV-2 na célula hospedeira...................................26 Figura 8: Representação da Covid ...........................................................27 Figura 9: Estrutura Covid, Spike e RBD....................................................28 Figura 10: Ligação Spike e ACE2..............................................................30 Figura 11: Estrutura geral de um flavonóide..............................................31 Figura 12: Representação chave-fechadura.............................................33 Figura 13: Formação do complexo proteína-ligante..................................34 Figura 14: Energia mínima e o melhor resultado entre receptor ligante.....35 Figura 15: Configuração de grade utilizada pelo DockThor.......................37 Figura 16: Representação geométrica do ângulo de torção......................38 Figura 17: Ligações entre dipolos atomicos/moleculares.........................39 Figura 18: Representação da Lei de Coulomb.........................................39 Figura 19: Representação dos mínimos locais encontrados ...................41 Figura 20: Distribuição aleatória X Distribuição de Cauchy......................42 Figura 21: Processo metodológico do desenvolvimento de uma pesquisa na área de docking molecular...................................................................44 Figura 22: Estrutura 6LGZ : RBD(laranja) e ACE2(verde).........................45 Figura 23: Gráfico aminoácidos mais frequentes encontrados..................56 Figura 24: Gráfico de frequência de aminoácidos encontrados referentes a tabela 4...................................................................................................58 LISTA DE TABELAS Tabela 1: Descrição dos flavonoides selecionados ...................................47 Tabela 2: Coordenadas utilizadas para os dockings direcionados.............50 Tabela 3: Resultados................................................................................53 Tabela 4: Análise dos aminoácidos encontrados em maior quantidade.....57 Tabela 5: Representação final dos ligantes pelo PyMOL...........................58 SUMÁRIO 1 INTRODUÇÃO ......................................................................................13 1.1 Bioinfirmática .......................................................................................21 1.2 Sequenciamento genético e estrutura do vírus ................................22 1.3 Proteína S ..............................................................................................27 1.4 Polifenóis: os flavonoides e sua ação antivira ..................................30 2 OBJETIVO E FUNDAMENTAÇÃO ........................................................32 2.1 Fundamentação teórica (modelagem matemática, definição de docking, descrição matemática da plataforma utilizada) .................33 2.2 Definição e análise matemática da afinidade (score) e da plataforma Dockthor.............................................................................36 3 MATERIAIS E MÉTODOS ......................................................................43 3.1 Métodos .................................................................................................43 3.2 Identificação do alvo molecular e seleção de flavonoides ..............44 4 RESULTADOS E DISCUSSÃO .............................................................49 5 CONCLUSÃO.........................................................................................61 REFERÊNCIAS ......................................................................................62 12 1 INTRODUÇÃO Desde dezembro de 2019, quando foi feita a comunicação oficial da cidade de Wuhan à OMS sobre a nova cepa a população mundial vem enfrentando um novo tipo de coronavírus, o SARS-CoV-2 que gerou uma situação pandêmica, a qual fez com que o mundo repensasse o modo de vida e a rotina à qual tinha se adaptado. O SARS-CoV-2 é um dos agentes causadores dessa síndrome respiratória aguda grave – SARS- Severe Acute Respiratory Syndrome. A denominação Covid-19 deriva das palavras Corona VIrus Disease e o algarismo 19 refere-se ao ano de surgimento da síndrome, 2019. O Covid-19 entra para a História das pandemias, no ano de 2020, de modo semelhante à Peste Bubônica no Século XIV, à Varíola em 1896-1980, à Gripe Espanhola entre 1918 e 1920 e, em menor escala, à Gripe Suína-H1N1em 2009. Nesse novo momento histórico que passamos, assim como nos outros citados, as maiores taxas de mortalidade registradas se dão em especial, nos espaços geográficos que apresentam maior vulnerabilidade social. Ou seja, onde as condições socioeconômicas são mais precárias e há uma maior dificuldade em se realizar o isolamento social, uma das medidas preventivas dessa nova doença, considerando que ainda não havia vacinas ou remédio para sua prevenção. (GUIMARÃES et. al. 2020) Nesse sentido, Guimarães (2020) desenvolveu uma pesquisa, na qual analisou 8 aspectos principais, quais sejam: “ 1) a área total da ocorrência de casos da Covid-19 no Brasil; 2) a área total da ocorrência de casos de Covid-19 nos 5.570 municípios brasileiros e no Distrito Federal; 3) onde ocorrem casos da Covid-19 nas regiões brasileiras (macrorregiões do IBGE e espaços opacos e luminosos) no período determinado: Ti; 4) como evoluíram os casos da Covid- 19 pelo território brasileiro; 5) como evoluiu, período a período, a ocorrência de casos da Covid-19 em um conjunto de municípios brasileiros; 6) o grau de correspondência espacial entre as áreas de ocorrência de casos de Covid-19 e seus fatores de risco, bem como as vulnerabilidades socioespaciais; 7) no conjunto de todos os municípios, quais são os que apresentam maior semelhança segundo os casos da Covid-19? E de óbitos? Considerar regiões metropolitanas, capitais, cidades médias e interioranas; 8) no período de Ti, 13 como evoluiu a correspondência espacial entre a ocorrência de casos da Covid- 19 localmente’’ (GUIMARÃES et. al. 2020, p.125). A partir do mapeamento daqueles oito aspectos, Guimaraes concluiu que o vírus se espalhou com mais intensidade nas áreas com menor isolamento. A direção, o tempo e a intensidade dos casos de Covid-19 apresentaram importante relação com a questão econômica. O autor demonstrou como a Covid-19 se dispersou de forma variada no território brasileiro, sendo influenciada por circunstancialidades, com destaque para as condições socioeconômicas (GUIMARÃES et. al. 2020, p.136). À luz dos estudos de Guimarães (2020), é possível reforçar, além de outros aspectos, que o isolamento social definido pela Organização Mundial de Saúde (OMS), com o aval de diversos especialistas, como a principal medida de combate à Covid-19., teve importante impacto na dispersão da doença. Além dele foram recomendadas também outras medidas, como é o caso dos hábitos de higiene mais rigorosos. Uma outra medida protetora comprovada logo no início, pela ciência, por meio de dados estatísticos, foi o uso de máscaras, descritos na figura 3. Foi evidenciado que em um par de pessoas, onde uma delas (pessoa A) está contaminada pelo vírus (portador) e a outra (pessoa B) não; caso a pessoa A esteja sem máscara e a pessoa B com máscara há uma probabilidade de 70% de que haja o contágio, no caso contrário, o portador do vírus estando de máscara e a pessoa B não, há uma probabilidade de contaminação em torno de 5%. Essa porcentagem cai para 1,5% quando ambas as pessoas estão fazendo uso de máscara. 14 Figura 1: Probabilidade de contágio do vírus relacionada a utilização de máscaras Fonte adaptada: Iamarino, 2020 Trata-se de medidas mais difíceis de se adotar em populações em condições socioeconômicas desfavorecidas, por isso se encaixam nos motivos da maior taxa de mortalidade se concentrar entre essas populações, conforme apontado por Guimarães (2020). No que se refere à importância da vacinação, as figuras 1 e 2 apresentam uma comparação dos casos no período de novembro de 2020, quando as principais medidas eram o isolamento e uso de máscaras e em outubro de 2021 quando já havia vacinas disponíveis para uma quantidade considerável de pessoas ao redor do mundo. Na figura 2 é possível analisar o número de casos diários, por meio do gráfico presente no canto inferior direito, comparado ao número de casos diários presentes no gráfico em vermelho no canto superior direito na figura 3. Essa comparação deixa evidente a queda de casos diários após o início das vacinações, uma vez que em novembro de 2020 os casos diários chegaram a aproximadamente 600.000 e, em outubro de 2021, após o início da vacinação, é perceptível uma média de 310.478,5 casos diários (média realizada com os dados do dia 1/10 ao 20 /10). 15 Figura 2: Quadro com casos mundiais de contaminação e mortes de COVID-19 datado de 14/11/2020 Fonte: Johns Hopkins University. COVID-19: Dashboard by the center for systems Science and engineering (CSSE). Disponível em: Acesso em: 14 de nov. de 2020 Figura 3: Quadro com casos mundiais de contaminação, mortes e aplicações de vacinas datado de 21/10/2021 Fonte: Johns Hopkins University. COVID-19: Dashboard by the center for systems Science and engineering (CSSE). Disponível em: Acesso em: 21 de out. de 2021 Por se tratar de uma nova doença que gerou um colapso no sistema de saúde de diversos países, lotando hospitais e sobrecarregando médicos, enfermeiros e técnicos da área de saúde, os pesquisadores tiveram que buscar em tempo recorde formas de tratamento ou de amenizar o quadro de pacientes graves, além da corrida por vacinas com eficácia satisfatória. Desse modo, https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6 16 encontramos na ciência a melhor alternativa para aliviar o trágico quadro de perdas humanas, que se abateu sobre o mundo, desde janeiro de 2020. Nesse sentido, com a pandemia do Covid-19, mais uma vez a Ciência se revelou fundamental, para a busca por respostas a situação de urgência que se apresentou para o mundo. Isso porque, pela primeira vez na história, rapidamente foi possível identificar o novo vírus como pertencente ao grupo dos coronavírus, possibilitando acompanhar essa pandemia desde o princípio e ainda criar protocolos de estudos e de aprovação de vacinas e medicamentos. (IAMARINO & LOPES, 2020). Figura 4: Ilustração da cepa da SARS-CoV-2 Fonte: https://www.sanarmed.com/coronavirus-origem-sinais-sintomas-achados- tratamentos O SARS-CoV-2 é uma mutação do SARS-CoV, que já circulava entre a população humana. Em 2003 foi registrada uma epidemia de coronavírus (SARS-CoV), que também partiu da China, chegou a atingir 26 países e causou milhares de mortes. Descobriu-se que foi um vírus transmitido de outros animais para seres humanos, tornando essencial conhecer seu hospedeiro inicial, para se analisar possíveis chances de uma epidemia assim acontecer novamente. Desse modo, foram descobertos mais de 200 tipos de coronavírus em diversos animais silvestres e, nesse caso de 2002 constatou-se que o coronavírus era https://www.sanarmed.com/coronavirus-origem-sinais-sintomas-achados-tratamentos https://www.sanarmed.com/coronavirus-origem-sinais-sintomas-achados-tratamentos 17 muito semelhante ao de morcegos que viviam na região da China. Concluiu-se ainda que o SARS-CoV foi inicialmente transmitido dos morcegos para os civetas, pequenos mamíferos asiáticos consumidos como alimento na China e na Índia. Dez anos depois, em 2012, foi identificada no Oriente Médio uma mutação de coronavírus chamada de MERS-CoV (Middle East Respiratory Sydrome COronaVírus), nesse caso o coronavírus de morcegos foi transmitido para os camelos, animais de criação na Arábia Saudita. Os camelos passaram a doença para seus tratadores, que passaram para os médicos gerando mais um grande surto. Atualmente, sabe-se que o surgimento do SARS-CoV-2 advém de mutações do antigo SARS-CoV ocorridas em populações de morcegos, que posteriormente passaram a infectar humanos e, assim como a influenza (H5N1, H1N1 e H7N9), emergiram de populações de animais comercializados vivos nos chamados “mercados úmidos”, causando infecções respiratórias graves e mortalidade nos seres humanos, assim como crises econômicas regionais e globais. (GE et al., 2013; MENACHERY et al., 2015; SONG et al., 2019; ZUMLA et al., 2016). A transmissão e infecção pelo SARS-CoV-2 ocorre de humano para humano por meio de gotículas respiratórias ou pelo convívio direto com o infectado. Essa doença sistêmica dá origem a um conjunto de sintomas, que são em geral, tosse, dores de cabeça, perda de olfato e paladar, febre e falta de ar, os quais podem aparecer entre 2 e 14 dias após a infecção. No entanto, grande parte dos infectados podem ser assintomáticos. Em casos graves podem aparecer complicações hepáticas, gastrointestinais, neurológicas, insuficiência respiratória, pneumonia grave, levando o paciente a necessitar de ventilação mecânica, ou até mesmo ao óbito. (SHANMUGARAJ et al., 2020; ZUMLA et al., 2016). Desde o início da pandemia alguns remédios já disponíveis têm sido utilizados para tentar controlar a doença em pacientes com COVID-19. Dentre esses medicamentos que foram testados temos: a ribavirina, corticosteroides e a cloroquina/hidroxicloroquina. A ribavirina é conhecida há bastante tempo por ser um antiviral de amplo espectro e a cloroquina é rotineiramente utilizada no tratamento de enfermidades como malária, amebíase, HIV e doenças 18 autoimunes (HAAGMANS; OSTERHAUS, 2006; VINCENT et al., 2005; ZUMLA et al., 2016). Alguns estudos mais recentes, da segunda metade do ano de 2020, mostraram que a má administração desses medicamentos pode piorar o quadro de pacientes que estão contaminados e com sintomas leves. Além do fato de não serem preventivos e nem bem-sucedidos para a cura dessa infecção. Com a liberação emergencial de algumas vacinas foi possível reverter paulatinamente o quadro de colapso mundial dos sistemas de saúde, mas como observado na figura 2, em alguns países esse colapso se arrastou pelo ano de 2021. É possível observar também que a aplicação de vacinas ainda não se configurou como uma solução do problema. A doença continua a acometer pessoas num ritmo elevado. A presente pesquisa, ao optar pela utilização dos flavonoides, é influenciada pela imunoterapia, um tratamento cujo foco é a utilização de partes do sistema imunológico para o combate de determinadas doenças. Pode ser realizada estimulando as defesas naturais do sistema imunológico fazendo com que ele trabalhe com mais eficiência para atacar células infectadas. É possível efetivá-la também por meio da produção de substâncias em laboratórios que podem ser usadas para ajudar no combate a infecção Acesso em: 01/05/2022 A imunoterapia é um tratamento biológico cujo objetivo é o de potencializar o sistema imunológico. Esse método é utilizado para o tratamento das infecções e diversos tipos de doenças, incluindo câncer, doenças autoimunes como o Lúpus e Crohn, dentre outras. Coughlin e Prabhakar relatam que o uso de anticorpos monoclonais humanos (hmAbs) mostraram eficiência na terapêutica de pacientes com SARS- CoV. A maioria dos hmAbs reagiu especificamente com o domínio de ligação ao receptor (RBD) da proteína spike (S) impedindo a ligação ao receptor. Sendo assim, focaremos nesta pesquisa na proteína S do vírus, mais especificamente em seu receptor (RBD) (COUGHLIN; PRABHAKAR, 2012). No contexto da imunoterapia, os flavonoides que são o objeto desta pesquisa se constituem como compostos polifenólicos naturais nas plantas, encontrados em sementes, caules, folhas, flores e frutas. Esses compostos têm importantes efeitos bioquímicos e fisiológicos nas plantas além de atuarem como 19 antioxidantes, inibidores de enzimas, precursores de substâncias tóxicas e pigmentos tonalisantes. Os flavonóides são também um dos responsáveis pela fotossensibilização e transferência de energia, ações de hormônios e reguladores de crescimento, controle de respiração, fotossíntese, morfogênese, determinação de sexo e defesa contra infecções (PUTINHON, 2016, p. 20) . A identificação de flavonoides com maior potencial de ligação à proteína S tem como base metodológica a bioinformática. 1.1 Bioinformática A bioinformática ainda se configura como uma ciência nova e complexa, cuja definição não é trivial, sendo assim as discussões sobre suas características possuem uma certa flexibilidade. Genericamente podemos definir a Bioinformática como o ramo da ciência que se utiliza de ferramentas computacionais para analisar, manipular e compartilhar questões referentes às ciências biológicas. Esse ramo pode ser relacionado também a área de planejamento de novos fármacos. (VERLI, 2014). Segundo Hugo Verli (2014, p. 3-5), a década de 1950 pode ser considerada como o marco inicial da bioinformática. Nesse ano foi publicado pela Nature o trabalho de Watson e Crick sobre a estrutura em hélice da molécula de DNA, considerado como base essencial, para os estudos atinentes ao atual entendimento das moléculas e suas devidas funções. Dentre esses estudos destacam-se: no início da década de 1950 o trabalho de Linus Pauling e Robert Corey, dez anos depois, os estudos de Ramachandran; além desses dois trabalhos, cumpre destacar a importância da pesquisa de Margaret Dayhoff, dedicada à sistematização do conhecimento das proteínas, no ano de 1965, que se configurou como a base do que entendemos hoje por bioinformática. Outro trabalho fundamental para a bioinformática, trata dos estudos de John Ward e Robert Stotz, os quais tiveram como resultado o primeiro relato da utilização de programas computacionais para visualizar estruturas tridimensionais, que foi publicado por Cyrus Levinthal, no ano de 1966 (VERLI, 2014). Nesta área de amplo espectro a identificação de um problema biológico relevante para trabalhar, que disponha de dados relevantes e demande a utilização de modelo, algoritmo, ferramentas, configura-se como uma pesquisa em bioinformática. Nesse sentido, trata-se de um campo interdisciplinar de 20 pesquisa. É um campo de pesquisa no qual se aplicam diversas áreas da ciência em técnicas de informática. Os dados obtidos promovem uma otimização, principalmente de tempo e custos para se chegar ao estudo experimental (in vivo) (JARDINE et al., 2017). Entre as principais funções dessa área estão: desenvolvimentos de algoritmos, análise estruturais de comparação, classificação, predição de proteínas, predição de interações de proteína ligante, interpretação de dados, análise em banco de dados. A partir dessas funções é possível atuar em diferentes áreas como, por exemplo, a medicina molecular, o desenvolvimento de fármacos, a análise forense, a biotecnologia, entre outras (JARDINE et al.,2017). Desde dezembro de 2019, mais uma vez, a área de bioinformática tem sido fundamental na busca por novos saberes que vêm contribuindo sobremaneira para o enfrentamento dessa situação pandêmica. 1.2 Sequenciamento genético e estrutura do vírus O genoma do novo coronavírus já foi sequenciado e os cientistas descobriram que esse vírus está inteiramente correlacionado a outros coronavírus conhecidos, apresentando 80% de identidade ao SARS-CoV. Os Coronavírus são da ordem Nidovirales, família Coronaviridae, são vírus de RNA de cadeia simples não segmentada, de sentido positivo e possuem aproximadamente 26 a 32 kb. Os CoVs são subdivididos em quatro gêneros: Alphacoronavírus, Betacoronavírus (βCoV), Gammacoronavírus e Deltacoronavírus, sendo o SARS-CoV-2 um Betacoronavírus (CHEN; YIU; WONG, 2020; LI; CLERCQ, 2020). Os vírus dessa família possuem seu corpo formado apenas por material genético e protegido por dois envoltórios, um capsídeo, um envoltório de proteínas, e um envelopado, uma proteção lipídica externa, conforme apresentado na Figura 5. 21 Figura 5: Constituição do vírus Fonte: Elaborado pela autora, a partir das informações de https://www.youtube.com/watch?v=pak1Yr0UmZs Os genes do coronavírus (Figura 5) codificam quatro proteínas estruturais que são a glicoproteína Spike (S), a proteína de Envelope (E), a proteína da Membrana (M) e a proteína Nucleocapsídica (N). A proteína N possui um núcleo capsídeo que tem forma helicoidal e interage com o RNA viral para formar a ribonucleoproteína (complexos de ácido ribonucleico (ARN) e proteína presentes no núcleo celular durante a transcrição (processo no qual ocorre a síntese do RNA a partir do DNA) e subsequente modificação pós-transcricional do recém-sintetizado ARN (pré-ARNm). A proteína E auxilia na montagem dos virions (partícula de vírus que se encontra fora das células hospedeiras), além de apresentar atividade de canal iônico in vitro, que é eficiente para o tráfego de virions pela via secretora. Foi demonstrado também que a proteína E inibe a resposta ao estresse da célula hospedeira, implicando diretamente na patogênese. A M é a proteína integral de membrana responsável pela montagem do vírus, atuando no ajuste de tamanho, formato e na captura de outras proteínas estruturais no local de brotamento (KANDEEL et al., 2020; NEUMAN et al., 2011; RISCO et al., 1996; RUCH; MACHAMER, 2012). O genoma do coronavírus (Figura 6) é organizado em 10 trechos de leitura aberta (ORFs), a extremidade 5' codifica a ORF1a e ORF1b, que são traduzidos 22 para dar origem à grande poliproteína, que é clivada em dois componentes individuais funcionas, a PP1a e PP1ab pelas cisteína protease do tipo papaína (PLpro) e serina protease do tipo 3C (3CLpro), para produzir proteínas não estruturais. Tanto a RNA polimerase RNA dependente (RpRd) e helicase (Hel), como as proteases PLpro e 3CLpro são vitais para a replicação do vírus. A protease 3CLpro do tipo 3-quimotripsina (também denominada protease principal ou Mpro; PDB 2BX4) é relatada em estudos como um promissor alvo de drogas contra o coronavírus (CHEN; YIU; WONG, 2020; KANDEEL et al., 2020; YANG et al., 2005; ZUMLA et al., 2016). Figura 6: O genoma do coronavírus de RNA de cadeia simples, de aproximadamente 26 a 32 kb. Organizado na ordem de 5ʹ o trecho de leitura aberto (ORF1a/b) que representa dois terços do genoma de CoV e codifica a grande poliproteína, que posteriormente será clivada em PP1a e PP1ab . O terço de 3 ́do genoma do CoV codifica as proteínas estruturais (S, E, M e N), essenciais para ligação vírus na célula hospedeira e montagem do virion. Fonte adaptada: ZUMLA et al., (2016) No corpo humano o vírus precisa inicialmente reconhecer na membrana plasmática um alvo específico, que no caso da Covid-19 é a proteína ACE2 (Angiotensin-Converting Enzyme 2). O vírus afeta especialmente locais onde existem mais células com o receptor ACE2, o qual é produzido na membrana de células que regulam a pressão sanguínea dos pulmões, intestino, rins e vasos sanguíneos e, é responsável pela quebra da angiotensina em duas, promovendo a vasodilatação e diminuindo a pressão do sangue. As principais vias de entrada do SARS-CoV-2 nos seres humanos são o nariz, boca e olhos. Após entrar no corpo humano o tempo médio de incubação do vírus, inicialmente, era de 5 dias, período em que o vírus está se replicando nas células do corpo infectado. Entretanto, com o surgimento de variantes como a ômicron e a BA.2, identificou-se um encurtamento desse período. Logo após o período de incubação já é possível que a pessoa infectada experimente alguns dos principais efeitos causados pelo vírus como dor de garganta e de cabeça, falta de paladar e olfato, tosse seca, em alguns casos febres e em casos mais 23 graves, insuficiência respiratória. Até o momento concluiu-se que a carga viral presente no corpo é de suma importância para o agravamento, ou não do quadro do paciente, de modo que quanto maior a carga viral, maiores as chances de a pessoa infectada apresentar um quadro grave da doença. A gravidade da infecção ocorre devido a forma como o vírus invade a célula humana, enfraquecendo-a. A figura 7 representa o ciclo da SARS-CoV-2 na célula hospedeira. A invasão celular ocorre após o reconhecimento da proteína ACE2. Após a invasão o vírus aproveita-se da ação do endossomo para fundir seu envelope com a membrana da célula hospedeira onde o vírus se desempacota. Como o genoma do vírus é feito por RNA, ele é imediatamente traduzido pelos ribossomos, dando origem a proteínas que serão futuras cópias desse vírus geradas por enzinas produzidas a partir do genoma. Grande parte dessas cópias passam a integrar o material genético desses novos vírus que se instalarão no citosol, outras serão traduzidas pelo ribossomo nesse local formando a proteína N no capsídeo. Outras participarão, ainda, da síntese de proteínas nos ribossomos associados ao retículo endoplasmático granuloso, passando pelo complexo de Golgi, onde são modificadas e levadas em vesículas formadas pela membrana do complexo. No citosol após montado o vírus é colocado para fora da célula, infectando células vizinhas e dando continuidade a essa multiplicação. (IAMARINO & LOPES, 2020) Figura 7: Ciclo SARS-CoV-2 na célula hospedeira 24 Fonte: Elaborado pela autora, a partir das informações de: ahttps://science.sciencemag.org/content/sci/early/2020/05/07/science.abb9332/F1.larg e.jpg?width=800&height=600&carousel=1 https://science.sciencemag.org/content/sci/early/2020/05/07/science.abb9332/F1.large.jpg?width=800&height=600&carousel=1 https://science.sciencemag.org/content/sci/early/2020/05/07/science.abb9332/F1.large.jpg?width=800&height=600&carousel=1 25 1.3 Proteína S A proteína S, cuja nomenclatura se derivada do inglês Spike, é uma espícula que confere o formato de coroa caracterítico do SARS-CoV-2. É por meio da proteína S que o vírus identifica em quais proteínas das células humanas deve se ligar, fazendo o contato fundamental entre vírus e célula hospedeira permitindo que o genoma viral entre, se replicando na célula humana. As figuras 8 e 9 apresentam a estrutura da Covid. A proteína Spike foi escolhida para esse estudo justamente por sua função e pelo fato de estar exposta, sendo o alvo mais vulnerável do vírus. (Bosch, Van der Zee, De Haan e Rottier, 2003). Figura 8: Representação da Covid Fonte: WIKIMEDIA, s.d. http://www.crfsp.org.br/images/arquivos/Manual_orientacao.pdf http://www.crfsp.org.br/images/arquivos/Manual_orientacao.pdf 26 Figura 9: Estrutura Covid, Spike e RBD Fonte: (Singh,2020) A glicoproteína Spike (S) é uma proteína de membrana indispensável no processo de adsorção do vírus à célula hospedeira, se ligando à enzima conversora de angiotensina 2 (ACE2), que atua como receptor funcional para SARS-CoV-2. Durante a interação, a glicoproteína S se divide em duas subunidades S1 e S2 que interagem entre si por meio de ligações não covalentes. A subunidade S1, parte superficial da proteína S, é a região em que se localiza o domínio de ligação ao receptor (RBD), fração da estrutura a qual se liga ao receptor. A subunidade S2 serve de suporte para S1, definindo a fusão da membrana (Hoffmann et al., 2020). A S1 apresenta dois domínios, o domínio N-terminal (S1-NTD) e domínio C-terminal (S1-CTD), por meio dos quais potencialmente se ligam aos receptores ACE2 humana e funcionam como domínio de ligação ao receptor (RBD). A subunidade S2 atua durante a fusão das membranas plasmáticas do vírus e da célula hospedeira. Estudos revelaram que o SARS-CoV e o SARS- 27 CoV-2 utilizam o mesmo receptor ACE2 para infectar a célula hospedeira. No estudo de Wan e colaboradores (2020) foi realizado o sequenciamento do SARS- CoV e do SARS-CoV-2 e os dados mostraram que uma única mutação no SARS- CoV-2, no resíduo N501 (correspondente à mutação do resíduo S487 do SARS- CoV), pode aumentar significativamente a afinidade de ligação entre o RBD da proteína S do CoV2 e a ACE2 humana. Devido à grande importância da interação da proteína Spike com o receptor ACE2, estudos são direcionados a essa proteína viral (S) com o intuito de encontrar uma molécula que possa impedir a ligação desse complexo, dificultando assim a infecção viral (BAGLIVO et al., 2020; HAAGMANS; OSTERHAUS, 2006; VINCENT et al., 2005; WAN et al., 2020; ZUMLA et al., 2016). Desta forma, vale a pena reforçar que, devido a função da subunidade S1 de se ligar a receptores de superfície das células do hospedeiro e da subunidade S2 de mediar a fusão entre membranas célula-célula e célula-vírus (XIA et al., 2014); a proteína Spike tem sido escolhida como a principal proteína estrutural de estratégias terapêuticas para bloqueio da entrada de coronavírus na célula do hospedeiro (WU et al., 2020). Analisando do ponto de vista do hospedeiro, o receptor ACE2, é outro alvo que tem papel fundamental na entrada e contágio do vírus na célula humana. A enzina ACE2 apresentou interações importantes com aminoácidos chaves do domínio RBD da proteína S (WAN et al., 2020). A proteína ACE2 possui 805 aminoácidos e consiste em 4 regiões: i) peptídeo sinal na região N-terminal; ii) domínio extracelular catalítico; iii) domínio transmembranar; e iv) o domínio intracelular na região C-terminal. Estudos recentes mostram que a interação da proteína receptora ACE2 com a proteína de superfície S do coronavírus ocorre pela sua região catalítica em um sulco profundo que é carregada negativamente e circundada por pequenas regiões hidrofóbicas (PRABAKARAN; XIAO; DIMITROV, 2004) essa ligação está representada na figura 10. 28 Figura 10: Ligação Spike e ACE2 Fonte: https://www.diariodasaude.com.br/news.php?article=proteina-espicula- novo-coronavirus&id=14963 1.4 Polifenóis: os flavonoides e sua ação antiviral Nos últimos anos houve um aumento na tendência científica global pela busca de compostos naturais como base estrutural para o desenvolvimento de fármacos, esse caminho pode ser uma alternativa para buscar as perspectivas para tratamento de infecções virais. Para compreender as múltiplas vias de sinalização alteradas pela infecção criaram modelos para avaliar o potencial dos compostos naturais contra a infecção por SARS-CoV-2 utilizando como base os parâmetros farmacológicos e previsões de sistemas computacionais como plataforma utilizada para RSV (GIRARD; TURGEON; GAUTHIER, 2003; GRYMONPRÉ et al., 2001; SEYREK et al., 2003). Entre as diferentes famílias de compostos naturais, os fenilpropanoides constituem uma grande família de compostos fenólicos produzidos por plantas originados a partir da desaminação do aminoácido L-fenilalanina, geralmente funcionando como fitoanticipinas ou fitoalexinas. Existem diversas classes oriundas desses compostos, dentre elas: chalconas, flavonoides, flavonois, isoflavanonas, isoflavonas, antocianinas, taninos, lignina e estilbenos. Os flavonoides, cuja estrutura geral está apresentada na figura 11, oriundos de chalconas, representam um dos grupos fenólicos mais importantes e diversificados entre os produtos de origem natural, devido a diversidade em 29 termos de estrutura, peso molecular, tamanho, fácil absorção, função e impacto na saúde, ampla distribuição no reino vegetal e por serem integrantes das dietas humana e animal (BAVARESCO et al., 1997; LANGCAKE; PRYCE, 1976; SIEMANN; CREASY, 1992). Figura 11: Estrutura geral de um flavonóide Fonte: Vijayakumar et al As principais razões para o crescente interesse em polifenóis estão no reconhecimento de suas propriedades antioxidantes e da sua utilidade potencial na quimioprevenção de várias doenças associadas ao estresse oxidativo, tais como câncer, doenças cardiovasculares, doenças infecciosas e doenças neurodegenerativas, conferindo-lhes significativa importância farmacológica (CAZAROLLI et al., 2008; KURODA; HARA, 1999; RAMASSAMY, 2006). Vários estudos já relataram o efeito de algumas chalconas, flavonóides e estilbenoides sobre a replicação viral em animais. Nesses estudos foram descritas suas atuações na inativação direta, afetando a entrada do vírus na célula, por meio da inibição da sua replicação e de efeito terapêutico, diminuindo sinais clínicos e a infectividade viral (DU et al., 2003; ISHITSUKA et al., 1982; MIDDLETON; KANDASWAMI; THEOHARIDES, 2000; VINSON, 1998). As chalconas (1,3-diaril-2-propen-1- onas) são conhecidas por serem as moléculas precursoras dos flavonoides e apresentarem atividades anti- inflamatória, antibacteriana, antifúngica, antiparasitária e antiviral já descritas. A chalcona Ro 09-0410 (4', 5-diidroxi-3,3',7-trimetoxiflavona), por exemplo, apresentou efeito de inativação específica do Rhinovirus em experimentos de cultura de célula HeLa (ISHITSUKA et al., 1982; NOWAKOWSKA, 2007). Diante da situação mundial atual, na falta de terapêutica e profilaxias contra o novo coronavírus, a presente proposta se identifica com estudos que têm como 30 alvo a utilização de técnicas e habilidades cientificas multidisciplinares para o entendimento dos processos e mecanismos moleculares de interação proteína viral/fármaco, a fim de identificar novas moléculas com potencial para eliminar ou amenizar os sintomas da COVID-19. 2 OBJETIVO E FUNDAMENTAÇÃO Esta pesquisa tem como foco investigar, por meio de ferramentas computacionais, os flavonoides, que são moléculas de origem natural, com maior potencial de atuar no bloqueio da atividade da proteína S do SARS-CoV-2. A proteína S e o receptor celular ACE2 são, como já mencionamos, importantes para o reconhecimento celular e também no ciclo replicativo viral, bem como na transcrição e tradução das proteínas virais (helicase, Nsp13 e Nsp1). Nessa perspectiva, o objetivo principal desta pesquisa foi a busca, entre alguns flavonoides, por pequenas moléculas com potencial de inibição da proteína S para o combate da COVID-19, causada pelo novo coronavírus. Para alcançar esse objetivo foram desenvolvidos os seguintes objetivos específicos: a. Estudo da proteína do vírus; b. Seleção da estrutura no PDB; c. Busca por regiões de interações; d. Seleção dos flavonoides mais promissores; e. Realização dos dockings com e sem a ACE2; f. Analise dos resultados obtidos no docking direcionado. 31 2.1 Fundamentação teórica (modelagem matemática, definição de docking, descrição matemática da plataforma utilizada) A modelagem matemática consiste na tentativa de descrever matematicamente um fenômeno. Se refere ao estudo de simulação de sistemas reais para prever seu comportamento, sendo utilizada em diversos campos de pesquisa. Segundo o matemático Jonei Barbosa (2004) a área de modelagem está correlacionada à problematização, à criação de perguntas ou problemas e à investigação, busca e manipulação das informações obtidas, tudo isso com enfoque na reflexão lógica e matemática sobre determinado problema proposto. (BARBOSA,2004) . Seguindo essa linha da modelagem matemática, temos o Docking, ou atracamento molecular. O Docking molecular, é o processo que calcula o ajuste mais apropriado para o encaixe entre duas moléculas tridimensionais por meio de pequenos ligantes se moldando a sítios específicos. Esse tipo de modelagem matemática computacional de docking entre proteína e ligante é baseado no modelo chave- fechadura de Emil Fisher de 1984. A associação feita nessa analogia consiste em: o receptor é comparado a fechadura, o sítio de ligação é considerado o buraco da fechadura e o ligante a chave, desse modo a ação de abrir e trancar a porta se relaciona a interação entre o ligante e a proteína conforme ilustra a figura 12 (VERLI, 2014, p.200). Figura 12: Representação chave-fechadura Fonte: http://www.quimica.ufpr.br/nunesgg/QIM__PG/material%20para%20estudo/Fundament os%20de%20quimica%20medicianal.pdf http://www.quimica.ufpr.br/nunesgg/QIM__PG/material%20para%20estudo/Fundamentos%20de%20quimica%20medicianal.pdf http://www.quimica.ufpr.br/nunesgg/QIM__PG/material%20para%20estudo/Fundamentos%20de%20quimica%20medicianal.pdf 32 Diferentemente da ação realizada entre chave fechadura em que se relacionam objetos rígidos, na natureza, tanto o ligante quanto a proteína são flexíveis; ou seja, é possível ocorrer modificações conformacionais durante o processo realizado. A formação entre o complexo proteína ligante pode ser representada conforme ilustra a figura 13. Essa flexibilidade está relacionada às suas atividades, como por exemplo as catálises das reações enzimáticas, o transporte de proteínas pela membrana, ou mesmo mudanças conformacionais relacionadas a formas ativas ou inativas da proteína (VERLI, 2014, p.200): Figura 13: Formação do complexo proteína-ligante Fonte: VERLI, 2014, p.200 No processo de docking é explorado o grau de liberdade do ligante. A função score corresponde a qualidade de predição. Assim dizendo, apresenta uma pontuação ótima, ou a afinidade, em relação à possíveis formações de complexos reais probabilísticos. Pela figura 14 é possível observar que o estado de energia mínima representa o melhor resultado entre receptor ligante. 33 Figura 14: Energia mínima e o melhor resultado entre receptor ligante Fonte: Esther Camilo dos Reis, p19, 2008 Para o reconhecimento de grau de afinidade ótimo entre proteína-ligante são consideradas suas características físico-químicas relacionadas às interações intermoleculares presentes no complexo em questão. Dentre essas interações destacam-se: a. Ligações de hidrogênio; b. Interações de Van der Waals; c. Interações iônicas; d. Interações hidrofóbicas; e. Interações cátion-π; f. Interações aromáticas π-π e empilhamento-T; e g. Coordenação com íons metálicos. Outro fator a ser considerado para análise do grau de afinidade são as características estruturais. Essas estão relacionadas aos arranjos de posicionamento e rotação espaciais das moléculas (VERLI, 2014, p.191). Para sabermos se há uma alta afinidade entre proteína e ligante devemos analisar as seguintes propriedades: a. A proteína e o ligante devem possuir uma alta porcentagem de suas superfícies de contato moleculares, a qual é definida pelos raios de Van der Waals; 34 b. Alta mutualidade de propriedades associadas às superfícies de contato moleculares, como a eletrostática; c. O ligante deve estar atracado em uma conformação energeticamente favorável e; d. As interações repulsivas entre ligante e proteínas devem ser mínimas. 2.2 Definição e análise matemática da afinidade (score) e da plataforma Dockthor A plataforma DockThor, escolhida para esta pesquisa, constitui-se por um programa que faz uso de duas funções, uma para a predição da pose e, outra para a predição da afinidade receptor-ligante. Essas funções são baseadas em campos de força da mecânica molecular. Melhor dizendo, referem-se à forma funcional e conjunto de parâmetros usados para calcular a energia potencial de um sistema. Em síntese, esta predição está relacionada à posição de determinado corpo e sua interação com outros corpos. As análises fazem uma função estatística gerando uma função score de pares de átomo que tenha sua estrutura 3D conhecida. Já para as funções empíricas precisa de dados estruturais para informações de afinidade, tentando obter o conhecimento de modo que minimize o erro do ∆𝐺. São baseadas em estrutura experimentais montadas em cima desse modelo. O DockThor é um programa baseado em grade, ou seja, ele considera o receptor rígido. Nessa metodologia discretiza-se uma malha em volta do sítio ativo, conforme ilustra a figura15. 35 Figura 15: Configuração de grade utilizada pelo DockThor Fonte: https://www.dockthor.lncc.br/v2/tutorials/Tutorial1_1HPV.pdf Quando é mapeado o potencial de interação intermolecular eletrostático, associado ao potencial de Lennard Jones faz-se uma busca, na qual gera uma conformação dentro do cubo da grade e quando o átomo cai dentro do volume desse cubo é necessário apenas interpolar os 8 pontos do cubo (Figura14) para encontrar a energia da proteína. O Potencial Lennard Jones consiste em um modelo que descreve a interação entre átomos neutros que estão sujeitos a duas forças distintas: uma de atração e outra de repulsão. As forças atrativas, de Van der Waals, são representadas pela força de dispersão de London: Uma molécula, mesmo que seja apolar, pode possuir muitos elétrons se movimentando rapidamente, de modo que, em determinado momento tenha mais elétrons de um lado do que de outro, ou seja estará momentaneamente polarizada e, consequentemente, provocará a polarização de uma molécula ao lado, desenvolvendo uma fraca atração entre elas. A segunda força descrita, a força de repulsão é gerada pela aproximação de núcleos atômicos. Uma das principais vantagens dessa metodologia que a plataforma segue é a velocidade. Caso fosse computar por meio de somatório, seria necessário um somatório sobre todos os átomos da proteína para cada átomo do ligante. 36 Em contrapartida, na plataforma DockThor, a cada átomo do ligante é preciso fazer apenas uma interpolação linear. Quanto mais perto das arestas, menor é a energia. Ao passo que, a interpolação é mais acurada quanto menor for a discretização. (MAGALHÃES et. al.; 2014) Para a predição da pose, o DockThor usa o campo de força MMFF94 (Merck Molecular Force Field) campo de força clássico. A plataforma foi parametrizada usando cálculos quânticos ab inistio, possui 94 tipos de átomos, além de parâmetros definidos para mais de 20 famílias químicas. (MAGALHAES, 2014) É um campo de força all átomo sendo necessário que todos os átomos de Hidrogênio do ligante estejam presentes (conforme mostraremos mais a frente) O cálculo de score de energia interna é formado por uma somatória entre 3 energias de interações: uma torsional, uma de Lennard Jones e uma eletrostática, conforme representada na equação 1. Equação 1 𝑆𝑐𝑜𝑟𝑒 = 𝐸𝑡𝑜𝑟𝑠𝑖𝑜𝑛𝑎𝑙 + 𝐸𝐿𝑒𝑛𝑎𝑟𝑑𝐽𝑜𝑛𝑒𝑠 + 𝐸𝑒𝑙𝑒𝑡𝑟𝑜𝑠𝑡á𝑡𝑖𝑐𝑎 A energia de interação torcional refere-se a um conjunto de 4 átomos ligados, conforme ilustra a figura 16, sendo o ângulo formado entre os átomos, o ângulo do diedro. A realização desse cálculo envolve a extensão da barreira energética para torção, o número de mínimos na curva de energia potencial, o ângulo diedral de ligação central em relação aos átomos entre outros fatores. Figura 16: Representação geométrica do ângulo de torção Fonte: elaborado pela autora 37 A energia de Lennard Jones, ou potencial de van der Waals se formam a partir da polarização de moléculas ou grupos de átomos e, se referem a ligações fracas relacionadas a atração de dipolos elétricos, como exemplifica a figura 17. O potencial Lennard Jones representa essa força atrativa a longas distâncias ou repulsivas em curta distância, matematicamente. Figura 17: Ligações entre dipolos atomicos/moleculares Fonte: elaborado pela autora Por fim, a energia de interação eletrostática, calculada a partir da Lei de Coulomb, trata da força de interação entre duas cargas através da repulsão ou atração entre elas conforme ilustra a figura18. Figura 18: Representação da Lei de Coulomb Fonte: elaborado pela autora Normalmente, outros programas precisam realizar cálculos quânticos para encontrar as cargas parciais. No entanto, o campo de força MMFF94 desenvolveu um processo de parametrização automática que tem uma carga 38 inicial 𝑞𝑖 0 que pode ser acrescida ou decrescida de carga, dependendo da polaridade do átomo aos quais aquele determinado átomo está ligado. Em resumo, as duas principais características que motivaram a escolha do DockThor foram: o fato de não precisar fazer cálculos quânticos e a propriedade da plataforma, de levar em consideração o ambiente químico ao qual aquele átomo está ligado. Melhor dizendo, a plataforma possui muitos átomos ligados parametrizados, além de diversos grupos químicos, não sendo necessário realizar esses cálculos quânticos, o que é de extrema vantagem quando há metais e íons. Além disso, tanto a proteína quanto o ligante estão parametrizados com o mesmo campo de força. Quando é necessária a realização de cálculos, em muitos casos, ao se acrescentar uma carga parcial vinda do cálculo quântico, desconsidera-se, o fato de esse campo de força ter sido parametrizado junto, tanto a parte de van der Waals, quanto a parte eletrostática e está apenas modificando um dos parâmetros. Enquanto no caso da MMFF94 tanto proteína quanto ligante carregam o mesmo campo de força sem introduzir nenhuma “perturbação” nessa parametrização. (MAGALHÃES, 2006) A plataforma é descrita como um campo de força pose prediction, isso significa que o cálculo da entalpia de ligação entre o ligante e a proteína, é muito eficiente para encontrar a pose. Isso ocorre porque, quando o mesmo ligante é dockado em um sítio ativo, tem-se toda uma parte de entropia do ligante ou do solvente. Como se trata da mesma pose, de uma para outra, acabam se cancelando. É um campo de força sem solvatação, a energia liberada não quebra a rede de cristal e prevê a pose com uma alta taxa de sucesso. O DockThor possui uma função empírica desenvolvida para prever a afinidade de ligação, representada na equação ∆𝐺. Normalmente, um algoritmo de busca tem como função procurar o mínimo global, o DockThor usa um algoritmo de múltiplas soluções que durante o algoritmo calcula os vários mínimos locais (Figura 19) e quando termina de rodar apresenta um conjunto dos melhores modos de ligação encontrados para aquele ligante, o que aumenta a chance de encontrar o mínimo global associado a estrutura nativa. 39 Figura 19: Representação dos mínimos locais encontrados pelo algoritmo Fonte: Magalhães 2006 O cálculo de score da plataforma DockThor é realizado por meio do reconhecimento molecular entre proteína-ligante através da combinação da energia térmica (efeitos entalpicos) e a desordem causada em um sistema termodinâmico (efeito entrópico). Esses efeitos associados estão diretamente ligados a uma constante de equilíbrio e geram uma grandeza termodinâmica que prevê a espontaneidade de uma determinada reação química. É possível determina-la por meio da energia livre de Gibbs, cujo intuito é prevenir a espontaneidade de uma reação química, representada por ∆𝐺 na equação 5. Os fatores dominantes para essa representação são entalpia, entropia e temperatura do sistema analisado. Equação 2 ∆𝐺𝑙𝑖𝑔 = ∆𝐻 − 𝑇∆𝑆 = −𝑅𝑇 𝑙𝑛 𝐾𝑒𝑞 De modo que, ∆𝐻 se refere à variação de entalpia, T diz respeito à temperatura absoluta, ∆𝑆 é relativo à variação de entropia e R corresponde à constante universal dos gases. A geração da população inicial é aleatória, no entanto, sempre será gerada dentro da grade de energia delimitada para o docking, o que torna o algoritmo totalmente independente da posição inicial do ligante. A primeira solução é agrupada e são encontradas algumas áreas principais para então, gerar uma nova população por meio da distribuição de Cauchy. A distribuição de Cauchy, é a distribuição de probabilidades dada pela função densidade de probabilidade, em volta dessas áreas preferenciais dos sítios ativos de ligação, pode também ser simulada como a razão entre duas 40 normais independentes. Após realizado isso, o algoritmo genético segue rodando com a nova população encontrada. Essa estratégia de repreparar a população inicial (figura 20) é muito utilizada nos algoritmos genéticos e apresenta grande benefício nos resultados. A função densidade de probabilidade citada anteriormente é uma função que descreve a possibilidade de uma variável aleatória X receber um dado valor menor ou igual a um certo x. Essa probabilidade é gerada a partir da integral da densidade dessa variável sobre a faixa determinada conforme apresentada na equação 6. Equação 3 ∫ 𝑓(𝑋)𝑑𝑋 𝑥 −∞ Figura 20: Distribuição aleatória X Distribuição de Cauchy Fonte: Magalhães 200 41 3 MATERIAIS E MÉTODOS 3.1 Métodos O docking molecular se configura como um método de predição da orientação preferencial de uma primeira molécula a uma segunda, formando um complexo estável. Assim dizendo, nossa preocupação principal é demonstrar como essa metodologia, pode contribuir para a previsão da maior afinidade de ligação entre duas moléculas, no caso do nosso objeto que são os flavonoides. Isso porque, conforme afirma Capriles et al. (2014, p. 148), desenvolver metodologias que se caracterizam por elevado grau de previsibilidade e acurácia tem se configurado como um grande desafio, mesmo diante dos avanços tecnológicos e metodológicos realizados até o momento. Vencer esse desafio poderia trazer um grande impacto direto na saúde e no bem-estar da humanidade. Esse processo pode ser descrito da seguinte forma: 1) escolha da doença a ser estudada, 2) identificação do alvo molecular, 3) seleção da estrutura 3D, por meio de um banco de dados escolhido pelo pesquisador, 4) realização da triagem computacional, 5) otimização dos compostos selecionados. Essas duas últimas etapas são o passo a passo para a realização do docking. Após as etapas citadas, os resultados obtidos são enviados para teste in vitro/in vivo. Caso esses testes apresentem bons resultados são encaminhados para testes clínicos e em seguida para a fabricação de possíveis fármacos (MAGALHÃES, 2006). Esse Processo metodológico do desenvolvimento de uma pesquisa na área de docking molecular pode ser visualizado na figura 21. 42 Figura 21: Processo metodológico do desenvolvimento de uma pesquisa na área de docking molecular Fonte: Magalhães, 2006. 3.2 Identificação do alvo molecular e seleção de flavonoides Para desenvolvimento da estratégia proposta, a doença é a COVID-19, o alvo molecular utilizado é o receptor RBD da proteína Spike (proteína S) do SARS-CoV-2. A proteína S está presente na partícula viral que propicia a fusão com o receptor da membrana celular (ACE2). Essa fusão resulta no transporte do vírus para dentro da célula hospedeira, iniciando assim o ciclo viral. A estrutura utilizada nessa exposição é a 6LZG (figura 22), adquirida no Protein Data Bank. O docking molecular dos compostos e estruturas selecionados na proteína alvo foi realizado de dois modos: utilizando a estrutura RBD da proteína S, juntamente com o receptor ACE2 humano e fazendo uso somente da estrutura RBDm sem a ACE2. No que se refere à seleção dos flavonoides, esta foi efetivada por meio de revisões bibliográficas, com foco em determinadas ações específicas tais como, propriedades antivirais, antioxidantes, anti-inflamatórias. As propriedades escolhidas baseadas nos sintomas gerados pelo vírus ao infectar a célula humana. Por fim, a triagem computacional e a Otimização de compostos serão realizadas pela plataforma DockThor. Sendo assim, nosso principal objetivo aqui 43 é encontrar uma molécula com potencial para bloquear essa fusão entre a proteína S, mais especificamente seu receptor RBD e a enzima humana ACE2. Figura 22: Estrutura 6LZG : RBD(laranja) e ACE2(verde) Fonte: https://www.rcsb.org/ Inicialmente, para a escolha da estrutura da proteína Spike foram realizadas buscas no banco de dados PDB. O PDB é um banco de dados de estruturas experimentais de biomoléculas livres ou complexadas com inibidores e ácidos nucleicos. Ele pode ser facilmente acessado pelo site: www.pdb.org. Atualmente possui 184.202 estruturas macromoleculares biológicas que permitem avanços em pesquisa e educação. Essas estruturas são obtidas por difração de Raios-x, ressonância magnética nuclear (RMN) ou Crio-microscopia eletrônica (Cryo-EM) enviadas por pesquisadores de todo o mundo e disponíveis para domínio público. Normalmente as estruturas disponíveis são representadas por 4 caracteres, por exemplo a 7DZW é uma das estruturas que representa a proteína S da SARS-CoV-2 (Protein Data Bank, online, 2021). Após essa etapa foi realizada uma seleção de moléculas, com potenciais farmacológicos, de modo a acelerar o processo de identificação de alternativas para minimizar o agravamento da doença. Trata-se de moléculas originadas da 44 flora brasileira, mais especificamente, os flavonoides. Desse modo, foram selecionados seis (6) flavonoides. A opção pelos flavonoides se deu devido a alguns de seus potenciais fármacos, dentre eles sua capacidade antiviral, anti-inflamatória, antioxidante, anticoagulante dentre outras (B.G. Vijayakumar et.al.). A resistência dos flavonoides à oxidação, à diversificação de acidez e às altas temperaturas, também concorreram para essa escolha (FLAMBÓ, 2013, P.9). A seleção dos flavonoides foi baseada em estudos bibliográficos que pesquisaram os diferentes tipos desses compostos fenólicos. A partir da leitura desses estudos foram escolhidos os seguintes flavonoides: Kaempferol, Quercetina, Miricetina, Eriodictiol, Genisteina e Cianidina. Esses compostos são representativos de três subclasses dos flavonoides. O kaempferol, a quercetina e a miricetina compõem a subclasse dos flavonois; já o eridictiol está no grupo das flavanonas; a genisteina, por sua vez, insere-se nas isoflavonas e a cianidina na subclasse das antocianidinas. (SANTOS, 2009). Essas subclasses de flavonoides estão entre as principais, em um universo de 8000 diferentes tipos desses compostos já descritos até hoje (FLAMBÓ, 2013, p.4) A opção por selecionar três compostos da subclasse dos flavonois se deu principalmente por dois motivos: 1) Flambó (2013, p.21) apontou em sua tese de doutorado que os flavonois são particularmente anti-trombóticos; 2) Santos (2009, p.26) destacou que essa subclasse dos flavonoides é encontrada com maior abundância, ou seja é a mais comum no Brasil. Por sua vez, as isoflavonas, especialmente a genisteina, possuem potencial para aumentar sobremaneira a ação antibacteriana (FLAMBÓ, 2013, p.14). Cumpre ressaltar que tanto as ocorrências trombóticas, como as bacterianas (no caso a pneumonia) foram observadas em pacientes com COVID 19 grave. As flavanonas; com destaque nesta pesquisa para o eridictiol, são representativas de cerca de 95% do conteúdo de flavonoide presente nas frutas cítricas (SILVEIRA, 2014, p.23). Essa subclasse de flavonoides se destaca ainda, por sua rápida absorção no organismo e por ser a mais consumida pelas pessoas. Possui também maior potencial antioxidante, além de outros potenciais tais como anti-hipertensivo e anti-inflamatório. (SILVEIRA, 2014, p.23-28). 45 Finalmente, segundo estudos de Santos (2005) a cianidina da subclasse das antocianidinas possui o maior potencial antioxidante dentre os flavonoides estudados, juntamente com a quercitina. Outro aspecto importante da cianidina, destacado por Santos (2005, p.13-50) é a estabilidade da ação antioxidante desse composto em diferentes situações. A tabela 1 a seguir, descreve os potenciais e a estrutura química dos seis flavonoides selecionados: Tabela 1: Descrição dos flavonoides selecionados Flavonoide Potencial Encontrado em: Estrutura química Kaempferol antioxidante e anti-inflamatório capaz de cuidar de lesões pulmonares agudas, atuando no bloqueio de radicais livres, impedindo que esses agentes danifiquem outras células chá verde, no chá preto, na pitanga, no caju, em rúculas e couves. Quercetina auxilia na prevenção de problemas cardiovasculares e no fortalecimento da imunidade alcaparras, pimentão amarelo, trigo, cebola, maçã, uva, brócolis e limão. 46 Miricetina antioxidantes, antiviral, anti- inflamatória e neuro protetora, dentre outras tomates, laranjas, nozes, frutas vermelhas, chá e uvas. Eriodictiol anti-inflamatório, antidiabético e um agente anti- osteoclastogenico frutas cítricas Genisteína antioxidante, antiangiogênica e imunossupressora leguminosas como tremoço, fava e soja Cianidina regular o metabolismo celular de lipídios, redução nas concentrações intracelulares de colesterol e triglicerídeos responsável pela pigmentação presente em vegetais como ameixa, jabuticaba, cereja, jamelão, uva, morango, amora, figo, cacau, repolho roxo e açaí, Fonte: elaborado pela autora Após a seleção dos flavonoides, descrita nas linhas anteriores, foi elaborado o estudo das interações proteína/ligante por meio de simulações computacionais. Realizou-se o docking molecular dos compostos selecionados nas proteínas alvo e a comparação dos seus resultados em cada estrutura. 47 O PyMOL foi o software de visualização escolhido para estudo das estruturas iniciais da proteína e dos ligantes, bem como dos resultados de docking molecular obtidos. Para realização do docking molecular foi utilizada a plataforma DockThor que é um portal brasileiro e, além disso é o único de todo hemisfério sul de docking molecular receptor-ligante, criado pelo Laboratório Nacional de Computação Científica (LNCC). Os dockings foram realizados em diferentes etapas, utilizando, primeiramente, o blind docking e, com base nos resultados obtidos, o redocking ajustado ao receptor baseado no resultado obtido no blind. O blind dock, foi efetuado para gerar uma área mais específica permitindo uma nova realização do procedimento, o redocking, com uma predição mais precisa. Aqui aplicamos alguns recursos dessas ferramentas na estrutura da proteína S de código 6LZG do PDB, a qual se refere a uma estrutura de cristal do domínio de ligação ao receptor da Spike SARS-CoV-2 ligado a ACE2, enzima conversora da angiotensina de algumas células do corpo humano. A escolha dessa estrutura se deve ao fato de se tratar das partes fundamentais de contato para entrada do vírus no corpo humano. O domínio receptor obrigatório (RBD), fração da proteína S, presente na estrutura, é justamente a parte da Spike que se liga ao receptor da célula humana, a ACE2 (LAN et al, 2020). 4 RESULTADOS E DISCUSSÃO Conforme descrito no tópico anterior foi realizado o blind dock na plataforma DockThor. O blind docking executado pelo DockThor com a parte RBD da estrutura 6LZG e os ligantes mencionados foi gerado a partir dos seguintes dados:  Grid center: X= - 32,496 Y=29,4925 Z=21,64  Grid size: X=40 Y=40 Z=40 48  Discretization: 0,42  Total Grid points: 884736  Number of evaluations: 1000000  Population size: 750  Initial Seed: -1985  Number of runs: 24  RMSD to cluster conformers: 2A  Number of binding modes: 3 A partir desses resultados apresentados pelo blind docking da RBD com a ACE2 foi possível realizar o docking direcionado no DockThor com os dados indicados na tabela 2. Tabela 2: Coordenadas utilizadas para os dockings direcionados Fonte: elaborado pela autora Estrutura Ligante Grid center 6LZG (apenas RBD, chainB) Cianidina X= - 29.86199951171875 Y=36.2400016784668 Z=31.104999542236328 Eriodictiol X=-26.94099998474121 Y=37.354000091552734 Z=30.520999908447266 Genisteína X=-34.862998962402344 Y=36.16299819946289 Z=28.746999740600586 Kaempferol X=-29.812999725341797 Y=35.816001892089844 Z=30.986000061035156 Miricetina X=-29.902000427246094 Y=35.821998596191406 Z=30.98699951171875 Quercetina X=-29.923999786376953 Y=35.86800003051758 Z=31.006999969482422 49 A solução obtida pelo blind docking gerou determinadas áreas principais para uma nova busca direcionada, de modo que foi possível utilizar uma área de grid menor, que a inicial utilizada no blind, obtendo resultados mais bem definidos. Esses resultados possibilitam chegar o mais perto possível do resultado ótimo, que é nosso objetivo com a realização do docking molecular. Além dos dados utilizados e das coordenadas apresentadas na tabela 2, também foram aplicados os seguintes padrões para todos os flavonoides selecionados, no docking direcionado:  Grid size: X=20 Y=20 Z=20  Discretization: 0,25  Total Grid points: 531441  Number of evaluations: 1000000  Population size: 750  Initial Seed: -1985  Number of runs: 24  RMSD to cluster conformers: 2A  Number of binding modes: 3 O objetivo principal na realização do blind docking é encontrar as coordenadas para essa área mais específica. Sendo assim, após a realização dele pela plataforma DockThor, abrimos no Pymol a proteína preparada e o resultado com o melhor rancking, enviados pelo programa. No Pymol é possível encontrar essas coordenadas que foram utilizadas para realização do docking direcionado. As tabelas 2 e 3 apresentam os seguintes dados: 1. Grid center: Referente ao centro da grade discretizada no local da análise, é definida pelas coordenadas X,Y,Z pertencente a um átomo no espaço; 50 2. Grid size: Se trata do tamanho da grade, sendo as coordenadas X,Y,Z as dimensões da caixa de grade; 3. Discretization: O valor de discretização define a distância entre os pontos da grade, é possível aumentar ou diminuir essa variável, sendo o valor padrão 0,25A aquele que gera uma maior precisão do experimento de encaixe, por isso no docking direcionado é possível ver que foi este o valor definido, (o número máximo de pontos deve ser 950.000) 4. Total Grid points: É o valor total de pontos utilizados para realizar o docking 5. Number of evaluations: Se refere ao número de avaliações 6. Population size: Tamanho da população 7. Initial Seed: deve ter um valor negativo, e para cada execução sucessiva seu valor é diminuído por um. 8. Number of runs: Número de execuções realizadas foi de 24 9. RMSD to cluster conformers: RMSD é o desvio quadrático médio da raiz, calculado usando os átomos diferentes de H de agrupamento (apresenta uma ideia dos diferentes modos de ligação conformacional entre o ligante), cujo valor padrão equivale a 2A 10. Number of binding modes: Número de diferentes modos de ligação do ligante, sendo possível até 10 poses para encaixe único e até 3 poses para triagem virtual (REFERENCIA: https://www.dockthor.lncc.br/v2/tutorials/Tutorial1_1HPV.pdf) Os itens 5, 6, 7 e 8 se referem a alguns parâmetros de algoritmo genético, os quais podem ser modificados. No entanto, para essa pesquisa utilizamos o padrão indicado pela plataforma. Após todos esses dados devidamente estabelecidos, foi gerado o arquivo final, que foi analisado com os resultados do docking direcionado. Em cada experimento são apresentadas as seguintes informações/resultados: 1. Afinidade (score): a previsão de afinidade (kcal / mol), usada para classificar diferentes ligantes em experimentos de triagem virtual considerando a pose de energia superior (de acordo com a energia total) de cada composto https://www.dockthor.lncc.br/v2/tutorials/Tutorial1_1HPV.pdf 51 2. Energia total: (kcal / mol) usado para classificar os diferentes modos de ligação do mesmo composto 3. Energia de vdW: Se referem as forças de atração que atuam entre moléculas ou átomos 4. Energia elec.: é referente a toda a carga elétrica de um corpo cujos átomos aparentam instabilidade na sua neutralidade. Tabela 3: Resultados do docking direcionado Estrutura Ligante Docking Afinidad e (score) Energia total Energia de vdW Elec energia Resíduos Distância (Å) Tipos de ligação 6LZG Cianidina (Blind) -6,874 16,981 2,911 -41,653 GLU-184 1,6 Empilha mento aromáti co H-OE1 (negativo Aceptor) TYR-64 2,5 O-HH (Direcio nado) -7,005 15,592 1,219 -41,766 ASP-96 1,7 Empilha mento aromáti co H-OD1 (negativo aceptor) 2,5 H-OD2 (negativo aceptor) Eriodictiol (Blind) -6,966 4,124 -0,416 -35,589 GLU-184 1,6 Empilha mento aromáti co H-OE1 (negativo Aceptor) 1,7 Empilha mento aromáti co (Direcio nado) -7,069 3,134 -1,235 -36,076 ASP-96 1,7 Empilha mento aromáti co H-OD1 (negativo aceptor) Genisteína Blind -6,858 18,273 -9,297 -16,750 GLU-184 1,8 Empilha mento aromáti co H-OE1 (Negativo aceptor) TYR-64 2,0 O-HH 52 (Aromátic o doador) Direcion ado -6,998 17,408 17,408 -16,767 ARG-134 2,6 O-HH11 (Positivo Doador) 2,4 H-O (positivo Aceptor) 2,1 O-H (Positivo Doador) ARG-23 2,8 O-HH21 (Positivo doador) Kaempferol Blind -6,888 13,991 -3,675 -28,818 GLU-184 1,6 Empilha mento aromáti co H-OE1 (Negativo aceptor) TYR-64 2,6 O-HH (Aromátic o doador) ASP-96 1,8 Empilha mento aromáti co H-OD2 (Negativo aceptor) Direcion ado -6,824 12,239 -3,556 -30,545 PRO-131 3,1 O-O (aceptor) 1,8 Empilha mento aromáti co H-O (Aceptor) Miricetina Blind -6,906 8,483 2,245 -42,630 TYR-396 2,5 O-H08 Aromátic o doador ASP-428 2,0 H-OD2 Negativo aceptor 1,6 Empilha mento aromáti co H-OD1 Negativo aceptor Direcion ado -6,881 7,393 0,525 -42,041 GLU-516 1,6 Empilha mento aromáti co H-OE1 Negativo aceptor 53 PRO-463 3,4 O-O aceptor 1,7 Empilha mento aromáti co H-O aceptor Quercetina Blind -6,918 8,647 1,436 -41,343 ASP-96 2,1 H-OD2 Negativo aceptor Direcion ada -6,930 7,444 -0,629 -40,526 1,6 Empilha mento aromáti co H-OD1 Negativo aceptor GLU-184 1,6 Empilha mento aromáti co H-OE1 Negativo aceptor TYR-64 2,4 O-HH Aromátic o doador PRO-131 3,4 O-O Aceptor 1,7 Empilha mento aromáti co H-O Aceptor Fonte: elaborado pela autora Dos resultados obtidos podemos observar que os aminoácidos encontrados em maior frequência, analisando todos os dockings realizados com a estrutura completa ( RBD e ACE-2 ), foram: GLU-184 (24%), ASP-96 (19%), TYR-64 (19%) e PRO-131 (9%). 54 Figura 23: Gráfico aminoácidos mais frequentes encontrados referentes a tabela 3 Fonte: Elaborado pela autora Para efeito comparativo foi realizado o blind docking apenas na cadeia da estrutura RBD, de modo que fosse possível verificar a ocorrência de alterações em resultados, com exclusão da enzima ACE2. Os blind docking foram realizados utilizando os seguintes padrões para todos os flavonoides selecionados:  Grid size: X=40 Y=40 Z=40  Discretization: 0,42  Total Grid points: 884736  Number of evaluations: 5000000  Population size: 750  Initial Seed: -1985  Number of runs: 24  RMSD to cluster conformers: 2A  Number of binding modes: 3 24% 19% 19% 4% 5% 9% 5% 5% 5% 5% Aminoácidos GLU-184 TYR-64 ASP-96 ARG-134 ARG-23 PRO-131 TYR-396 ASP-428 GLU-516 PRO-463 55 O resultado desse blind apresentou em todos os 6 resultados ligações aos aminoácidos glutamato e aspartato, sendo a tirosina o aminoácido seguinte mais presente, estando em 3 dos 6 dockings realizados conforme mostram os dados na tabela 4 Tabela4: Resultados do blind docking sem a ACE2 Estrutur a Ligante Docking Afinida de (score) Energi a total Energi a de vdW Elec energia Resíduos Distânci a (Å) Cianidina Blind -7.104 23.827 -5.864 -33.858 GLU-516 ASP-428 TYR-396 1.6 1.7 3.5 Eriodictiol Blind -6.888 22.193 -1.080 -37.396 GLU-516 ASP-428 1.6 e 1.7 1.7 Genisteina Blind -7.064 19.350 2.542 -29.386 GLU-516 ASP-428 1.5 1.6 Kaempferol Blind -6.863 16.532 -4.983 -32.028 GLU-516 ASP-428 1.7 1.8 Miricetina Blind -6.831 14.363 1.524 -39.313 GLU-516 ASP-428 TYR-396 1.6 1.6 e 2.0 3.4 Quercetina Blind -6.845 14.258 -0.292 -38.720 GLU-516 ASP-428 TYR-396 1.7 1.6 e 1.9 3.4 Fonte: elaborado pela autora Os dockings realizados apenas com a cadeia referente ao domínio RBD apresentam apenas 3 dos aminoácidos, sendo sua proporção: GLU-516, ASP- 428 e TYR-396, de modo que o glutamato e o aspartato estão presentes em todos os dockings, enquanto a tirosina se mostrou presente em 3 dos experimentos, conforme ilustra o gráfico abaixo. 56 Figura 24: Gráfico de frequência de aminoácidos encontrados referentes a tabela 4 Tabela 4: Análise dos aminoácidos encontrados em maior quantidade 40% 40% 20% Aminoácidos ASP-428 GLU-516 TYR-396 Aminoáci do Estrutura química Grupo funcional Polaridade Classificação Glutamato ou ácido glutâmico Carboxila -COOH Polar ácido Tirosina Anéis de C Apolar Aromático 57 Fonte: elaborado pela autora . Ainda analisando a presença de aminoácidos é perceptível que ao realizar os Dockings com a estrutura completa, qual seja: com o domínio receptor (RBD) e a enzima conversora de angiotesina (ACE 2), há uma presença de diferentes aminoácidos como arguinina e prolina, que não estão presentes nos resultados do Docking realizado apenas com o domínio RBD. Tabela 5 Representação final dos ligantes pelo PyMOL Cianidina Eriodictiol Aspartato ou ácido aspártico Carboxila -COOH Polar Ácido 58 Genisteina Kaempferol Miricetina Quercetina Fonte: elaborado pela autora 59 Na tabela 6 verifica-se na primeira coluna a representação final dos ligantes dockados na estrutura completa 6LZG. Na segunda coluna é apresentada a posição dos ligantes nos resultados do blind realizado apenas com a parte RBD da estrutura 6LZG, ou seja, sem a ACE2 . A partir dos resultados obtidos, a análise das imagens permite concluir que as áreas encontradas são próximas às folhas BETA antiparalelas da estrutura analisada. Estas regiões apresentam ligações de hidrogênio que formam um ângulo de 90° com as fitas, tendendo a ser mais estáveis conformacionalmente, acarretando na desnaturação das proteínas por seus inibidores; trata-se de regiões hidrofóbicas. Na tabela 6 é possível notar que os ligantes apresentam conformações finais semelhantes. No Docking realizado com a estrutura completa nota-se que a genisteina apresenta uma conformação diferente dos demais, porém no Docking realizado apenas com o RBD é possível observar que não há essa diferença posicional, visto que ela apresenta posição semelhante a das demais estruturas. 5 CONCLUSÃO O estudo, por meio do Docking molecular, permite destacar como resultado que as áreas encontradas para melhor interação são próximas às folhas β antiparalelas da estrutura analisada. São regiões hidrofóbicas e os principais aminoácidos encontrados na genisteína: arginina, ácido glutâmico e tirosina; no Eriodictiol: ácido glutâmico,e ácido aspártico. 60 REFERÊNCIAS ALMEIDA, D. M. Dockthor: Implementation, upgrade and validation of a receptor-ligand Docking software. 2011. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2011. ALVES, C. A. S. et. al. A importância da bioinformática aplicada na parasitologia. In: VI ENCONTRO PIAUIENSE DE BIOMEDICINA, p.7 , 2021. Anais [...]. Piauí, 16 de ago. 2021. BAGLIVO, M. et al. Natural small molecules as inhibitors of coronavirus lipid- dependent attachment to host cells: a possible strategy for reducing SARS- COV-2 infectivity? Acta Biomédica, Fidenza, Itália, v. 91, n. 1, 19 mar. 2020. p. 161–164. Disponível em: https://doi.org/10.23750/abm.v91i1.9402. Acesso em: 10 jun. 2022. BAVARESCO, L. et al. Elicitation and accumulation of stilbene phytoalexins in grapevine berries infected by Botrytis cinerea. Vitis. Journal of Grapevine Research. Alemanha, 1997, v. 36, p. 77–83. Disponível em: https://doi.org/10.5073/vitis.1997.36.77-83 Acesso em: 05 jun. 2022. Berman, H., The Protein Data Bank: a historical perspective. Acta Crystal. 2008, v. 64, p. 88– 95. Disponível em: https://doi.org/10.1107/S0108767307035623 Acesso em: 10 jun. 2022. Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE. The Protein Data Bank. Nucleic Acids Res. 2000 Jan 1;28(1):235-42. doi: 10.1093/nar/28.1.235. PMID: 10592235; PMCID: PMC102472. BEDANI, R.; ROSSI, E. A. Isoflavonas: bioquímica, fisiologia e implicações para a saúde. Boletim do Centro de Pesquisa de Processamento de Alimentos, [S.l.], dec. 2005. ISSN 19839774. doi:http://dx.doi.org/10.5380/cep.v23i2.4490. Disponível em: https://revistas.ufpr.br/alimentos/article/view/4490. Acesso em: 01 jun. 2022. BEST, R. B. et al. Optimization of the Additive CHARMM All-Atom Protein Force Field Targeting Improved Sampling of the Backbone ϕ, ψ and Side-Chain χ1 and χ2 Dihedral Angles. Journal of Chemical Theory and Computation, v. 8, n. 9, p. 3257–3273, 11 set. 2012. BIAZUS, M.; THOM, L. H.; DORN, M. Modelagem e Análise de Conformidade do Processo de Atracamento Molecular. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 10. , 2016, Porto Alegre. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2016 . p. 294-301. ISSN 2763-8774. DOI: https://doi.org/10.5753/bresci.2016.10012. BOROUDJERDI, H. et al. Statics and dynamics of strongly charged soft matter. Physics Reports, v. 416, n. 3, p. 129–199, 1 set. 2005. BRENK, R. et al. Lessons learnt from assembling screening libraries for drug discovery for neglected diseases. ChemMedChem, v. 3, n. 3, p. 435–444, mar. 2008. https://doi.org/10.23750/abm.v91i1.9402 https://doi.org/10.5073/vitis.1997.36.77-83 https://doi.org/10.1107/S0108767307035623 61 Magalhães, C. S.; et. al. A dynamic niching genetic algorithm strategy for docking highly flexible ligands. Information Sciences, p.206–224. 2014. doi: 10.1016/j.ins.2014.08.002. CAPRILES, P. V. Z. Modelos Tridimensionais. In: VERLI, H. (Org.) Bioinformática: da biologia à flexibilidade molecular. p. 148. 2014. Caruso, Í. P. Estudo de interação dos flavonóides Isovitexina e 2- Fenilcromona com a Albumina do Soro Humano : abordagem experimental e computacional.2016. Tese (Doutorado em Biofisica Molecular). Instituto de Biociências, Letras e Ciências Exatas de São José do Rio Preto. Universidade Estadual Pulista - UNESP. São José do Rio Preto, 2016. Cazarolli L., Zanatta L., Alberton E., et ai. Flavonóides: potenciais candidatos a drogas. Mini-Revisões em Química Medicinal. p.1429–1440. 2008. doi: 10.2174/138955708786369564. . CERDAN, M. T. D. Benefícios à saúde dos compostos Eriodictiol, Hesperidina e suas formas derivadas. 33 f. , 2013. Trabalho de Conclusão de Curso (Graduação em Farmácia). Faculdade de Ciências Farmaceuticas de Araraquara. Universidade Estadual Paulista - UNESP. Disponível em: http://hdl.handle.net/11449/118634. Acesso em: 02 jun. 2022. CHEN, Y. W.; YIU, C.-P. B.; WONG, K.-Y. Prediction of the SARS-CoV-2 (2019-nCoV) 3C-like protease (3CL pro) structure: virtual screening reveals velpatasvir, ledipasvir, and other drug repurposing candidates. F1000 Research, v. 9, 9 abr. 2020. CHIPOT, C. Frontiers in free-energy calculations of biological systems. Wiley Interdisciplinary Reviews: Computational Molecular Science, v. 4, n. 1, p. 71– 89, 1 jan. 2014. COMER, J. et al. The Adaptive Biasing Force Method: Everything You Always Wanted To Know but Were Afraid To Ask. The Journal of Physical Chemistry B, v. 119, n. 3, p. 1129–1151, 22 jan. 2015. COUGHLIN, M. M.; PRABHAKAR, B. S. Neutralizing human monoclonal antibodies to severe acute respiratory syndrome coronavirus: target, mechanism of action, and therapeutic potential. Reviews Medical Virology, v. 22, n. 1, p. 2–17, jan. 2012. DE CARVALHO, S. J.; GHIOTTO, R. C. T.; DA SILVA, F. L. B. Monte Carlo and modified Tanford-Kirkwood results for macromolecular electrostatics calculations. The Journal of Physical Chemistry. B, v. 110, n. 17, p. 8832– 8839, 4 maio 2006. DE VRIES, R. Monte Carlo simulations of flexible polyanions complexing with whey proteins at their isoelectric point. The Journal of Chemical Physics, v. 120, n. 7, p. 3475–3481, 15 fev. 2004. DockThor. Portal DockThor 2009. Disponível em: http://www.inct- inofar.ccs.ufrj.br/inofar2009/download/dockthor_port.pdf . Acesso em: 16 Ago. 2021. http://hdl.handle.net/11449/118634. 62 DROZDOV-TIKHOMIROV, L. N. et al. About factors providing the fast protein- protein recognition in processes of complex formation. Journal of Biomolecular Structure & Dynamics, v. 21, n. 2, p. 257–266, out. 2003. DU, J. et al. Antiviral flavonoids from the root bark of Morus alba L. Phytochemistry, v. 62, n. 8, p. 1235–1238, abr. 2003. Farias, A. Q. P.; Chacon, P. F. S.; da Silva, N. R. R. A bioinformática como ferramenta de formação de recursos humanos no IFRN. HOLOS, vol. 6, 2012, pp. 113-123. FLAMBÓ, Diana Filipa Afonso Lopes Peres. Atividades Biológicas dos Flavonoides: Atividade Antimicrobiana. 2013. 31 f. Dissertação (Mestrado) - Curso de Ciências da Saúde, Universidade Fernando Pessoa, Porto, 2013. FOGOLARI, F. et al. Biomolecular electrostatics with the linearized Poisson- Boltzmann equation. Biophysical Journal, v. 76, n. 1 Pt 1, p. 1–16, jan. 1999. FOGOLARI, F.; BRIGO, A.; MOLINARI, H. The Poisson-Boltzmann equation for biomolecular electrostatics: a tool for structural biology. Journal of molecular recognition: JMR, v. 15, n. 6, p. 377–392, dez. 2002. Fokoue, Harold H. et al. Há algo novo no reconhecimento molecular aplicado à química medicinal?. Química Nova [online]. 2020, v. 43, n.1 p. 78-89. Disponível em: https://doi.org/10.21577/0100-4042.20170474. Epub 16 Mar 2020. ISSN 1678-7064. https://doi.org/10.21577/0100-4042.20170474. Acesso em 04 maio 2022. FRADERA, X.; BABAOGLU, K. Overview of Methods and Strategies for Conducting Virtual Small Molecule Screening. Current Protocols in Chemical Biology, v. 9, n. 3, p. 196–212, 14 set. 2017. FREITAS, Renato Ferreira de; SCHAPIRA , Matthieu. A systematic analysis of atomic protein–ligand interactions. PDB. MedChem, [s. l.], p. 1970-1981, 1 out. 2017. Disponível em: https://pubs.rsc.org/en/content/articlelanding/2017/MD/C7MD00381A#!divCitati on. Acesso em: 16 ago. 2021. GE, X.-Y. et al. Isolation and characterization of a bat SARS-like coronavirus that uses the ACE2 receptor. Nature, p. 535–8, 2013. GIMENO, A. et al. The Light and Dark Sides of Virtual Screening: What Is There to Know? International Journal of Molecular Sciences, v. 20, n. 6, 19 mar. 2019. GIRARD, M.; TURGEON, S. L.; GAUTHIER, S. F. Quantification of the Interactions between β-Lactoglobulin and Pectin through Capillary Electrophoresis Analysis. Journal of Agricultural and Food Chemistry, v. 51, n. 20, p. 6043–6049, 1 set. 2003. GONÇALVES, W. R. S; et al. PDBEST - uma ferramenta de processamento paralelo para aquisição, manipulação, edição e filtragem de arquivos do protein data bank (PDB). 81 f. 2015. Disssertação (Mestrado em Bioinformática), Instituto de Ciências Biológicas. Universidade Federal de Minas Gerais. Belo Horizonte. 2015. https://doi.org/10.21577/0100-4042.20170474. 63 GRYMONPRÉ, K. R. et al. Identification by Integrated Computer Modeling and Light Scattering Studies of an Electrostatic Serum Albumin-Hyaluronic Acid Binding Site. Biomacromolecules, v. 2, n. 2, p. 422–429, 1 jun. 2001. Guedes, I. A. et al. Drug design and repurposing with DockThor-VS web server focusing on SARS-CoV-2 therapeutic targets and their non-synonym variants. Sci Rep 11, 5543. 2021. GUEDES, I. A.; MAGALHÃES, C. S. de; DARDENNE, L. E. Receptor-ligand molecular docking. Biophysical Reviews, Heidelberg, 2014. v. 6, n. 1, p. 75- 87, Mar. 2014. Guedes, I.A., Costa, L.S.C., dos Santos, K.B. et al. Drug design and repurposing with DockThor-VS web server focusing on SARS-CoV-2 therapeutic targets and their non-synonym variants. Sci Rep 11, 5543 (2021). https://doi.org/10.1038/s41598-021-84700-0 GUEDES, Isabella A. et al. Drug Design and Repurposing with DockThor-VS Web Server: Virtual Screening focusing on SARS-CoV-2 Therapeutic Targets and their Non-Synonym Variants. Research Square, 10.21203/rs.3.rs- 96789/v1, 23 out. 2020 GUIMARÃES, R.B. et al. O raciocínio geográfico e as chaves de leitura da COVID-19 no território brasileiro. Estudos Avançados. V. 34, n. 99, p. 119- 141, 2020. HAAGMANS, B. L.; OSTERHAUS, A. D. M. E. Coronaviruses and their therapy. Antiviral Research, v. 71, n. 2–3, p. 397–403, set. 2006. HOPKINS, D. L.; PURCELL, A. H. Xylella fastidiosa: cause of Pierce’s disease of grapevine and other emergente diseases. Plant Disease, Saint Paul, v. 86, n. 10, p. 1056-1066, Oct. 2002. Disponível em: http://apsjournals.apsnet. org/doi/pdf/10.1094/PDIS.2002.86.10.1056. Acesso em: 07 out. 2021. http://www.biodados.icb.ufmg.br/pinguim/stuff/tutorial_DockThor.pdf http://www.pbc.uem.br/arquivos/mc7-2016.pdf. Acesso em: 07 out. 2021. HUMPHREY, W.; DALKE, A.; SCHULTEN, K. VMD – Visual Molecular Dynamics. Journal of Molecular Graphics, v. 14, p. 33–38, 1996. IAMARINO, Átila; LOPES, Sônia. Coronavírus: Explorando a pandemia que mudou o mundo, São Paulo, Moderna, 2020. ISHITSUKA, H. et al. Direct and specific inactivation of rhinovirus by chalcone Ro 09-0410. Antimicrobial Agents and Chemotherapy, v. 22, n. 4, p. 617– 621, out. 1982. JARDINE, José Gilberto et al. Biologia computacional molecular e suas aplicações na agricultura. In: JARDINE, José Gilberto et al. Biologia computacional molecular e suas aplicações na agricultura. Embrapa Informática Agropecuária - Capítulo em livro científico (ALICE): [s. n.], 2017. cap. 6, p. 101-117. JIN, Z. et al. Structure of Mpro from COVID-19 virus and discovery of its inhibitors. BioRxiv, p. 2020.02.26.964882, 29 mar. 2020. http://www.biodados.icb.ufmg.br/pinguim/stuff/tutorial_DockThor.pdf http://www.pbc.uem.br/arquivos/mc7-2016.pdf. 64 KANDEEL, M. et al. From SARS and MERS CoVs to SARS-CoV-2: Moving toward more biased codon usage in viral structural and nonstructural genes. Journal of Medical Virology, 11 mar. 2020. KARPLUS, M.; MCCAMMON, J. A. Molecular dynamics simulations of biomolecules. Nature Structural Biology, v. 9, n. 9, p. 646–652, 2002. KESVATERA, T. et al. Calbindin D(9k): a protein optimized for calcium binding at neutral pH. Biochemistry, v. 40, n. 50, p. 15334–15340, 18 dez. 2001. KIRKWOOD, J. G. Statistical Mechanics of Fluids Mixtures. J. Chem. Phys., v. 3, p. 300–313, 1935. KIRKWOOD, J. G.; SHUMAKER, J. B. Forces between Protein Molecules in Solution Arising from Fluctuations in Proton Charge and Configuration. Proceedings of the National Academy of Sciences, v. 38, n. 10, p. 863–871, 1 out. 1952. KOES, D. R.; CAMACHO, C. J. Pharmer: Efficient and Exact Pharmacophore Search. Journal of Chemical Information and Modeling, v. 51, n. 6, p. 1307– 1314, 27 jun. 2011. KOES, D. R.; CAMACHO, C. J. ZINCPharmer: pharmacophore search of the ZINC database. Nucleic Acids Research, v. 40, n. W1, p. W409–W414, 1 jul. 2012. KUNTZ, I. D.; BLANEY, J. M.; OATLEY, S. J.; LANGRIDGE, R.; FERRIN, T. A geometric approach to macromolecular-ligand interactions. Journal of Molecular Biology, London, v. 161, n. 2, p. 269-288, Oct. 1982. KURODA, Y.; HARA, Y. Antimutagenic and anticarcinogenic activity of tea polyphenols. Mutation Research/Reviews in Mutation Research, v. 436, n. 1, p. 69–97, 1 jan. 1999. LAN, J. et al. Structure of the SARS-CoV-2 spike receptor-binding domain bound to the ACE2 receptor. Nature, p. 1–9, 30 mar. 2020. Lan, J., Ge, J., Yu, J. et al. Structure of the SARS-CoV-2 spike receptor-binding domain bound to the ACE2 receptor. Nature 581, 215–220 (2020). https://doi.org/10.1038/s41586-020-2180-5 LANGCAKE, P.; PRYCE, R. J. The production of resveratrol by Vitis vinifera and other members of the Vitaceae as a response to infection or injury. Physiological Plant Pathology, v. 9, n. 1, p. 77–86, 1 jul. 1976. LARKIN, M. A. et. al. Clustal W and Clustal X version 2.0. Bioinformatics, Oxford, v. 23, n. 21, p. 2947-2948, Nov. 2007. LESIEUR, C.; SCHULTEN, K. Editorial overview: Theory and simulation. Current Opinion in Structural Biology, Theory and simulation/Macromolecular machines and assemblies. v. 31, p. v–vi, 1 abr. 2015. LI, G.; CLERCQ, E. D. Therapeutic options for the 2019 novel coronavirus (2019-nCoV). Nature Reviews Drug Discovery, v. 19, n. 3, p. 149–150, mar. 2020. 65 LIPINSKI, C. A. et al. Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Advanced Drug Delivery Reviews, v. 46, n. 1–3, p. 3–26, 1 mar. 2001. LUMLEY, J. A. Compound Selection and Filtering in Library Design. QSAR & Combinatorial Science, v. 24, n. 9, p. 1066–1075, 1 nov. 2005. LUND, M.; ÅKESSON, T.; JÖNSSON, B. Enhanced Protein Adsorption Due to Charge Regulation. Langmuir, v. 21, n. 18, p. 8385–8388, 1 ago. 2005. LUND, M.; JÖNSSON, B. A Mesoscopic Model for Protein-Protein Interactions. Solution. Biophysical Journal, v. 85, n. 5, p. 2940–2947, nov. 2003. LUND, M.; JÖNSSON, B. On the Charge Regulation of Proteins. Biochemistry, v. 44, n. 15, p. 5722–5727, 1 abr. 2005. MAGALHÃES, C. S. Algoritmos genéticos para o problema de Docking proteína-ligante. 2006. 220 f. Tese (Doutorado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2006. Mancini, A. L.; Higa, R. H.; Oliveira, A.; Dominiquini, F.; Kuser, P. R.; Yamagishi, M.E. B.; Togawa, R. C. & Neshich, G. (2004). Sting contacts: a web-based application for identification and analysis of amino acid contacts within protein structure and across protein interfaces. Bioinformatics, 20(13):2145–2147. MCCOY, A. J.; CHANDANA EPA, V.; COLMAN, P. M. Electrostatic complementarity at protein/protein interfaces11Edited by B. Honig. Journal of Molecular Biology, v. 268, n. 2, p. 570–584, 2 maio 1997. MENACHERY, V. D. et al. A SARS-like cluster of circulating bat coronaviruses shows potential for human emergence. Nature Medicine, v. 21, n. 12, p. 1508– 1513, dez. 2015. MIDDLETON, E.; KANDASWAMI, C.; THEOHARIDES, T. C. The effects of plant flavonoids on mammalian cells: implications for inflammation, heart disease, and cancer. Pharmacological Reviews, v. 52, n. 4, p. 673–751, dez. 2000. NELSON, M. et al. NAMD: A parallel, object oriented molecular dynamics program. International journal of supercomputer applications and high, v. 10, n. 4, p. 251–268, WIN 1996. NEUMAN, B. W. et al. A structural analysis of M protein in coronavirus assembly and morphology. Journal of Structural Biology, v. 174, n. 1, p. 11– 22, abr. 2011. NOWAKOWSKA, Z. A review of anti-infective and anti-inflammatory chalcones. European Journal of Medicinal Chemistry, v. 42, n. 2, p. 125–137, fev. 2007. OLIVEIRA, M. S. Identificação de padrões conformacionais em estruturas experimentais e projeto de metaheurísticas para a predição da estrutura tridimensional de proteínas. 2016. 87 f. Trabalho de Conclusão de Curso (Graduação em Biotecnologia) Instituto de Biociências Universidade Federal do Rio Grande do Sul. Porto Alegre. 66 PAGADALA, N. S.; SYED, K.; TUSZYNSKI, J. Software for molecular docking: a review. Biophysical Reviews, v. 9, n. 2, p. 91–102, 16 jan. 2017. PERILLA, J. R. et al. Molecular dynamics simulations of large macromolecular complexes. Current Opinion in Structural Biology. v. 31, p. 64–74, 1 abr. 2015. POLISHCHUK, P. et al. Virtual Screening Using Pharmacophore Models Retrieved from Molecular Dynamic Simulations. International Journal of Molecular Sciences, v. 20, n. 23, 20 nov. 2019. PRABAKARAN, P.; XIAO, X.; DIMITROV, D. S. A model of the ACE2 structure and function as a SARS-CoV receptor. Biochemical and Biophysical Research Communications, v. 314, n. 1, p. 235–241, 30 jan. 2004. RAMASSAMY, C. Emerging role of polyphenolic compounds in the treatment of neurodegenerative diseases: a review of their intracellular targets. European Journal of Pharmacology, v. 545, n. 1, p. 51–64, 1 set. 2006. RISCO, C. et al. The transmissible gastroenteritis coronavirus contains a spherical core shell consisting of M and N proteins. Journal of Virology, v. 70, n. 7, p. 4773–4777, jul. 1996. RODRIGUES, R. P. et al. Estratégias de Triagem Virtual no Planejamento de Fármacos. Revista Virtual de Química, v. 4, n. 6, p. 739–776, 24 dez. 2012. Rowling, J. K. Harry Potter e a Pedra Filosofal. Tradução Lia Wyler. Rio de Janeiro. Rocco. 2000. p. 21, 63. RUCH, T. R.; MACHAMER, C. E. The Coronavirus E Protein: Assembly and Beyond. Viruses, v. 4, n. 3, p. 363–382, 8 mar. 2012. SANTOS, N. C. Tabela Brasileira de Composição de Alimentos (TBCA- USP): dados de flavonóides. 2009. 178 f. Dissertação (Mestrado em Nutrição Humana Aplicada) - Nutrição Humana Aplicada, Universidade de São Paulo, São Paulo, 2009. SANTOS, R. J. Efeito do armazenamento de polpas de frutas congeladas sobre os teores de flavonóides, vitamina C e atividade antioxidante. 2005. Dissertação (Mestrado em Bromatologia) - Faculdade de Ciências Farmacêuticas, Universidade de São Paulo, São Paulo, 2005. SEYREK, E. et al. Ionic strength dependence of protein-polyelectrolyte interactions. Biomacromolecules, v. 4, n. 2, p. 273–282, abr. 2003. SHANMUGARAJ, B. et al. Perspectives on monoclonal antibody therapy as