RESSALVA Atendendo solicitação do autor, o texto completo desta tese será disponibilizado somente a partir de 20/05/2022 Campus de São José do Rio Preto Fernando Bruno da Silva Estudo das Interações Não-Nativas, Eletrostáticas e Hidrofóbicas, no Processo de Enovelamento de Proteínas Utilizando Modelos Minimalistas São José do Rio Preto 2021 Fernando Bruno da Silva Estudo das Interações Não-Nativas, Eletrostáticas e Hidrofóbicas, no Processo de Enovelamento de Proteínas Utilizando Modelos Minimalistas Tese apresentada como parte dos requisitos para obtenção do título de Doutor em Bio- física Molecular, junto ao Programa de Pós- Graduação em Biofísica Molecular, do Insti- tuto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CNPq - Proc. 141715/2017-0 Orientador: Prof. Dr. Vitor Barbanti Pereira Leite São José do Rio Preto 2021 S586e Silva, Fernando Bruno da Estudo das interações não-nativas, eletrostáticas e hidrofóbicas, no processo de enovelamento de proteínas utilizando modelos minimalistas / Fernando Bruno da Silva. -- São José do Rio Preto, 2021 115 p. Tese (doutorado) - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto Orientador: Vitor Barbanti Pereira Leite 1. Biologia molecular. 2. Biofísica molecular. 3. Proteínas - Estruturas. 4. Enovelamento de proteínas. 5. Dinâmica molecular. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca do Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto. Dados fornecidos pelo autor(a). Essa ficha não pode ser modificada. Fernando Bruno da Silva Estudo das Interações Não-Nativas, Eletrostáticas e Hidrofóbicas, no Processo de Enovelamento de Proteínas Utilizando Modelos Minimalistas Tese apresentada como parte dos requisitos para obtenção do título de Doutor em Bio- física Molecular, junto ao Programa de Pós- Graduação em Biofísica Molecular, do Insti- tuto de Biociências, Letras e Ciências Exatas da Universidade Estadual Paulista “Júlio de Mesquita Filho”, Câmpus de São José do Rio Preto. Financiadora: CNPq - Proc. 141715/2017-0 Comissão Examinadora Prof. Dr. Vitor Barbanti Pereira Leite UNESP – Câmpus São José do Rio Preto Orientador Profa. Dra. Ana Lígia Scott UFABC – Universidade Federal do ABC Prof. Dr. Leandro Martínez UNICAMP – Universidade Estadual de Campinas Prof. Dr. Jorge Chahine UNESP – Câmpus São José do Rio Preto Prof. Dr. Laurent Emmanuel Dardenne LNCC – Laboratório Nacional de Computação Científica São José do Rio Preto 20 de maio de 2021 Dedico este trabalho a toda minha família, principalmente a minha mãe e aos meus ir- mãos que sempre me apoiaram e me incenti- varam nesta minha jornada. Agradecimentos Quero agradecer, primeiramente, a toda minha família, por acreditar em meu potencial e principalmente por me apoiar. Agradeço exclusivamente a minha mãe, Marta Bruno Prudêncio, e aos meus irmãos, Aline Bruno da Silva e Diego Bruno da Silva, pelo companheirismo e carinho, pois sem vocês eu não teria conseguido chegar onde cheguei. Agradeço ao Prof. Dr. Vitor Barbanti Pereira Leite, por me orientar du- rante esses anos e por confiar em meu trabalho. Muito obrigado pela dedicação e confiança. Agradeço ao pessoal do grupo de pesquisa Paulo Mouro, Thiago Tombonis, Vinícius de Godoi Contessoto, Vinícius Martins de Oliveira, Antonio Bento de Oliveira e Murilo Sanches pela ajuda nos momentos de dificuldade e pelos bons momentos que passamos juntos. Aos meus amigos do departamento de Física e do programa de pós-graduação em Biofísica Molecular, agradeço pelos bons momentos que passamos juntos, por todo o companherismo e ao acolhimento, vocês foram essenciais em minha trajetória. Aos professores do Departamento de Física e do Programa de Pós-Graduação em Biofísica Molecular, muito obrigado por todo ensinamento compartilhado. Agradeço aos membros títulares Profa. Dra. Ana Lígia Scott, Prof. Dr. Jorge Chahine, Prof. Dr. Leandro Martínez e Prof. Dr. Laurent Emmanuel Dardenne por aceitarem em participar desta banca de defesa de doutorado, deixo aqui meu muito obrigado. Por fim e não menos importante, agradeço ao IBILCE/UNESP por fornecer toda a infraestrutura necessário para o desenvolimento do projeto proposto em meu doutorado. CNPq pelo apoio financeiro fornecido em meu doutorado e ao GridUNESP pela disponibilização dos recursos computacionais imprescindíveis para a realização deste trabalho. “What you do makes a difference, and you have to decide what kind of difference you want to make” Dr. Jane Goodall [1] Resumo O estudo do enovelamento proteína nesse trabalho tem como base o uso do modelo baseado em estrutura, modelo no qual apenas as interações nativas são consideradas como favoráveis durante o enovelamento. Entretanto, as interações di- tas como não favoráveis são consideradas pelo modelo. Dessa forma, o objetivo geral desse trabalho buscou averiguar os efeitos das interações não-nativas durante o processo enovelamento. Os potencias não-nativos adotados são: potencial eletrostático (Elec), hidrofóbico (HP) e de dessolvatação (db ou dsb). Esses potenciais foram combinados de diferentes formas e adicionados no modelo SBM-Cα. Portanto, o trabalho desen- volvido buscou compreender como as interações não-nativas e os estados metaestáveis podem estar correlacionados. O primeiro trabalho desenvolvido envolve a proteina CI2, onde foram analisados diferentes grupos mutacionais para obter uma proteína mais termoestável. O modelo computacional adotado foi o SBM-Cα + Elec + HP. O segundo trabalho foi com os domínios R15, R16 e R16M5 da α-espectrina, esse estudo é continuação dos trabalhos realizadas anteriormente com os domínios R15, R16 e R17. O modelo computacional utilizado foi o mesmo proposto para CI2 e tem como obje- tivo analisar os fatores mutacionais envolvidos na redução do tempo de enovelamento devido a um grupo mutacional específico. Além disso, por meio do método ELViM, foram averiguados os perfis energéticos dessas proteínas. Por fim, no terceiro trabalho foi investigado os estados intermediários das proteínas Im7 e Im9, pois em diferentes valores de pH, esses estados apresentam diferentes comportamentos. Portanto, o mo- delo computacional adotado foi o SBM-Cα + Elec + HP + db. Afim de reproduzir o sistema em diferentes valores de pH, foram alterados os valores de carga dos resíduos ionizáveis. Palavras-chave: Modelo Baseado em Estrutura. Enovelamento de Proteína. Dinâ- mica Molecular. Efeito Hidrofóbico. Interações Eletrostáticas. Potencial de dessolva- tação. Estados Metaestáveis. Estados Intermediários. Abstract The protein folding studies in this work are based on the structure-based model. Structure-based model are usually used to explore the folding process, but this model consists only the native interactions are favorable to the protein folding. Howe- ver, unfavorable interactions may also help the process too. The non-native potentials, that incorporate these interactions, it was added to the structure-based Cα model (the electrostatic (Elec), the hydrophobic (HP), and the desolvation potential (db or dsb)). These potentials were combined in different ways into the SBM-Cα model and, as a result, we tried to understand how non-native interactions and the metastable states could be associated. In the present study with the CI2 protein, a group of mutants was selected to obtain a new version of the CI2 protein with a different thermostability. The simulation was performed with the SBM-Cα + Elec + HP. The second project includes two domains from α-spectrin, R15 and R16, and a version of R16 with five mutations, R16M5. This study is part II of our previous work with the domains R15, R16, and R17. The computational model was the same applied for CI2 and the main goal of this study was to understand the mutation effects in the folding time when we have the group of five mutations. The central idea was to explore the presence of a metastable state that may or may not support the folding process when considering the five mutations. In addition, using the ELViM method, the energy profiles of these proteins were analyzed. Finally, in the third project, the Im7 and Im9 intermediate states were investigated. The intermediate states of these proteins stabilized under different pH values. The simulations were carried out with the SBM-Cα + Elec + HP + db model. In order to reproduce the system at different pH values, the charge values of the ionizable residues were changed, according to their theoretical pKa. Keywords: Strucuture-Based Model. Protein Folding. Molecular Dynamics. Hy- drophobic Effects. Electrostatic Interactions. Desolvation Potential. Metastable Sta- tes. Intermidiate States. Lista de Figuras 1.1 Representação simplificada de uma ligação peptídica entre dois ami- noácidos diferentes. O grupo carboxílico libera um OH, enquanto que o grupo amino cede um H. Posteriormente, essas duas espécies irão formar uma molécula de água, H2O. A ligação CO-NH resultante é denominada ligação peptídica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.2 Diagrama de uma proteína (PCNA com PDB ID: 1AXC) em diferentes níveis hierárquicos. Estrutura primária (A), estrutura secundária (B), estrutura terciária (C) e por fim, estrutura quartenária (D). . . . . . . 21 1.3 Representação do funil de energia para uma proteína qualquer. No eixo horizontal, tem-se a entropia, S(Q), em função da coordenada de reação. No eixo vertical, a representação da energia, E(Q), lado esquerda, e a representação da coordenada de reação, lado direira, fração dos contatos nativos, Q. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.1 Representação do potencial eletrostático, Vele, de Coulomb puro e blin- dado em função da distância de separação, r, entre dois resíduos carre- gadas em diferentes concentrações da sal. . . . . . . . . . . . . . . . . . 31 3.2 Representação do potencial de barreira de dessolvatação, U(r) = Vdb, em função da distância de separação entre dois resíduos de aminoácidos. Esse potencial é caracterizado por um máximo, εdb, e por um mínimo, εssm, que representam as barreiras de dessolvatação. As variáveis rnat, rdb e rssm representam, respectivamente, as distâncias de separação entre os dois resíduos e entre os resíduos e as moléculas de água. . . . . . . . 32 3.3 Exemplo de duas estruturas (k e l) onde são indicadas as distâncias internas (ri,j) entre os aminoácidos (1, 7, 13, 33 e 60). As diferenças estruturais estão relacionadas com as variações destas distâncias entre todos os aminoácidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4 Exemplo de visualização em 2D. No lado esquerdo da figura, tem-se a visualização da superfície de enovelamento da proteína ww domain. Cada ponto neste gráfico refere-se a uma conformação. No lado di- reito, estão representadas quatro conformações (em vermelho), e suas respectivas distâncias multidimensionais (δk,l). Uma estrutura exemplo de cada uma delas está representada sobreposta com a estrutura nativa da proteína (em verde). . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.5 Histogramas produzidos em função da energia potencial total para o domínio R15 da α-espectrina em diferentes temperaturas. Os valores das temperaturas variam de 70(A) a 160(J), com intervalos iguais a 10. As simualções foram realizadas com o modelo SBM-Cα. . . . . . . . . . 40 4.1 Representação da estrutura terciária (A), secundária e sequência primá- ria (B) da proteína CI2. As folhas β1, β2, β3 e β4 estão representadas em cor vermelha, α1-hélice em cor azul e as regiões não estruturadas em cinza. Os resíduos destacados por uma esfera de cor branca (K19, D24, R49 e F51), são os resíduos de aminoácidos que quando substituídos por resíduos hidrofóbicos ou carregados aceleram o tempo de enovelamento. Já os resíduos indicados por uma seta na sequência primária, correspon- dem aos mesmos resdíduos destacados na estrutura terciária. O desenho da estrutura tridimensional foi obtido pelo software CHIMERA e a es- trutura secundária e a sequência primária pelo software ALINE . . . . 44 4.2 Energia livre eletrostática, ∆Gqq, para a proteína CI2-WT (A) e CI2-MD (K19R/D24A/R49F/F51L) (B). ∆Gqq > 0 indica que o resíduo apre- senta energia livre eletrostática desfavorável para estabilizar o estado nativo, porém seu valor de SASA < 50%. As setas vermelhas indicam quais são os candidatos que sofrerão mutações. Todos os resultados foram calculados para o pH = 7,0 e obtidos pelo software TKSA-MC . 48 4.3 Energia livre eletrostática, ∆Gqq, para todas as mutações realizadas na CI2. A sequência das figuras segue a ordem decrescente, em módulo, da energia: K19R, R49W, R49Y, R49F/F51L, MB - K19R/R49F/F51L, D24A, MA - K19R/D24A, MC - D24A/R49F/F51L. Os resultados foram obtidos para o pH = 7,0.∆Gqq > 0 indica que o resíduo apresenta ener- gia livre eletrostática desfavorável para estabilizar o estado nativo, com SASA < 50%. Já as barras em vermelho, apresentam SASA ≥ 50%, tornando esses resíduos candidados a sofrerem mutações . . . . . . . . 49 4.4 Efeitos mutacionais na estabilidade, ∆GT, e no tempo de enovelamento, τ ∗, da proteína CI2. (A) Energia livre eletrostática total (∆GT) em função da temperatura de enovelamento (Tf * - em unidades reduzidas) para cada grupo mutacional da CI2. (B) Tempo de enovelamento para cada versão da CI2, τ ∗, normalizado pelo tempo de enovelamento da tipo selvagem (CI2-WT), τwt. A correlação linear esta representada pela li- nha continua em cor vermelha. (C) Tempo de enovelamento (τ ∗) para as mutações propostas (MA, MB, MC, e MD) comparado com o tempo de enovelamento da R49Y e WT. As barras de cor azul são dados com- putacionais e as barras de cor laranja e cinza, são dados experimentais. Todos dados experimentais foram extraídos de Ladurner e Lawrence . . 51 4.5 Análise da energia média eletrostática e hidrofóbica, assim como da di- ferença de probabilidade de formação dos contatos nativos no ensemble ETS e TS para CI2-MD e CI2-WT. (A) Energia média eletrostática, 〈Eel〉, e hidrofóbica, 〈Ehp〉, para a CI2 selvagem (CI2-WT em cor azul) e para a mutação MD (CI2-MD em cor vermelha). Energia computada para o estado não-nativo (Unf - unfolded), pré-estado de transição (ETS - early transtion state), estado de transição (TS - transition state), pós- estado de transição (LTS - late transition state) e estado nativo (Fold - folded) para CI2-WT e CI2-MD. (B) Diferença percentual (∆Pij (%)) entre os mapas de contato da CI2-MD e CI2-WT para o ETS (triân- gulo superior) e para TS (triângulo inferior). A estrutura secundária está representada em cor cinza e a barra está associada à diferença de probabilidade do mapa de contato. (C) e (D) são as estruturas repre- sentativas da CI2-MD e CI2-WT, respectivamente, no esemble ETS. A região destacada em vermelho na CI2-MD corresponde a mesma região em vermelho do triângulo superior (ETS) da figura B. . . . . . . . . . . 53 5.1 Alinhamento das sequências dos domínios R15, R16 e R17 e a repre- sentação estrutural do domínio R16 em que os aminoácidos da primeira α-hélice que serão substituídos estão destacados. Na Figura A, repre- sentação estrutural da R16 destacando os resíduos Glu14 em vermelho, Glu15 em verde, Ile18 em azul, Lys21 em laranja e Val25 em preto. Na Figura B, alinhamento sequencial dos domínios R15, R16 e R17 com sua respectiva representação tubular, α-hélices, da estrutura secundária. . . 57 5.2 (A) Visualização da trajetória de enovelamento da C(R15WT, R16WT) no espaço de fase 2D obtido pelo ELViM. A barra de cor está associ- ada à fração de contatos nativos, Q, normalizada de 0 a 1. (B) e (C) mapa de densidade bidimensional para os domínios R15WT e R16WT, respectivamente. A barra de cor corresponde a densidade de estados, ρ. Em (A), (B) e (C), cada ponto representa uma conformação e a distân- cia euclidiana entre os pontos está associada a uma distância relativa entre as estruturas. (D) e (E), ensemble de estruturas obtidas a partir do pontos indicados em (B) e (C), onde o estado desenovelado e nativo estão indicado em (1) e (4). . . . . . . . . . . . . . . . . . . . . . . . . 61 5.3 (A) Visualização da trajetória de enovelamento da C(R16WT, R16M5) no espaço de fase 2D obtido pelo ELViM. A barra de cor está associ- ada à fração de contatos nativos, Q, normalizada de 0 a 1. (B) e (C) mapa de densidade bidimensional para os domínios R16WT e R16M5, respectivamente. A barra de cor corresponde a densidade de estados, ρ. Em (A), (B) e (C), cada ponto representa uma conformação e a distân- cia euclidiana entre os pontos está associada a uma distância relativa entre as estruturas. (D) e (E), ensemble de estruturas obtidas a partir do pontos indicados em (B) e (C), onde o estado desenovelado e nativo estão indicado em (1) e (4). . . . . . . . . . . . . . . . . . . . . . . . . 64 5.4 Distribuição bidimensional do número dos contatos nativos versus o nú- mero dos contatos não-nativos (NN) hidrofóbicos (A,B e C) e carregados (D, E e F) para as proteínas R15WT, R16WT e R16M5. Os histogra- mas correspondentes aos contatos não-nativos e aos contatos nativos encontram-se nos eixos verticais e horizontais, respectivamente . . . . . 65 5.5 A e B, número de contatos não-nativos hidrofóbicos e carregados (ηHP e ηElec) em função dos contatos nativos. C e D, energia média hidrofóbica e eletrostática (< EHP > e < EDH >) em função dos contatos nativos. Todos os cálculos foram realizados para os domínios R15WT, R16WT e R16M5 que serão representadas pelas cores, vermelho, preto e verde, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 5.6 Em A, mapa de densidade para os domínios R16WT e R16M5, respecti- vamente, com seus estados intermediários destacados por uma circunfe- rência. Número de estados selecionados correspondem a 531 e 667 para os domínios R16WT e R16M5, respecivamente. Em B, C e D, proba- bilidade de formação de contatos nativos e não-nativos hidrofóbicos e carregados, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . 68 5.7 A distância do centro de massa das hélices. R16WT (A, B e C) e R16M5 (D, E e F) exibem a distância do centro de massa (Å) entre α-hélice 1 e 2, 1 e 3, e 2 e 3 , respectivamente, em função dos contatos nativos com sua distribuição correspondente (vertical e horizontal). As barras coloridas representam a densidade dos estados, ρ. . . . . . . . . . . . . 69 5.8 Histograma da energia eletrostática (A) e da energia hidrofóbica (B) para as proteínas R16WT e R16M5, nas cores preto e azul, respectivamente. 70 6.1 Representação estrutural das proteínas Im7 e Im9. Em A, Im7 (azul) e em B, Im9 (verde), ambas apresentam 86 resíduos de aminoácidos e apresentam o RMSD ≈ 2,0 Å. As proteínas Im7 e Im9 foram extraídas do PDB 1AYI e 1IMQ, respectivamente. . . . . . . . . . . . . . . . . . 74 6.2 (A) Perfil de energia livre, F (Q), em função da fração dos contatos na- tivos, Q. (B) Calor espefifíco, Cv, em função temperatura em unidades reduzidas, T . As linhas nas cores preto, vermelho e verde correspondem aos potenciais dsb+HP, dsb+HP+Elec1, e dsb+HP+Elec2, respectiva- mente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 6.3 (A) Perfil de energia livre, F(Q), em função dos contatos nativos em di- ferentes temperaturas (parte seperior) e rota de enovelamento, R(Q), em função dos contatos nativos, calculada na tempratura de enovelamento, T = 0,79 (parte inferior). (B) Número de estruturas presentes dentro do intervalo de 80 < Q < 100, para o estado intermediário da Im7 em diferentes valores de temperatura. . . . . . . . . . . . . . . . . . . . . . 82 6.4 (A) Alinhamento da estrutura nativa, em cinza, com a estrutura repre- sentativa do cluster -1 formado a partir da trajetória na tempratura T2, com valor de RMSD igual a 1,3 Å. (B) Alinhamento das estruturas re- presentativas selecionadas a partir do cluster -1 nas temperatutas T2 e T5, para as cores rosa e amarelo, respectivamente, com valor de RMSD igual a 1,7 Å. (C) Probabilidade da formacão dos contatos nativos for- mados para estruturas presentes na região destacada no perfil de energia livre para a temperatura T2. . . . . . . . . . . . . . . . . . . . . . . . . 83 6.5 (A) Perfil de energia livre, F(Q), em função dos contatos nativos para diferentes temperaturas. (B) Rota de enovelamento, R(Q), em função dos contatos nativos, calculada na tempratura de enovelamento, T2 = 0,79. (C) Triângulo superior, probabilidade de formacão dos contatos nativos para o conjunto de estruturas selecionadas a partir da região destacada no perfil de energia livre para a tempratura T2. Triângulo in- ferior, diferença na probabilidade de formacão dos contatos nativos entre as estruturas representativas dos sistemas Elec1 e Elec2. (D) Diferença percentual das rotas de enovelamento para os sistemas Elec1 e Elec2. . 85 6.6 Cálculo do número de contatos não-nativos, hidrofóbicos (A) e eletros- táticos (B), em função do número de contatos nativos. O sistema Elec1 e Elec2 estão representados pelas linhas sólidas nas cores vermelho e verde, respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 6.7 Cálculo da energia livre (KBT ) em função do número de contatos nati- vos e do RMSD (Å). (A) Para o sistema Elec1, o RMSD foi calculado utilizando a estrutura nativa da Im7 como referência. (B e C) Para os sistemas Elec1 e Elec2, foi utilizado no cálculo do RMSD* a estrutura do estado intermediário (cluster − 1) exbida na Figura 6.4A. (D) Para o sistema ausente do potencial eletrostático, fou utuilizado o cálculo do RMSD* tendo a estrutura do estado intermediário como referência (6.4A). 88 C.1 Grupo de estruturas correspondente aos domínios R15WT e R16WT obtidas pelo ELViM (vide Figuras 5.2B e 5.2C) . . . . . . . . . . . . . 107 C.2 Grupo de estruturas correspondente aos domínios R16WT e R16M5 ob- tidas pelo ELViM (vide Figuras 5.3B e 5.3C) . . . . . . . . . . . . . . . 108 Lista de Tabelas 3.1 Energia de interação entre aminoácidos hidrofóbicos dada pelo potencial de Miyazawa-Jernigan. . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 6.1 Diferentes valores de carga para as histidinas 40 e 47 da Im7 e para as histidinas 05, 39 e 46 da Im9 em diferentes valores de pH. . . . . . . . . 78 B.1 Energia de contato entre os aminoácidos segundo Miyazawa e Jernigan 106 Lista de Abreviaturas e Siglas DNA Deoxyribonucleic acid (ácido desoxirribonucleico) RNA Ribonucleic acid (ácido ribonucleico) ELViM Energy Landscape Visualization Method SBM Structure-Based Model WHAM Weighted Histogram Analysis Method Unf Unfold ETS Early Transition State TS Transition State LTS Late Transition State MFPT Mean First Passage Time ML Machine Learning ALINE Alignment Editor RMSD Root-Mean-Square Deviation HP Hydrophobic Elec Electrostatic MJ Miyazawa-Jernigan dsb Desolvation Barrier IDP Intrinsically disordered protein TKSA-MC Tanford-Kirkwood Surface Accessibility Monte Carlo Sumário 1 Introdução 19 2 Organização da Tese 25 3 Metodologia 27 3.1 Modelo Baseado em Estrutura: SBM-Cα . . . . . . . . . . . . . . . . . 27 3.2 Potencial Hidrofóbico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.3 Potencial Eletrostático . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.4 Potencial de Dessolvatação . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.5 Modelo TKSA-MC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.6 Cálculo da Rota de Enovelamento . . . . . . . . . . . . . . . . . . . . . 35 3.7 Probabilidade de Formação de Contatos . . . . . . . . . . . . . . . . . 36 3.8 Método de Visualização da Superfície de Energia Potencial . . . . . . . 36 3.8.1 Projeção multidimensional . . . . . . . . . . . . . . . . . . . . . 38 3.9 Método dos Múltiplos Histogramas . . . . . . . . . . . . . . . . . . . . 39 3.10 Detalhes da Simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.10.1 Análise das Simulações . . . . . . . . . . . . . . . . . . . . . . . 41 4 Efeitos Mutacionais e Otimização das Interações Não Nativas na Pro- teína CI2 43 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3 Resultados e Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.3.1 CI2 - Mutações . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.3.2 Interação Eletrostática e a Estabilidade da Proteína CI2 . . . . 47 4.3.3 Efeitos Mutacionais na Cinética de Enovelamento . . . . . . . . 49 4.3.4 Comportamento Antagônico na CI2-MD . . . . . . . . . . . . . 51 4.4 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 5 Estudo do Perfil Energético dos Domínios R15, R16 e R16M5 da α- Espectrina 56 5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.3 Resultados e Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5.3.1 Rota de enovelamento da R15WT e R16WT . . . . . . . . . . . 60 5.3.2 Otimização das interações não-nativas e a diminuição no tempo de enovelamento do domínio R16MM5 . . . . . . . . . . . . . . 63 5.3.3 Densidade de contatos não-nativos do R15WT, R16WT e R16M5 65 5.3.4 Formação de contatos específicos devido as interações não-nativas 67 5.4 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6 Estabilização do Estado Intermediário da Im7 e Im9 devido à Mu- dança de Carga 73 6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 6.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.3 Resultados e Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 6.3.1 Efeito da Mudança de Carga nas Histidinas 40 e 47 da Im7 . . . 79 6.3.2 Estado intermediário para o sistema denominado Elec1: H40(+1) e H47(0) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 6.3.3 Estado intermediário para o sistema denominado Elec2: H40(0) e H47(0) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 6.3.4 Densidade de contatos não-nativos, hidrofóbicos e eltrostáticos, para os sistemas Elec1 e Elec2 . . . . . . . . . . . . . . . . . . . 86 6.4 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 7 Considerações Finais 92 Referências 94 Apêndice A Dinâmica Molecular 104 Apêndice B Table geral de Miyazawa e Jernigan 106 Apêndice C Representação das estruturas obtidas pelo ELViM 107 Apêndice D Produção Acadêmica 109 Capítulo 1 Introdução Em nosso organismo, quase todas as funções celulares vitais para o seu fun- cionamento são realizadas por moléculas de proteínas. As proteínas são biopolímeros constituídos por pequenas moléculas de aminoácidos, sendo de grande importância para a vida e estando presente em todos os seres vivos. As proteínas são componentes es- truturais elementares das células e apresentam diversas funções, tais como: regulatória (controlando as condições intra e extracelulares), transportadora, receptora de sinais, elaboradora de estruturas celulares, assim como, são uma parte crucial dos músculos e outros tecidos, convertendo energia química em energia mecânica [2, 3]. O que diferencia uma proteína da outra são as possíveis combinações que podem ser formadas devido a grande variedade de aminoácidos, estruturas e funções. Existem 22 tipos de aminoácidos essenciais e naturais, sendo Alanina, Asparagina, Ácido glutâmico, Ácido aspártico, Glutamina, Glicina, Ornitina, Prolina, Taurina, Cis- tina, Isoleucina, Leucina, Valina, Histidina, Lisina, Metionina, Fenilalanina, Treonina, Triptofano, Arginina, Cisteina, Tirosina, Serina. Os aminoácidos são conhecidos por aminoácidos α, pois o seu carbono central, usualmente denominado carbono α, realiza quatro ligações covalentes: i) uma com o grupo amino (-NH2); ii) uma com um hidro- gênio (H); iii) uma com um grupo carboxílico (-COOH) e; iv) uma com um radial (-R), sendo este o responsável por distinguir um aminoácido do outro, conforme representado na Figura 1.1 [2, 3]. Sabe-se que a sequência de nucleotídeos do DNA é a responsável por di- rigir a síntese proteica. Por consequência, alterações no material genético (muta- ções/substítuições) podem produzir proteínas com funções diferenciadas e, ademais, as funções das proteínas estão intrinsecamente relacionadas com suas estruturas. Por- tanto, a estrutura de uma proteína pode ser resumida em diferentes níveis hierárquicos: primário, secundário, terciário e quaternária [2, 3]. 20 Figura 1.1: Representação simplificada de uma ligação peptídica entre dois aminoácidos diferentes. O grupo carboxílico libera um OH, enquanto que o grupo amino cede um H. Posteriormente, essas duas espécies irão formar uma molécula de água, H2O. A ligação CO-NH resultante é denominada ligação peptídica. Fonte: Extraído e modificado da Ref. [2] A estrutura primária de uma proteína, denominada pela sua sequência (Fi- gura 1.2A), é o nível mais simples da estrutura da proteína. A estrutura secundária (Figura 1.2B) de uma proteína refere-se à estruturação local que se forma dentro de uma cadeia polipeptídica. Essas regiões tipicamente se formam devido as ligações de hidrogênio entre os resíduos e os elementos estruturais secundários, onde em uma mo- lécula são conhecidos como α-hélices e as folhas β. A estrutura terciária (Figura 1.2C) descreve o dobramento dos elementos estruturais secundários e especifica o arranjo tri- dimensional de todos os átomos que compõem a proteína, caracterizando, dessa forma, sua configuração global. A estrutura terciária é estabilizada por meio de ligações não covalentes, incluindo ligações de hidrogênio, ligações iônicas, interações dipolo-dipolo e forças hidrofóbicas. No próximo nível hierárquico encontra-se a estrutura quaternária (Figura 1.2D), no qual envolve o arranjo e as interações entre os domínios da proteína ou entre duas ou mais proteínas. A estrutura quaternária descreve essencialmente como diferentes proteínas encontram-se agregadas [2, 3]. A função da proteína depende criticamente de sua estrutura tridimensio- nal determinada por sua sequência de aminoácidos (estrutura primária), assim como, apresenta uma correlação com sua dinâmica. Este paradigma de estrutura-função, uma ideia central da biologia, sugere que as proteínas recém sintetizadas enovelem em uma única forma tridimensional antes de realizar sua função biológica. No entanto, muitas exceções à regra foram recentemente encontrados na forma das chamadas proteínas intrinsecamente desordenadas (IDPs). As IDPs não apresentam uma forma tridimen- sional fixa, mas apresentam funções célulares altamente essenciais [5–7]. Exemplos das funções realizadas por IDPs: reconhecimento molecular de proteínas regulatórias, DNAs e RNAs, aceleração enzimática de reações químicas, facilitador de modificações pós-traducional, splicing alternativo e inserções/deleções [8, 9]. Em geral, as atividades biológicas das IDPs desempenham um papel crucial nas células vivas, frequentemente complementando as das proteínas estruturadas. O trabalho desenvolvido nessa tese 21 Figura 1.2: Diagrama de uma proteína (PCNA com PDB ID: 1AXC) em diferentes ní- veis hierárquicos. Estrutura primária (A), estrutura secundária (B), estrutura terciária (C) e por fim, estrutura quartenária (D). Fonte: Extraído e modificado da Ref. [4]. não envolve IDPs, mas foi mencionada devido a sua relevância no cenário científico. Assim, compreender o mecanismo biomolecular que leva uma proteína do seu estágio inicial (estrutura primária) ao seu estágio final (estrutura terciária ou quar- tenária), tem sido um enorme desafio durante décadas. Ao que se pode observar, está é uma área da ciência que vem incentivando e gerando discussões entre diferentes pes- quisadores. Apesar dos avanços das técnicas experimentais e teóricas, encontra-se em aberto o entendimento exato do processo que leva uma proteína a sair de sua estrutura primária e alcançar a sua estrutura terciária ou quartenária. Este processo é conhecido na literatura como enovelamento de proteína [2, 3]. O enovelamento de proteínas é um processo indispensável que ocorre em todos os seres vivos. O foco deste estudo não se restringe somente ao papel que o enovelamento desempenha no organismo, mas também aos processos físico-químicos que o governam. O entendimento do enovelamento pode responder a problemas fun- damentais em diversas áreas da ciência que ainda encontram-se em aberto como, por exemplo, a causa das doenças de Alzheimer, Huntington e Parkinson [10, 11]. A formação de uma estrutura tridimensional única pode ocorrer espontane- amente sem a necessidade de ajuda adicional de outras moléculas como, por exemplo, as proteínas chaperonas. As interações dos aminoácidos dentro da cadeia polipeptídica e com moléculas do solvente são as responsáveis pela auto-organização espontânea de uma molécula de proteína para obter a conformação enovelada, frequentemente referida 22 como estado nativo. O número de configurações tridimensionais disponíveis para um polipeptí- deo cresce exponencialmente com o tamanho da proteína. Explorar todo espaço de fase para encontrar uma conformação particular levaria muito tempo, tornando uma busca incompatível com os requisitos biológicos, sendo esse fenômeno conhecido como paradoxo de Levinthal [12]. De acordo com Levinthal, se levar um picossegundo para amostrar um estado conformacional particular. O estado nativo de uma proteína por meio de uma busca aleatória levaria uma escala de tempo que é comparável à idade do universo. Isso, evidentemente, sugere que as moléculas de proteína limitam o espaço fase de modo que seu enovelamento ocorra através de um número limitado de caminhos para o estado nativo. A teoria que foi e ainda é capaz de descrever o enovelamento de proteína é conhecida como a Teoria de Superfície de Energia do inglês Energy Landscape Theory. [13–15]. A teoria de superfície de energia propõe a existência de uma seleção natural de vias de enovelamento, que resultam em uma superfície energética afunilada e rugosa, onde a mais profunda energia do funil corresponde a conformação nativa da proteína, conforme representado na Figura 1.3. As rugosidades correspondem aos mínimos locais de energia, que funcionam como armadilhas para o enovelamento. Para que a proteína possa exercer seu papel biológico, a reação de enovelamento deve acontecer sem que ela fique presa em mínimos locais e, por esse motivo, a inclinação do funil de energia deve ser grande o bastante para vencer esses mínimos. Essa teoria mostrou-se uma ferramenta fundamental para a compreensão qualitativa e quantitativa dos resultados teóricos e experimentais relacionados ao enovelamento [16–20]. Por meio de análises estatísticas, essa teoria também fornece uma forte base teórica para o entendimento de fenômenos de oligomerização [21] e transições funcionais em proteínas [22–25]. De acordo com a teoria de superfície de energia, o mecanismo de enovela- mento apresenta a forma de um funil e pode ser descrito por um pequeno número de parâmetros, denotados como Q, que medem a similaridade de uma conformação para o estado nativo. A largura do funil representa a entropia e no eixo vertical tem-se a representação da coordenada de reação,Q, e entalpia, E(Q). Para valores de Q ≈ 0, tem-se o conjunto em sua forma não nativa e para Q ≈ 1, o conjunto de estruturas do estado nativo. A entropia, S(Q), e a energia, E(Q), dependem da semelhança com a conformação nativa medida por Q. No topo do funil a entropia é grande, pois existem muitas conformações sem semelhanças com o estado nativo. A energia desses estados não estruturados também é maior em comparação com a energia do estado nativo. Conforme Q aumenta, a entropia conformacional reduz, pois o conjunto de estruturas apresenta alta similaridade com o estado nativo e a energia torna-se mais estável. A 23 Figura 1.3: Representação do funil de energia para uma proteína qualquer. No eixo horizontal, tem-se a entropia, S(Q), em função da coordenada de reação. No eixo verti- cal, a representação da energia, E(Q), lado esquerda, e a representação da coordenada de reação, lado direira, fração dos contatos nativos, Q. Fonte: Extraído e modificado da Ref. [26]. correlação da energia de uma dada conformação e a similaridade do estado nativo é conhecida como o "princípio da frustração mínima" [27, 28]. Em condições fisiológicas, o estado nativo de uma proteína corresponde aos mínimos globais da energia livre. A energia livre, F (Q), da proteína pode ser formulada por sua entalpia, E(Q), e entropia, S(Q), na temperatura de equilíbrio, T , assumindo pressão e volume constante, conforme representado pela Equação 1.1: F (Q) = E(Q)− TS(Q), (1.1) onde Q é o parâmetro de ordem que descreve a enovelamento. Dependendo das con- dições a entropia e a energia não se compensam completamente conforme a proteína caminha para o estado nativo, o que resulta em um perfil de energia livre com uma bar- reira que passa a controlar a taxa de enovelamento em um valor intermediário de Q. As propriedades estruturais do conjunto conformacional dentro deste estado de transição 24 indicaram o mecanismo de enovelamento da proteína. De acordo com a Equação 1.1, a competição entre entalpia e entropia define o estado nativo e não nativo da proteína. No estado nativo as interações intramolecula- res são responsáveis pela estabilização estrutural, o que caracteriza uma baixa entropia conformacional. A baixa entropia conformacional resulta no aumento da entropia do solvente, pois os resíduos hidrofóbicos encontram-se menos expostos ao solvente no es- tado nativo. A entalpia da proteína também é baixa, pois as interações favoráveis são satisfeitas. A conformação nativa pode ser perturbada pela adição de desnaturante, aumento da temperatura ou pela alteração do nível de pH. O estado não nativo ou desnaturado apresenta alta entropia conformacional e alta entalpia devido à perda de interações favoráveis. Além disso, as interações entre o solvente e os resíduos hidrofóbi- cos reduzem a entropia do solvente em relação ao estado nativo. Portanto, o aumento da entropia também é considerado como uma força que auxilia a proteína para estado nativo [29, 30]. O estudo do enovelamento de proteínas a partir da teoria do funil de energia tem levado a contribuições relevantes para a Biofísica Molecular, assim como para áreas afins. O comportamento cinético e termodinâmico de sistemas com uma superfície energética irregular (ou rugoso) diferencia-se daqueles com uma superfície regular (ou lisa), sendo que, em casos onde a superfície de energia for irregular, há uma grande competição entre as interações locais e não locais, caracterizando asism o nível de frustração do sistema [16, 31, 32]. A frustração existe em biomoléculas e, às vezes, é de grande importância em determinadas funções biológicas. Do ponto de vista biofísico, as interações não locais também podem ser energeticamente favoráveis [33], como as interações locais. Mediante o aprimoramento de técnicas experimentais, as interações não-nativas pas- saram a apresentar um importante papel durante o processo de enovelamento [34, 35] e o entendimento da presença ou da ausência dessas interações é fundamental para compreender os seus efeitos sobre o processo de enovelamento [36]. Com base em toda teoria apresentada, foram explorados três sistemas com o objetivo de estudar o papel dessas interacões não locais no processo de enovelamento. Os sistemas de interesse foram: i) efeitos mutacionais na proteína CI2; ii) papel das interacões não nativas nos domínios R15, R16 e R16M5 da α-espectrina; e iii) estado intermediário das proteínas Im7 e Im9. Na próxima seção encontram-se descritos como foram dívididos os capítulos dos sistermas que serão abordados, assim como, os métodos e as análises estatísticas e termodinâmicas aplicadas. Capítulo 7 Considerações Finais O estudo desenvolvido com a proteína CI2 foi realizado seguindo o mesmo modelo de simulação proposto para os domínios R15, R16 e R17 da α-espectrina. Os dados computacionais para esses domínios revelaram que as diferenças nos tempos de enovelamento podem ser compreendidas em termos das interações não-nativas. Com a finalidade de investigar os efeitos mutacionais na termoestabilidade e no tempo de enovelamento da CI2, foi adequada a escolha do modelo, pois as mutações foram rea- lizadas em resíduos carregados e hidrofóbicos e o modelo utilizado capturou os efeitos decorrentes dessas interações. Além disso, os dados computacionais revelaram que o comportamento cooperativo observado nos domínios da α-espectrina não foi o mesmo verificado na CI2 com as mutações. Acredita-se que as mutações que melhoram a termoestabilidade, geralmente, estão associadas à aceleracão do processo de enovela- mento. Entretanto, os resultados obtidos foram contraintuitivos. Enquanto um dos efeitos diminuiu a termoestabilidade, o outro foi responsável pela alteração no tempo de enovelamento. No caso dos domínios R15WT, R16WT e R16M5 da α-espectrina, os efeitos oriundos dos potenciais não-nativos foram capazes de elucidar as diferenças nas taxas de enovelamento, assim como, obter, aproximadamente, a mesma ordem de grandeza nos tempos de enovelamento dos domínios R15WT e R16M5. Devido a esse resultado, foi investigado o perfil energético das trajetórias de enovelamento com a finalidade de observar regiões de interesse que pudessem caracterizar os efeitos não-nativos. Análise semelhante foi realizada no estudo da CI2, onde uma região se destacou e, assim, foi interpretada como sendo uma região crucial durante o processo de enovelamento. As simulações realizadas com as proteínas Im7 e Im9 foram executadas considerando um potencial a mais no modelo utilizado para as proteínas CI2, R15WT, R16WT e R16R16M5. Contudo, antes de chegar a esse modelo, foram realizadas si- 93 mulações combinando diferentes técnicas, onde buscou-se investigar os estados inter- mediários dessas proteínas. Do ponto de vista experimental, os estados intermediários são estabilizados em diferentes valores de pH e, do ponto de vista computacional, foram realizadas simulações com carga constante para mimetizar os sistemas experi- mentais. O estado intermediário da Im7 foi observado quando quando foi incorporado, no modelo computacional, o potencial de dessolvatação. Os efeitos desses potencias encontram-se em diferentes ordens de grandeza, mas devido a essas pequenas pertuba- ções/contribuições, foi possível observar estados com baixa população, porém exercendo um papel importante durante o processo de enovelamento. Esse mesmo comportamento também é verificado com as proteínas CI2 e R16M5. Logo, com a adição dos potenci- ais não-nativos, estados visitados com baixa frequência passaram a ser caracterizados por diferentes métodos, o que pode ser averiguado nos resultados apresentados neste trabalho. Referências Bibliográficas 1 GOODALL, J. Jane Goodall Quotes (Author of In the Shadow of Man). Goodreads. Acesso em: 18 june 2021. Disponível em: . 2 VOET, D. Fundamentos de Bsioquímica. A Vida em Nível Molecular (Em Português do Brasil). [S.l.]: Artmed, 2014. 3 NELSON, D. L.; COX, M. M. Lehninger Principles of Biochemistry, Fourth Edition. [S.l.]: W. H. Freeman, 2004. 4 PROTEIN structure – Wikimedia Commons, the free media repository. Acesso em: 23 nov. 2020. Disponível em: . 5 KIM, P. M. et al. The role of disorder in interaction networks: a structural analysis. Mol. Syst. Biol., v. 4, n. 1, p. 179, 2008. 6 WRIGHT, P. E.; DYSON, H. Intrinsically unstructured proteins: re-assessing the protein structure-function paradigm. J. Mol. Biol., v. 293, n. 2, p. 321 – 331, 1999. 7 GALEA, C. A. et al. Regulation of cell division by intrinsically unstructured proteins: Intrinsic flexibility, modularity, and signaling conduits. Biochemistry, v. 47, n. 29, p. 7598–7609, 2008. 8 GSPONER, J. et al. Tight regulation of unstructured proteins: From transcript synthesis to protein degradation. Science, v. 322, n. 5906, p. 1365–1368, 2008. 9 BABU, M. M. et al. Intrinsically disordered proteins: regulation and disease. Curr. Opin. Struct. Biol., v. 21, n. 3, p. 432 – 440, 2011. 10 DOBSON, C. M. Protein folding and misfolding. Nature, v. 426, n. 6968, p. 884–890, 2003. 11 HATTERS, D. M. Protein misfolding inside cells: The case of huntingtin and huntington’s disease. IUBMB Life, v. 60, n. 11, p. 724–728, 2008. 12 LEVINTHAL, C. Are there pathways for protein folding? J. Chem. Phys., v. 65, n. 1, p. 44–45, 1968. 13 ONUCHIC, J. N. et al. The energy landscape theory of protein folding: Insights into folding mechanisms and scenarios. In: . [S.l.: s.n.], 2000. v. 53, p. 87 – 152. 95 14 SHOEMAKER, B.; WANG, J.; WOLYNES, P. G. Structural correlations in protein folding funnels. Proc. Natl. Acad. Sci. U.S.A., v. 94, n. 3, p. 777–782, 1997. 15 DILL, K. A.; CHAN, H. S. From levinthal to pathways to funnels. Nat. Struct. Mol. Biol., v. 4, n. 1, p. 10–19, 1997. 16 CHAVEZ, L. L.; ONUCHIC, J. N.; CLEMENTI, C. Quantifying the roughness on the free energy landscape: Entropic bottlenecks and protein folding rates. J. Am. Chem. Soc., v. 126, n. 27, p. 8426–8432, 2004. 17 NETTELS, D. et al. Ultrafast dynamics of protein collapse from single-molecule photon statistics. Proc. Natl. Acad. Sci. U.S.A., v. 104, n. 8, p. 2655–2660, 2007. 18 BRYNGELSON, J. D. et al. Funnels, pathways, and the energy landscape of protein folding: A synthesis. Proteins: Struct., Funct., Bioinf., v. 21, n. 3, p. 167–195, 1995. 19 CLEMENTI, C.; NYMEYER, H.; ONUCHIC, J. N. Topological and energetic factors: What determines the structural details of the transition state ensemble and "en-route" intermediates for protein folding? An investigation for small globular proteins. J. Mol. Biol., v. 298, n. 5, p. 937–953, 2000. 20 WHITFORD, P. C. et al. An all-atom structure-based potential for proteins: Bridging minimal models with all-atom empirical forcefields. Proteins: Struct., Funct., Bioinf., v. 75, n. 2, p. 430–441, 2009. 21 LU, Q.; LU, H. P.; WANG, J. Exploring the mechanism of flexible biomolecular recognition with single molecule dynamics. Physical Review Letters, v. 98, n. 12, 2007. 22 WHITFORD, P. C. et al. Conformational transitions of adenylate kinase: Switching by cracking. J. Mol. Biol., v. 366, n. 5, p. 1661–1671, 2007. 23 BEST, R. B.; CHEN, Y.-G.; HUMMER, G. Slow protein conformational dynamics from multiple experimental structures: The helix/sheet transition of arc repressor. Structure, v. 13, n. 12, p. 1755–1763, 2005. 24 ZUCKERMAN, D. M. Simulation of an ensemble of conformational transitions in a united-residue model of calmodulin. J. Phys. Chem. B, v. 108, n. 16, p. 5127–5137, 2004. 25 LU, Q.; WANG, J. Single molecule conformational dynamics of adenylate kinase: energy landscape, structural correlations, and transition state ensembles. J. Am. Chem. Soc., v. 130, n. 14, p. 4772–4783, 2008. 26 FOLDING funnel schematic – Wikimedia Commons, the free media repository. Acesso em: 23 nov. 2020. Disponível em: . 27 BRYNGELSON, J. D.; WOLYNES, P. G. Spin glasses and the statistical mechanics of protein folding. Proc. Natl. Acad. Sci. U. S. A., v. 84, n. 21, p. 7524–7528, 1987. 96 28 BRYNGELSON, J. D.; WOLYNES, P. G. Intermediates and barrier crossing in a random energy model (with applications to protein folding). J. Phys. Chem., v. 93, n. 19, p. 6902–6915, 1989. 29 SALI, A.; SHAKHNOVICH, E.; KARPLUS, M. How does a protein fold? Nature, v. 369, n. 6477, p. 248–251, 1994. 30 WOLYNES, P. G. Evolution, energy landscapes and the paradoxes of protein folding. Biochimie, v. 119, p. 218 – 230, 2015. 31 SNOW, C. D. et al. How well can simulation predict protein folding kinetics and thermodynamics? Annu. Rev. Bioph. Biom., v. 34, n. 1, p. 43–69, 2005. 32 MOURO, P. R. Estudo da Interação não-nativa no enovelamento de proteínas. Dissertação (Mestrado em Biofísica Molecular) — UNESP, São José do Rio Preto, 2014. 33 CHAN, H. S.; DILL, K. A. Transition states and folding dynamics of proteins and heteropolymers. J. Chem. Phys., v. 100, n. 12, p. 9238–9257, 1994. 34 BROCKWELL, D. J.; RADFORD, S. E. Intermediates: ubiquitous species on folding energy landscapes? Curr. Opin. Struct. Biol., v. 17, n. 1, p. 30–37, 2007. 35 BARTLETT, A. I.; RADFORD, S. E. An expanding arsenal of experimental methods yields an explosion of insights into protein folding mechanisms. Nat. Struct. Mol. Biol., v. 16, n. 6, p. 582–588, 2009. 36 CHEN, T.; SONG, J.; CHAN, H. S. Theoretical perspectives on nonnative interactions and intrinsic disorder in protein folding and binding. Curr. Opin. Struct. Biol., v. 30, p. 32–42, 2015. 37 TAKETOMI, H.; UEDA, Y.; GŌ, N. Studies on protein folding, unfolding and fluctuations by computer simulation: I. the effect of specific amino acid sequence represented by specific inter-unit interactions. Int. J. Pept. Protein Res., v. 7, n. 6, p. 445–459, 1975. 38 NOEL, J. K. et al. Smog 2: A versatile software package for generating structure-based models. PLoS Comput. Biol., v. 12, n. 3, p. 1–14, 03 2016. 39 SUN, Y.; MING, D. Energetic frustrations in protein folding at residue resolution: A homologous simulation study of Im9 proteins. PLoS One, v. 9, n. 1, p. e87719, 2014. 40 CONTESSOTO, V. G. et al. Analyzing the effect of homogeneous frustration in protein folding. Proteins: Struct., Funct., Bioinf., v. 81, n. 10, p. 1727–1737, out. 2013. 41 MENDONçA, M. R. de et al. Inferring a weighted elastic network from partial unfolding with coarse-grained simulations. Proteins: Struct., Funct., Bioinf., v. 82, n. 1, p. 119–129, 2014. 97 42 TRIPATHI, S.; GARCìA, A. E.; MAKHATADZE, G. I. Alterations of Nonconserved Residues Affect Protein Stability and Folding Dynamics through Charge-Charge Interactions. J. Phys. Chem. B, v. 119, n. 41, p. 13103–13112, out. 2015. 43 CLEMENTI, C.; PLOTKIN, S. S. The effects of nonnative interactions on protein folding rates: Theory and simulation. Protein Sci., v. 13, n. 7, p. 1750–1766, 2004. 44 SILVA, F. Bruno da et al. Non-native cooperative interactions modulate protein folding rates. J. Phys. Chem. B, v. 122, n. 48, p. 10817–10824, 2018. 45 MIYAZAWA, S.; JERNIGAN, R. L. Self-consistent estimation of inter-residue protein contact energies based on an equilibrium mixture approximation of residues. Proteins: Struct., Funct., Bioinf., v. 34, n. 1, p. 49–68, 1999. 46 ZHANG, Z.; CHAN, H. S. Competition between native topology and nonnative interactions in simple and complex folding kinetics of natural and designed proteins. Proc. Natl. Acad. Sci. U. S. A., v. 107, n. 7, p. 2920–2925, 2010. 47 ULLNER, M.; WOODWARD, C. E.; JÖNSSON, B. A Debye-Hückel theory for electrostatic interactions in proteins. J. Chem. Phys., v. 105, p. 2056–2065, 1996. 48 PAPOIAN, G. A.; ULANDER, J.; WOLYNES, P. G. Role of water mediated interactions in protein−protein recognition landscapes. J. Am. Chem. Soc., v. 125, n. 30, p. 9170–9178, 2003. 49 LIU, Z.; CHAN, H. S. Solvation and desolvation effects in protein folding: native flexibility, kinetic cooperativity and enthalpic barriers under isostability conditions. Physical Biology, v. 2, n. 4, p. S75–S85, 2005. 50 HILLSON, N.; ONUCHIC, J. N.; GARCIA, A. E. Pressure-induced protein- folding/unfolding kinetics. Proc. Natl. Acad. Sci. U.S.A., v. 96, n. 26, p. 14848–14853. 51 CHEUNG, M. S.; GARCÍA, A. E.; ONUCHIC, J. N. Protein folding mediated by solvation: Water expulsion and formation of the hydrophobic core occur after the structural collapse. Proc. Natl. Acad. Sci. U.S.A., v. 99, n. 2, p. 685–690, 2002. 52 TANFORD, C.; KIRKWOOD, J. G. Theory of protein titration curves. i. general equations for impenetrable spheres. J. Am. Chem. Soc., v. 79, n. 20, p. 5333–5339, 1957. 53 CONTESSOTO, V. G. et al. Tksa-mc: A web server for rational mutation through the optimization of protein charge interactions. Proteins: Struct., Funct., Bioinf., v. 86, n. 11, p. 1184–1188, 2018. 54 HAVRANEK, J. J.; HARBURY, P. B. Tanford–kirkwood electrostatics for protein modeling. Proc. Natl. Acad. Sci. U.S.A., v. 96, n. 20, p. 11145–11150, 1999. 55 SHIRE, S.; HANANIA, G.; GURD, F. N. Electrostatic effects in myoglobin. hydrogen ion equilibriums in sperm whale ferrimyoglobin. Biochemistry, v. 13, n. 14, p. 2967–2974, 1974. 98 56 TANFORD, C.; ROXBY, R. Interpretation of protein titration curves. application to lysozyme. Biochemistry, v. 11, n. 11, p. 2192–2198, 1972. 57 ORTTUNG, W. H. Proton binding and dipole moment of hemoglobin. refined calculations. Biochemistry, v. 9, n. 12, p. 2394–2402, 1970. 58 KIRKWOOD, J. G. Theory of solutions of molecules containing widely separated charges with special application to zwitterions. J. Chem. Phys., v. 2, n. 7, p. 351–361, 1934. 59 SILVA, F. L. B. D.; JÖNSSON, B.; PENFOLD, R. A critical investigation of the tanford-kirkwood chceme by means of monte carlo simulations. Protein Sci., v. 10, n. 7, p. 1415–1425, 2001. 60 METROPOLIS, N. et al. Equation of state calculations by fast computing machines. J. Chem. Phys., v. 21, n. 6, p. 1087–1092, jun. 1953. 61 PLOTKIN, S. S.; ONUCHIC, J. N. Investigation of routes and funnels in protein folding by free energy functional methods. Proc. Natl. Acad. Sci. U. S. A., v. 97, n. 12, p. 6509–6514, jun. 2000. 62 LAMMERT, H.; NOEL, J. K.; ONUCHIC, J. N. The dominant folding route minimizes backbone distortion in sh3. PLoS Comput. Biol., v. 8, n. 11, p. 1–12, 11 2012. 63 JUNIOR, A. B. O. et al. Distinguishing biomolecular pathways and metastable states. J. Chem. Theory Comput., 2019. 64 HARDIN, C. et al. Associative memory hamiltonians for structure prediction without homology: / proteins. Proc. Natl. Acad. Sci. U.S.A., v. 100, n. 4, p. 1679–1684, 2003. 65 JUNIOR, A. B. de O. Métodos para visualização de superfície de energia do enovelamento de proteínas. Dissertação (Doutorado em Biofísica Molecular) — UNESP, São José do Rio Preto, 2018. 66 TEJADA, E.; MINGHIM, R.; NONATO, L. G. On improved projection techniques to support visual exploration of multi-dimensional data sets. Inform. Visual., v. 2, n. 4, p. 218–231, 2003. 67 FERRENBERG, A. M.; SWENDSEN, R. H. New monte carlo technique for studying phase transitions. Phys. Rev. Lett., v. 61, p. 2635–2638, 1988. 68 KUMAR, S. et al. The weighted histogram analysis method for free-energy calculations on biomolecules. i. the method. J. Comp. Chem., v. 13, n. 8, p. 1011–1021, 1992. 69 KUMAR, S. et al. Multidimensional free-energy calculations using the weighted histogram analysis method. J. Comput. Chem., v. 16, n. 11, p. 1339–1350, 1995. 99 70 NOEL, J. K.; WHITFORD, P. C.; ONUCHIC, J. N. The shadow map: A general contact definition for capturing the dynamics of biomolecular folding and function. J. Phys. Chem. B, v. 116, n. 29, p. 8692–8702, 2012. 71 BERENDSEN, H. J. C. et al. Molecular dynamics with coupling to an external bath. J. Chem. Phys., v. 81, n. 8, p. 3684–3690, 1984. 72 YANG, H. et al. Rational design to improve protein thermostability: Recent advances and prospects. Chem. Bio. Eng. Rev., v. 2, n. 2, p. 87–94, 2015. 73 SEELIGER, D. et al. Boosting antibody developability through rational sequence optimization. mAbs, v. 7, n. 3, p. 505–515, 2015. 74 FENG, R. et al. Rational design of xylose dehydrogenase for improved thermostability and its application in development of efficient enzymatic biofuel cell. Enzyme Microb. Technol., v. 84, p. 78–85, 2016. 75 THOMPSON, P. et al. Rational design, biophysical and biological characterization of site-specific antibody-tubulysin conjugates with improved stability, efficacy and pharmacokinetics. J. Controlled Release, v. 236, p. 100–116, 2016. 76 GALDIERO, S.; GOMES, P. A. C. Peptide-based drugs and drug delivery systems. Molecules, v. 22, n. 12, p. 2185, 2017. 77 SACHDEVA, S.; LOBO, S.; GOSWAMI, T. What is the future of noninvasive routes for protein- and peptide-based drugs? Ther. Delivery, v. 7, n. 6, p. 355–357, 2016. 78 MOHANDESI, N. et al. Catalytic efficiency and thermostability improvement of suc2 invertase through rational site-directed mutagenesis. Enzyme Microb. Technol., v. 96, p. 14–22, 2017. 79 KELLOGG, E. H.; LEAVER-FAY, A.; BAKER, D. Role of conformational sampling in computing mutation-induced changes in protein structure and stability. Proteins: Struct., Funct., Bioinf., v. 79, n. 3, p. 830–838, 2011. 80 YIN, S.; DING, F.; DOKHOLYAN, N. V. Modeling backbone flexibility improves protein stability estimation. Structure, v. 15, n. 12, p. 1567–1576, 2007. 81 MASSO, M.; VAISMAN, I. I. Accurate prediction of stability changes in protein mutants by combining machine learning with structure based computational mutagenesis. Bioinformatics, v. 24, n. 18, p. 2002–2009, 2008. 82 HUANG, L.-T.; GROMIHA, M. M. Reliable prediction of protein thermostability change upon double mutation from amino acid sequence. Bioinformatics, v. 25, n. 17, p. 2181–2187, 2009. 83 CAPRIOTTI, E.; FARISELLI, P.; CASADIO, R. I-mutant2. 0: Predicting stability changes upon mutation from the protein sequence or structure. Nucleic Acids Res., v. 33, n. suppl_2, p. W306–W310, 2005. 100 84 CHENG, J. et al. Scratch: A protein structure and structural feature prediction server. Nucleic Acids Res., v. 33, n. suppl_2, p. W72–W76, 2005. 85 JIA, L.; YARLAGADDA, R.; REED, C. C. Structure based thermostability prediction models for protein single point mutations with machine learning tools. PloS one, v. 10, n. 9, p. e0138022, 2015. 86 FANG, J. A Critical Review of Five Machine Learning-Based Algorithms for Predicting Protein Stability Changes Upon Mutation. Briefings Bioinf., v. 00, n. 00, p. 1–8, 2019. 87 PETTERSEN, E. F. et al. Ucsf chimera–a visualization system for exploratory research and analysis. J. Comp. Chem., v. 25, n. 13, p. 1605–1612, 2004. 88 BOND, C. S.; SCHÜTTELKOPF, A. W. ALINE: A WYSIWYG Protein-Sequence Alignment Editor for Publication-Quality Alignments. Acta Crystallogr., Sect. D: Struct. Biol., v. 65, n. 5, p. 510–512, 2009. 89 SILVA, F. B. da et al. Rational design of chymotrypsin inhibitor 2 by optimizing non-native interactions. J. Chem. Inf. Model., v. 60, n. 2, p. 982–988, 2020. 90 CHEN, T.; CHAN, H. S. Native contact density and nonnative hydrophobic effects in the folding of bacterial immunity proteins. PLoS Comput. Biol., v. 11, n. 5, p. 1–27, 05 2015. 91 WU, J. et al. The low populated folding intermediate of a mutant of the fyn sh3 domain identified by a simple model. Phys. Chem. Chem. Phys., v. 19, p. 22321–22328, 2017. 92 YRAZU, F. M.; PINAMONTI, G.; CLEMENTI, C. The effect of electrostatic interactions on the folding kinetics of a 3-α-helical bundle protein family. J. Phys. Chem. B, v. 122, n. 49, p. 11800–11806, 2018. 93 TZUL, F. O.; SCHWEIKER, K. L.; MAKHATADZE, G. I. Modulation of folding energy landscape by charge–charge interactions: Linking experiments with computational modeling. Proc. Natl. Acad. Sci. U. S. A., v. 112, n. 3, p. E259–E266, 2015. 94 MCPHALEN, C.; JAMES, M. Crystal and molecular structure of the serine proteinase inhibitor ci-2 from barley seeds. Biochemistry, v. 26, n. 1, p. 261–269, 1987. 95 ITZHAKI, L. S.; OTZEN, D. E.; FERSHT, A. R. The structure of the transition state for folding of chymotrypsin inhibitor 2 analysed by protein engineering methods: Evidence for a nucleation-condensation mechanism for protein folding. J. Mol. Biol., v. 254, n. 2, p. 260–288, 1995. 96 JACKSON, S. E.; FERSHT, A. R. Folding of chymotrypsin inhibitor 2. 1. evidence for a two-state transition. Biochemistry, v. 30, n. 43, p. 10428–10435, 1991. 97 LADURNER, A. G. et al. Synergy between simulation and experiment in describing the energy landscape of protein folding. Proc. Natl. Acad. Sci. U. S. A., v. 95, n. 15, p. 8473–8478, 1998. 101 98 LAWRENCE, C. et al. Investigation of an anomalously accelerating substitution in the folding of a prototypical two-state protein. J. Mol. Biol., v. 403, n. 3, p. 446–458, 2010. 99 WEBB, B.; SALI, A. Comparative protein structure modeling using modeller. Curr. Protoc. Bioinf., v. 54, n. 1, p. 5.6.1–5.6.37, 2016. 100 CONTESSOTO, V. G. et al. NTL9 Folding at Constant pH: The Importance of Electrostatic Interaction and pH Dependence. J. Chem. Theory Comput., v. 12, n. 7, p. 3270–3277, 2016. 101 CORONADO, M. A. et al. Cold shock protein A from Corynebacterium pseudotuberculosis: Role of electrostatic forces in the stability of the secondary structure. Protein Pept. Lett., v. 24, n. 4, p. 358–367, 2017. 102 OLIVEIRA, V. M. de et al. Effects of ph and salt concentration on stability of a protein g variant using coarse-grained models. Biophys. J., v. 114, n. 1, p. 65–75, 2018. 103 GRIBENKO, A. V. et al. Rational stabilization of enzymes by computational redesign of surface charge–charge interactions. Proc. Natl. Acad. Sci. U. S. A., v. 106, n. 8, p. 2601–2606, 2009. 104 PLOTKIN, S. S. Speeding protein folding beyond the gō model: How a little frustration sometimes helps. Proteins: Struct., Funct., Bioinf.., v. 45, n. 4, p. 337–345, 2001. 105 CONTESSOTO, V. G. et al. Analyzing the effect of homogeneous frustration in protein folding. Proteins: Struct., Funct., Bioinf., v. 81, n. 10, p. 1727–1737, 2013. 106 MOURO, P. R. et al. Quantifying Nonnative Interactions in the Protein-Folding Free-Energy Landscape. Biophys. J., v. 111, n. 2, p. 287–293, 2016. 107 ZARRINE-AFSAR, A. et al. Kinetic consequences of native state optimization of surface-exposed electrostatic interactions in the fyn sh3 domain. Proteins: Struct., Funct., Bioinf., v. 80, n. 3, p. 858–870, 2012. 108 SOCCI, N. D.; ONUCHIC, J. N.; WOLYNES, P. G. Diffusive dynamics of the reaction coordinate for protein folding funnels. J. Chem. Phys., v. 104, n. 15, p. 5860–5868, 1996. 109 LEOPOLD, P. E.; MONTAL, M.; ONUCHIC, J. N. Protein folding funnels: A kinetic approach to the sequence-structure relationship. Proc. Natl. Acad. Sci. U. S. A., v. 89, n. 18, p. 8721–8725, 1992. 110 KUBELKA, J.; HOFRICHTER, J.; EATON, W. A. The protein folding ’speed limit’. Curr. Opin. Struct. Biol., v. 14, n. 1, p. 76–88, 2004. 111 FERSHT, A. R.; MATOUSCHEK, A.; SERRANO, L. The folding of an enzyme. J. Mol. Biol., v. 224, n. 3, p. 771–782, 1992. 102 112 SCOTT, K. A.; RANDLES, L. G.; CLARKE, J. The folding of spectrin domains ii: Phi-value analysis of R16. J. Mol. Biol., v. 344, n. 1, p. 207–221, 2004. 113 SCOTT, K. A. et al. The folding of spectrin domains i: Wild-type domains have the same stability but very different kinetic properties. J. Mol. Biol., v. 344, n. 1, p. 195–205, 2004. 114 SCOTT, K. A.; CLARKE, J. Spectrin R16: Broad energy barrier or sequential transition states? Protein Sci., v. 14, n. 6, p. 1617–1629, 2005. 115 SCOTT, K. A. et al. The folding pathway of spectrin R17 from experiment and simulation: Using experimentally validated MD simulations to characterize states hinted at by experiment. J. Mol. Biol., v. 359, n. 1, p. 159–173, 2006. 116 WENSLEY, B. G. et al. Experimental evidence for a frustrated energy landscape in a three-helix-bundle protein family. Nature, v. 463, n. 7281, p. 685–688, Feb 2010. 117 WENSLEY, B. G. et al. Separating the effects of internal friction and transition state energy to explain the slow, frustrated folding of spectrin domains. Proc. Natl. Acad. Sci. U. S. A., v. 109, n. 44, p. 17795–17799, 2012. 118 BORGIA, A. et al. Localizing Internal Friction Along the Reaction Coordinate of Protein Folding by Combining Ensemble and Single-Molecule Fluorescence Spectroscopy. Nat. Commun., v. 3, p. 1195, 2012. 119 BEST, R. B. How well does a funneled energy landscape capture the folding mechanism of spectrin domains? J. Phys. Chem. B, v. 117, n. 42, p. 13235–13244, 2013. 120 PASCUAL, J. et al. The spectrin repeat folds into a three-helix bundle in solution. FEBS Lett., v. 383, n. 3, p. 201–207, 1996. 121 PASCUAL, J. et al. Solution structure of the spectrin repeat: A left-handed antiparallel triple-helical coiled-coil. J. Mol. Biol., v. 273, n. 3, p. 740–751, oct 1997. 122 KUSUNOKI, H. et al. Independent movement, dimerization and stability of tandem repeats of chicken brain α-spectrin. J. Mol. Biol., v. 344, n. 2, p. 495–511, 2004. 123 KWA, L. G. et al. The folding of a family of three-helix bundle proteins: Spectrin r15 has a robust folding nucleus, unlike its homologous neighbours. Journal of Molecular Biology, v. 426, n. 7, p. 1600–1610, 2014. 124 WENSLEY, B. G. et al. Protein folding: Adding a nucleus to guide helix docking reduces landscape roughness. J. Mol. Biol., v. 423, n. 3, p. 273–283, 2012. 125 CAPALDI, A. P.; KLEANTHOUS, C.; RADFORD, S. E. Im7 folding mechanism: misfolding on a path to the native state. Nat. Struct. Biol., n. 9, p. 209–2016, 2002. 126 GORSKI, S. A. et al. Acidic conditions stabilise intermediates populated during the folding of Im7 and Im9. J. Mol. Biol., v. 312, n. 4, p. 849–863, 2001. 103 127 WHITTAKER, S. B.-M. et al. NMR analysis of the conformational properties of the trapped on-pathway folding intermediate of the bacterial immunity protein Im7. J. Mol. Biol., v. 366, n. 3, p. 1001–1015, 2007. 128 GSPONER, J. et al. Determination of an ensemble of structures representing the intermediate state of the bacterial immunity protein Im7. Proc. Natl. Acad. Sci. U.S.A., v. 103, n. 1, p. 99–104, 2006. 129 ALLEN, M.; TILDESLEY, D. Computer simulation of liquids Oxford Science. [S.l.]: London, 1990. 130 SCHERER, C. Métodos Computacionais da Física. [S.l.]: Editora Livraria da Física, 2005.