Ricardo Belarmino de Souza Júnior Estudo dos Efeitos de Regulação de Carga na Adsorção do Citocromo C em Poros Carregados São José do Rio Preto 2023 Ricardo Belarmino de Souza Júnior Estudo dos Efeitos de Regulação de Carga na Adsorção do Citocromo C em Poros Carregados Dissertação apresentada como parte dos re- quisitos para obtenção do título de Mestre em Biofísica Molecular, junto ao Programa de Pós-Graduação em Ciências Biomoleculares e Farmacológicas do Instituto de Biociências, Letras e Ciências Exatas “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Financiadora: CNPq - Proc. 156223/2021-0 Orientador: Prof. Dr. Sidney J. de Carvalho Co-orientador: Dr. Daniel Lucas Z. Caetano São José do Rio Preto 2023 S729e Souza, Ricardo Belarmino Júnior de Estudo dos efeitos da regulação de carga na adsorção do citocromo c em poros carregados / Ricardo Belarmino Júnior de Souza. -- São José do Rio Preto, 2023 74 p. Dissertação (mestrado) - Universidade Estadual Paulista (Unesp), Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto Orientador: Sidney Jurado de Carvalho Coorientador: Daniel Lucas Zago Caetano 1. Adsorção de proteínas. 2. Regulação de carga. 3. Método de Monte Carlo. 4. Citocromo c. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Biblioteca do Instituto de Biociências Letras e Ciências Exatas, São José do Rio Preto. Dados fornecidos pelo autor(a). Essa ficha não pode ser modificada. Ricardo Belarmino de Souza Júnior Estudo dos Efeitos de Regulação de Carga na Adsorção do Citocromo C em Poros Carregados Dissertação apresentada como parte dos re- quisitos para obtenção do título de Mestre em Biofísica Molecular, junto ao Programa de Pós-Graduação em Ciências Biomoleculares e Farmacológicas do Instituto de Biociências, Letras e Ciências Exatas “Júlio de Mesquita Filho”, Campus de São José do Rio Preto. Financiadora: CNPq - Proc. 156223/2021-0 Comissão Examinadora Prof. Dr. Sidney Jurado de Carvalho UNESP - Câmpus de São José do Rio Preto Orientador Prof. Dr. Ícaro Putinhon Caruso UNESP - Câmpus de São José do Rio Preto Prof. Dr. Ernesto Raúl Caffarena Fundação Oswaldo Cruz - Rio de Janeiro São José do Rio Preto 31 de Agosto de 2023 Agradecimentos A jornada que trilhei até aqui esteve repleta de pessoas que, de uma forma ou de outra, contribuíram para torná-la possível (ou, no mínimo, menos árdua). Sem minha avó e minha mãe, eu certamente não estaria aqui. Desde os dias de escola até hoje, foram elas que sempre e incondicionalmente me apoiaram a seguir o caminho que eu julgasse melhor (talvez seria diferente se minha avó soubesse a diferença entre física e educação física), e por isso a elas eu sempre serei irretribuivelmente grato. Durante o recorrentemente penoso decorrer da vida acadêmica, também tive a sorte de encontrar algumas boas pessoas que, entre discussões produtivas e outras nem tanto, trouxeram alegria e estiveram presentes em momentos importantes dessa caminhada. Por mais injusto e difícil que seja citar nomes, principalmente porque não representa a exata contribuição de cada um, tampouco a ordem de importância, acredito que seria uma injustiça ainda maior me abster de agradecer, para início de conversa, ao meu melhor amigo Gustavo, que nunca precisou estar fisicamente presente para me ajudar nos momentos mais difíceis; aos inabaláveis e talvez com toda certeza, não se engane doidos amigos 017 Carlos, Piloto, Gui, Buffo, Perles, Italo, entre outros; aos amigos que fiz depois, especialmente na caminhada da pós, como Dante, Henry, João Marcos, Amanda e demais amigos do grupo de pesquisa; às tão inesperadas quanto especiais amizades de Leonan e Ju; à Brenda, indescritivelmente importante em muitas frentes da minha vida; entre tantos outros que não foram citados explicitamente por falta de uma memória melhor e de espaço desta seção - a todos vocês dedico minha gratidão. Evidentemente que essa jornada contou com alguns bons professores aos quais devo minha gratidão, em especial meu orientador Sidney, que investiu grande paciência e dedicação no meu trabalho e aprendizado (com o bônus das conversas inspiradoras e das histórias engraçadas); meu co-orientador Daniel, por toda a ajuda no processo inicial com os códigos; os professores que me orientaram e ensinaram muito, tanto na graduação, quanto na pós, na pesquisa e na sala de aula, mesmo com uma menção implícita, não deixo de expressar meus agradecimentos; os membros da banca, 4 Ícaro Putinhon Caruso e Ernesto Raúl Caffarena; Bruno, Valéria e Barbosa, por todas as prestações de ajuda em toda sorte de problemas e por manter o departamento inteiro e funcionando. Por fim, é claro, meus extensos agradecimentos à CNPq (Proc. 156223/2021- 0) e seus avaliadores, que forneceram o auxílio financeiro a esse projeto e possibilitou que o presente trabalho fosse efetivamente realizado; ao professor Vitor Leite, pela dispo- nibilização de seus recursos computacionais; e ao IBILCE, por possibilitar literalmente toda a jornada acadêmica trilhada até aqui. "R2, I have a bad feeling about this" — C-3PO Resumo A adsorção de proteínas em superfícies porosas carregadas tem sido amplamente inves- tigada devido ao seu potencial de aplicação nas áreas de biotecnologia e biomedicina, como em biossensores e drug delivery. Em geral, a adsorção é favorecida em pH próximo do ponto isoelétrico (pI) da proteína, no qual a repulsão eletrostática proteína-proteína é minimizada, e os patches de carga de sinal oposto à da superfície promovem a atração proteína-poro. Entretanto, resultados experimentais da adsorção do citocromo c em mesoporos de sílica SBA-15 mostraram que o pH no qual ocorre a máxima adsorção está significativamente abaixo do pI da proteína. Nossa hipótese é que o mecanismo de regulação de carga pode ser importante para esse comportamento. Para investigar essa questão, estudamos a adsorção do citocromo c enovelado, utilizando um modelo simpli- ficado baseado em estrutura, por meio de simulações computacionais de Monte Carlo a pH constante. A proteína foi confinada em um poro cilíndrico carregado negativamente e foram avaliados os efeitos do pH, da concentração de sal e do raio de confinamento na distribuição de cargas da proteína e na energia de ligação proteína-superfície. Nós observamos que a regulação de carga causada pela presença da superfície favorece a protonação dos resíduos ionizáveis da proteína, mas esse comportamento é invertido para pH > pI. Esse aumento da carga líquida resulta em menores energias de ligação para raios maiores e salinidades menores. Também vimos que a regulação de carga aumenta a estabilidade da orientação do citocromo c durante a adsorção, além de possibilitar que a adsorção ocorra em pH ≈ pI, o que não acontece sem considerar a regulação de carga. Palavras-chave: Adsorção de proteína. Regulação de carga. Citocromo c. Método de Monte Carlo. Abstract Protein adsorption onto charged porous surfaces has been extensively investigated in the literature due to its applicability in biotechnology and biomedicine, such as biosensors and drug delivery systems. Typically, adsorption is favored in pH values close to the protein’s isoelectric point (pI), in which protein-protein electrostatic repulsion is minimized and the oppositely charged regions of the protein promote protein-surface attraction. However, experimental results of cytochrome c adsorption into SBA-15 silica mesopores have shown that the pH at which maximum adsorption occurs is significantly below pI. We propose that the charge regulation mechanism might play a crucial role in this behavior. To address this hypothesis, we employ pH-constant Monte Carlo simulations with a simplified structure-based model of folded cytochrome c, confined within a negatively charged cylindrical pore. We evaluate the effects of pH, salt concentration and confinement radius on the protein’s charge distribution and the protein-surface binding energy. Our results indicate that the charge regulation induced by the surface promotes the protonation of titratable residues in the protein, although this behavior is inverted for pH > pI. This increased charge state results in lower binding energies for larger confinement sizes and lower salinities. We have also shown that charge regulation increases the stability of cytochrome c orientation during adsorption and promotes adsorption at pH ≈ pI, which does not occur without employing charge regulation. Keywords: Protein adsorption. Charge regulation. Cytochrome c. Monte Carlo method. Lista de Ilustrações Figura 1.1 – Estrutura geral de um aminoácido. No esquema, um grupo amina (azul) e um grupo carboxílico (vermelho) ligam-se ao carbono central (carbono-α ou Cα), que além do átomo de hidrogênio, também está ligado a uma ca- deia lateral (roxo) responsável por distinguir os diferentes aminoácidos. 19 Figura 1.2 – Formação da ligação peptídica. No esquema, dois aminoácidos com ca- deias laterais R1 e R2 formam um dipeptídeo, no qual o hidrogênio do grupo amino (R2) e a hidroxila do grupo carboxílico (R1) formam uma molécula de água por condensação, estabelecendo uma ligação peptídica (sombreada) no dipeptídeo. . . . . . . . . . . . . . . . . . . . . . 19 Figura 1.3 – Os 4 níveis estruturais da proteína. A estrutura primária (A) é a sequência linear dos resíduos de aminoácidos na cadeia polipeptídica. A estrutura secundária são conformações espaciais locais na proteína (como folhas-β e α-hélices) (B), compostas por um segmento de resíduos interconectados. Essas estruturas locais se arranjam tridimensionalmente para formar um polímero emaranhado. Esse arranjo caracteriza a estrutura terciária da proteína (C), que depende da sequência linear dos resíduos. Por fim, a estrutura quaternária é a composição espacial de subunidades proteicas de estruturas terciárias, formando o complexo proteico (D). . . . 20 Figura 1.4 – Estrutura geral do grupo heme. Este grupo prostético está presente na mioglobina, na hemoglobina, nos citocromos e outras hemoproteínas. Sua estrutura é formada por um anel orgânico de protoporfirina ligado a um átomo de ferro (Fe-Protoporfirina-IX), que realiza 6 ligações coordenadas: 4 covalentes no plano da molécula e 2 axiais perpendiculares ao plano. Os grupos vinil (CH2=CH) circulados de magenta na imagem formam ligação covalente com os resíduos de cisteína 14 e 17 do citorcromo c. 24 9 Figura 1.5 – Grupo prostético heme do citocromo c. Liga-se covalentemente ao ci- tocromo c por meio de duas ligações tioéster (azul) com duas cisteínas (Cys) da proteína. Já o ferro, no estado nativo da proteína, realiza 2 ligações não-covalentes perpendiculares ao plano da protoporfirina com o citocromo c: uma histidina e uma metionina. . . . . . . . . . . . 25 Figura 1.6 – Representação visual da estrutura do citocromo c. À esquerda, a es- trutura completa da proteína, onde o grupo heme está representado em verde. À direita, o grupo heme (azul) em detalhes, realizando ligações não-covalentes com a Met-80 e a His-18 da proteína (laranja). . . . 26 Figura 1.7 – Ilustração da presença de contraíons positivos atraídos por uma superfície carregada negativamente. Além de causar um efeito de blindagem eletros- tática no potencial da superfície, os contraíons também promovem uma perturbação do pH local, originando um efeito de regulação de carga em corpos próximos à superfície. . . . . . . . . . . . . . . . . . . . . 28 Figura 3.1 – Representação visual da cadeia do citocromo c em nosso modelo CG SBM- Cα. Na imagem, a GLY-1 é o N-terminal e o Glu-104, o C-terminal. 33 Figura 3.2 – Esquema das interações intramoleculares entre os monômeros da proteína. No diagrama, r é a distância entre dois monômeros ligados e θ e ϕ são ângulos formados por uma sequência de monômeros. . . . . . . . 34 Figura 3.3 – Representação do grupo heme. À esquerda, o heme, em vermelho, ligado ao citocromo c por meio de duas ligações covalentes com as cisteínas 14 e 17, em azul escuro. O átomo de ferro, em vermelho sólido, centrado no retângulo formado pelos 4 pseudoátomos que compõem o heme, em vermelho transparente. À direita, o heme com todos os átomos explícitos (compare com a figura 1.4). Destacados em vermelho, os 4 átomos de carbono escolhidos para serem as posições dos 4 pseudoátomos da figura à esquerda. Em ciano, os átomos de nitrogênio nos quais está ligado covalentemente o átomo de ferro, em rosa. . . . . . . . . . . . . . 35 Figura 3.4 – Esquema do modelo de poro confinante. . . . . . . . . . . . . . . 37 Figura 3.5 – À esquerda, a fração de contatos nativos do citocromo c em função da constante ϵC , à temperatura T = 349, 15 K. Modelando uma sigmoide na curva, obtemos ϵC ≈ 0, 668 kcal/mol para metade dos contatos nativos, portanto usamos ϵC = 0, 67 kcal/mol em nossas simulações. À direita, o calor específico a volume constante CV do citocromo c com o ϵC determi- nado. O pico da curva de CV representa a temperatura de transição da proteína (pelo gráfico, T ≈ 349K). . . . . . . . . . . . . . . . . . 43 Figura 4.1 – Carga líquida do citocromo c em função do pH, em salinidades de 1 mM (A), em azul, e 10 mM (B), em vermelho. Os círculos preenchidos re- presentam as simulações com regulação de carga, enquanto os círculos vazios representam as simulações com a proteína livre em solução. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de carga, em unidades da carga elementar e, é da ordem do tamanho dos círculos no gráfico. . . . . . . . . . 47 Figura 4.2 – Energia média de interação eletrostática proteína-poro, em concentrações de sal de 1 mM (A), em azul, e 10 mM (B), em vermelho. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de energia é da ordem de 3 kBT . . . . . . . . . 49 Figura 4.3 – Comparação entre as energias médias de interação eletrostática proteína- poro com (círculos preenchidos) e sem (círculos vazios) o efeito da regulação de cargas, em concentrações de sal de 1 mM (A), em azul, e 10 mM (B), em vermelho. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de energia é da ordem de 3 kBT 50 Figura 4.4 – Distribuição da densidade de probabilidade dos resíduos mais próximos da superfície, em raio de confinamento de 160 Å, salinidade de 1 mM e valores de pH 8, 9 e 10. As linhas sólidas representam as simulações com regulação de carga, enquanto as linhas tracejadas indicam as simulações mantendo a proteína com suas cargas fixas. . . . . . . . . . . . . 52 Figura 4.5 – Distribuição da densidade de probabilidade de resíduos que promovem duas orientações de adsorção, em raio de confinamento de 160 Å, salini- dade de 1 mM e pH 10. As linhas sólidas representam as simulações com regulação de carga, enquanto as linhas tracejadas indicam as simulações mantendo a proteína com suas cargas fixas. . . . . . . . . . . . . 54 Figura 4.6 – Projeção Mollweide da densidade superficial de carga do citocromo c, em raio de confinamento de 160 Å, salinidade 1 mM e pH 8, com regulação de carga. Os círculos em azul claro representam a Arg-38 e a Lys-39, as cruzes brancas as lisinas 72 e 73, a cruz em vermelho claro a Lys-86 e o losango branco o átomo de ferro. . . . . . . . . . . . . . . . . . . 55 Lista de Tabelas Tabela 1.1 – pKa dos aminoácidos de cadeia lateral ionizável em solução aquosa . . . 23 Tabela 3.1 – Densidade superficial de carga σ em função do pH para sílica SBA-15 . . 38 Tabela 4.1 – Densidade superficial de cargas do citocromo c em raio de 160 Å. . . . . 55 13 Sumário 1 Introdução 16 1.1 Proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.1.1 Estrutura das proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.1.2 Influência do pH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.1.3 O citocromo c e o grupo heme . . . . . . . . . . . . . . . . . . . . . . . . 24 1.2 Regulação de Carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2 Objetivos 31 3 Metodologia 32 3.1 Modelo da Proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.1.1 Modelo Baseado em Estrutura . . . . . . . . . . . . . . . . . . . . . . . . 32 3.1.2 O grupo heme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.2 A Solução Iônica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 3.3 A Superfície Carregada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.4 O Programa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.4.1 O Método de Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3.4.2 O algoritmo de Metropolis . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3.4.3 Amostragem de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3.5 Detalhes Computacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.5.1 Determinação do parâmetro ϵc . . . . . . . . . . . . . . . . . . . . . . . . 42 3.5.2 Simulações e Análises . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.5.3 Projeção da Densidade Superficial de Carga . . . . . . . . . . . . . . . . 44 4 Resultados e Discussão 46 4.1 Carga Líquida e ponto Isoelétrico . . . . . . . . . . . . . . . . . . . . . . . 46 4.2 Energia Potencial de Ligação . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.3 Distribuição dos Resíduos . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.4 Projeção da Densidade Superficial de Carga . . . . . . . . . . . . . . . . . 54 5 Conclusões 58 14 Referências 60 Apêndices 68 A – Potencial Eletrostático de uma Superfície Cilíndrica Carregada 68 A.1 Equação de Poisson-Boltzmann . . . . . . . . . . . . . . . . . . . . . . . . 68 A.2 Aproximação de Debye-Hückel . . . . . . . . . . . . . . . . . . . . . . . . . 69 A.3 Solução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 A.4 Condições de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 1 Introdução A adsorção de proteínas em superfícies é um tema que vem sendo estudado há décadas [1, 2], dada a importância de se entender tanto os recorrentes processos naturais envolvendo esse tema, como atividade de anticorpos [1, 3], catálise enzimática [4–6], e sinalização transmembrana [7, 8], quanto possíveis aplicações biomédicas e biotecnológicas, como sistemas de drug delivery [9–11] e biossensores [12, 13]. Nos dois últimos casos, destaca-se a adsorção de proteínas em nanomateriais porosos, como a sílica, uma vez que o confinamento pode conferir às proteínas maior estabilidade térmica e química [14, 15], protegendo contra sua desnaturação e até contra decomposição biológica, devido ao poro ser menor do que estruturas bacterianas [16]. Os nanoporos baseados em silício, além de serem materiais biocompatíveis [13], podem funcionar como um dispositivo óptico, e há décadas já têm sido usados como biossensores [17]. Remédios anticâncer possuem baixa solubilidade em água, de modo que o confinamento em poros de sílica, por possuir ampla área superficial e grande variabilidade de raio de confinamento, surge também como uma boa opção para entrega de drogas hidrofóbicas de diferentes tamanhos [10, 18]. Na literatura, o modelo predominante usado para descrever a adsorção de proteínas em superfícies carregadas se baseia nas interações eletrostáticas. Esse modelo leva em consideração a competição entre as interações repulsiva proteína-proteína e atrativa proteína-superfície [14, 16, 19–21]. Com isso, espera-se que o pH no qual a adsorção é máxima ocorra no ponto isoelétrico (pI) da proteína [14, 16, 20]. Isso porque, nesse pH, a repulsão proteína-proteína é mínima e, por conta das proteínas serem moléculas poliméricas com distribuição heterogênea de cargas, as regiões da proteína de carga oposta à da superfície promovem a adsorção por atração eletrostática [22–24]. Em valores de pH diferentes do pI, a repulsão entre as proteínas na solução desfavorece um maior empacotamento nos poros [16]. Embora a força que leva a proteína a se ligar à superfície carregada envolva mecanismos tanto entálpicos, como atração eletrostática e forças de Van der Waals, quanto entrópicos, como liberação de contraíons [25, 26], o modelo eletrostático é, em geral, suficiente para explicar a maioria das observações experimentais referentes à adsorção de proteínas [16]. Entretanto, o trabalho publicado em 2015 por Moerz e Huber [27], referente 17 à adsorção do citocromo c em mesoporos de sílica SBA-15, revelou um comportamento que o modelo eletrostático falha em explicar: é observada máxima adsorção em pH próximo de 7,5 que é significativamente abaixo do pI de 10,5 da proteína [28–30], o que vai na contramão de alguns resultados obtidos em outros estudos [14, 20]. Os autores afirmam, em seu trabalho, que os experimentos tipicamente utilizam superfícies cobertas por uma camada de polietilenoglicol (PEG), cuja expessura excede o comprimento de Debye, o que pode afetar o comportamento esperado pelas previsões dos modelos teóricos [16]. Ainda segundo os autores, outro aspecto importante a ser considerado para o entendimento desses resultados, para além dos fatores entálpicos e entrópicos supracitados, é o mecanismo da regulação de carga (seção 1.2), que diz respeito à forma como a distribuição de cargas de uma molécula é perturbada ao se aproximar de um campo elétrico externo [31, 32]. Mais especificamente, uma superfície carregada em uma solução iônica resulta em uma interface com distribuição desigual de íons, culminando em um pH local que difere do pH no bulk da solução [33]. Assim, alguns resíduos de aminoácido ionizáveis da proteína podem apresentar uma carga alterada na interface em relação ao caso livre em solução, o que afeta a maneira como a proteína interage eletricamente com a superfície. A própria adsorção também afeta o potencial e a distribuição de cargas na interface, gerando uma contribuição adicional à energia livre do sistema [34], o que resulta em uma afinidade eletrostática que não segue necessariamente as previsões do modelo eletrostático [33]. Contudo, em trabalhos experimentais, o fator limitante para a inclusão do mecanismo de regulação de carga na interpretação de resultados é a dificuldade em quantificar seu impacto no experimento, já que para calcular o pH da superfície é preciso conhecer o potencial superficial, que é afetado tanto pela protonação dos grupos silanol da sílica, quanto pela carga e quantidade de proteínas adsorvidas. Além disso, mesmo sabendo o potencial e a alteração do valor do pH, ainda seria preciso conhecer informações específicas da proteína, como a distribuição de seus grupos carregados e como eles dependem do pH, sua estrutura e sua orientação durante a adsorção [16, 27]. Com o objetivo de esclarecer os detalhes desses efeitos da regulação de carga na adsorção de proteínas, Daniel L. Z. C. et al [35], em 2021, publicaram um trabalho de simulação computacional analisando os efeitos da regulação de cargas na adsorção da lisozima em poro carregado. Um de seus resultados indicou que a regulação de carga promove uma mudança de orientação dependente do pH que estabiliza a adsorção [35]. Também descobriram que a mínima energia de ligação ocorre em pH relativamente próximo do pI da lisozima, que é o valor de pH, obtido por Moerz et al [27], em que se observa máxima quantidade de proteína adsorvida nos poros. Embora os efeitos associados à interação proteína-proteína não tenham sido contemplados nesse trabalho, 1.1. Proteínas 18 os efeitos causados pela regulação de carga indicam que esse mecanismo pode ser bastante importante para o entendimento de resultados experimentais. Tendo em vista a continuidade do trabalho de Daniel, o presente trabalho consiste num estudo dos efeitos da regulação de carga na adsorção do citocromo c em um poro cilíndrico carregado, via simulação computacional de Monte Carlo à pH constante, analisando a influência de diferentes condições de salinidade, pH e raio do poro na energia de ligação proteína-poro e na distribuição de cargas da proteína, com o objetivo de entender melhor o papel da regulação de carga na adsorção de proteínas e como ele pode complementar o modelo eletrostático estabelecido na literatura para descrever esse tipo de sistema. 1.1 Proteínas As proteínas têm papel vital no funcionamento biológico, participando de quase todas as funções celulares e constituindo cerca de 50% da massa celular [36, 37]. Podem desempenhar tanto funções estruturais, como promover o transporte de outras moléculas, clivar estruturas poliméricas de ácidos nucleicos e compor a estrutura e rigidez do citoesqueleto, quanto funções regulatórias, como formar canais que controlam o transporte de substâncias nas células, acelerar reações químicas e sinalizar outras moléculas com informações importantes para o funcionamento correto das células [36–38]. As proteínas são biomoléculas poliméricas, cujos monômeros da cadeia principal são os aminoácidos – moléculas compostas por um grupo amina, um ácido carboxílico e uma cadeia lateral, conforme a figura 1.1 [37]. A última tem grande importância na proteína, uma vez que ela é a responsável por diferir um aminoácido de outro, e com isso atribuir características à proteína, como estrutura, tamanho, carga e solubilidade em água [36, 37, 39]. Os aminoácidos se ligam por meio da condensação química, que ocorre na ligação covalente peptídica, onde uma molécula de água é liberada para que 2 aminoácidos se liguem, formando uma cadeia de resíduos de aminoácidos, conhecida como polipeptídeo [37]. A figura 1.2 ilustra a formação de um dipeptídeo. Polipeptídeos que possuem mais de 50 resíduos, são chamados de proteínas [36, 37]. Ao todo, existem 20 aminoácidos que podem formar uma proteína in vivo, embora existam outros aminoácidos não essenciais [38, 40, 41]. 1.1. Proteínas 19 Fonte: Retirada do livro "Princípios de Bioquímica de Lehninger" [37] Figura 1.1: Estrutura geral de um aminoácido. No esquema, um grupo amina (azul) e um grupo carboxílico (vermelho) ligam-se ao carbono central (carbono-α ou Cα), que além do átomo de hidrogênio, também está ligado a uma cadeia lateral (roxo) responsável por distinguir os diferentes aminoácidos. Fonte: Retirada do livro "Princípios de Bioquímica de Lehninger" [37] Figura 1.2: Formação da ligação peptídica. No esquema, dois aminoácidos com cadeias laterais R1 e R2 formam um dipeptídeo, no qual o hidrogênio do grupo amino (R2) e a hidroxila do grupo carboxílico (R1) formam uma molécula de água por condensação, estabelecendo uma ligação peptídica (sombreada) no dipeptídeo. 1.1.1 Estrutura das proteínas A estrutura de uma proteína é entendida em 4 níveis: a estrutura primá- ria, na qual a proteína é representada linearmente por sua sequência de resíduos de aminoácidos (figura 1.3-A); a estrutura secundária (figura 1.3-B), que possui represen- tações de estruturas locais na proteína (como α-hélice, folha-β ou sem estrutura bem definida, chamada de random coil); a estrutura terciária, na qual há uma organização tridimensional da cadeia polipeptídica (figura 1.3-C); e a estrutura quaternária, em que as estruturas terciárias se unem espacialmente (figura 1.3-D), formando um complexo proteico [36–39]. 1.1. Proteínas 20 Fonte: Adaptado do National Human Genome Reseach Institute (NIH) [42] Figura 1.3: Os 4 níveis estruturais da proteína. A estrutura primária (A) é a sequência linear dos resíduos de aminoácidos na cadeia polipeptídica. A estrutura secundária são conformações espaciais locais na proteína (como folhas-β e α-hélices) (B), compostas por um segmento de resíduos interconectados. Essas estruturas locais se arranjam tridimensionalmente para formar um polímero emaranhado. Esse arranjo caracteriza a estrutura terciária da proteína (C), que depende da sequência linear dos resíduos. Por fim, a estrutura quaternária é a composição espacial de subunidades proteicas de estruturas terciárias, formando o complexo proteico (D). A estrutura tridimensional que a proteína assume é entendida como o estado enovelado da proteína, ou estado nativo, pois é nessa conformação que a proteína desempenha suas funções biológicas, e o processo pelo qual uma proteína evolui da estrutura primária à terciária ou quaternária, é chamado de enovelamento [37, 39]. Para que esses arranjos tridimensionais se formem e se estabilizem, tanto na estrutura secundária, como na terciária e quaternária, inúmeras interações inter e intramoleculares atuam na proteína, como ligações de hidrogênio, forças de Van der Waals, interações eletrostáticas e hidrofóbicas [38, 43]. O enovelamento pode ser analisado por meio de uma grandeza importante da física aplicada à biologia molecular e bioquímica, conhecida como energia livre. Essa grandeza representa a energia que pode ser aproveitada para realização de trabalho ou formação de ligações químicas [36, 37]. A energia livre G para o ensemble canônico, no qual o número de partículas, o volume V e a temperatura T se mantêm constantes, é dada por G ≡ H − TS, em que H é a entalpia, dada por H = U + PV , uma função de 1.1. Proteínas 21 estado que leva em conta a energia interna U de um sistema, e a energia de interação do sistema com o meio, descrita pelo produto da pressão P do meio com o volume V do sistema. T é a temperatura e S é a entropia [44, 45]. Para que uma reação química ocorra de forma espontânea, a variação de energia livre ∆G do sistema, à temperatura T constante, deve ser negativa, isto é, a energia livre deve diminuir de um estado para outro (∆G < 0) [36, 37, 44]. Pela Segunda Lei da Termodinâmica, a entropia do universo, somando o sistema e a vizinhança, nunca pode diminuir, isto é, ∆Suniv ≥ 0, sendo ∆Suniv = 0 em processos reversíveis e ∆Suniv > 0 em processos irreversíveis [44]. A estrutura enovelada da proteína representa a configuração de mínima energia livre G do sistema, considerando tanto as interações intramoleculares (proteína com ela mesma), quanto as interações intermoleculares (proteína-sistema). Isso inclui as contribuições entálpica H, como as interações fracas supracitadas que formam e mantêm a estrutura enovelada, e entrópica TS, que se relaciona com a liberdade conformacional da cadeia polipeptídica1 e das moléculas do meio [38, 46]. Se fosse considerada apenas a proteína, o processo de enovelamento leva a cadeia polipeptídica a uma diminuição da entropia, por estar bem ordenada numa conformação mais rígida e menos flexível, e portanto ∆Sprot < 0 [46]. Entretanto, considerando também a vizinhança do sistema, as moléculas de solvente que antes interagiam com a proteína (solvatação) são "liberadas" ao sistema à medida que a cadeia se enovela e diminui sua superfície de contato, o que garante um aumento da entropia das moléculas de solvente e do sistema como um todo, portanto ∆Sprot + ∆Smeio = ∆Suniv ≥ 0 [37, 38, 46]. Como o termo entrópico contribui negativamente para a energia livre, quanto maior a temperatura ou o aumento da entropia, menor o ∆G. O enovelamento da proteína também depende das condições do ambiente em que a proteína se encontra, como o pH (seção 1.1.2), a concentração e o tipo de soluto na solução, a presença de íons, a temperatura e a influência de outros corpos na proteína. O processo de enovelamento realizado de forma errada pode acarretar em doenças neurodegenerativas em humanos, como o mal de Alzheimer e o mal de Huntington [36–39] 1.1.2 Influência do pH O pH mede o grau de acidez de uma solução aquosa. Quantitativamente, o pH é calculado com base na concentração de íons H+ da solução em que se encontra. 1Na física estatística, a entropia de um corpo diz respeito à liberdade que esse corpo possui em um espaço de configurações (ou microestados) possíveis. Logo, a entropia da proteína é maior quando ela pode acessar uma quantidade maior de conformações, e menor à medida que ela se enovela [46]. 1.1. Proteínas 22 Essa propriedade decorre do fato de que a água pura possui um pequeno grau de ionização, por meio do qual suas moléculas de H2O dissociam-se nos íons hidrogênio (H+) e hidróxido (OH−), descrita pela reação de equilíbrio H2O ⇌ H+ + OH−, cuja constante de equilíbrio da reação é: Keq = [H+][OH−] [H2O] , (1.1) onde [ ] denota a concentração molar. Como a concentração da água pura, à temperatura ambiente de 298 K, é [H2O] = 55, 5 mols/L, e a constante Keq = 1, 8×10−16 mol/L [37]), temos que: [H+][OH−] = Keq[H2O] = 55, 5× 1, 8× 10−16 ≈ 1, 0× 10−14(mols/L)2. (1.2) O produto das concentrações iônicas da água pura é uma constante, e o pH é definido como: pH = − log[H+]. (1.3) Assim, o pH pode assumir valores em uma escala entre 0 e 14, a depender das concen- trações de íons positivos e negativos. Quando essas concentrações são iguais, o pH é 7,0 e é considerado neutro [36]. Alguns grupos químicos também possuem a capacidade de se dissociar em íons positivos e negativos quando em solução aquosa, HA ⇌ H+ + A−, e por conta disso são considerados grupos ionizáveis. Sua constante de equilíbrio Ka é dada por: Ka = [H+][A−] [HA] e pKa = − log(Ka), (1.4) sendo que o pKa é conhecido como a constante de dissociação ácida de um grupo ionizável. Para entender melhor o que essa grandeza representa na física de biomoléculas e complementar a abordagem físico-química que fizemos até agora, vamos interpretar o efeito do pH do ponto de vista estatístico. Em uma solução iônica, a agitação térmica das moléculas dita um comportamento dinâmico da reação de ionização descrita pela equação 1.4. Isso quer dizer que quando a espécie HA é formada, ela logo será dissociada novamente nos íons H+ + A−, até que essa reação reversível atinja o equilíbrio, no qual [HA] e [A−] são formados a uma taxa que os mantém, em média, constantes [47]. Ainda assim, o próton H+ continua em constante processo de dissociação e associação, e a probabilidade de que ele esteja ligado ou livre em solução, em um determinado instante, depende da relação de concentrações das espécies iônicas na solução. A equação 1.4 1.1. Proteínas 23 Tabela 1.1: pKa dos aminoácidos de cadeia lateral ionizável em solução aquosa Aminoácido Tyr Cys Lys His Arg Asp Glu pKa 9, 6 8, 2 10, 6 6, 3 12, 0 4, 0 4, 5 Fonte: Retirada do trabalho de Daniel L. Z. C. et al [35] apresenta a constante Ka que estabelece essa relação. Se o pH = pKa, então − log[H+] = − log(Ka)⇒ [H+] = [H+][A−] [HA] ⇒ [HA] = [A−]. (1.5) Assim, o pKa determina o valor do pH em que a probabilidade do grupo A estar protonado ou desprotonado é a mesma. Em outras palavras, quando pH < pKa, o grupo tem probabilidade maior de estar protonado. Quando pH > pKa, é mais provável que esteja desprotonado. [36, 37]. A carga de um aminoácido livre em função do pH é determinada pelo pKa dos grupos químicos ionizáveis que o formam. Tanto o grupo H3N+ quanto o COO− de um aminoácido (figura 1.1) são ionizáveis. O grupo carboxila pode ganhar prótons num pH mais ácido e se tornar COOH, ou num pH mais básico, o grupo amina pode perder um próton e se tornar NH2. Esses dois grupos estão presentes em todos os aminoácidos, e o pKa deles não difere muito de um para outro. Dos 20 aminoácidos padrão, o pKa do COO− varia entre 1, 8 e 2, 4, enquanto o pKa do grupo H3N+ varia entre 8, 9 e 10, 9. Assim, em pH neutro predomina a forma zwitteriônica do aminoácido, isto é, uma região positiva (amina) e uma negativa (carboxila) [37]. Entretanto, com exceção dos resíduos terminais de uma proteína (das extre- midades), mais conhecidos como N-terminal e C-terminal, os aminoácidos presentes nas proteínas não estão livres, pois os grupos amina e carboxila estão ligados covalentemente, formando a ligação peptídica (figura 1.2) e, com isso, não são mais ionizáveis. Sendo assim, a diferença de carga elétrica entre proteínas distintas se origina da cadeia lateral dos resíduos de aminoácidos. Nem todos os aminoácidos possuem cadeias laterais capa- zes de receber ou doar prótons - dos 20 aminoácidos padrões, apenas 7 são ionizáveis: a tirosina (Tyr), a cisteína (Cys), a lisina (Lys), a histidina (His), a arginina (Arg), o ácido aspártico (Asp) e o ácido glutâmico (Glu). Seus valores de pKa estão dispostos na tabela2 1.1. São eles os responsáveis por formar a distribuição de cargas de uma proteína em um determinado pH [37]. A importância do pH em sistemas biológicos é grande, uma vez que pratica- mente todos os processos biológicos dependem do pH. Variações neste grau de acidez 2O pKa da cisteína foi retirado do livro "Princípios de Bioquímica de Lehninger" [37] 1.1. Proteínas 24 Fonte: Retirada do livro "Princípios de Bioquímica de Lehninger" [37] Figura 1.4: Estrutura geral do grupo heme. Este grupo prostético está presente na mioglobina, na hemoglobina, nos citocromos e outras hemoproteínas. Sua estrutura é formada por um anel orgânico de protoporfirina ligado a um átomo de ferro (Fe-Protoporfirina-IX), que realiza 6 ligações coordenadas: 4 covalentes no plano da molécula e 2 axiais perpendiculares ao plano. Os grupos vinil (CH2=CH) circulados de magenta na imagem formam ligação covalente com os resíduos de cisteína 14 e 17 do citorcromo c. podem influenciar atividades importantes como mecanismos de reação de enzimas [48], ou mesmo a própria estrutura de biomoléculas, como a desnaturação de uma proteína induzida por ácidos ou o enovelamento errôneo da proteína [36, 49]. 1.1.3 O citocromo c e o grupo heme Nem todas as proteínas são constituídas apenas por resíduos de aminoácidos. Algumas também contêm outros componentes químicos permanentemente associados a suas cadeias. Esses componentes são conhecidos como grupos prostéticos. Exemplos conhecidos são as glicoproteínas, cujo grupo prostético são açúcares, ou as lipoproteínas, que possuem lipídeos. Geralmente, o grupo prostético desempenha uma função biológica importante, como também ocorre com as hemoproteínas (ou proteínas-heme), que possuem um grupo heme [37]. O grupo heme é uma estrutura complexa orgânica em anel, a protoporfirina-IX, que se liga a um átomo de ferro no estado ferroso (Fe2+) (figura 1.4). Existem diferentes tipos de grupos heme, cada um podendo desempenhar um tipo de função [50]. As hemoproteínas, como a hemoglobina, estudadas desde 1850 [51], estão presentes universalmente em quase todos os organismos aeróbicos [52] por possuírem funções importantes, atribuídas ao grupo heme, nas células. Por exemplo, na hemoglo- 1.1. Proteínas 25 Fonte: Retirada do livro "Princípios de Bioquímica de Lehninger" [37] Figura 1.5: Grupo prostético heme do citocromo c. Liga-se covalentemente ao citocromo c por meio de duas ligações tioéster (azul) com duas cisteínas (Cys) da proteína. Já o ferro, no estado nativo da proteína, realiza 2 ligações não-covalentes perpendiculares ao plano da protoporfirina com o citocromo c: uma histidina e uma metionina. bina, o grupo heme se liga reversivelmente a uma molécula de oxigênio por meio do seu átomo de ferro, conferindo à hemoglobina a capacidade de transporte de oxigênio dos pulmões para os tecidos [36, 37]. Os citocromos são uma família de hemoproteínas globulares, nos quais o grupo heme atua como transportador de elétrons, devido à função oxirredutora do átomo de ferro, em que ele pode alternar entre o estado férrico (3+) e ferroso (2+). Seu nome é dado porque os citocromos surgem como pigmentos celulares em alguns métodos de espectroscopia e são localizados, em geral, na membrana citoplasmática [37, 50]. Os citocromos atuam na cadeia transportadora de elétrons, processo encontrado na membrana interna da mitocôndria e envolvido na respiração celular, no qual os elétrons são transferidos através de uma cadeia de diferentes complexos enzimáticos, mediados por proteínas transportadoras, como o citocromo c. Ao fim do processo, os elétrons entram no complexo citocromo-oxidase, onde se combinam com uma molécula de oxigênio O2 para a formação de água [37]. Em nosso trabalho, estudaremos o citocromo do tipo c (ou citocromo c). Os citocromos c são proteínas globulares de pouco mais de 100 resíduos de aminoácidos, cujo grupo heme é do tipo c (heme c). O heme c consiste numa Fe-protoporfirina-IX ligada à proteína, por meio de dois grupos vinil (CH2=CH), realizando ligação tioéster com as cisteínas 14 e 17 do motivo peptídico Cys-X-X-Cys- His [50, 53, 54]. A representação bidimensional da estrutura do heme c é exibida na figura 1.5. No estado nativo do citocromo c (figura 1.6), o ferro do grupo heme também realiza duas ligações axiais não-covalentes: uma com a His-18, do motivo 1.2. Regulação de Carga 26 Fonte: Retirada do PDB da proteína 2B4Z (citocromo c de coração bovino) [29] Figura 1.6: Representação visual da estrutura do citocromo c. À esquerda, a estrutura completa da proteína, onde o grupo heme está representado em verde. À direita, o grupo heme (azul) em detalhes, realizando ligações não-covalentes com a Met-80 e a His-18 da proteína (laranja). CXXCH supracitado, e outra com a Met-80 (figura 1.6) [29, 54, 55]. Além do transporte de elétrons, os citocromos do tipo c também podem atuar em sítios catalíticos de enzima [53, 56] e em apoptose celular [37, 57]. O grupo heme também é importante no processo de enovelamento do citocromo c, não só porque atua como um sítio de nucleação para ligação de cadeias laterais de aminoácidos, mas também por possuir uma grande superfície hidrofóbica [58, 59]. Sob condições de desnaturação, causadas por hidroclorido de guanidina ou ureia, a ligação do heme com a Met-80 é perdida, mas são mantidas tanto a ligação com a His-18, quanto as ligações covalentes [50, 55]. Na condição de apocitocromo, isto é, citocromo sem o grupo prostético, a proteína se encontra desenovelada [60]. 1.2 Regulação de Carga Para melhor entendimento do mecanismo de regulação de carga, vamos considerar novamente a reação de equilíbrio de um grupo ionizável, HA ⇌ H+ + A−, mas levando em conta as interações iônicas com outros corpos carregados. A constante de equilíbrio Ka dessa reação é dada por: Ka = Kγ [H+][A−] [HA] ; Kγ ≡ γH+γA− γHA , (1.6) sendo Kγ a constante de atividade, definida pelos coeficientes de atividade γ, que compreende interações quando a solução não é considerada infinitamente diluída (i.e. fora da idealidade, quando γ = 1) [32, 45]. Rearranjando a equação e aplicando o 1.2. Regulação de Carga 27 logaritmo, temos: log(Ka)− log(γH+ [H+]) = log ( [A−] [HA] ) + log ( γA− γHA ) . (1.7) Substituindo as equações 1.3 e 1.4 na última, obtemos: − log ( [A−] [HA] ) = −pH + pKa + log ( γA− γHA ) (1.8) − log ( [HA] [A−] ) = pH − pKa + log ( γHA γA− ) (1.9) A partir da equação 1.9 podemos entender o efeito da regulação de carga no comportamento do estado de protonação de grupos ionizáveis, como em proteínas, do ponto de vista físico-químico. O termo do lado esquerdo da equação caracteriza a carga média do grupo ionizável A, uma vez que os íons positivos estão constantemente se associando e dissociando do grupo, por conta da agitação térmica da solução [32]. Como discutido na seção 1.1.2, quando pH é muito diferente do pKa, a probabilidade é alta do grupo se encontrar protonado (pH < pKa) ou desprotonado (pH > pKa). Nesse caso, a diferença pH − pKa deve ser decisiva na média da carga do grupo ionizável. No entanto, quando pKa ≈ pH, a equação 1.9 se torna − log ( [HA] [A−] ) ≈ log ( γHA γA− ) , (1.10) de modo que a carga média passa a depender muito dos coeficientes de atividade γ. Numa solução ideal desconsiderando interação com outros corpos, γ = 1 e não há alteração na carga média do grupo ionizável. Mas quando esse grupo se aproxima de outro corpo carregado, como uma proteína se aproximando de uma superfície carregada, os coeficientes de atividade passam a ditar o comportamento de protonação do grupo, que se torna muito diferente de quando ele está livre em solução. Esse mecanismo que altera a configuração de cargas de uma molécula, devido à presença de uma região carregada, é chamado de regulação de carga [31, 32]. A regulação de carga pode ser entendida como uma alteração no pH de uma região devido à presença de um potencial externo. O potencial de uma superfície carregada, como uma membrana, uma proteína ou um poro, atrai íons de carga oposta à da superfície (contraíons), ilustrado na figura 1.7, o que perturba o pH da vizinhança dessa superfície e modifica o estado de protonação de uma molécula ionizável que se aproxima dessa região. Ou seja, a diferença pH − pKa é alterada, e isso causa uma regulação de cargas nos grupos ionizáveis da molécula [31, 32, 61]. 1.2. Regulação de Carga 28 Fonte: Retirada do trabalho de Podgornik et al [61]. Figura 1.7: Ilustração da presença de contraíons positivos atraídos por uma superfície carregada negativamente. Além de causar um efeito de blindagem eletrostática no potencial da superfície, os contraíons também promovem uma perturbação do pH local, originando um efeito de regulação de carga em corpos próximos à superfície. Como discutido na seção 1.1.2, o processo de protonação de um grupo ionizável é dinâmico - os prótons não ficam ligados ou desligados o tempo todo, mas têm probabilidade de estarem ligados ou não. Podemos retomar essa interpretação, agora empregando o formalismo da mecânica estatística. Vamos retornar à equação 1.9, mas considerando novamente a idealidade do sistema, em que γ = 1. Neste caso, − ln ( [HA] [A−] ) = (pH − pKa) ln 10. (1.11) A diferença de energia livre ∆G entre os estados protonado (HA) e desprotonado (A−) do grupo ionizável A é expressa por ∆G = −kBT ln ([HA]/[A−]), ou, em termos do pH e do pKa [31, 32]: ⇒ β∆G = − ln ( [HA] [A−] ) = (pH − pKa) ln 10, (1.12) sendo β−1 ≡ kBT . Definimos, então, a função partição ζ desse sistema de dois estados, considerando que no estado desprotonado, a energia GA− = 0. Assim, ζ = ∑ i e−βGi = e−βGA− + e−βGHA = 1 + e−(pH−pKa) ln 10 (1.13) e, com isso, equacionamos o valor esperado da valência do grupo ionizável A: ⟨z⟩ = ∑ i zie −βGi ζ = zA− + zHAe(pH−pKa) ln 10 ζ . (1.14) Para grupos ácidos, zA− =−1, para básicos, zA− =0, e zHA =zA− + zH+ , onde zH+ = +1 para prótons, de modo que ⟨z⟩ = zA− + (zA− + zH+) e(pH−pKa) ln 10 ζ . (1.15) 1.2. Regulação de Carga 29 A flutuação de carga do sítio de ligação é dada pela variância c c = 〈 z2 〉 − ⟨z⟩2 = z2 H+e(pH−pKa) ln 10 ζ2 = − zH+ ln 10 ∂ ⟨z⟩ ∂pH . (1.16) A variância c pode ser interpretada como uma medida da quantidade de carga que pode ser induzida em um sítio de ligação por uma variação do pH. Alguns trabalhos definem c como a capacitância, relacionada a uma resposta da carga do sistema a uma perturbação elétrica externa. Dessa forma, ela pode ser um parâmetro quantitativo para a regulação de carga [31, 32, 62, 63]. Se agora considerarmos duas moléculas, A e B, com cargas pontuais zi e zj posicionadas em ri e rj, respectivamente, levando em conta que os centros de massa de ambas as moléculas sejam separados por R⃗, e que ∑i zi = ZA e ∑j zj = ZB, então a energia potencial eletrostática de interação entre elas é dada por βUES(R) = ∑ i ∑ j lBzizj rij = ∑ i ∑ j lBzizj∣∣∣R⃗ + r⃗j − r⃗i ∣∣∣ , (1.17) sendo lB = βe2/4πε0εs o comprimento de Bjerrum [31, 32]. Podemos usar a teoria da perturbação da mecânica estatística [64, 65] para introduzir o efeito causado por uma perturbação elétrica externa. Escrevemos a energia livre G aproximada de interação entre as moléculas A e B, levando em conta que U ≪ kBT , ou |βU | ≪ 1, e expandimos a função exponencial em série de Taylor, βG(R) = − ln 〈 e−βU(R) 〉 ≈ − ln 〈 1− βU(R) + 1 2β2U2(R) 〉 , (1.18) βG(R) ≈ − ln [ 1− ⟨βU(R)⟩+ 1 2 〈 β2U2(R) 〉] . (1.19) A notação ⟨...⟩ representa a média sobre todas as orientações e estados de ionização da molécula no sistema não-perturbado (livre em solução iônica) [31]. Podemos realizar a mesma aproximação agora com a função logaritmo, obtendo a expansão em série de Taylor até segunda ordem, ln(1− x) ≈ −(x + x2/2): βG(R) ≈ ⟨βU(R)⟩ − 1 2 〈 β2U2(R) 〉 + 1 2 [ −⟨βU(R)⟩+ 1 2 〈 β2U2(R) 〉]2 . (1.20) Considerando, então, o sistema não perturbado, em que as duas moléculas estão muito distantes e não interagem, R ≫ ri, rj ⇒ 1/rij ≈ 1/R. Substituindo a 1.2. Regulação de Carga 30 equação 1.17 na equação 1.20, e levando em conta apenas os termos até 1/R2, temos βG(R) ≈ lB ⟨ZA⟩ ⟨ZB⟩ R − l2 B 2R2 [〈 Z2 A 〉 〈 Z2 B 〉 − ⟨ZA⟩2 ⟨ZB⟩2 ] . (1.21) Podemos reescrever a última equação em termos da capacitância C = ⟨Z2⟩ − ⟨Z⟩2 da molécula: βG(R) ≈ lB ⟨ZA⟩ ⟨ZB⟩ R − l2 B 2R2 [ ⟨ZA⟩2 CB + ⟨ZB⟩2 CA ] − l2 B 2R2 (CACB). (1.22) A equação 1.22 representa uma expressão aproximada para a energia livre de interação entre duas moléculas carregadas, considerando apenas os termos de monopolo3. O primeiro termo da equação representa a interação de Coulomb direta, o segundo é uma interação carga-carga induzida, e o terceiro termo indica uma interação carga induzida- carga induzida [31, 32]. Isso significa que existe uma contribuição das flutuações de carga, resultantes da influência de outros corpos carregados, na energia livre de interação entre as moléculas A e B [32]. Essa contribuição, que atribuímos à regulação de carga, pode ser importante para melhor compreensão do fenômeno de adsorção de proteínas. 3Considerando macromoléculas com distribuição heterogênea de cargas, num caso em que 1/rij ≈ 1/R não é válido, os termos de multipolo de ordem superior têm uma contribuição significativa na regulação de carga [35]. Porém, o resultado da equação 1.22, considerando apenas contribuições de monopolo, já revela os efeitos importantes das flutuações de carga na interação entre moléculas carregadas. 2 Objetivos O objetivo principal deste trabalho é estudar os efeitos do mecanismo de regulação de carga na adsorção do citocromo c em um poro cilíndrico carregado, por meio de simulação computacional de Monte Carlo. Para isso, o trabalho consiste nas seguintes etapas: 1. Modelar adequadamente um sistema composto pelo citocromo c em solução, em sua forma enovelada, confinado em um poro cilíndrico de sílica SBA-15, considerando detalhamento suficiente para reproduzir adequadamente os efeitos da superfície carregada confinante no equilíbrio ácido-base, e aproximações que permitam uma otimização do tempo e reduzam custo computacional. 2. Avaliar, em diferentes condições de sal, pH e raio de confinamento, o efeito da regulação de carga na adsorção da proteína, por meio das análises da energia de ligação proteína-poro, da variação da carga líquida da proteína confinada e livre e da distribuição superficial de cargas da proteína. 3. Relacionar os resultados com outros trabalhos, a fim de verificar se o modelo consegue não apenas reproduzir, como também ajudar na compreensão do com- portamento visto na literatura. 3 Metodologia Neste trabalho, realizamos um estudo da proteína citocromo c em seu estado enovelado numa solução com íons implícitos dentro de um poro carregado. Analisamos esse sistema em diferentes condições de sal, pH e tamanho do poro cilíndrico (seção 3.5). Realizamos a modelagem da proteína, da solução iônica e da superfície carregada, conforme descrito nas seções 3.1, 3.2, e 3.3, respectivamente. O programa e os métodos computacionais empregados para realizar nossas simulações estão descritos na seção 3.4. 3.1 Modelo da Proteína A proteína que utilizamos foi o citocromo c de coração bovino, cuja es- trutura, estudada e obtida por métodos de cristalografia de raio-x, foi depositada e disponibilizada no PDB (Protein Data Bank [66]), sob o código "2B4Z" [29] (figura 1.6). O citocromo c de coração bovino possui 104 resíduos e um grupo prostético heme (seção 1.1.3), e a distribuição de seus resíduos carregados confere um ponto isoelétrico de aproximadamente 10,7 [28–30]. Tanto o potencial de interação não-eletrostática entre os resíduos, quanto a representação estrutural da proteína, foram descritos de acordo com o Modelo Baseado em Estrutura, descrito na seção 3.1.1, e o grupo heme teve seu modelo implementado conforme descrito na seção 3.1.2. Já o potencial eletrostático de interação entre os resíduos foi dado pelo potencial de Coulomb blindado, discutido na seção 3.2. Por fim, o potencial eletrostático de interação entre a proteína e o poro cilíndrico foi dado pela solução da equação linear de Poisson-Boltzmann, abordado na seção 3.3. 3.1.1 Modelo Baseado em Estrutura Os modelos que se baseiam na estrutura tridimensional da proteína enovelada como a estrutura geométrica de mínima energia, são conhecidos como modelos baseados em estrutura (SBM, do inglês "Structure Based Model") [39, 67–69]. Um dos modelos baseados em estrutura é o SBM-Cα, um modelo coarse- 3.1. Modelo da Proteína 33 Fonte: Elaborado pelo autor Figura 3.1: Representação visual da cadeia do citocromo c em nosso modelo CG SBM-Cα. Na imagem, a GLY-1 é o N-terminal e o Glu-104, o C-terminal. grained, no qual cada resíduo de aminoácido da cadeia é modelado como um único monômero esférico (figura 3.1), e a energia potencial U(Γ, Γ0) de interação entre eles, quando a proteína se encontra na conformação Γ(r, θ, ϕ, rij), é dada pela equação 3.1, sendo que a energia potencial1 mínima é aquela para a conformação nativa da proteína Γ0(r0, θ0, ϕ0, dij), em que os monômeros estão na posição do carbonon-α na estrutura nativa [39, 70]: Ures-res(Γ, Γ0) = ∑ ligações { ϵr (r − r0)2 } + ∑ ângulos { ϵθ (θ − θ0)2 } + + ∑ diedros ϵϕ { [1− cos(ϕ− ϕ0)] + 1 2 [1− cos(3ϕ− 3ϕ0)] } + + ∑ contatos ϵC 5 ( dij rij )12 − 6 ( dij rij )10 + ∑ não-contatos ϵNC ( σNC rij )12  . (3.1) O primeiro termo representa a soma das contribuições de energia das ligações covalentes entre dois resíduos adjacentes, modeladas por um potencial harmônico, sendo que r é a distância de ligação entre esses resíduos, como o par 1-2 da figura 3.2. O segundo termo é a soma das energias potenciais relacionadas aos ângulos formados por 3 resíduos adjacentes, também dado por um potencial harmônico, sendo 1Em geral, neste trabalho, utilizamos em equações "U" para energia potencial, e "V" para potencial elétrico. Para diferenciar interações eletrostáticas e não eletrostáticas, utilizamos a notação sobrescrita "ES" nos casos eletrostáticos. 3.1. Modelo da Proteína 34 Fonte: Adaptado do trabalho de Ponder et al [71]. Figura 3.2: Esquema das interações intramoleculares entre os monômeros da proteína. No diagrama, r é a distância entre dois monômeros ligados e θ e ϕ são ângulos formados por uma sequência de monômeros. que θ é o ângulo formado por esses 3 resíduos, conforme os monômeros 2-3-4 da figura 3.2. O terceiro termo é a soma dos potenciais de diedros (ou ângulos de torção da cadeia), sendo que ϕ é o ângulo de diedro da sequência 1-2-3-4 da figura 3.2. O quarto termo corresponde à energia de interação entre os resíduos i e j (i < j − 3), distantes entre si por rij, que fazem contato na estrutura nativa da proteína, de acordo com o mapa de contato CSU [72], sendo que dij é a distância entre esses resíduos na estrutura nativa. Modelos baseados em estrutura requerem um mapa de contatos da proteína, isto é, a informação de quais resíduos realizam contato na estrutura nativa e por meio de quais critérios são definidos esses contatos [73]. Existem mapas de contato que fazem uso de critérios simples, como uma distância de corte entre dois resíduos na estrutura nativa - se a distância entre os resíduos i e j for menor que a distância de corte, então eles fazem contato [74]. Outros mapas usam critérios mais elaborados, como é o caso do Contacts Structural Units (CSU), que leva em conta a sobreposição dos raios de Van der Waals entre dois resíduos [72, 75]. Os mapas de contatos são muito importantes na utilização do modelo SBM e têm sido amplamente estudados nas últimas décadas [74, 76, 77]. Neste trabalho, utilizamos o mapa de contato CSU. O potencial de contatos, representado pelo potencial Lennard-Jones 10-12, é o resultado das interações não-covalentes importantes para formar e manter a estrutura tridimensional da proteína, discutidas na seção 1.1.1. O último termo é o potencial de não-contatos, que representa uma interação repulsiva entre todos os resíduos que não realizam contato na estrutura nativa, sendo que σNC = 4 Å é o parâmetro que ajusta o alcance desse potencial repulsivo [35, 39]. Em nosso trabalho, os parâmetros ϵr = 100ϵc, ϵθ = 20ϵc, ϵϕ = ϵnc = ϵc são 3.1. Modelo da Proteína 35 Fonte: Elaborado pelo autor Figura 3.3: Representação do grupo heme. À esquerda, o heme, em vermelho, ligado ao citocromo c por meio de duas ligações covalentes com as cisteínas 14 e 17, em azul escuro. O átomo de ferro, em vermelho sólido, centrado no retângulo formado pelos 4 pseudoátomos que compõem o heme, em vermelho transparente. À direita, o heme com todos os átomos explícitos (compare com a figura 1.4). Destacados em vermelho, os 4 átomos de carbono escolhidos para serem as posições dos 4 pseudoátomos da figura à esquerda. Em ciano, os átomos de nitrogênio nos quais está ligado covalentemente o átomo de ferro, em rosa. definidos em função do parâmetro ϵc, regulados para melhor representarem as interações no sistema estudado [39, 71]. O ϵc determina a magnitude da energia de interação entre os resíduos que realizam contato no mapa de contatos, e está relacionado com a temperatura de transição (temperatura de melting) da proteína [35]. 3.1.2 O grupo heme Modelar o citocromo c exigiu um cuidado adicional com o grupo heme, uma vez que ele não é um aminoácido na cadeia principal, mas um grupo prostético que se liga em dois monômeros formando uma ramificação na cadeia. Como discutido na seção 1.1.3, o grupo heme realiza 2 ligações covalentes, nos resíduos 14 e 17, e 2 ligações não-covalentes no estado nativo da proteína, com os resíduos 18 e 80. Sob condições de desnaturação, o ferro do heme perde a ligação com o resíduo 80, mas a ligação com o resíduo 18 e as ligações covalentes permanecem. O ferro se liga covalentemente a 4 nitrogênios numa geometria planar quadrada, conforme figuras 1.4 e 3.3, e 2 ligações axiais com os resíduos 18 e 80 no estado nativo. 3.2. A Solução Iônica 36 Tendo em vista essas informações, modelamos a estrutura do grupo heme considerando 4 pseudoátomos, em vermelho transparente à esquerda da figura 3.3, que não interagem entre si, com suas posições centradas nas posições nativas dos átomos de carbono destacados em vermelho à direita da figura. Consideramos sua estrutura totalmente rígida, sem a capacidade de torsão nem vibração, ou seja, nunca nenhum dos 4 átomos se move em relação a eles mesmos. Dois desses átomos, os 2 vermelhos da parte inferior da imagem à direita, realizam ligação covalente com a proteína, então esses dois pseudoátomos interagem, um com o resíduo 14 outro com o 17, pelo potencial harmônico de ligações, o primeiro termo da equação 3.1. Os outros dois átomos, em vermelho na parte superior da imagem à direita, apenas formam a geometria planar do heme. A posição do átomo de ferro é determinada no modelo pelo centro geométrico dessa estrutura retangular, dada a simetria da estrutura do heme. O ferro também não interage com os 4 pseudoátomos do heme, mas interage com os resíduos 18 e 80 pelo potencial de contatos também do modelo SBM. Além disso, uma vez que o átomo de ferro está em estado ferroso, ele possui carga +2e, logo também atua nas interações eletrostáticas, tanto com os resíduos carregados da proteína (equação 3.2), quanto com a superfície carregada (equação 3.4). 3.2 A Solução Iônica O intuito do trabalho é estudar a adsorção do citocromo c em mesoporo de sílica, estando este sistema em solução aquosa e temperatura ambiente. Dessa forma, os íons da solução foram representados implicitamente através do potencial de Coulomb blindado UES res-res, com a restrição de volume excluído:  Ures-res(rij) =∞, rij ≤ b UES res-res(rij) = zizje 2 0 4πε0εs e−κrij rij , rij > b (3.2) sendo que i e j representam o par de resíduos carregados, b = 2 Å é o raio dos resíduos, z é sua valência, e0 = 1, 602×10−19 C é a carga elementar do elétron, ε0 é a permissividade elétrica do vácuo, εs = 78, 7 é a constante dielétrica do solvente (água), κ é o inverso do comprimento de Debye, dado pela equação A.10 do apêndice A e rij é a distância entre os resíduos i e j. O fator e−κrij engloba o efeito de blindagem dos íons, que se acumulam em regiões de carga oposta (figura 1.7) e atenuam a magnitude do potencial eletrostático [43]. Já a constante dielétrica εs representa a influência também atenuadora do solvente no potencial, dados os efeitos de polarização de meios dielétricos [43, 78, 79]. Para 3.3. A Superfície Carregada 37 Elaborado pelo autor. Figura 3.4: Esquema do modelo de poro confinante. rij ≤ b, o potencial assume valores muito altos de energia, então, para evitar isso, incluímos a repulsão de esfera rígida entre dois monômeros esféricos [43]. 3.3 A Superfície Carregada O poro de sílica foi modelado como uma superfície cilíndrica infinitamente longa com densidade superficial de carga σ e raio a (figura 3.4). Já a energia potencial eletrostática UES res-poro entre um resíduo carregado k da proteína e a superfície cilíndrica carregada é dada pela solução da equação de Poisson-Boltzmann linearizada: UES res-poro = zke0Vporo, (3.3) sendo que Vporo é dado pela equação A.51, cuja obtenção e cálculos estão detalhados no apêndice A. Assim:  Ures-poro(ri) =∞, ri ≥ a− b UES res-poro(rk) = zke0σK0(κa) ε0εsκ [I0(κa)K1(κa) + I1(κa)K0(κa)]I0(κrk), rk < a− b, (3.4) sendo que I e K são as funções de Bessel modificadas de primeiro e segundo tipo, respectivamente, e rk é a distância radial do resíduo carregado k até o centro do poro [35]. O índice i itera sobre todos os resíduos, não somente os carregados, e ri representa a distância radial entre um resíduo i e o centro do poro. Foi incluída uma repulsão de esfera rígida na condição ri ≥ a− b para que a proteína se mantenha confinada [43], sendo b o raio do resíduo. Cada valor de pH altera o estado de protonação dos resíduos tituláveis da proteína e também a densidade de carga da superfície cilíndrica, uma vez que estamos modelando um mesoporo de sílica SBA-15, cujos grupos silanol são tituláveis [16]. 3.4. O Programa 38 Tabela 3.1: Densidade superficial de carga σ em função do pH para sílica SBA-15 pH σ (C/m2) pH σ (C/m2) pH σ (C/m2) 3.0 -0.0005 7.0 -0.05 11.0 -0.21 3.5 -0.003 7.5 -0.065 11.5 -0.23 4.0 -0.0055 8.0 -0.08 12.0 -0.25 4.5 -0.0098 8.5 -0.105 12.5 -0.27 5.0 -0.014 9.0 -0.13 13.0 -0.29 5.5 -0.021 9.5 -0.15 13.5 -0.31 6.0 -0.028 10.0 -0.17 14.0 -0.33 6.5 -0.039 10.5 -0.19 Fonte: Dados experimentais de Brown et al [80]. Assim, a densidade superficial de carga σ do cilindro variou com o pH conforme tabela 3.1 [80]. 3.4 O Programa Finalmente, para realizar as simulações do citocromo c em solução eletro- lítica interagindo com uma superfície cilíndrica, utilizamos um programa escrito na linguagem Fortran [81], desenvolvido por Sidney J. de Carvalho e Daniel L. Z. Caetano e recentemente utilizado por eles para um estudo de adsorção da proteína lisozima [35]. O programa emprega o método de simulação de Monte Carlo a pH constante com critério de Metropolis [35, 67, 82, 83], realizando diferentes movimentos para amostragem dos estados conformacionais da proteína e sua posição e orientação em relação à superfície No entanto, o programa foi modificado pelo discente para este trabalho, de modo a implementar no modelo coarse-grained polimérico SBM da proteína o grupo prostético heme do citocromo c (seção 3.1.2). 3.4.1 O Método de Monte Carlo O método de Monte Carlo foi desenvolvido por von Neumann, Ulam e Metropolis, ao fim da Segunda Guerra Mundial, durante o Projeto Manhattan, para se estudar a difusão de nêutrons em material fissionável [84–87]. Devido ao extenso uso de números aleatórios, o nome Monte Carlo foi cunhado por Nicholas Metropolis em homenagem ao famoso e homônimo cassino localizado em Mônaco [86, 87]. O termo método de Monte Carlo sumariza uma variedade de métodos que se baseiam na amostragem de números aleatórios para se obter uma solução, amplamente 3.4. O Programa 39 utilizados em problemas de física estatística. Por vezes, métodos determinísticos possuem um custo computacional mais elevado ou são incapazes de amostrar estados muito distantes do equilíbrio. Nestes casos, o método estocástico de Monte Carlo surge como uma boa alternativa [85, 88]. De modo geral, a ideia do método de Monte Carlo é gerar uma trajetória no espaço de configurações de um ensemble [85], a fim de se obter informações sobre um dado sistema [88], embora também existam métodos de Monte Carlo para cálculos de dinâmica [86]. O método é muitas vezes combinado com um critério de aceitação- rejeição para a amostragem aleatória, especialmente em sistemas físicos nos quais existem diferentes probabilidades para determinados estados, ou seja, uma função densidade de probabilidade. O critério mais comum e mais usado é o algoritmo de Metropolis [88], discutido na seção a seguir. 3.4.2 O algoritmo de Metropolis Embora não haja uma forma única de construir um algoritmo de Monte Carlo, a metodologia mais comum é o esquema de Metropolis da cadeia de Markov [89], no qual a distribuição de estados é limitada por um critério de probabilidade, isto é, a amostragem de estados é feita passando do estado A para o estado B, respeitando a estatística de Boltzmann: PA→B = e−β∆U, (3.5) sendo que PA→B é a probabilidade do sistema evoluir do estado A ao estado B, β = 1/kBT é o inverso da energia térmica do sistema e ∆U = UB − UA é a variação de energia quando o sistema evolui do estado A ao B [89]. Dessa forma, num ensemble termodinâmico onde a temperatura T é constante, estados mais prováveis são estados nos quais UB < UA. Baseando-se nisso, o algoritmo de Metropolis [85, 86, 88] define um critério de aceitação-rejeição para as configurações da seguinte forma: As equações 3.1, 3.2 e 3.4 somadas formam a energia potencial do sistema, e cada perturbação nas variáveis dessas funções resulta num estado diferente. Quando ocorre um movimento aleatório na proteína, por exemplo, o método de Monte Carlo está amostrando um estado aleatório diferente, e o critério de Metropolis decide se essa nova configuração é aceita ou não, respeitando a probabilidade de cada estado. Os tipos de movimentos aleatórios que exploram o espaço configuracional estão descritos na seção a seguir. 3.4. O Programa 40 Algoritmo de Metropolis for i = 1, 2, . . . , N do Calcula UA Perturba o sistema Calcula UB Sorteia número aleatório n ∈ [0, 1] if n ≤ exp[−β(UB − UA)] then A← B ▷ i.e. Aceita o estado B else Rejeita o estado B end if end for 3.4.3 Amostragem de Estados Ao todo, nosso programa realiza 5 tipos de movimentos aleatórios na proteína, a fim de explorar o espaço configuracional [35, 90]: 1. Translação de um resíduo: um resíduo da proteína é escolhido aleatoriamente para ser deslocado a uma distância aleatória em relação a suas coordenadas. 2. Translação da proteína: toda a proteína é deslocada a uma distância aleatória. 3. Rotação da proteína: é escolhido um eixo (x, y ou z) aleatoriamente para rotacionar a proteína, em torno desse eixo, por um deslocamento angular aleatório. 4. Rotação de pivô: um resíduo aleatório da proteína é escolhido, de modo que o trecho menor da proteína, a partir desse resíduo, sofre uma rotação em torno de um dos 3 eixos também aleatoriamente escolhido por um deslocamento angular aleatório 5. Rotação de crank-shaft: dois resíduos são escolhidos aleatoriamente, de modo que o intervalo de cadeia compreendido entre eles sofre uma rotação, por um deslocamento angular aleatório, em torno do eixo que passa pelos dois resíduos escolhidos. Além de movimentos na cadeia, a variação dos estados de protonação dos resíduos ionizáveis também foi realizada utilizando o critério de Metropolis. A variação de energia deste processo é escrita em função dos valores de pKa desses resíduos e do pH do meio (seção 1.1.2), conforme equação 3.6 [31, 35, 91, 92]. ∆U = ∆UES ± χ [ kBT (pH − pK0 a)ln(10) ] , (3.6) 3.5. Detalhes Computacionais 41 sendo que ∆UES é a variação de energia eletrostática (equações 3.2 e 3.4) quando o resíduo protona ou desprotona, pK0 a é o valor do pKa do resíduo quando está livre na solução (tabela 1.1), χ = 1 se o resíduo é básico e χ = −1 se o resíduo é ácido. O sinal ± na equação 3.6 é positivo na protonação e negativo na desprotonação. O segundo termo da equação é a diferença de energia livre entre os estados protonado e desprotonado, discutida na seção 1.2. Essa abordagem considera que as variações no grau de protonação dos resíduos ionizáveis ocorrem também devido a interações eletrostáticas, e é bastante utilizada em simulações de biossistemas a pH constante [35, 67, 82, 83]. A cada passo de Monte Carlo um dos 5 movimentos é escolhido aleatoriamente e, em 30% dos passos, escolhe-se um resíduo ionizável aleatório da proteína para alterar seu estado de protonação [35], conforme critério de Metropolis com a variação de energia dada pela equação 3.6. Por fim, ressaltamos a importância da determinação do parâmetro de deslo- camento máximo δmax nos movimentos citados acima. O parâmetro δmax diz respeito ao deslocamento máximo que pode ocorrer nos movimentos de monômero e translação, e ao deslocamento angular máximo nos movimentos de rotação, pivô e crank-shaft. O valor de δmax precisa ser regulado, porque um valor muito pequeno implicaria num índice de aceitação do critério de Metropolis muito alto, isto é, os novos estados seriam aceitos com muita frequência, por se tratar de configurações vizinhas com energias muito próximas, o que não permite explorar o espaço de configurações adequadamente. Por outro lado, um valor de δmax muito alto resultaria numa aceitação muito baixa, o que, novamente, explora muito pouco o espaço de configurações do sistema [85]. Dessa forma, os valores de δmax de cada movimento foram regulados durante as simulações, de modo que a frequência de aceitação ficasse o mais próximo possível de 50%. 3.5 Detalhes Computacionais As simulações foram realizadas em 3 etapas principais: (1) Determinação de δmax, (2) Equilibração da energia e (3) Produção. Na primeira etapa (1), foram realizadas simulações curtas (104 passos e 200 configurações independentes2) a fim de regular o parâmetro δmax (seção 3.4.3), de modo 2Esse número de configurações independentes, ou configurações descorrelacionadas, diz respeito à quantidade de movimentos de Monte Carlo explorados entre um passo e outro que são considerados para os cálculos das propriedades estatísticas. Isso é feito para que os passos utilizados para o cálculo das médias se tornem menos dependentes uns dos outros (no nosso caso, 200 configurações vizinhas entre uma amostra e outra). 3.5. Detalhes Computacionais 42 que as aceitações dos movimentos se aproximassem o máximo possível de 50%. Para isso, os valores de δmax de translação começaram sendo iguais ao raio do cilindro, e depois foram refinados para atingir aceitação ideal. O δmax da translação de um resíduo manteve-se constante e igual a 0, 12 Å, durante todas as simulações, o que garantiu aceitação ideal. Para os movimentos de crank-shaft e pivô, δmax = 5◦ foi o valor que mais aproximava as aceitações de 50%. Por fim, a rotação se iniciou em δmax = 120◦ e foi refinada até um valor mínimo de 30◦. Na etapa (2), verificamos a equilibração do sistema, analisando as curvas de energia total do sistema e, novamente, as aceitações. Se a energia não estivesse oscilando em torno de um valor de equilíbrio, então simulações um pouco maiores (106 passos e 200 configurações independentes) seriam realizadas, de modo que o sistema atingisse o equilíbrio. Por fim, na etapa (3), com o sistema em equilíbrio, foi executada a produção (4× 106 passos e 500 configurações independentes), a partir da qual toda a estatística e médias foram obtidas (seção 4). 3.5.1 Determinação do parâmetro ϵc A temperatura de melting Tm de uma proteína pode ser definida como a temperatura de transição dos estados enovelado-desenovelado (também chamada de temperatura de folding, ou de enovelamento), isto é, a temperatura na qual a probabilidade de a proteína estar enovelada ou desenovelada é a mesma [93, 94]. Essa temperatura é característica de cada proteína e é importante para modelar o parâmetro ϵc do potencial de contatos do modelo baseado em estrutura (equação 3.1) [35]. De acordo com a literatura [95], Tm = 76 ◦C = 349, 15 K para o citocromo c de coração bovino. Dessa forma, realizamos os seguintes passos, com a proteína livre em solução: 1. Fixamos a temperatura definida como a Tm experimental e realizamos algumas simulações variando ϵc. 2. Plotamos uma curva de fração de contatos nativos Q em função do valor de ϵc (à esquerda da figura 3.5). 3. Encontramos o valor ϵc = 0, 67 kcal/mol, onde Q ≈ 0, 5. 4. Fixamos o valor de ϵc encontrado e realizamos simulações variando as temperaturas em torno da Tm experimental. 5. Plotamos a curva do calor específico (à direita da figura 3.5). 3.5. Detalhes Computacionais 43 Fonte: Elaborado pelo autor. Figura 3.5: À esquerda, a fração de contatos nativos do citocromo c em função da constante ϵC , à temperatura T = 349, 15 K. Modelando uma sigmoide na curva, obtemos ϵC ≈ 0, 668 kcal/mol para metade dos contatos nativos, portanto usamos ϵC = 0, 67 kcal/mol em nossas simulações. À direita, o calor específico a volume constante CV do citocromo c com o ϵC determinado. O pico da curva de CV representa a temperatura de transição da proteína (pelo gráfico, T ≈ 349K). Para a obtenção da curva do calor específico CV = ( ⟨E2⟩ − ⟨E⟩2 ) /kBT , utilizamos o método dos múltiplos histogramas, WHAM (Weighted Histogram Analysis Method), um algoritmo que calcula as densidades de estados do sistema a uma dada temperatura, por meio de histogramas de energias gerados em simulações com diferentes temperaturas [96, 97]. As simulações em diferentes temperaturas permitem que estados com energias mais altas sejam amostrados. O pico da curva do calor específico em função da temperatura indica a temperatura de transição (que estamos considerando como a temperatura de melting da literatura) [82]. Assim, a constante ϵc do potencial de contatos SBM foi determinada de modo que a temperatura de transição da proteína, de acordo com a nossa consideração, seja igual à Tm [35], uma vez que é o potencial de contatos quem mantém uma interação atrativa entre os pares de resíduos presentes no mapa de contatos, e portanto estabiliza sua estrutura enovelada. Após estimarmos o ϵc, fixamos seu valor no potencial e produzimos 20 simulações, variando a temperatura de 260 K a 420 K, de 10 em 10 K. Isso foi feito para que houvesse uma estatística robusta para o cálculo das médias feito pelo WHAM, que fornece a curva do calor específico (à direita da figura 3.5). Pelo gráfico, a temperatura de transição é T = 349 K≈ Tm, conforme esperado. 3.5. Detalhes Computacionais 44 3.5.2 Simulações e Análises Depois que o parâmetro ϵc foi estabelecido, realizamos, então, as produções para as análises principais da adsorção do citocromo c, agora com a presença do potencial de interação do poro com a proteína, com e sem o mecanismo de regulação de carga. À temperatura ambiente de T = 298 K, variamos o pH (de 3 a 12,5) e o raio de confinamento (40 Å, 80 Å, 120 Å, 160 Å), em salinidades de 1 mM e 10 mM. A densidade superficial de carga σ do cilindro variou com o pH conforme tabela 3.1. A carga líquida média da proteína foi obtida a partir das médias da carga líquida da proteína, em cada pH, raio de confinamento e salinidade. Em seguida, analisamos a energia de interação proteína-poro, definida pelas médias da energia eletrostática da interação da proteína com a superfície nas mes- mas condições. Essa energia fornece informações do que seria, aproximadamente, a contribuição entálpica para a energia livre de ligação [37, 65]. Em todas as simulações, a proteína começou no centro da cavidade cilíndrica, em seu estado nativo. Os resíduos tituláveis começaram carregados (+1e ou -1e). Nas simulações sem regulação de carga, a probabilidade de protonação dos resíduos da proteína foi definida como zero (e não 30%, como descrito na seção 3.4.3), e as cargas dos resíduos tituláveis da proteína ficaram fixas durante as simulações, recebendo os valores das cargas médias obtidas nas simulações com a proteína livre. Isso foi feito porque o caso da proteína livre remove o efeito da regulação de carga causado pela superfície carregada, mas preserva o efeito do pH na probabilidade de protonação dos resíduos. 3.5.3 Projeção da Densidade Superficial de Carga Anže L. Božič e Rudolf Podgornik publicaram, em 2018, um trabalho teórico sobre o mecanismo da regulação de carga [98]. Nesse trabalho é desenvolvido um modelo para projetar a densidade superficial de carga ϱ em pontos (θ, ϕ) sobre a superfície de uma esfera de raio R que compreende um conjunto de N cargas pontuais qk. Essa densidade de carga é dada por ϱ(θ, ϕ) = 1 4πR2 N∑ k=1 q± k λk senh(λk) exp [λk cos (γk)], (3.7) sendo λk o parâmetro de concentração da k-ésima carga (se λk → 0, a distribuição se torna uniforme sobre a superfície, enquanto que λk →∞ fornece uma distribuição de 3.5. Detalhes Computacionais 45 cargas pontuais) e cos γk = cos (θk) cos (θ) + sen(θk) sen(θ) cos (ϕk − ϕ) (3.8) é a menor distância (comprimento de arco) sobre a superfície que une os pontos (θ, ϕ) e (θk, ϕk) [98, 99]. Relacionando essa abordagem com nosso trabalho, com o intuito de mapear a distribuição de cargas do citocromo c, consideramos as cargas qk como as cargas médias dos resíduos ionizáveis da proteína (valores entre -1 e 1, em unidades de carga elementar) e suas respectivas posições (rk, θk, ϕk), cuja origem é o centro de massa da proteína. Definimos R = r do resíduo mais distante da origem. Para o cálculo da equação 3.7, considerando 104 pontos (θ, ϕ), desenvolvemos um programa em Fortran, cujos parâmetros de entrada são as posições e cargas dos resíduos da proteína, e o parâmetro de saída é a densidade superficial de carga ϱ(θ, ϕ) da esfera que envolve a proteína. Para analisar toda a distribuição tridimensional de ϱ(θ, ϕ) num plano 2D, desenvolvemos um programa em Python que recebe como parâmetro de entrada os valores de ϱ de todos os pontos (θ, ϕ) calculados e gera uma projeção Mollweide [98, 100]. 4 Resultados e Discussão 4.1 Carga Líquida e ponto Isoelétrico Avaliamos o efeito do pH e da regulação de carga na carga líquida do citocromo c, conforme figura 4.1. Pode ser notado pela figura 4.1-A que o pI da proteína sofre um aumento com o aumento do raio, embora a diferença seja muito pequena - pI ≈ 10, 5 pro caso livre e pI ≈ 10, 7 pro raio de confinamento de 160 Å. Para concentração de sal de 10 mM, (figura 4.1-B), o comportamento é o mesmo, exceto para raio de 160 Å, no qual o pI assume um valor próximo de 11,0. Considerando que o desvio dos valores de carga é da ordem de 1e, pode-se assumir que essa variação no pI é desprezível. Esse aumento do pI com o aumento do raio de confinamento, embora pouco perceptível, está diretamente relacionado com o efeito da regulação de carga. Quando a proteína está sob influência do potencial elétrico da superfície, a energia ∆U da equação 3.6 também sofre uma variação, porque o termo ∆UES agora contabiliza a contribuição da interação eletrostática resíduo-superfície. Quanto mais forte essa interação, menor é ∆UES e consequentemente ∆U. Este último está diretamente relacionado com a probabilidade de protonação dos resíduos ionizáveis da proteína via critério de Metropolis (seção 3.4.2). Dessa forma, a tendência é que a protonação dos resíduos se torne mais provável à medida que a energia de interação com a superfície se torna mais negativa. Como veremos na seção 4.2, a energia potencial eletrostática proteína-poro de fato aumenta com o aumento do raio. Logo, para compensar esse aumento de ∆UES, o termo à direita da equação 3.6 precisa aumentar também - e ele aumenta se a diferença pH − pKa aumentar. Assim, para que a proteína desprotone seus resíduos até a neutralidade elétrica, é necessário um pH cada vez maior à medida que a força proteína- poro aumenta. Isso configura um aumento do ponto isoelétrico. Evidentemente, essa é a interpretação com base na equação 3.6, que descreve a protonação dinâmica dos resíduos carregados e, portanto, a regulação de carga em nosso modelo. Do ponto de vista experimental, quanto maior o campo elétrico da superfície, maior a concentração de contraíons em suas proximidades, os quais não são descritos 4.1. Carga Líquida e ponto Isoelétrico 47 Fonte: Elaborado pelo autor Figura 4.1: Carga líquida do citocromo c em função do pH, em salinidades de 1 mM (A), em azul, e 10 mM (B), em vermelho. Os círculos preenchidos representam as simulações com regulação de carga, enquanto os círculos vazios representam as simulações com a proteína livre em solução. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de carga, em unidades da carga elementar e, é da ordem do tamanho dos círculos no gráfico. explicitamente em nosso modelo. Como a superfície tem carga negativa, os contraíons são positivos. Com isso, conforme se aproxima da superfície, a proteína entra num microambiente de maior concentração de íons positivos, o que aumenta a probabilidade de protonação dos seus resíduos. Esse microambiente pode ser interpretado como uma região de menor pH do valor no bulk. Isso implica que, para que os resíduos básicos da proteína percam seus prótons até que a carga líquida da proteína se torne nula, é necessário um pH cada vez maior, o que, por sua vez, configura um aumento do pI da proteína. Isso pode ser visto avaliando a equação 1.9. Conforme a interação elétrica proteína-poro aumenta, o logaritmo à direita da equação sofre uma variação que precisa ser compensada pela diferença pH− pKa para que a carga média da proteína não sofra alterações. Sem a presença da superfície, a concentração de íons positivos na solução depende exclusivamente do pH no bulk, de forma que o pI da proteína é menor. Pela figura 4.1, pI = 10, 5 do citocromo c livre é apenas levemente menor que o valor experimental de 10,7 [28–30]. De maneira geral, podemos assumir que o efeito observado da concentração de sal, implícito no κ de Debye (equação A.10), na carga líquida da proteína foi muito pequeno. Pode ser observado que a diferença máxima de carga líquida entre o confinamento em raio 160 Å, que foi o caso em que a proteína assume maior carga, e o caso livre ocorre em pH ≈ 9, 5, para 1 mM, e pH ≈ 10, 0, em 10 mM. Os raios de confinamento menores, devido à maior blindagem eletrostática em sal 10 mM, promovem 4.2. Energia Potencial de Ligação 48 menor protonação do que o raio maior, e as curvas, nessa salinidade, se aproximam mais do caso livre. Outra observação que pode ser feita é referente à intersecção entre a curva da proteína livre e as curvas da proteína confinada, que ocorre próximo do pI do citocromo c. Até o ponto isoelétrico, a proteína confinada apresenta maior protonação do que no caso livre, em ambas as salinidades. Porém, para valores de pH acima do pI, o comportamento se inverte - o confinamento, e portanto a regulação de carga, confere à proteína uma carga líquida mais negativa do que o caso livre. Era esperado, de acordo com a tendência observada entre os pHs 3 e 11, que a carga líquida da proteína confinada fosse, no mínimo, num caso em que a proteína ficasse no meio do poro, e portanto dessorvida, igual à da proteína livre, e não mais negativa. O confinamento leva a proteína a uma carga mais negativa, apesar da observada tendência do confinamento de aumentar a protonação dos resíduos ionizáveis. Entendendo como a carga da proteína varia com o pH, vamos analisar a energia eletrostática proteína-poro em função do pH. 4.2 Energia Potencial de Ligação Plotamos as curvas de energia potencial eletrostática de interação entre a superfície carregada do poro e a proteína, dada pela equação 3.4, em unidades de kBT , em função do pH, na figura 4.2, em salinidades de 1 mM, em azul, e 10 mM, em vermelho. Em pH 3, todas as curvas da figura 4.2-A apresentam aproximadamente a mesma energia de potencial, uma vez que esse pH é próximo do ponto de carga nula da superfície (tabela 3.1), o que reduz o módulo da energia de interação dela com a proteína. Na figura 4.2-B, em maior salinidade, o mesmo ocorre, mas a energia é ainda mais próxima de zero, dada a maior blindagem causada pela concentração de sal de 10 mM. Conforme o pH aumenta, a carga da superfície se torna mais negativa e a interação proteína-poro se intensifica. É possível notar que a energia de ligação é mais negativa com o aumento do raio do cilindro, isto é, quanto maior o raio de confinamento, mais forte é a atração eletrostática proteína-poro. Isso ocorre porque o potencial atrativo do poro se torna maior com o aumento do raio do poro a nesse intervalo, conforme dependência com as funções de Bessel da equação 3.4. Isso explica o efeito da regulação de carga ser maior em raios maiores, conforme discutido na seção 4.1. Experimentalmente, é observado que poros de sílica SBA-15 com diâmetros maiores apresentam uma maior capacidade de adsorção do citocromo c [14], o que pode estar 4.2. Energia Potencial de Ligação 49 Fonte: Elaborado pelo autor. Figura 4.2: Energia média de interação eletrostática proteína-poro, em concentrações de sal de 1 mM (A), em azul, e 10 mM (B), em vermelho. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de energia é da ordem de 3 kBT . relacionado com essa maior força de interação eletrostática proteína-superfície em raios maiores, observada em nossos resultados. Para valores de pH próximos de 9, a energia de ligação começa a aumentar, novamente à exceção do raio de 40 Å, no qual a energia começa a aumentar a partir do pH 4,5. A energia então se torna aproximadamente zero a partir do pH 11,5, nas duas salinidades. Até o pH 11,5, ainda existe uma energia potencial de ligação negativa entre a proteína e o poro. Porém, o pI do citocromo c, obtido pela figura 4.1, é menor do que 11, em concentração salina de 1 mM. Portanto, mesmo a proteína e a superfície possuindo ambas cargas negativas, ainda existe uma energia de interação negativa e, portanto, atrativa entre elas. Se a adsorção dependesse exclusivamente da carga líquida total da proteína, essa atração não ocorreria, porque a proteína e a superfície se repeliriam. Isso quer dizer que os termos de multipolo que contribuem para a interação proteína-poro são relevantes para a ocorrência da adsorção. Como será visto na seção 4.4, a distribuição de resíduos carregados formam patches de carga na superfície da proteína, importantes para que ocorra adsorção, mesmo em pH > pI. Isso também indica que a proteína deve possuir uma orientação preferencial para a ocorrência da adsorção, o que analisaremos na seção 4.3. A figura 4.3 apresenta o efeito da regulação de carga na energia eletrostática proteína-poro. As curvas com círculos vazios representam as simulações nas quais a regulação de carga não foi implementada, ou seja, as cargas dos resíduos ionizáveis, definidas na discussão da seção 3.5.2, se mantiveram fixas durante a produção. O efeito do sal, comparando os gráficos A e B, tanto da figura 4.3, quanto da 4.2, é o de blindar a 4.2. Energia Potencial de Ligação 50 Fonte: Elaborado pelo autor. Figura 4.3: Comparação entre as energias médias de interação eletrostática proteína-poro com (círculos preenchidos) e sem (círculos vazios) o efeito da regulação de cargas, em concentrações de sal de 1 mM (A), em azul, e 10 mM (B), em vermelho. As tonalidades mais claras de cada cor simbolizam os raios de confinamento menores, e as tonalidades mais escuras são os raios maiores, conforme legenda. O desvio dos valores de energia é da ordem de 3 kBT interação eletrostática, ou seja, reduzir o módulo da energia em todas as curvas, embora o comportamento e o intervalo de pH no qual ocorrem os mínimos de energia sejam os mesmos em ambas as salinidades. A principal observação a ser feita da figura 4.3 é a comparação da energia eletrostática proteína-poro entre os casos com e sem regulação de carga. Em ambas as salinidades, a conclusão é a mesma: a regulação de carga promove uma energia eletrostática proteína-poro menor, uma vez que a carga líquida da proteína, até pH = pI, é mais positiva quando está confinada, do que quando está livre, conforme figura 4.1. Também podemos entender isso, a partir da equação 1.22. A variância ou, como apresentamos na seção 1.2, a capacitância C = ⟨Z2⟩ − ⟨Z⟩2 da proteína leva em conta as flutuações de carga. Considerando que a interação descrita na equação 1.22 é compreendida entre a proteína e o poro, e que a superfície do poro também mantém suas cargas fixas em todas as simulações, Cporo = 0 e nossa energia de interação se torna: βG(R) ≈ lB ⟨Zprot⟩ ⟨Zporo⟩ R − ⟨Zporo⟩2 Cprot. (4.1) Note que o segundo termo envolve a flutuação de cargas da proteína, caracterizada por Cprot, e representa, assim, a contribuição da regulação de carga para a energia de interação. Essa contribuição é negativa e, portanto, a regulação de carga diminui a energia de interação, como visto na figura 4.3. Quando as cargas da proteína se mantém fixas, Cprot = 0 e a energia é simplesmente a interação de Coulomb direta, representada pelo primeiro termo da equação 4.1. 4.3. Distribuição dos Resíduos 51 Finalmente, podemos avaliar os valores mínimos de energia potencial eletros- tática para cada caso. Para o raio de confinamento de 160 Å, em ambas as salinidades, a energia assume seu valor mínimo entre os pHs 8 e 9, no caso com regulação de carga, e entre 6 e 7 pro caso da proteína com cargas fixas. Ou seja, a regulação de carga desloca o mínimo da energia para um pH maior, no qual a proteína é mais suscetível a flutuações de carga. Isso significa que pode ocorrer uma adsorção mais estável nesses intervalos de pH, e essa estabilidade diminui à medida que o pH se aproxima de 12. Para investigar essa questão, nas seções a seguir, analisamos a orientação da proteína durante a adsorção, bem como a distribuição de seus resíduos carregados. 4.3 Distribuição dos Resíduos Analisamos, para os valores de pH 8, 9 e 10, a densidade de probabilidade espacial de alguns resíduos carregados em relação ao centro do poro durante as simulações. Identificamos os 5 resíduos mais próximos da superfície para esse intervalo de pH, nos casos com e sem regulação. Isso foi feito para entender a orientação da proteína durante a adsorção e quais resíduos podem ser importantes para estabilizar essa orientação. Escolhemos as condições de salinidade de 1 mM e raio 160 Å, nos baseando no gráfico 4.3, onde é vista uma diferença mais evidente de comportamento entre os casos com e sem a regulação de cargas. Isso quer dizer que um pico de distribuição concentrado próximo de 160 Å indica uma alta probabilidade do resíduo se encontrar a uma distância de 160 Å do centro do poro, isto é, em contato com a superfície. Dos 5 resíduos mais próximos da superfície identificados, 3 lisinas são co- muns em todos os casos analisados: Lys-72, Lys-73 e Lys-86. Suas distribuições de probabilidade em função da distância ao centro do poro, para os pHs 8, 9 e 10, estão dispostas na figura 4.4. Em pH 8, é possível perceber que a proteína parece adsorvida nos dois casos, com e sem regulação de carga, uma vez que para distâncias ao centro do poro abaixo de 120 Å, os valores das distribuições vão a zero. As lisinas 72 e 73 mostram um pico maior de adsorção próximo à superfície, enquanto a Lys-86 mostra um segundo pico, menor, a uma distância de aproximadamente 132 Å do centro do poro, ou a 28 Å da superfície, o que sugere uma segunda orientação de menor probabilidade. Esse comportamento é observado nos dois casos, em pHs 9 e 10 também. O que fica mais claro nos pHs 9 e 10 é o efeito da regulação de carga em promover uma orientação mais estável, durante a adsorção, do que o caso sem regulação. Veja que em pH 9, no gráfico à esquerda, os picos de probabilidade das lisinas são muito maiores do que no caso sem regulação. Isso indica que, nesse pH, existe uma 4.3. Distribuição dos Resíduos 52 Fonte: Elaborado pelo autor. Figura 4.4: Distribuição da densidade de probabilidade dos resíduos mais próximos da superfície, em raio de confinamento de 160 Å, salinidade de 1 mM e valores de pH 8, 9 e 10. As linhas sólidas representam as simulações com regulação de carga, enquanto as linhas tracejadas indicam as simulações mantendo a proteína com suas cargas fixas. orientação mais estável durante a adsorção, isto é, a regulação de carga promove maior direcionalidade na adsorção do citocromo c. Note, comparando a escala dos três gráficos à esquerda, que os picos assumem valores maiores em pH 9 do que nos pHs 8 e 10. Isso mostra que a orientação, em que 4.3. Distribuição dos Resíduos 53 as 3 lisinas analisadas ficam em contato com a superfície durante a adsorção, é mais estável em pH 9 do que nos outros pHs. Em pH 10 a proteína se mantém adsorvida no caso com regulação, consi- derando que as curvas de distribuição apresentam picos próximos da superfície e vão a zero a 120 Å do centro do poro. No entanto, no caso com as cargas fixas, as curvas de distribuição se estendem até o centro do poro e não apresentam picos próximos da superfície, ou seja, dessorve sem a regulação. Olhando para a figura 4.3-A, a energia, em pH 10 e raio 160 Å, pro caso de cargas fixas é próxima de zero, enquanto a energia do caso com regulação de carga é da ordem de −15 kBT . Logo, faz sentido que não ocorra adsorção no caso sem regulação de carga. Também pode ser observado que as lisinas possuem dois picos de probabi- lidade, um maior, próximo à superfície, outro mais distante. Para a Lys-86, o pico maior ocorre aproximadamente a 2 Å da superfície, e o menor a 28 Å. Isso indica, considerando que o raio de giro do citocromo c Rg ≈ 13 Å, que a proteína possui, nesse pH, uma orientação mais provável, na qual a Lys-86 fica próxima à superfície, e outra, menos provável, em que a Lys-86 fica do outro lado da proteína. Essa orientação menos provável evidencia que deve haver outros resíduos orientados próximos à superfície que promovem uma orientação adsorvida quando a Lys-86 está distante. Investigando distribuições de resíduos que possuem dois picos, um maior mais distante da superfície e outro menor próximo da superfície, identificamos dois resíduos: a Arg-38 e a Lys-39. Plotamos as distribuições, em pH 10, na figura 4.5. Note que a Lys-39 e a Arg-38 assumem um pico a 3 Å da superfície, o que sugere que esses dois resíduos podem ser importantes para promover uma segunda orientação na adsorção da proteína, o que verificaremos na próxima seção. Quando as cargas se mantêm fixas, o citocromo c perde direcionalidade na adsorção e dessorve, conforme gráfico à direita da figura 4.5. Essas duas orientações também ocorrem para os pHs 8 e 9, como pode ser deduzido pelo pequeno pico da curva de distribuição da Lys-86 na figura 4.4, mas a orientação menos provável é mais discreta e menos estável que em pH 10. Veremos, na próxima seção, a densidade superficial de cargas da proteína, a fim de entender melhor como a regulação de carga afeta os patches de carga, formados pelos resíduos ionizáveis analisados acima, de forma a favorecer a direcionalidade da proteína durante a adsorção. 4.4. Projeção da Densidade Superficial de Carga 54 Fonte: Elaborado pelo autor. Figura 4.5: Distribuição da densidade de probabilidade de resíduos que promovem duas orientações de adsorção, em raio de confinamento de 160 Å, salinidade de 1 mM e pH 10. As linhas sólidas representam as simulações com regulação de carga, enquanto as linhas tracejadas indicam as simulações mantendo a proteína com suas cargas fixas. 4.4 Projeção da Densidade Superficial de Carga Inicialmente, definimos as posições de alguns resíduos de interesse no mapa Mollweide do citocromo c, conforme figura 4.6. Note que as lisinas 72, 73 e 86, que vimos serem 3 dos resíduos mais próximos da superfície na orientação mais provável de adsorção, representadas por um símbolo de cruz na figura, formam dois patches de carga: a Lys-72 e Lys-73, em branco, formam um, um pouco abaixo do centro da projeção, e a Lys-86, em vermelho claro, forma outro, mais à direita inferior. Os dois resíduos Arg-38 e Lys-39, que discutimos na figura 4.5, representados por círculos em azul claro, também formam uma região carregada positivamente, à centro-esquerda da figura. A escala de cor do gráfico foi definida com valor máximo, em vermelho escuro, para o maior valor da densidade de carga de todos os casos analisados, e o valor mínimo, em azul escuro, para o menor de densidade. O átomo de ferro, que possui carga +2e, forma mais uma região carregada positivamente. Em seguida, a fim de comparar com os resultados da figura 4.4, plotamos as densidades de carga para os pHs 8, 9 e 10, com e sem regulação de carga, na tabela 4.1. Pode-se ver, comparando as figuras à esquerda, que representam os casos com regulação de carga, com as à direita, nas quais a proteína manteve suas cargas fixas, que a regulação promove um aumento da protonação das regiões postivas, bem como uma maior desprotonação nas regiões negativas. No entanto, como entendido pela figura 4.1, nesses valores de pH, a carga líquida da proteína confinada é sempre mais positiva que a proteína livre. Isso quer dizer que, embora as regiões com densidade de carga 4.4. Projeção da Densidade Superficial de Carga 55 Fonte: Elaborado pelo autor. Figura 4.6: Projeção Mollweide da densidade superficial de carga do citocromo c, em raio de confinamento de 160 Å, salinidade 1 mM e pH 8, com regulação de carga. Os círculos em azul claro representam a Arg-38 e a Lys-39, as cruzes brancas as lisinas 72 e 73, a cruz em vermelho claro a Lys-86 e o losango branco o átomo de ferro. Tabela 4.1: Densidade superficial de cargas do citocromo c em raio de 160 Å. pH Regulação de Carga Cargas Fixas 8 9 10 Fonte: Elaborado pelo autor. 4.4. Projeção da Densidade Superficial de Carga 56 negativa se tornem ainda mais negativas com a regulação de carga, a protonação dos patches positivos supera essa diminuição, o que garante a carga líquida positiva. Como consequência dessa diferença no estado de protonação, as curvas analisadas na figura 4.3 revelam uma energia mais negativa para o caso com regulação de carga, nesse intervalo de pH. Em pH 8, comparando com a figura 4.4, em que as distribuições de probabi- lidade das lisinas 72, 73 e 86 assumem picos um pouco maiores no caso com regulação, vemos pela tabela 4.1 que a projeção da densidade de carga com regulação mostra que os patches de carga formados por esses resíduos estão mais positivos do que no caso sem regulação, o que é coerente com a densidade de cargas observada em pH 8. Já em pH 9, observamos na seção anterior que a proteína, com regulação de carga, apresenta uma orientação mais estável, com pico de probabilidade aproximada- mente duas vezes maior do que em outros pHs. Vemos pe