UNIVERSIDADE ESTADUAL PAULISTA 
MESTRADO EM CIÊNCIA E TECNOLOGIA DE MATERIAIS 

CAMPUS DE BAURU 

“DOCKING E ANÁLISE DO MODO DE LIGAÇÃO DE
TRÊS  MOLÉCULAS PEQUENAS,

UM BENZIMIDAZOL E DOIS COMPOSTOS DE CRÔMIO,
NOS SULCOS DO DNA 5'-CGCGAATTCGCG-3' ”

ESTHER CAMILO DOS REIS 

Bauru
2008


ESTHER CAMILO DOS REIS 

“DOCKING E ANÁLISE DO MODO DE LIGAÇÃO DE
TRÊS  MOLÉCULAS PEQUENAS,

UM BENZIMIDAZOL E DOIS COMPOSTOS DE CRÔMIO,
NOS SULCOS DO DNA 5'-CGCGAATTCGCG-3' ”

Dissertação apresentada como requisito à 
obtenção do Título de Mestre em Ciência e 
Tecnologia dos Materiais do Programa de 
Pós Graduação em Ciência e Tecnologia 
de Materiais da Universidade Estadual 
Paulista “Julio de Mesquita Filho”. 

Orientadora: Profa. Dra. Ignez Caracelli 

Bauru
2008


DIVISÃO TÉCNICA DE BIBLIOTECA E DOCUMENTAÇÃO 
UNESP – BAURU 

Reis, Esther Camilo dos.
   Docking  e análise  do modo de ligação  de 
três  moléculas  pequenas, um  benzimidazol e 
dois  compostos  de crômio, nos sulcos do DNA 
5’-CGCGAATTCGCG-3’ / Esther  Camilo  dos Reis, 
2008.
   xii, 84 f. il.

   Orientador: Ignez Caracelli. 

   Dissertação (Mestrado) – Universidade Esta- 
dual Paulista.   Faculdade de Ciências, Bauru, 
2008.

1. Docking.  2. DNA.  3. Programa GOLD.  4.
Crômio. I. Universidade Estadual Paulista. Fa- 
culdade de Ciências. II. Título. 

Ficha catalográfica elaborada por Maricy Fávaro Braga – CRB-8 1.622 


AGRADECIMENTOS

À minha orientadora, Profa. Dra. Ignez Caracelli, por ter me colocado em contato 

com um ramo da ciência tão rico e ainda inexplorado. Por seus conselhos de vida, 

agradeço. 

Ao Prof. Dr. Mauricio Angel Vega Teijido, do Grupo de Pesquisa BioMat, FC- 

UNESP/Bauru pela paciência e valiosa colaboração na parte de cálculos e sugestões 

na análise de resultados. 

Ao aluno de iniciação científica Sergio Pizano Rodrigues, do Grupo de Pesquisa 

BioMat, FC-UNESP/Bauru pela paciência e colaboração com a visualização dos 

resultados.

À aluna de doutorado Cristiane Cabral de Melo, do Laboratório de Cristalografia, 

Estereodinâmica e Modelagem Molecular – DQ – UFSCar, São Carlos, pela ajuda 

nos cálculos. 

Ao Prof. Dr. Julio Zukerman Schpector do Laboratório de Cristalografia, 

Estereodinâmica e Modelagem Molecular – DQ – UFSCar, São Carlos, pela busca 

de estruturas de pequenas moléculas utilizando sua licença CSD. 

À Secretaria Estadual de Educação pela Bolsa de Estudos da Secretaria da 
Educação do Estado de São Paulo

Aos professores do programa de pós-graduação pelos ensinamentos. 

Aos membros da banca por suas sugestões 

Aos amigos por torcerem pelo meu sucesso. 

A toda a minha família pelo apoio, carinho e paciência sempre. 

iv


REIS, Esther Camilo dos. Docking e análise do modo de ligação de três  
moléculas pequenas, um benzimidazol e dois compostos de crômio, nos 
sulcos  do DNA 5'-CGCGAATTCGCG-3'. 2008. Dissertação (Mestrado em Ciências 
e Tecnologia dos Materiais) – UNESP, Faculdade de Ciências, Bauru, 2008. 

RESUMO 

Neste trabalho foi estudado o modo de ligação de três moléculas pequenas ao 

DNA 5'-CGCGAATTCGCG-3', através da simulação computacional e análise em tela 

gráfica. Verificou-se que é possível utilizar o programa GOLD, baseado em 

algoritmos genéticos, em estudos envolvendo o DNA, uma vez que até o momento 

há apenas dois trabalhos publicados na base de dados Scopus (Portal de Periódicos 

da CAPES) onde esta metodologia é utilizada. Também foi verificado que 1vzk, 

complexo cristalográfico do DNA com 2-(5-{4-[amino (imino)metil]fenil}-2-tienil)-1h-

benzimidazol-6-carboximida (DB818), obtido do PDB é uma estrutura representativa 

para estudos no sulco menor. Foram investigados os modos de ligação dos 

seguintes ligantes: (a) DB818, obtido a partir da estrutura cristalográfica 1vzk; (b) 

DAZJOE; [Cr(1,2-bis(naftilidenoamino)etano)(H2O)2], estrutura obtida do Cambridge 

Structural Database e (c) CR3NC,  [Cr(2,3-bis{[(2-hidroxi-4-dietilamino) (fenil) 

(metileno)]amino}2-butenodinitrila) (H2O)2], cuja estrutura foi obtida por modelagem 

molecular, tomando como modelo  DAZJOE. Os estudos de docking do DAZJOE em 

DNA sugerem que seu modo de ligação seria no sulco menor, porém sua interação 

não se dá com as bases AATTC como no caso do DB818, mas sim entre as bases 

ATTC. Quando os cálculos de docking foram realizados com a molécula CR3NC, 

que tem volume maior e mais flexibilidade nas extremidades, observou-se que a 

mesma posiciona-se no sulco maior. Este resultado está em concordância com 

dados experimentais disponíveis. Um mecanismo de quebra do DNA é sugerido,  

não devido à influência do crômio, mas sim devido à presença dos nitrogênios. 

Observou-se que a influência do metal é menor do que a da molécula complexada 

ao íon nas interações.

Palavras-chave: docking, DNA, programa GOLD, crômio. 

v


REIS, Esther Camilo dos. Docking e análise do modo de ligação de três  
moléculas pequenas, um benzimidazol e dois compostos de crômio, nos 
sulcos  do DNA 5'-CGCGAATTCGCG-3'. 2008. Dissertação (Mestrado em Ciências 
e Tecnologia dos Materiais) – UNESP, Faculdade de Ciências, Bauru, 2008. 

ABSTRACT 

In this work we studied the binding mode of some small molecules in the DNA 

5'-CGCGAATTCGCG-3' through computer simulation and analysis in graphical 

screen. We found that it is possible to use the GOLD program, based on genetic 

algorithms in studies involving DNA, despite we found only two papers in the 

database Scopus (CAPES Portal of Journals) where this approach is used. It was 

also found that 1vzk, crystallographic complex of the DNA with 2-(5-(4-[amino (imino) 

methyl] phenil) -2- thienyl)-1h-benzimidazol-6-carboximide (DB818), obtained from 

PDB is a representative structure for studies in the minor groove. We investigated the 

binding mode of the following ligands: a) DB818, obtained from the 1vzk 

crystallographic structure, (b) DAZJOE, [Cr(1,2-bis(naphthylideneamino) 

ethane)(H2O)2], structure obtained from Cambridge Structural Database and (c) 

CR3NC, [Cr((2,3-bis[(2-hydroxy-4-phenyl) (diethylamino) (methylene)] 2-amino 

butenedinitrile)(H2O)2], whose structure was obtained by molecular modeling, taking 

DAZJOE as model. The DAZJOE docking’s studies in DNA suggest that its binding 

mode would be in the minor groove, but their interaction is not given with the bases 

AATTC as for the DB818, but between the bases ATTC. When the docking 

calculations were performed with CR3NC molecule, which has larger volume and 

more flexibility in the extremities, we observed that it take place in major groove. This 

result is in agreement with experimental data available. It is suggested a DNA break 

mechanism, but not due to the influence of chromium, but the nitrogens. It was 

observed that the influence of the metal is lower than the ionophore in interactions 

Keywords: docking, DNA, GOLD program, chromium. 

vi


LISTA DE FIGURAS 

página 
Figura 1.1  Níveis de organização desde o organismo até os pares de base do DNA. Nos seres humanos há 23          

pares de cromossomos. As histonas são proteínas globulares onde o DNA se enovela. 5

Figura 1. 2  Cristais de DNA 8

Figura 1. 3  Esquema ilustrando o modo de obtenção do padrão de difração por mono-cristal de DNA. 8

Figura 1. 4  Padrão de difração para o B-DNA, obtido por Franklin, apresentando um “X”. 9

Figura 1. 5   Padrão de difração usual para moléculas protéicas. 9

Figura 1. 6  Padrão de difração onde se observam os “diamantes”. 10

Figura 1. 7   As camadas, na foto de difração, com destaque para a camada 4 (direita). 10

Figura 1. 8  Representação esquemática da estrutura tridimensional do DNA. 11

Figura 1. 9  Estrutura cristalográfica do B-DNA 1vzk e sua representação esquemática (direita).  12

Figura 1. 10  (a) Formas A, B e Z do DNA considerando o eixo de enrolamento e embaixo uma visão perpendicular ao     
eixo. (b) Diferença entre os eixos de enrolamento das fitas. 13

Figura 1. 11   As quatro bases nitrogenadas do DNA: Timina e Adenina, Guanina e Citosina. As linhas pontilhadas       
indicam ligações de hidrogênio entre as bases C e G e as bases A e T. 14

Figura 1. 12  Nomenclatura padrão dos átomos em formato pdb. 15

Figura 1. 13   O gráfico da energia em função da conformação mostra que a mínima energia também resulta no melhor 
resultado receptor-ligante em um caso de docking rígido. 19

Figura 1. 14   Fluxograma de um GA básico (MIRANDA, 2000). 20

Figura 1. 15   Cruzamento do cromossomo 1 com o cromossomo 2. Um ponto de cruzamento representado por uma        
barra é escolhido aleatoriamente. Copia-se tudo o que vem antes de um dos pais e tudo o que vem          
depois do outro. 22

Figura 1. 16   Exemplo de mutação 22

Figura 1. 17  (a) Benzimidazol ligado ao DNA no sulco menor (código PDB:1vzk). (b) Antraciclina ligada ao DNA                
por intercalação (código PDB: 1nab). Observa-se uma deformidade das bases. (c) A enzima recombinase 
atuando no sulco maior do DNA (código PDB: 1jkq). 25

Figura 2. 1  Fluxograma de trabalho 27

Figura 2.2  Tela de Entrada do algoritmo de busca do NDB, com os parâmetros adotados. 28

Figura 2.3  Ligante 1 – DB818 - com a numeração dos átomos utilizada neste trabalho. 31

Figura 2.4  Ligante 2 - DAZJOE - com a numeração dos átomos utilizada neste trabalho 32

Figura 2.5  Ligante 3 - CR3NC - com a numeração dos átomos utilizada neste trabalho. 33

Figura 2.6  Docking 34

vii


LISTA DE FIGURAS (continuação)

página 
Figura 2.7  Redocking. 35

Figura 2.8  Cross-docking 36

Figura 2.9  A função escore dentro do programa GOLD. 38

Figura 3. 1    O dodecâmero d(C-G-C-G-A-A-T-T-C-G-C-G)2  das estruturas 1vzk e 2b3e. Os centros dos cálculos são 
mostrados 48

Figura 3. 2   Estruturas tridimensionais 1vzk e 2b3e, com seus respectivos ligantes DB818 e DB819, dentro do              
sulco menor. 48

Figura 3. 3   Estruturas tridimensionais 1vzk e 2b3e, com seus respectivos ligantes DB818 e DB819, dentro do              
sulco menor. 49

Figura 3. 5  O ligante DB819 dentro do sulco menor do receptor 2b3e, mostrando a ligação de hidrogênio.  50 

Figura 3. 6   Os ligantes DB818  e DB819. 50

Figura 3. 7    Duas orientações representam os dois grupos obtidos no redocking em torno do centro O2/T19. 54 

Figura 3. 8   Superposição da estrutura cristalográfica do complexo DNA-DB818 (stick) com a orientação selecionada       
no redocking (ball-stick). As interações análogas entre essas estruturas são apresentadas. 55

Figura 3. 9:  Sobreposição da solução obtida em cálculos com a versão anterior do GOLD e a solução obtida           
utilizando-se a última versão. Um RMSD de apenas 0,16 Å foi encontrado, evidenciando a compatibilidade   
das duas versões. 57

Figura 3. 10   Na  orientação 6 o anel aromático é perpendicular ao restante da molécula o que dificulta sua entrada   no 
sulco. 58

Figura 3. 11   Observa-se que o resultado do cálculo de redocking(em ball-stick) está em concordância com a estrutura 
cristalográfica (em stick). No entanto observa-se uma aproximação do N32 do O4 do açúcar. 61

Figura 3. 12   Superposição da estrutura cristalográfica do ligante DB818 (em preto, ao fundo) com as 6 soluções 
selecionadas nos 6 cálculos de redocking (em branco) 62

Figura 3. 13  Orientação 4 no sítio da 2b3e resultante do cross-docking no centro T8 em 2b3e. O ligante não fica   
totalmente plano, mas acomoda-se no sulco menor entre as bases AATTC. 66

Figura 3. 14  Orientação 7 no sítio da 2b3e resultante do cross-docking no centro T20 em 2b3e. Melhor resultado 
comparando-se com a simulação em T8. 67

Figura 3. 15  Interações entre os nucleotídeos T8, T19 e T20 e do receptor 1vzk e o ligante DAZJOE. Estas interações  
estão descritas na Tabela 3.14. 71

Figura 3. 16   Mecanismo de quebra do DNA pelo composto Cr3NC sugerido por Vaidyanathan  et al. (2000) 72 

Figura 3. 17   Orientações representativas dos grupos 1 e 2 das soluções do docking de cr3nc  em 1vzk 73

Figura 3. 18  Posição das três orientações do ligante CR3NC em 2b3e. A interação ocorre no sulco maior, porém há    
contato maior com uma das faces. 74

Figura 3. 19   Medida da abertura do sulco maior das estruturas 1vzk e 2b3e. 75

viii


LISTA DE TABELAS 

página 

Tabela 1. 1   As bases nucleotídicas do DNA 6

Tabela 1. 2  Formas do DNA e suas características geométricas  (pb = par de base) 13

Tabela 1. 3   Resumo das interações consideradas na função escore do Programa GOLD 24

Tabela 3. 1   Levantamento de complexos de DNA CGCGAATTCGCG e pequenos ligantes 43

Tabela 3. 2  Descrição dos ligantes dos complexos DNA-moléculas pequenas 45

Tabela 3. 3   Resultados do redocking para o cálculo com o centro T19, raio 10 Å. 54

Tabela 3. 4  Resultados do redocking para o cálculo com centro T19, raio 25 Å. 56

Tabela 3. 5  Resultados do redocking para o cálculo com o centro C15, raio 25 Å.  57

Tabela 3. 6  Resultados do redocking para o cálculo com o centro T8, raio 25 Å. 59

Tabela 3. 7  Resultados do redocking para o cálculo com o centro C21, raio 25 Å. 60

Tabela 3. 8  Resultados do redocking para o cálculo com o centro C21 raio 25 Å.   61

Tabela 3. 9  Solução selecionada do cálculos de redocking e valor de Fitness. 62

Tabela 3. 10   Resultados do cross- docking para o cálculo centrado em T8.   65

Tabela 3. 11   Resultados do cross-docking para o cálculo centrado em T20. 67

Tabela 3. 12 Resultados de docking da DAZJOE em 1vzk centrado em T8. 69

Tabela 3. 13  Resultados de docking da DAZJOE em 1vzk centrado em T19. 70

Tabela 3. 14    Interações entre a DAZJOE e 1vzk 70

Tabela 3. 15   Resultados de docking de CR3CN em 1vzk. 73

Tabela 3. 16   Interações entre a orientação 6 e o DNA 74

Tabela 3. 17    Resultados de docking de CR3NC em 2b3e. 75

ix


LISTA DE ABREVIATURAS E SÍMBOLOS 

� polarizabilidade 

�0 permissividade no vácuo 

A adenina 
AMP adenosina monofosfato 
C citosina 
CSD Cambridge Structural Database

DNA ácido desoxirribonucléico 
dTMP deoxitimidina monofosfato 
EOR espécies de oxigênio reativo 
G guanina 
GA Genetics Algorithms (Algoritmo Genético)
GMP guanosina monofosfato 
GOLD  Genetic Optimisation for Ligand Docking

GTF Glucose Tolerance Factor

hb hidrogen bond (ligação de hidrogênio) 
k constante de Boltzmann 
LaCrEMM Laboratório de Cristalografia, Estereodinâmica e Modelagem Molecular 
MC Monte Carlo 
NDB Nucleic Acid Database

NMR Ressonância Magnética Nuclear 
p dipolo 
pb par de base 
PBS Public Broadcasting Service

PDB Protein Data Bank

pic picolinato 
q carga 
r distância entre as cargas 
R raio 
RMSD root mean square deviation

RNA ribonucleic acid

T timina 
T temperatura 
vdw van der Waals 
int interno 
ext externo 

�G energia livre de Gibbs 

x


SUMÁRIO

Página 

1 INTRODUÇÃO 1

1.1 CIÊNCIA DOS MATERIAIS E MATERIAIS BIOLÓGICOS 1 
1.2 DNA – UM POUCO DE HISTÓRIA 2 
1.3 COMPOSIÇÃO QUÍMICA 4 
1.4 DESVENDANDO A ESTRUTURA TRIDIMENSIONAL DO DNA 5 
1.5 A ESTRUTURA TRIDIMENSIONAL DO DNA 7 
1.6 BANCOS DE DADOS DE ESTRUTURAS DE MOLÉCULAS BIOLÓGICAS, ORGÂNICAS E ORGANOMETÁLICAS 14 
1.7 DOCKING MOLECULAR 17 
1.8 ALGORITMO GENÉTICO (GA) 20 
1.9 INTERAÇÕES COM DNA 22 
1.10 COMPOSTOS DE CRÔMIO 25 

2 METODOLOGIA                                                                                                                                          27 

2.1.   RECEPTOR 27
2.1.1.   Busca nos Bancos de dados de informações estruturais do DNA 27
2.1.2.   Levantamento dos complexos de DNA-ligante 28
2.1.3.   Seleção e Análise do DNA 29
2.1.4.   Seleção de sítios para o cálculo de docking 29
2.1.5.   Adição de Hidrogênios 29

2.2.    LIGANTES 31
2.2.1.   Ligante 1 31
2.2.2.   Ligante 2 32
2.2.3.   Ligante 3 33
2.2.4.   Adição de Hidrogênios 33

2.3.     DOCKING MOLECULAR 34
2.3.1.   O que é docking? 34
2.3.2.   Redocking ou validação 35
2.3.3.   Cross-docking 36
2.3.4.   O Método Computacional 36

2.4.    VISUALIZAÇÃO GRÁFICA 39

2.5.    EXPERIMENTO IN SILICO � DADOS EXPERIMENTAIS 41

xi


xii

3 RESULTADOS E DISCUSSÃO 42

3.1.   LEVANTAMENTO NO PDB DAS ESTRUTURAS TRIDIMENSIONAIS DE DNA 5'-CGCGAATTCGCG-3'    COMPLEXADOS  
COM MOLÉCULAS PEQUENAS 42
3.2.   ANÁLISE DAS ESTRUTURAS CRISTALOGRÁFICAS DOS COMPLEXOS 1VZK E 2B3E DO PDB 47
3.3.    ESTUDOS DE LIGAÇÃO NO SULCO MENOR DO DNA. 51

         3.3.1.   Resultados do redocking de DB818 no sulco menor de 1vzk 51
3.3.1.a Resultados do redocking de DB818 no receptor R-1vzk, centrado em T19, com raio 10 Å 53 
3.3.1.b Resultados do redocking de DB818 no receptor R-1vzk, centrado em T19, com raio 25 Å 55 
3.3.1.c Resultados do redocking de DB818 no receptor R-1vzk, centrado em C15, com raio 25 Å 57 
3.3.1.d Resultados do redocking de DB818 no receptor R-1vzk, centrado em T8, com raio 25 Å 58 
3.3.1.e Resultados do redocking de DB818 no receptor R-1vzk, centrado em C21, com raio 25 Å 59 
3.3.1.f Resultados do modelo-2 de DB818 no receptor R-1vzk, centrado em T19, com raio 25 Å 60 
3.3.1.g  Comparacao dos resultados de redocking 62 

        3.3.2.   Cross-docking 64

3.3.2.a Cross-docking do modelo M2 no receptor R-2b3e centrado em T8 com raio 25 Å 64 
3.3.2.b Cross-docking do modelo M2 no receptor R-2b3e centrado em T20 com raio 25 Å 64 

         3.3.3.   Docking do ligante DAZJOE no receptor R-1vzk 68

3.3.3.a Docking do ligante DAZJOE no receptor R-1vzk, centrado em T8, com raio 25 Å 69 
3.3.3.b Docking do ligante DAZJOE no receptor R-1vzk, centrado em T19, com raio 25 Å 69 
3.3.3.b  Comparacao dos resultados de docking centrado em T8 e T19 e análise das interações  69 

3.4.    ESTUDOS DE LIGAÇÃO NO SULCO MAIOR DO DNA 71
3.4.1.   Docking do ligante CR3CN no receptor R-1vzk 72
3.4.2.   Docking do ligante CR3CN no receptor R-2b3e 74

4 CONCLUSÕES 77

5 REFERÊNCIAS 79


INTRODUÇÃO 1

1 INTRODUÇÃO 

1.1  CIÊNCIA DOS MATERIAIS E MATERIAIS BIOLÓGICOS 

Com o desenvolvimento das ciências, o conhecimento foi se subdividindo em 

áreas cada vez mais específicas. Em tal situação, um pesquisador da área da 

Física tinha pouco ou nenhum conhecimento sobre os avanços da biologia, 

química e computação e vice-versa. Com o rápido avanço tecnológico e a 

necessidade moderna do desenvolvimento de novos materiais essas áreas tiveram 

que trabalhar cada vez mais próximas, o que culminou em uma área 

interdisciplinar: a ciência e tecnologia dos materiais. Essa área possibilitou o 

estudo dos materiais não somente sob o ponto de vista macroscópico, mas 

também a partir do conhecimento da estrutura tridimensional das moléculas.  

Dentre os materiais que podem ser estudados, encontram-se os materiais 

biológicos, como as proteínas, o DNA e o RNA. A compreensão de como os 

sistemas biológicos funcionam, pode auxiliar tanto no tratamento de doenças, 

como também no desenvolvimento de outros materiais com aplicações 

tecnológicas. Com relação ao tratamento de doenças, atualmente, o planejamento 

racional de fármacos tem à disposição importantes ferramentas computacionais 

necessárias ao aumento da rapidez e à diminuição dos custos envolvidos no 

processo de desenvolvimento desses produtos. Já no desenvolvimento de novos 

materiais com aplicações tecnológicas, os organismos vivos são fontes 

inesgotáveis de informações e em pleno século XXI muitos mistérios, como o 

enovelamento de proteínas, os mecanismos de desenvolvimento do câncer ou 

como são armazenadas as informações no cérebro, continuam sendo desafios da 

ciência que permanecem sem uma completa explicação. Novas informações que 

contribuam para a compreensão da lógica da vida podem levar ao 

desenvolvimento de tecnologias, novos materiais e computadores mais 

inteligentes.  

Percebe-se hoje que a solução para os problemas modernos não pode mais 

ser encontrada somente por pesquisadores de uma única área do conhecimento. É 

preciso que pessoas com diferentes formações trabalhem com o objetivo de 

desvendar e/ou modificar o sistema em estudo. 


INTRODUÇÃO 2

O sistema biológico em estudo nesta dissertação é um fragmento de DNA, na 

sua forma B, que é a forma de DNA que aparece em condições fisiológicas. Em 

geral, compostos que podem se ligar ao B-DNA no sulco menor, de forma não-

covalente, podem ter aplicações como agentes contra câncer, vírus, e algumas 

infecções. É o caso, por exemplo, de pentanamida, que demonstrou atividade 

contra leishmaniose e contra pneumonia causada pelo Pneumocystis carinii,

doença oportunista que aparece freqüentemente em pacientes portadores do vírus 

HIV (EVANS, NEIDLE, 2006). 

No caso presente, o sistema em estudo é o fragmento de DNA 5'-

CGCGAATTCGCG-3', do qual se pretende analisar o modo de ligação de 

pequenos ligantes.  Inicialmente, foi feito um estudo do complexo de código PDB 

(Protein Data Bank) 1vzk, no qual o fragmento de B-DNA tem ligada, no sulco 

menor, uma molécula de 2-(5-{4-[amino(imino)metil]fenil}-2-tienil)-1h-benzimidazol-

6-carboximida (DB818) (MALLENA et al., 2004).

O modo de ligação de outros dois compostos de crômio com o DNA também 

foram também estudados:  [Cr(1,2-bis(naftilidenoamino)etano)(H2O)2], cujo código 

no Cambridge Structural Database (CSD) é DAZJOE, e [Cr(2,3-bis{[(2-hidroxi-4-

dietilamino)(fenil)(metileno)]amino}2-butenodinitrila)(H2O)2] (CR3CN), modelado a 

partir de DAZJOE. 

 Para estudar os modos de ligação destes compostos ao DNA, foram feitos 

cálculos de docking, utilizando métodos de algoritmos genéticos, e a análise dos 

resultados foi feita através de visualização gráfica. Isto permitiu o estudo de cada 

molécula e comparações entre moléculas e sítios possíveis de ligação. 

1.2   DNA – UM POUCO DE HISTÓRIA 

Em 1869, Friedrich Miescher, durante a guerra da Criméia, enquanto 

trabalhava com feridos e colocava bandagens nas feridas, isolou células de pus. 

Miescher adicionou uma solução alcalina fraca ao pus que rompeu as membranas 

celulares e permitiu a precipitação dos núcleos. A partir deles, isolou-se uma única 

substância química, a qual Miescher chamou de nucleína. Posteriormente, a 

nucleína foi encontrada em todas as células testadas e era rica em fósforo. 


INTRODUÇÃO 3

Miescher pensou que a função principal das nucleínas era armazenar átomos de 

fósforo na célula. Entretanto, seu papel genético e sua estrutura permaneceram 

desconhecidos por muito tempo (ACOT, 2003). Naquela época, não havia como 

demonstrar qualquer outra função biológica para a substância. Mesmo sem saber, 

Miescher tinha obtido o primeiro extrato de DNA bruto. 

Depois da descoberta de Miescher, outros cientistas desenvolveram técnicas 

de purificação mais refinadas e a substância “pura” ficou conhecida como ácido 

desoxirribonucléico, por causa do açúcar presente em sua estrutura, a 

desoxirribose, e suas propriedades de natureza ácida. No início do ano de 1900, 

sabia-se que as nucleínas de Miescher eram uma mistura de proteínas e ácidos 

nucléicos, havendo dois tipos: DNA (sigla do inglês “deoxyribonucleic acid” - ácido 

desoxirribonucléico), encontrado principalmente no núcleo; e RNA (“ribonucleic 

acid” – ácido ribonucléico), encontrado principalmente no citoplasma (Acot, 2003). 

Cientistas, como Phoebus Aaron Theodor Levene (1869-1940), começaram a 

estudar o DNA decompondo-o em seus componentes e descobriram que era 

constituído de nucleotídeos (estrutura composta por grupos fosfato, o açúcar 

desoxirribose e bases nitrogenadas) de quatro tipos diferentes (Adenina - A,

Timina - T, Citosina - C e Guanina - G). Esses resultados não chegaram a 

provocar interesse, pois o DNA foi considerado uma molécula muito simples para 

ser um bom candidato à molécula responsável pelas características hereditárias. 

Em 1909, por exemplo, o químico lituano Phoebus Levene assegurou que os 

nucleotídeos do DNA ocorriam em quantidades idênticas e cunhou a chamada 

“hipótese do tetranucleotídeos” que afirmava que essas subunidades mantinham-

se unidas em uma seqüência repetida e invariável ao longo da molécula. Dessa 

forma, se Levine estivesse certo, o DNA não teria potencial para ser o repositório 

das informações genéticas. Essa visão modificou-se a partir da década de 40 após 

alguns importantes experimentos. Inicialmente, o médico de origem canadense 

Oswald Avery (1877-1955) trabalhando com cepas virulentas e não virulentas de 

Penumococcos mostrou que o DNA era um fator chave para as diferenças 

herdadas entre esses organismos. Posteriormente, no final de 1940, Erwin 

Chargaff (1905-2002) demonstrou a incorreção da “hipótese do tetranucleotídeos”. 

Chargaff mostrou que as freqüências de nucleotídeos diferem entre espécies e, 


INTRODUÇÃO 4

mesmo quando esses valores são mantidos analiticamente constantes, poderia 

ocorrer um número enorme de variações nessas seqüências e mesmo entre 

regiões diferentes de uma mesma molécula de DNA. Deste modo, os ácidos 

nucléicos poderiam apresentar um grau elevado de complexidade em suas 

seqüências, apesar de serem compostos por apenas 4 tipos de bases diferentes. 

Foi o começo do estudo e entendimento sobre a composição química do DNA 

(SIMONI, HILL, VAUGHAN, 2002; SEMENZA, 2003). 

Essa complexidade dos ácidos nucléicos e sua relação com o 

armazenamento e transmissão da informação genética tornou-se clara após a 

elucidação da estrutura tridimensional do DNA em 1953, feita por difração de raio 

X  por Franklin, Wilkins, Watson e Crick (Maddox, 2002). 

1.3   COMPOSIÇÃO QUÍMICA 

Todos os organismos vivos, desde os vírus aos seres humanos, têm as 

informações genéticas armazenadas nos ácidos nucléicos (DNA ou RNA como no 

caso de alguns vírus), em particular, as células dos eucariontes têm o seu DNA 

organizado na forma de cromossomos que se encontram no núcleo celular (Figura 

1.1).

Um cromossomo pode ser conceitualmente dividido em genes – blocos 

funcionais do DNA, cada um dos quais codifica uma proteína em particular. Cada 

gene está posicionado em um locus (posição) particular no cromossomo que é 

conservada de geração em geração. Muito superficialmente, pode-se pensar no 

gene como o codificador de uma característica, como por exemplo, a cor dos 

olhos. O conjunto dos genes que resultam em determinada característica são 

denominadas alelos.


INTRODUÇÃO 5

Figura 1.1 Níveis de organização desde o organismo até os pares de base do DNA. Nos seres 
humanos há 23 pares de cromossomos. As histonas são proteínas globulares onde o DNA se 
enovela. 

Organismo 

Os genes são formados por uma seqüência de pares de nucleotídeos. Por 

sua vez, essas unidades moleculares são constituídas por um açúcar 

(desoxirribose) ligado por um lado a um grupo fosfato e por outro a uma das quatro 

bases nitrogenadas (Tabela 1.1). A seqüência de pares de bases ao longo da 

molécula de DNA é a responsável pela informação genética. O código genético é 

justamente a leitura destas seqüências, a qual especifica a seqüência linear dos 

aminoácidos das proteínas. Embora os nucleotídeos que constituem o DNA sejam 

muito pequenos, o DNA de todos os cromossomos de uma única célula é superior 

a um metro em humanos, pois cada molécula contém aproximadamente 3�109

milhões de nucleotídeos. (VOET, VOET, PRATT, 2000). 

Esses nucleotídeos se agrupam por ligações dos grupos fosfatos às posições 

3’ e 5’ da ribose e estas ligações assimétricas significam que a fita de DNA tem 

uma direção. Em uma dupla hélice a direção dos nucleotídeos em uma fita é 

oposta à direção dos nucleotídeos na outra fita. Este arranjo das fitas do DNA é 

chamado antiparalelo e as terminações assimétricas das fitas de DNA são 

chamadas terminais 5’ e 3’. 


INTRODUÇÃO 6

Tabela 1. 1  As bases nucleotídicas do DNA 

1.4 DESVENDANDO A ESTRUTURA TRIDIMENSIONAL DO DNA 

Após muitos anos de investigações, em 1953, James Watson e Francis Crick 

publicaram o célebre artigo apresentando o primeiro modelo tridimensional da 

molécula de DNA que foi amplamente aceito pela comunidade científica. Este 

modelo era compatível com todas as características químicas conhecidas da 

molécula e levava em consideração vários resultados experimentais obtidos 

previamente por outros pesquisadores. A publicação desse artigo só foi possível 

graças à contribuição de cientistas como Linus Pauling, que usou seu 

conhecimento de química e uma nova técnica poderosa chamada Cristalografia de 

raio X, para descobrir uma estrutura com formato de saca-rolhas encontrada em 

muitas proteínas – a alfa-hélice. Watson e Crick seguiram a abordagem química de 

Pauling e os modelos de difração de raio X para desenvolver o modelo da 

estrutura do DNA. A difração de raio X pode fornecer muitas informações sobre o 

formato e estrutura de uma molécula (ACOT, 2003).


INTRODUÇÃO 7

A cientista Rosalind Franklin teve um papel fundamental para essa 

descoberta, integrante da equipe de John Randall, no King's College de Londres, 

onde também trabalhava Wilkins. Na Universidade de Cambridge, onde estudava 

física e química, Rosalind Franklin teve contato com Sir William Lawrence Bragg, 

que usava a difração por raio X para revelar a estrutura de cristais. Em 1951 foi 

incumbida de analisar a estrutura do DNA, um campo novo para ela, e sua 

primeira tarefa foi montar um equipamento de difração de raio X, com o qual 

obteve imagens de DNA com qualidade cada vez melhor, auxiliada pelo estudante 

de doutorado Raymond Gosling. Porém, as desavenças entre Franklin e Wilkins 

contribuíram para a ruptura dos dois, que chegaram a trabalhar sobre o mesmo 

tema, mas isolados. Após dois anos, Franklin decidiu ir embora. Muitas 

especulações são feitas sobre até onde Franklin chegou na sua interpretação das 

imagens que obteve do DNA. Porém, o que se sabe é que a cientista obteve 

imagens de excelente qualidade em 1952, em especial a de número 51, que 

Gosling deu a Wilkins, e este mostrou a Watson sem que Franklin soubesse. 

Seguiu-se daí, uma série de manobras que minimizaram a contribuição de 

Franklin. Para ter crédito sobre a descoberta, Wilkins escreveu um texto sobre 

DNA para a revista “Nature” sem mencionar o trabalho de Franklin. Em 1958, 

Rosalind morreu de câncer de ovário. Em 1962, o norte-americano James Watson, 

o britânico Francis Crick e o neozelandês Maurice Wilkins ganham o prêmio Nobel 

e nesse contexto Franklin não passa de uma mera colaboradora (MADDOX, 2002). 

Progressos continuam sendo feitos no estudo do DNA e o Projeto Genoma 

Humano foi um grande avanço em sua pesquisa. Iniciado em 1990 e finalizado em 

2003, esse projeto seqüenciou as 3164,7 milhões de bases nucleotídicas (A, C, T 

e G) que constituem o DNA humano (HUMAN GENOME PROJECT). Ainda há 

muito a fazer no estudo do DNA e o papel das ferramentas computacionais é 

crucial, visto o grande número de dados experimentais disponíveis para análise. 

1.5    A ESTRUTURA TRIDIMENSIONAL DO DNA 

A estrutura tridimensional do DNA pode ser desvendada graças aos 

experimentos realizados utilizando-se a difração por raio X. 


INTRODUÇÃO 8

Para realizar os estudos utilizando esta metodologia, o primeiro passo é a 

obtenção de um cristal da macromolécula em questão. A Figura 1.2 mostra 

algumas fotos de cristais de DNA (CAVALIERE, 2004). 

Figura 1. 2 Cristais de DNA 

Um cristal, quando submetido a um feixe de raio X gera um padrão de 

difração representado de forma simplificada na Figura 1.3. 

Figura 1. 3 Esquema ilustrando o modo de obtenção do padrão de difração por mono-cristal de 
DNA. 

Rosalind Franklin, na determinação da estrutura do DNA, conseguiu obter 

uma fibra de DNA na forma B, cujo padrão de difração é apresentado na Figura 

1.4 (PBS FOUNDATION). 


INTRODUÇÃO 9

Figura 1. 4 Padrão de difração para o B-DNA, obtido por Rosalind Franklin, apresentando um “X”. 

O passo importante do trabalho foi tentar entender porque o padrão de 

difração apresentava um “X” característico, ao invés do padrão usual para outras 

moléculas biológicas como o apresentado na Figura 1.5. 

                      Figura 1. 5  Padrão de difração usual para moléculas protéicas. 

A interpretação das fotos de DNA, feita por Watson, Crick e Wilkins, mostra 

que o “X” estava relacionado com a estrutura química do DNA. O padrão de “X” foi 

relacionado com a dupla hélice do DNA. 

No difratograma do DNA outro aspecto observado, além do “X”, foram os 

diamantes (Figura 1.6) (PBS Foundation).  Os diamantes foram relacionados com 

a existência e organização dos açúcares e fosfatos do DNA, posicionados no lado 

externo das hélices.


INTRODUÇÃO 10

              Figura 1. 6 Padrão de difração onde se observam os “diamantes”. 

Outro aspecto observado foi em relação às manchas que apareciam nos “X”, 

pois o X, não se apresenta como uma linha continua (Figura 1.7) (PBS 

Foundation). As descontinuidades foram relacionadas com camadas, e as 

camadas com as bases que formam os degraus da hélice.  Além disso, foi 

observado também que uma das camadas, a chamada camada 4, ocorre devido 

ao fato que as hélices correm em direções contrárias, mas se enrolam em relação 

a um eixo comum ocorrendo desse modo, a formação de dois sulcos (groove, em 

inglês), chamados de sulco maior e sulco menor. 

Figura 1. 7  As camadas, na foto de difração, com destaque para a camada 4 (direita). 

Na Figura 1.8, observa-se a estrutura do DNA, que lembra uma escada com 

seus degraus e os bastões que representam os pares de bases (adenina, citosina, 

guanina e timina). Também aparece o corrimão de cada hélice, mostrando que tem 


INTRODUÇÃO 11

um eixo comum e que correm em direções opostas, como indicado pelas setas. 

Observa-se a formação do sulco maior e do sulco menor. 

          
          Figura 1. 8 Representação esquemática da estrutura tridimensional do DNA.  

                   
Sulco
Maior

Sulco
Menor

Muitas características do DNA são importantes para seu funcionamento, 

entretanto, sua estrutura tridimensional é a característica chave. Essa estrutura foi 

publicada por Francis Crick e James Watson em 1953 baseando-se em 

experimentos cristalográficos realizados por Rosalind Franklin. Até então nenhum 

cristalógrafo havia conseguido separar as formas A e B do DNA, que Franklin 

percebeu estarem relacionadas com a hidratação, conforme será visto mais 

adiante. Após obter a imagem de difração de raio X do DNA, Franklin trabalhando 

com o mapa de densidade eletrônica determinou que os fosfatos ficavam nas 

extremidades e as bases na parte interna do DNA. (ELKIN, 2003).

Pode-se perguntar por que o DNA se mantém em formato de hélice e porque 

duas hélices se mantêm unidas. Uma análise da polaridade dos componentes do 

DNA revela que tanto os açúcares quanto os fosfatos são muito solúveis em água. 

Porém, as bases são insolúveis. Considerando que todo espaço nas células que 

não são ocupados por componentes importantes, como DNA, RNA e enzimas, são 

preenchidos por água, observa-se que o formato helicoidal do DNA está 

estritamente relacionado à sua interação com moléculas de água. Na estrutura 

tridimensional do DNA as bases ficam para dentro, evitando interação com a água 

e os fosfatos e a ribose ficam para fora, fato que pode ser observado através de 

resultados da difração de raio X do DNA (Figura 1.9). 


INTRODUÇÃO 12

Figura 1. 9 Estrutura cristalográfica do B-DNA 1vzk e sua representação esquemática (direita).  

Há três formas biológicas conhecidas do DNA: A-DNA, B-DNA e Z-DNA 

(Figura 1.10). As formas A e B-DNA são similares do ponto de vista estrutural, uma 

vez que ambas são hélices de mão direita e as duas fitas de DNA estão em 

direção opostas: uma das fitas tem a direção exata da sua síntese (5'�3')

enquanto que a outra está invertida (3'� 5'). Em condições de baixa hidratação, a 

forma predominante é A-DNA enquanto que em condições fisiológicas é B-DNA. 

Na forma Z-DNA as hélices são de mão esquerda. A forma Z parece estar 

associada à zonas de transcrição e é a que apresenta maior energia entre as três 

formas (HA et al., 2005). Uma comparação entre as características estruturais das 

três formas é apresentada na Tabela 1.2. 


INTRODUÇÃO 13

Figura 1. 10 (a) Formas A, B e Z do DNA considerando o eixo de enrolamento e embaixo uma 
visão perpendicular ao eixo. (b) Diferença entre os eixos de enrolamento das fitas.  

Tabela 1. 2 Formas do DNA e suas características geométricas (pb = par de base)

Formas A B Z
sentido da hélice mão direita mão direita mão esquerda 
unidade de repetição  1 bp 1 bp 2 bp 
rotação/pb 33,6° 35,9° 60°/2
pb/volta 10,7 10,0 12,0
inclinação do bp em relação ao eixo +19,0° -1,2° -9,0°
passo/volta da hélice 24,6Å 33,2Å 45,6Å
diâmetro 26 Å 20 Å 18 Å 

As quatro bases nitrogenadas do DNA são a Timina (T), Adenina (A), 

Guanina (G) e Citosina (C). As maiores, A e G, com dois anéis são as purinas e as 

menores (T e C), as pirimidinas. No DNA existe uma relação A/T = 1 e C/G = 1. 

Devido à relação complementar entre as bases A�T e C�G (uma purina associada 


INTRODUÇÃO 14

com uma pirimidina), o espaçamento entre os corrimãos das hélices contém três 

anéis. As linhas pontilhadas na Figura 1.11 indicam ligações de hidrogênio, 

fundamentais para a estabilidade da molécula de DNA. Entre as bases C e G 

existem três ligações de hidrogênio, enquanto que entre as bases A e T existem 

somente duas. 

Figura 1. 11  As quatro bases nitrogenadas do DNA: Timina e Adenina, Guanina e Citosina. As 
linhas pontilhadas indicam ligações de hidrogênio entre as bases C e G e as bases A e T. 

1.6 BANCOS DE DADOS DE ESTRUTURAS DE MOLÉCULAS BIOLÓGICAS, 
ORGÂNICAS E ORGANOMETÁLICAS. 

Nos anos 70, um grupo de jovens cristalógrafos, Edgar Meyer, Gerson Cohen 

e Helen Berman (BERMAN, 2008), reuniu esforços no sentido de estabelecer uma 

central de coordenadas de estruturas cristalográficas de moléculas biológicas. No 

início, tratava-se de cerca de uma dúzia de estruturas e hoje já são mais de 50.000 

estruturas depositadas (cerca de 75% das estruturas obtidas por difração de raio 

X, e o restante, por Ressonância Magnética Nuclear – NMR,  microscopia 

eletrônica, difração de elétrons e difração de nêutrons e também por modelos 

construídos teoricamente). Esse banco de dados, de domínio público, o Protein 

Data Bank (PDB) era uma base de dados de cristalografia e utilizada por 

cristalógrafos. Hoje essa base de dados dispõe de dados de estruturas de 

proteínas, RNA, DNA, e dos complexos formados, como por exemplo, DNA – 

proteínas, enzimas – inibidores. Outro fato importante, é que seus dados têm sido 


INTRODUÇÃO 15

acessados não só por cristalógrafos, mas também por pesquisadores de diversas 

áreas que utilizam dados biológicos estruturais. 

Por causa do crescente interesse, o banco de dados PDB também relaciona 

dados cristalográficos com dados biológicos das moléculas de interesse, com links

para outros bancos de dados como o de enzimas, dados de sítios ativos, bancos 

de ligantes, etc. O PDBSum (outro banco que pode ser consultado de forma 

paralela ao PDB), foi construído com uma forma mais resumida e com uma 

visualização gráfica mais imediata, permitindo consultar os resultados a uma 

simples vista (LASKOWSKI, CHISTYAKOV, THORNTON, 2005 e LASKOWSKI, 

2007).

Outro banco, o Nucleic Acid Database - NDB (BERMAN et al., 1992), é um 

repositório de informações sobre a estrutura tridimensional de ácidos nucléicos. 

Hoje em dia, contém cerca de 3750 estruturas, envolvendo o DNA, RNA, DNA-

RNA e complexos de DNA com proteínas, vírus e outras moléculas. 

O PDB, PDBSum e NDB estão interligados, de forma que toda a informação 

pode ser obtida em qualquer um deles, com diferentes visualizações. Todas as 

informações sobre as moléculas de DNA utilizadas neste trabalho foram obtidas 

nestes bancos de dados: informações sobre seqüências, coordenadas 

cristalográficas, presença ou não de ligantes, dados de resolução das estruturas. 

Quando as informações obtidas são as coordenadas cristalográficas, elas 

aparecem com o chamado formato PDB.

Por exemplo, os dados referentes ao nucleotídeo citosina (base + 

desoxirribose + grupo fosfato) aparecem da seguinte forma: 

ATOM     39  P     C A   3      25.585  25.276  18.534  1.00 30.62 
ATOM     40  O1P   C A   3      27.060  25.288  18.677  1.00 37.04 
ATOM     41  O2P   C A   3      24.889  25.966  17.423  1.00 33.38 
ATOM     42  O5*   C A   3      25.081  23.755  18.538  1.00 28.67 
ATOM     43  C5*   C A   3      25.162  22.978  19.736  1.00 23.94 
ATOM     44  C4*   C A   3      24.072  21.936  19.787  1.00 23.50 
ATOM     45  O4*   C A   3      22.800  22.540  20.100  1.00 23.10 
ATOM     46  C3*   C A   3      23.820  21.202  18.477  1.00 25.60 
ATOM     47  O3*   C A   3      24.686  20.071  18.379  1.00 32.06 
ATOM     48  C2*   C A   3      22.367  20.817  18.534  1.00 26.01 
ATOM     49  C1*   C A   3      21.762  21.715  19.594  1.00 24.49 
ATOM     50  N1    C A   3      20.727  22.632  19.093  1.00 22.43 
ATOM     51  C2    C A   3      19.390  22.374  19.389  1.00 22.08 
ATOM     52  O2    C A   3      19.100  21.374  20.073  1.00 23.13 
ATOM     53  N3    C A   3      18.457  23.230  18.918  1.00 24.96 
ATOM     54  C4    C A   3      18.829  24.290  18.187  1.00 30.21 
ATOM     55  N4    C A   3      17.888  25.125  17.730  1.00 34.79 
ATOM     56  C5    C A   3      20.191  24.574  17.870  1.00 27.52 
ATOM     57  C6    C A   3      21.097  23.716  18.346  1.00 26.15


INTRODUÇÃO 16

onde os átomos da citosina são representados por N1, C2, O2, N3, C4, N4, C5 e

C6 os da desorribose são O5*, C5*, C4*, O4*, C3*, O3*, C2* e C1*, e os do grupo 

fosfato são P,O1P e O2P. Em todos os nucleotídeos, os grupos fosfato e açúcar se 

repetem quanto à nomenclatura. Na Figura 1.12 estão representados os grupos de 

cada nucleotídeo e os respectivos nomes dos átomos.   

Figura 1. 12  Nomenclatura padrão dos átomos em formato pdb. 

Estas informações são fundamentais para os softwares gráficos.  A primeira 

coluna contém o tipo de informação da linha. Esta, pode ser cabeçalho (HEADER), 

comentário (REMARK), informações sobre os átomos da macromolécula (ATOM) 

ou seu ligante (HETATM) entre outras. A segunda coluna indica o ID (número de 

identificação) do átomo. A terceira, contém o nome do átomo o qual segue o 

seguinte padrão para ácidos nucléicos: todos os átomos são nomeados por seu 

símbolo acompanhados de um número, conforme mostra a Figura 1.12. A quarta 

coluna contém o nome do nucleotídeo ao qual pertence o átomo. A quinta coluna 

contém o nome da cadeia, na sexta seu número. As sétima, oitava e nona colunas 


INTRODUÇÃO 17

contêm as coordenadas x, y e z do átomo. A décima contém a ocupação, a décima 

primeira, o fator de temperatura (104�Å2)(PDB, 1998). Toda esta representação 

recebe o nome de formato pdb. 

Um ponto importante a ressaltar, é que o PDB (banco de dados) ou o 

PDBSum não trazem em seus arquivos os átomos de hidrogênio. Então, na 

realização de cálculos, medidas de interações ou outros, é necessário utilizar 

outros programas que adicionam hidrogênios aos arquivos de coordenadas.

Outro banco de dados muito importante, mas não-público, é o Cambridge 

Structural Database (CSD) que dispõe de uma coleção de estruturas de pequenas  

moléculas orgânicas e organometálicas (ALLEN, 2002), obtidas por difração de 

raio X ou difração de nêutrons. Esta base de dados contém cerca de 322.000 

estruturas depositadas, sendo atualizado a cada dois meses. Como não é um 

banco de dados de acesso gratuito, todas as informações e apoio a este trabalho 

foram resultado de consultas realizadas pelo Prof. Dr. Julio Zukerman Schpector 

do LaCrEMM – DQ – UFSCar, que possui uma licença para acesso ao CSD. 

1.7 DOCKING MOLECULAR 

Docking molecular, ou simplesmente docking, é o processo de se encontrar o 

melhor ajuste para o encaixe entre duas moléculas tridimensionais. Inicialmente 

esta busca era realizada visualizando as moléculas em programas gráficos, onde 

se tentava manualmente obter o melhor ajuste para as duas moléculas formarem 

um complexo. Normalmente uma molécula é chamada de receptor (proteínas, 

enzimas, DNA, etc.) e a outra molécula é chamada de ligante (em geral, a 

molécula menor).

Hoje em dia, há vários programas que permitem realizar essa busca de forma 

mais automatizada. Podemos dividir o processo de “docking” em três partes: 

� planejamento do experimento in silico (ou seja, realizado utilizando programas  e 
simulações computacionais); 

� realização do “experimento” com objetivo de formar complexos; 
� avaliação dos resultados obtidos no experimento. 


INTRODUÇÃO 18

Para a parte de planejamento, necessita-se primeiro buscar quais as 

moléculas serão estudadas, informações disponíveis sobre as mesmas (por 

exemplo, dados de cinética enzimática, se for o caso de enzimas, dados de 

bioquímica, etc.). A escolha também depende da disponibilidade de dados 

cristalográficos das moléculas envolvidas. No caso dos receptores biológicos, a 

consulta será realizada no PDB. Para moléculas orgânicas, o desejável é que se 

disponha das estruturas cristalográficas das moléculas, ou, se não for possível, 

obtidas por modelagem molecular. Depois da escolha das moléculas, procura-se o 

sítio de ligação a ser estudado, que será o centro de uma esfera de raio R, em 

torno do qual os programas computacionais realizam sua busca. Terceiro, 

adicionar hidrogênios às moléculas a serem estudadas.

Depois se utiliza um programa computacional que será uma ferramenta na 

realização de cálculos. Há basicamente três possibilidades metodológicas 

utilizadas pelos programas computacionais: o docking rígido, o docking 

semiflexível e o docking flexível. No primeiro caso, as duas moléculas são 

consideradas como corpos rígidos e o programa busca a melhor orientação de um 

corpo em relação a outro. No semiflexível, permite-se que o ligante possa variar 

seus ângulos torsionais. No último caso, permite-se que o receptor também sofra 

flexibilização parcial ou total.  Os programas computacionais variam também no 

que diz respeito à sua essência metodológica de tal forma que a busca de 

conformações pode ser feita utilizando métodos de mecânica molecular, métodos 

estocásticos e algoritmos genéticos ou outros. Outro fator que também varia de 

programa para programa é a chamada “função escore”  que determina a melhor 

orientação e/ou conformação das moléculas. A função escore pode estar baseada 

em métodos empíricos, campos de força ou potenciais variados. 

No docking rígido, o algoritmo de busca explora diferentes posições para o 

ligante no sítio ativo do receptor usando os graus de liberdade translacional e 

rotacional (Figura 1.13). O docking de ligantes flexíveis adicionalmente, explora os 

graus de liberdade torcionais do ligante nesse processo. Uma função escore deve  

ter uma qualidade de predição que forneça uma pontuação favorável à formação 

de complexos realísticos (essa qualidade será analisada mais adiante quando for 

tratado o redocking). Usualmente, a função escore avalia ambos, a 


INTRODUÇÃO 19

complementaridade estérica entre o ligante e o receptor e a sua 

complementaridade química (BROOIJMANS, KUNTZ, 2003).

Figura 1.13  O gráfico da energia em função da conformação mostra que a mínima 
energia também resulta no melhor resultado receptor-ligante em um caso de docking rígido.

Os primeiros procedimentos de docking começaram a acontecer logo depois 

do desenvolvimento dos programas gráficos moleculares, dado que eles 

permitiram aos pesquisadores manipular duas moléculas e encontrar diferentes 

conformações que pareciam complementares geométrica e quimicamente. Os 

programas de docking molecular permitiram a automação da busca e um modo 

mais objetivo de avaliar o ajuste entre duas moléculas. O número de modos que 

duas moléculas podem interagir é grande e para tornar a busca eficiente, o 

problema do docking molecular é simplificado e somente certos graus de liberdade 

são explorados. 

Os principais métodos estocásticos são Monte Carlo (MC) e Algoritmo 

Genético (GA). No primeiro é utilizado especificamente o método Metrópolis, onde 

o movimento aleatório do ligante no sistema é aceito ou rejeitado com base na 

probabilidade de Boltzmann. O segundo é baseado na teoria da evolução de 

Darwin e é uma poderosa ferramenta para a solução de problemas complexos. 

Essa técnica imita o processo de evolução manipulando uma coletânea de dados 

de estrutura chamados cromossomos. Cada uma dessa estruturas codifica uma 

possível solução isto é, uma possível orientação do ligante dentro do sítio da 

macromolécula ao problema do docking, e tem relacionado a si uma pontuação 

(escore). Boas soluções, ou “indivíduos” melhor encaixados com energia mais 

baixa, sofrerão mutação e recombinação para a geração de um novo grupo de 


INTRODUÇÃO 20

soluções. Este ciclo se repete até que a variação de energia entre diversas 

conformações esteja dentro de valor de corte (JONES et al.,1997).

Neste trabalho será utilizado o programa GOLD – Genetic Optimisation for 

Ligand Docking (JONES, WILLETT E GLEN, 1995, JONES et al., 1997) algoritmo 

genético desenvolvido para ligantes flexíveis. Na próxima seção, será feita uma 

breve descrição da idéia existente neste tipo de algoritmo. 

1.8 ALGORITMO GENÉTICO (GA) 

É um algoritmo estocástico utilizado para solucionar problemas de 

otimização. A estrutura básica de um GA está apresentada na forma de um 

fluxograma na Figura 1.14. Neste trabalho, a situação a ser otimizada é a modo de 

ligação entre algumas pequenas moléculas e o DNA 5'-CGCGAATTCGCG-3'. 

Figura 1.14   Fluxograma de um GA básico (MIRANDA, 2000). 

Os principais conceitos utilizados em GA são: a) gene, que representa cada 

parâmetro a ser explorado na otimização; b) cromossomo, também chamado de 

indivíduo, que é a cadeia de genes que representa uma solução possível para o 

problema e c) população, que é o conjunto de soluções no espaço de busca. 


INTRODUÇÃO 21

O processo de solução adotado nos algoritmos genéticos consiste em gerar 

um grande número de indivíduos de forma a promover uma varredura tão extensa 

quanto necessária do espaço de soluções. 

O procedimento básico de um GA consiste em inicializar uma população de n 

indivíduos aleatoriamente. Cada um dos indivíduos da população representa uma 

possível solução para o problema. Abaixo um exemplo de uma população com 3 

indivíduos, cada um representado por uma cadeia de 8 bits.

Posteriormente é calculada a aptidão de cada indivíduo conforme a função 

objetivo, que depende das especificações de problema. Neste trabalho, cada 

indivíduo representa uma conformação do ligante no sítio do DNA, cuja saída 

fornece uma pontuação (ou escore) do complexo formado o qual permite ao 

algoritmo genético o cálculo da aptidão do indivíduo. Ainda nesta fase os 

indivíduos são ordenados conforme a sua aptidão, isto é, maior pontuação. Nesta 

fase os indivíduos mais aptos da geração atual são selecionados. Esses indivíduos 

são utilizados para gerar uma nova população por cruzamento, onde cada 

indivíduo tem uma probabilidade de ser selecionado proporcional à sua aptidão. 

Como conseqüência, a seleção de indivíduos pode conter várias cópias de um 

mesmo indivíduo enquanto outros podem desaparecer, devido a sua probabilidade 

ser menor. Desta maneira, os mais aptos tem maior probabilidade de serem 

selecionados.

O cruzamento (crossover) é o processo de embaralhar aleatoriamente todos 

os indivíduos selecionados na etapa anterior, criando-se, desta forma, uma 

segunda lista, chamada lista de parceiros. Cada indivíduo selecionado é então 

cruzado com o indivíduo que ocupa a mesma posição na lista de parceiros. A 

forma como se realiza este cruzamento, é ilustrada na Figura 1.15. Os 

cromossomos de cada par de indivíduos a serem cruzados são particionados em 

um ponto, chamado ponto de corte, sorteado aleatoriamente.

Um novo cromossomo é gerado permutando-se a metade inicial de um 

cromossomo com a metade final do outro. 


INTRODUÇÃO 22

Figura 1. 15  Cruzamento do cromossomo 1 com o cromossomo 2. Um ponto de cruzamento representado por 
uma barra é escolhido aleatoriamente. Copia-se tudo o que vem antes de um dos pais e tudo o que vem depois do 
outro.

   A operação de mutação (Figura 1.16) consiste em alterar aleatoriamente o 

valor de um determinado gene para assegurar uma maior varredura do espaço de 

soluções e evitar que o algoritmo genético convirja muito cedo para mínimos 

locais.

Figura 1. 16 Exemplo de mutação

Há muita bibliografia sobre o tema já que este tipo de algoritmo tem sido 

empregado em vários tipos de aplicações. Uma descrição mais detalhada pode ser 

encontrada em Mitchell (1996). 

1.9 INTERAÇÕES COM DNA 

Recentes desenvolvimentos têm sido feitos no estudo de modelos da dupla 

hélice investigando-se principalmente o papel da seqüência de bases em sua 

flexibilidade (LANKAS et al., 2000). No entanto, a importância do papel do DNA na 

vida celular só pode ser considerado quanto à sua interação com outras 

moléculas. Dentre as interações que poderiam ser citadas, destacam-se: 

� complexos com proteínas que se ligam especificamente a diferentes partes da seqüência do DNA 
para realizar importantes tarefas biológicas, tais como, a repressão e ativação de genes, desenovelamento 
da hélice para cópia e replicação, entre outras; 
� as interações consigo próprio no processo de espiralamento; 
� complexos com RNA no processo de replicação (CALLADINE et al.,2004). 
� complexos com pequenas moléculas orgânicas ou inorgânicas. 


INTRODUÇÃO 23

Neste trabalho foi dada ênfase ao último tipo de interação, sendo que a 

compreensão de como elas ocorrem pode fornecer subsídios que permitam 

trabalhar com estas moléculas para atuarem como fármacos, seja com fins 

terapêuticos ou ainda para evitar a formação de complexos que danifiquem o DNA. 

Como exemplo da primeira aplicação pode ser citada a cisplatina empregada no 

tratamento de câncer (VAN GARDEREN, VAN HOUTE, 1994), e como exemplo da 

segunda a bleomecina (ZHAO et al., 2002), um antibiótico que quando utilizado 

indiscriminadamente pode causar câncer. As informações obtidas a partir da 

visualização gráfica das várias estruturas de DNA-ligante depositadas no PDB 

permitem verificar que as estruturas tridimensionais do DNA e do ligante têm 

grande influência na formação do complexo.

O estudo e design de moléculas que possam reconhecer seqüências 

específicas é fundamental para o reconhecimento molecular, bem como para o 

desenvolvimento de novas terapias e reagentes para a biotecnologia.  Parece que 

o desenvolvimento de novos fármacos pode ser promissor utilizando ácidos 

nucléicos como possíveis alvos (MUNDE et al., 2007). 

As pequenas moléculas que se ligam ao DNA ocupam papel central na 

farmacologia e bioquímica devido ao papel-chave que ocupam nos processos de 

replicação, transcrição, recombinação e mutagênese. A habilidade de pequenas 

moléculas interferirem nas funções do DNA as tornam um alvo para interação com 

fármacos. No caso de ligantes aromáticos que se ligam ao DNA, pode ocorrer 

intercalação por sua interação tipo empilhamento (stack) que interfere na interação 

do DNA com proteínas, ou o ligante pode entrar no sulco menor, podendo causar 

pequenas distorções no DNA pela acomodação que as duas moléculas sofrem ao 

formar o complexo. (BERA et al. 2008). 

Os ligantes que se ligam de modo não-covalente ao DNA no sulco menor tem 

demonstrado larga atividade contra câncer, antivírus, antiprotozoária e contra 

infecções (EVANS, NEIDLE, 2006, CAMPBELL et al., 2006).

Estruturas cristalinas de um grande número de complexos de DNA com 

possíveis fármacos, foram determinadas (ver o resultado do levantamento nas 

Tabelas 3.1 e 3.2). Isto constitui uma fonte signiticativa de dados para o 


INTRODUÇÃO 24

desenvolvimento, analise e compreensão de mecanismos de reação de fármacos, 

mecanismos de interação dependentes de formas e seqüências de DNA, tendo 

como alvo moléculas de DNA (EVANS, NEIDLE, 2006). 

As forças intermoleculares são as principais responsáveis pela forma 

tridimensional das macromoléculas e também por sua interação com outras 

moléculas, sendo que as principais são: interações eletrostáticas, interações 

dipolares, ligações de hidrogênio, interações hidrofóbicas e interações de van der 

Waals. Essas interações ocorrem quando as moléculas se organizam como 

moléculas individuais e também quando se associam a outras formando 

complexos. O estudo destas interações permite que se analise os complexos 

virtuais formados através de simulações computacionais de docking. (ERMONDI, 

CARON, 2006).

O Programa GOLD, utilizado neste trabalho para a realização dos cálculos de 

docking, tem uma função escore que envolve as energias decorrentes das ligações 

de hidrogênio e as interações de van der Waals, que normalmente tem um peso 

maior na energia de ligação da formação dos complexos. 

Na Tabela 1.3 são apresentadas as forças intermoleculares utilizadas na 

função escore do programa GOLD. Esta tabela foi adaptada do trabalho de 

Ermondi e Caron, 2006. 

Tabela 1. 3  Resumo das interações consideradas na função escore do Programa GOLD 
(adaptada de Ermondi e Caron, 2006) 

Categoria Ordem de energia dos valores totais  

l igações de hidrogênio                                                 Ocorre entre um átomo eletronegat ivo (A – aceptor)  
e um átomo de hidrogênio ligado a um átomo  
relativamente eletronegativo (D – doador).  

Energias: 4 a 60 kJ/mol. 

interações de van der Waals Energias:  50 a 500 kJ/mol. 

As pequenas moléculas podem ligar-se ao DNA por dois modos principais: 

ligação nos sulcos (maior ou menor) ou por intercalação, com uma deformação e 

alargamento do DNA. (Figura 1.17).  


INTRODUÇÃO 25

Figura 1. 17 (a) Benzimidazol ligado ao DNA no sulco menor (código PDB:1vzk). (b) Antraciclina ligada ao DNA por 
intercalação (código PDB: 1nab). Observa-se uma deformidade das bases. (c) A enzima recombinase atuando no sulco 
maior do DNA (código PDB: 1jkq).

Pode-se observar experimentalmente que a ligação de moléculas nos sulcos 

perturba pouco a estrutura do DNA, porém uma ligação por intercalação deve 

distanciar as bases adjacentes tornando o DNA mais alargado. (CHAIRES, 2006). 

1.10 COMPOSTOS DE CRÔMIO 

Muitos metais desempenham papéis biológicos fundamentais. Os canais de 

potássio, por exemplo, fazem parte da atividade dos nervos e contração muscular. 

Já, outros metais auxiliam alguma função do organismo, mas não são 

considerados essenciais. Exemplos são o Cr(III) que auxilia no metabolismo da 

insulina e o ouro, que é utilizado no tratamento de artrite reumatóide e nas 

pesquisas de ponta como as da área da nanobiotecnologia,  desenvolvida pelo 

grupo do Prof. Edward Tiekink, University of Texas, San Antonio, Texas (SARMA 

et al. 2007, BROWN et al.,  2007, M.,  LI et al., 2007). 

Uma característica dos metais de transição é a sua capacidade de mudar de 

estado de oxidação. Se por um lado essa propriedade é benéfica, como no caso 

do transporte de oxigênio (Fe (III) 	  Fe(II)) , a transferência de elétrons feita por 

enzimas ligadas ao íon, por outro, pode causar sérios danos à saúde. É o caso do 

íon de crômio (VI), que ao mudar seu estado de oxidação no interior da célula 

pode causar a clivagem do DNA (FERREIRA, 2002). No estado de oxidação (III), 

no entanto, o crômio pode auxiliar no metabolismo de ação da insulina. Em 1959, 

ratos com necrose do fígado e intolerância à insulina foram tratados com sucesso 

com GTF (Glucose Tolerance Factor), uma molécula com estrutura tridimensional 


INTRODUÇÃO 26

ainda indefinida, mas que continha o íon crômio (III). Atualmente Crômio(III) 

tris(picolinato) ou Cr(pic)3, é utilizado como suplemento nutricional, porém, em 

elevadas concentrações foi demonstrado recentemente que pode quebrar o DNA 

(SPEETJENS et al. 1999a).

No entanto, compostos de Cr(III) também podem causar câncer, mas o 

mecanismo com que isso ocorre é totalmente diferente dos compostos de Cr(VI). 

Sua interação com o DNA, a qual é muito mais dependente da molécula orgânica 

que acompanha o íon, do que do próprio íon, é responsável por impedir a atuação 

de enzimas iniciando um processo carcinogênico (VAIDYANATHAN et al., 2005).


METODOLOGIA     27

2 METODOLOGIA 

Neste trabalho foram feitas simulações computacionais nas quais o receptor 

estudado foi uma molécula de DNA 5'-CGCGAATTCGCG-3', e os ligantes foram 

pequenas moléculas, uma vez que a habilidade de pequenas moléculas interferirem 

na transcrição e replicação do DNA faz com que sejam um alvo importante para o 

estudo da interação de fármacos. O método de simulação foi o docking molecular, 

utilizando o programa GOLD, cuja estratégia está baseada em algoritmos genéticos. 

Um diagrama do fluxo de trabalho está apresentado na Figura 2.1. 

Figura 2. 1 Fluxograma de trabalho 

2.1. RECEPTOR 

2.1.1. Busca nos Bancos de dados de informações estruturais do DNA 

Para escolher a molécula de trabalho, foi feita uma busca no banco de dados 

NDB, e como o banco está conectado ao PDB e PDBSum, a informação da 


METODOLOGIA     28

estrutura cristalográfica é imediata.  A tela de acesso ao NDB, com os parâmetros 

adotados para a busca está representada na Figura 2.2. Observar que as buscas 

foram feitas no sentido de encontrar complexos DNA-pequenas moléculas.  

Figura 2.2 Tela de Entrada do algoritmo de busca do NDB, com os parâmetros adotados. 

2.1.2. Levantamento dos complexos de DNA-ligante 

O PDB contém 2601 estruturas contendo DNA, obtidas por difração de raio X 

ou Ressonância Magnética Nuclear (NMR). As moléculas de DNA aparecem 

isoladas, complexadas com proteínas, RNA, moléculas orgânicas ou íons metálicos. 

Podem ainda ser encontradas nas mais diversas seqüências de pares de bases, 

bem como em fita simples ou dupla hélice e ainda em outras formas. 


METODOLOGIA     29

Para os propósitos desse trabalho, foram inicialmente selecionados utilizando 

algoritmo de busca do NDB, todas as estruturas de B-DNA com ligantes sem 

proteínas e sem RNA e obtidas por difração de raio X. Obteve-se inicialmente 179 

estruturas. Dessas, foram selecionadas aquelas cuja seqüência era 

CGCGAATTCGCG. Posteriormente as estruturas que continham somente íons 

interagindo com a seqüência foram descartadas, pois não se adequavam aos 

propósitos do trabalho.  Assim foram analisadas as 25 estruturas que estão 

descritas na Tabela 3.1 e seus respectivos ligantes na Tabela 3.2, do Capítulo 3 de 

Resultados e Discussão. 

2.1.3. Seleção e Análise do DNA

Para fazer a escolha das moléculas a serem utilizadas nos cálculos, foram 

utilizados programas de visualização gráfica, que permitiram fazer uma inspeção na 

estrutura cristalográfica do complexo. Os programas de visualização gráfica 

utilizados estão na Seção 2.4.  

2.1.4. Seleção de sítios para o cálculo de docking 

A partir da visualização gráfica e medidas dos parâmetros envolvidos nas 

interações, distâncias e ângulos, foram estabelecidos os possíveis sítios para o 

docking. Em cada caso, foi selecionado um centro (em torno do qual se determina 

um raio R) para o docking. Todos os átomos dentro da esfera de raio R foram 

considerados.  

2.1.5. Adição de Hidrogênios 

Para realizar os cálculos é necessário obter as coordenadas cristalográficas 

do PDB (formato pdb) e adicionar hidrogênios, já que as estruturas estão 

depositadas sem eles. Para realizar esta tarefa, o programa tem que ter 

parametrizados todos os tipos de átomos. O programa utilizado para realizar a 

adição de hidrogênios, foi o Vega (PEDRETTI, VILLA, VISTOLI, 2002, 2003, 2004).   


METODOLOGIA     30

O formato mol2, além das coordenadas x, y e z das moléculas, também 

informa a hibridização do átomo, pode apresentar ou não as cargas parciais, a 

conectividade e o tipo de ligação. O programa GOLD aceita as duas possibilidades 

de formatos: pdb e mol2, mas por uma questão de conveniência, todas as moléculas 

foram salvas em formato mol2 (arquivo de entrada) e foram obtidas nesse formato 

nos arquivos de saída do programa GOLD. 

O programa GOLD aceita duas possibilidades de formatos: pdb e mol2 

(TRIPOS); tanto os receptores utilizados no trabalho R-1vzk e R-2b3e (nomes 

derivados dos complexos obtidos do PDB, 1vzk e 2b3e), quanto os ligantes foram 

formatados no formato mol2 ao construir os arquivos input do programa GOLD. 

Um exemplo do arquivo em formato mol2: 


METODOLOGIA     31

Na seção “@<TRIPOS>ATOM”, seção da estrutura 3D, além das informações 

de número, nome e coordenadas x, y e z dos átomos nas cinco primeiras colunas, 

esse tipo de arquivo também contém, na sexta coluna, a hibridização dos átomos. 

Por exemplo, C.2 significa carbono sp2, N.ar, significa nitrogênio que faz parte de um 

anel aromático. As últimas 3 colunas referem-se ao número de fragmento (resíduo 

ou base nitrogenada no caso de proteínas e ácidos nucléicos, respectivamente), a 

última coluna é a das cargas parciais de cada átomo, neste exemplo nulas. Na 

seção “@<TRIPOS>BOND” são fornecidas as ordens de ligação entre os átomos, 

no exemplo: simples, 1, ou dupla, 2, também existem opções para tripla, 3, ou 

aromática, ar.   

2.2. LIGANTES 

Os ligantes estudados foram obtidos do PDB, CSD ou modelados quando a 

estrutura cristalográfica não estava disponível. 

2.2.1. Ligante 1 

 A estrutura do ligante 1, de nome 2-(5-{4-[amino (imino)metil]fenil}-2-tienil)-

1h-benzimidazol-6-carboximida, foi obtida do complexo cristalográfico 1vzk 

(MALLENA et al., 2004).  Esta molécula também foi estudada como ligante no 

trabalho de Campbell et al. (2006), com o código DB818 (Figura 2.3).  

Figura 2.3 Ligante 1 – DB818 - com a numeração dos átomos utilizada neste trabalho. 


METODOLOGIA     32

Este ligante foi extensamente estudado neste trabalho, desde a etapa inicial 

de estudo complexo cristalográfico de partida, até nas etapas de validação e 

otimização das opções de cálculo utilizadas posteriormente com os outros ligantes.  

2.2.2. Ligante 2 

O ligante 2 é um composto de crômio de fórmula geral C25H26ClCrN2O9, cujo 

nome é [Cr(1,2-bis(naftilidenoamino)etano)(H2O)2]. A estrutura desde ligante foi 

obtida do CSD, onde está depositada com o código DAZJOE e está apresentada na 

Figura 2.4. A molécula também foi estudada no trabalho de Vaidyanathan et al. 

(2005).    

A escolha desse composto deu-se pelo fato de que, apesar dos compostos de 

Cr(III) serem considerados não carcinogênicos, este pode danificar o DNA fazendo 

com que a célula exiba atividade tipo nuclease que é evidência de que enzimas 

reparadoras de DNA estão sendo ativadas (VAIDYANATHAN et al., 2005). 

A molécula DAZJOE é uma base de Schiff, mesma característica de uma 

série de fármacos largamente utilizados no tratamento de tumores, sendo que sua 

eficácia aumenta quando complexados com metais (VAIDYANATHAN et al., 2005). 

Figura 2.4 Ligante 2 - DAZJOE - com a numeração dos átomos utilizada neste trabalho 

 
METODOLOGIA     33

2.2.3.  Ligante 3 

O ligante 3 é o composto de crômio [Cr(2,3-bis{[(2-hidroxi-4-dietilamino) (fenil) 

(metileno)]amino}2-butenodinitrila) (H2O)2], (CR3CN). Esta molécula aparece citada 

no artigo de Vijayalakshmi et al. (2000). Como não se contava com uma estrutura 

cristalográfica deste ligante, ele foi modelado a partir de DAZJOE. A geometria de 

CR3CN foi otimizada utilizando o método semi-empírico PM6, implementado no 

programa MOPAC2007 (Stewart, 2007). A estrutura deste ligante está apresentada 

na Figura 2.5. 

Figura 2.5 Ligante 3 - CR3NC - com a numeração dos átomos utilizada neste trabalho. 

2.2.4. Adição de Hidrogênios

ligante 1: DB818 - Os hidrogênios foram adicionados utilizando o programa Vega  
 
ligante 2: DAZJOE – A molécula foi obtida do CSD com  os hidrogênios. 
 
ligante 3: CR3NC – Os hidrogênios foram adicionados durante a modelagem. 

  
METODOLOGIA     34

2.3. DOCKING MOLECULAR 

2.3.1. O que é docking?

O docking molecular é um método que permite estudar como duas estruturas 

tridimensionais se ajustam uma à outra, da melhor forma possível. Este método tem 

sido muito utilizado para estudar como algumas moléculas podem inibir enzimas e 

planejar fármacos. A mesma idéia tem sido aplicada ao estudo de DNA.  

No docking o que se pretende é a formação de um complexo teórico, partindo 

de duas estruturas tridimensionais obtidas independentemente (Seção 1.7). Em 

geral, denomina-se a molécula maior receptor e a menor de ligante. Mas, 

ultimamente também tem sido um método utilizado para estudar como 

macromoléculas  interagem entre si. 

Aqui o receptor será uma molécula de DNA (obtida do PDB) e o ligante será 

uma molécula pequena que pode ser obtida por cristalografia (CSD) e/ou 

modelagem molecular. 

Um esquema mostrando a idéia do docking molecular está apresentada na 

Figura 2.6. 

Figura 2.6 Docking: a formação de um complexo tridimensional teórico partindo de duas estruturas tridimensionais

Na Figura 2.6, observa-se que há um algoritmo de docking. Na realidade, no 

inicio dos estudos de docking, tratava-se de um método manual utilizando os 


METODOLOGIA     35

programas gráficos de visualização molecular. No caso deste trabalho, o programa 

GOLD, descrito na Seção 2.3.4, foi utilizado para criar os complexos virtuais que 

foram analisados posteriormente em tela gráfica.  

2.3.2. Redocking ou validação 

Normalmente, quando o trabalho de docking tem inicio, é necessário verificar 

se todas as escolhas feitas (a macromolécula, o estado da macromolécula, o sítio de 

ligação, o raio R utilizado nos cálculos para construir a esfera que inclui todos os 

átomos, parâmetros utilizados no programa de cálculos de docking) são adequadas. 

Para tal, escolhe-se (quando possível) uma macromolécula do PDB que pertence a 

um complexo do tipo que se pretende formar. No caso do trabalho presente, a 

estrutura selecionada foi 1vzk, um complexo DNA-ligante. A molécula foi obtida do 

PDB. Como primeiro passo transforma-se o complexo cristalográfico (PDB) em duas 

moléculas isoladas, e tenta-se reconstruir o complexo inicial. Um esquema 

mostrando os passos do redocking está apresentado na Figura 2.7. 

Figura 2.7 Redocking. Inicia-se com um complexo cristalográfico. Com as estruturas tridimensionais das moléculas isoladas, 
reconstrói-se o complexo virtual e procede-se à comparação com o complexo cristalográfico. 

 
Depois de obtido o complexo virtual faz-se comparações com a molécula 

cristalográfica inicial. Se os resultados são compatíveis, pode-se considerar que a 

metodologia está validada. Caso contrário, são necessárias modificações, como, por 

exemplo, modificar parâmetros utilizados no programa, escolher outro centro do sítio 

receptor. As modificações são feitas, os cálculos de docking refeitos, até que se 


METODOLOGIA     36

obtenha um resultado compatível com o complexo original. Isto significa então que a 

metodologia utilizada está validada e pode-se iniciar os estudos de docking com a 

molécula receptora e os ligantes que se deseja.  

2.3.3. Cross-docking

No experimento de cross-docking, toma-se o complexo A (receptor A – ligante 

A) e o complexo B (receptor B – Ligante B) e separam-se receptores de ligantes 

(Figura 2.8). Neste caso, os receptores devem ser a mesma molécula, mas podem 

apresentar diferente estado conformacional, uma vez que no complexo 

cristalográfico formado, o receptor pode sofrer mudanças para acomodar um ligante 

determinado. Toma-se, por exemplo, o ligante A e realiza-se o experimento de 

docking utilizando o receptor B. Experimentos como esse permitem analisar se 

determinadas características do receptor e/ou ligante o tornam especifico ou não.  

Figura 2.8 Cross-docking 

2.3.4. O Método Computacional

Os estudos de docking foram realizados utilizando GOLD 3.1.1 (Genetic 

Optimization for Ligand Docking) (JONES, WILLETT, GLEN,1995, JONES et al., 


METODOLOGIA     37

1997).  O programa GOLD utiliza um algoritmo genético (Seção 1.8) na busca de 

uma população de possíveis soluções utilizando operadores genéticos (mutações, 

crossovers e migrações) para obter uma população final, trabalhando com a 

otimização de uma função Fitness pré-definida, o GoldScore ou o ChemScore. O 

uso desta função Fitness permite que o docking seja realizado com flexibilização dos 

ligantes e das hidroxilas da macromolécula. Desta forma, o programa GOLD opera 

com um método de ajuste do ligante ao sítio, considerando os aspectos 

conformacional e de energia do ligante e da macromolécula. A função pré-definida 

compreende quatro componentes (JONES, WILLETT, GLEN,1995, JONES et al., 

1997, VERDONK et al., 2003): 

(a) energia de ligação de hidrogênio do complexo receptor-ligante; 
(b) energia de ligação de van der Waals; 
(c) energia de ligação de hidrogênio intramolecular do ligante; 
(d) energia de van der Waals interna do ligante 

O programa realiza uma seleção interna dos resultados do docking com base 

na função Fitness e no escore escolhido (GoldScore ou ChemScore). Os cálculos de 

docking em geral estão planejados para obter 10 saídas em cada etapa de cálculo. 

Porém pode ser alterado para obtenção de mais ou menos saídas. Quando fornece 

menos saídas que o solicitado, é porque o valor de RMSD – o desvio médio 

quadrático, do inglês root mean square deviation, entre os ligantes é muito pequeno, 

de forma que o programa considera que as saídas são iguais. 

 A função escore dentro do programa, opera como apresentado na Figura 2.9. 

A função escore adotada permite que o processo possa ser interrompido e 

modificado durante o docking. Se algum usuário quiser, também pode modificar a 

função escore, construindo novas versões de libfitfunc_dll.so (GOLD 

SCORING-FUNCTION A.P.I. DOCUMENTATION).  

 
METODOLOGIA     38

Figura 2.9 A função escore dentro do programa GOLD.

Os dois tipos de escore utilizados pelo programa GOLD são: 

(a) GoldScore, que é uma função escore baseada em campo de força e é 

constituída de quatro componentes:  

� S(hb_ext): energia de ligação de hidrogênio entre do complexo proteína-ligante;  

� S(vdw_ext)): energia de van der Waals entre proteína-ligante; 

� S(vdw_int): energia de van der Waals no ligante; 

� S(hb_int): energia de ligação de hidrogênio intramolecular do ligante.  

O escore vdw_ext é multiplicado por um fator de 1,375 quando o escore total 

é calculado. Isto é uma correção empírica para induzir a proteína-ligante ao contato 

hidrofóbico.  O resultado final é multiplicado por -1 para fornecer escores positivos, 

derivados de termos da energia potencial, dados em kcal/mol (ANNAMALA, 

INAMPUDI, GURUPRASAD, 2007) . 

Fitness = S(hb_ext) + 1.3750*S(vdw_ext) + S(hb_int) + S(vdw_int)  

Nos resultados desse trabalho as pontuações S(hb_int) + S(vdw_int) são 

somadas e denominadas S(int) nas tabelas apresentadas no Capitulo 3 de 

Resultados e Discussão. 

O campo de força (mecânica molecular) utilizado no programa GOLD é o 

Tripos 5.2 Force Field (CLARK, CRAMER, VAN OPDENBOSCH,1989). 

(1)


METODOLOGIA     39

(b) ChemScore, que é uma função empírica para estimar a energia livre de 

ligação do ligante à proteína. Usa termos de contato simples para estimar as 

contribuições lipofílicas e contribuições metal-ligante, incluindo interações de 

hidrogênio. Esse escore não faz diferenciação entre os diversos tipos de ligações de 

hidrogênio e a natureza geométrica da interação e ainda adiciona uma penalidade 

quando os contatos são muito próximos. ChemScore estima a variação da energia 

livre que ocorre no ligante quando forma o complexo com a macromolécula, 

conforme observado na equação abaixo: 

         �G binding = �G o+ �G hbond + �G metal + �G lipo + �G rot …..                   (2)

onde cada componente dessa equação é o produto de um termo dependente da 

magnitude de uma contribuição física P para a energia livre (por exemplo, ligação de 

hidrogênio) e um fator de escala determinado por regressão. Por exemplo, �Ghbond = 


� Phbond, sendo � o fator de escala e Phbond o parâmetro físico. O escore final 

(Equação 3) é obtido considerando também como penalidades os parâmetros de 

choques (clash) e torções internos, que não favorecem os contatos para o docking. 

Parâmetros para ligações covalentes também podem ser considerados. 

   ChemScore = �G binding + Pclash + Cinternal Pinternal + (CcovalentPcovalent + Pconstraint)             (3) 

Neste trabalho, foi utilizado apenas o GoldScore. 

2.4. VISUALIZAÇÃO GRÁFICA 

Utiliza-se a visualização gráfica em cada passo do trabalho. Na escolha do 

receptor, na análise das estruturas cristalográficas envolvidas no trabalho 

(complexos, receptores e ligantes), na escolha do sítio receptor e na análise dos 

resultados dos cálculos de docking. 

A parte inicial de visualização permitirá que se tome decisões importantes e 

podem definir ou não o sucesso do experimento in silico. Para isso é necessário 

acostumar-se com os programas gráficos, quais as suas possibilidades e 

ferramentas. Essa parte inicial pode tomar até cerca de 30% do tempo do projeto 

como um todo. Normalmente seleciona-se qual a molécula será tomada como 


METODOLOGIA     40

receptor a partir do uso dos bancos de dados (PDB, PDBSum, CSD, NDB, entre 

outros) descritos na seção 1.6. 

Quando já se tomaram decisões acerca do receptor, e dos ligantes, inicia-se 

o experimento de docking. O primeiro passo, redocking, tem que ter seus resultados 

cuidadosamente analisados. Quando o redocking permite determinar a validade dos 

procedimentos e escolhas realizados, passa-se a fazer o chamado “virtual 

screening”, onde são analisados mais ligantes com o receptor validado no 

redocking. 

Os programas de docking geram muitas saídas. Cabe ao pesquisador através 

da investigação visual, determinar a validade ou não dos resultados. Em geral, o 

primeiro passo é o de verificar quantas saídas de um mesmo cálculo são iguais ou 

diferentes quanto à sua orientação e/ou conformação, separar em grupos por 

similaridades de orientação, analisar as interações receptor-ligante, verificar quais 

são as interações, se são desejáveis ou não. A partir disso cabe ao pesquisador 

decidir qual será a orientação escolhida. Esta parte do trabalho toma cerca de 60% 

do tempo como um todo.  

Os programas gráficos são muitos, alguns são específicos para 

macromoléculas (proteínas, DNA) outros para moléculas pequenas e outros servem 

a ambos. Cada um dispõe de ferramentas específicas, mas todos permitem a 

visualização gráfica em diversas formas, movimentar a molécula (rotação, 

translação, zoom), alguns permitem modificar ligações (quebrar, ligar), tomar 

medidas de distâncias e ângulos, determinar os átomos envolvidos nas diferentes 

ligações e interações, medir os parâmetros das ligações de hidrogênio, bem como 

calcular as coordenadas dos centróides dos anéis aromáticos e cálculos de RMSD. 

Alguns deles também permitem salvar as figuras de moléculas apresentadas neste 

trabalho. 

Os programas gráficos utilizados para sistema Windows, todos tipo software 

livre, foram: 

programa “O” (JONES E KJELDGAARD, JONES, 1982); 

DS VISUALIZER™; 


METODOLOGIA     41

VEGA ZZ 2.1.0 (PEDRETTI, VILLA, VISTOLI, 2002, 2003, 2004); 

MERCURY CSD 1.4.2 - Department of Chemistry of Cambridge University; 

Qmol  (GANS, SHALLOWAY, 2001). 

2.5. EXPERIMENTO IN SILICO � DADOS EXPERIMENTAIS 

Na realidade, um trabalho totalmente teórico é possível, mas não teria sentido 

se não pudesse ser comparado com dados experimentais. Em alguns casos é 

possível que seja feita associação entre grupo de pesquisa teórico – grupo de 

pesquisa experimental, mas isso nem sempre é possível, ou o que se pretende.  

Na indústria de fármacos, a parte experimental pode ser abreviada pelo 

trabalho teórico.  

Hoje, com o Portal de Periódicos da CAPES, e acesso a informações das 

mais diversas fontes e áreas, pode-se comparar, confrontar os resultados teóricos 

com os experimentais, permitindo que se valide totalmente o experimento in silico, e 

fazendo com que se torne um modelo para planejamento de futuros experimentos in 

silico, in vitro, in vivo. 

 
RESULTADOS e DISCUSSÃO 42   

3 RESULTADOS e DISCUSSÃO  

3.1. LEVANTAMENTO NO PDB DAS ESTRUTURAS TRIDIMENSIONAIS DE 
DNA 5'-CGCGAATTCGCG-3' COMPLEXADAS COM MOLÉCULAS 
PEQUENAS

A Tabela 3.1 contém informações a respeito de 25 estruturas de DNA 5'-

CGCGAATTCGCG-3' complexadas com moléculas pequenas. Nesta tabela são 

apresentados o código pdb de cada complexo B-DNA-ligante, o nome do ligante, 

uma figura mostrando o complexo (PDBSum), comentários acerca do dado 

experimental obtido e a respectiva referência sobre a estrutura tridimensional.  

Em destaque na Tabela 3.1, estão as figuras dos complexos que mostram as 

orientações dos ligantes em relação ao DNA. São 25 estruturas tridimensionais de 

complexos DNA-moléculas pequenas, e todos se ligam no sulco menor, com uma 

exceção, de código pdb 2dyw. Todos os complexos são formados por ligações não-

covalentes.  

Na Tabela 3.2 são apresentados os ligantes relacionados às 25 estruturas 

dos complexos de DNA 5'-CGCGAATTCGCG-3' contidos na Tabela 3.1. 


RESULTADOS e DISCUSSÃO 43   

Tabela 3. 1  Levantamento de complexos de DNA CGCGAATTCGCG e pequenos ligantes  
109d Número de anéis: 6 (sendo 3 

aromáticos) 
Comprimento: 18,65 Å 
Bases em contato com o ligante: 
A18 T19 T20 C21 – A5 A6 T7 T8 
C9
(WOOD et al., 1995) 

1fms Número de anéis: 5, sendo 1 
aromático 
Comprimento: 22,97 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A18 T19 
T20 C21 
(SIMPSON et al., 2000) 

127d Número de anéis: 6 (sendo 3 
aromáticos) 
Comprimento: 19,05 Å 
Bases em contato com o ligante : 
A18 T19 T20 C21 – A6 T7 T8 
(SRIRAM et al., 1992) 

1ftd Número de anéis: 6, sendo 4 
aromáticos 
Comprimento: 25,14 Å 
Bases em contato com o 
ligante: A5 A6 T7 T8 C9 G10 – 
G16 A17 A18 T19 T20 C21 G22
(MANN et al., 2001) 

166d Número de anéis: 2 aromáticos
Comprimento: 18,98 Å 
Bases em contato com o ligante: 
A18 T19 T20 C21 – A5 A6 T7 T8 
C9
(NUNN et al., 1994) 

1ley Número de anéis: aromáticos
Comprimento:  19,75 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A17 A18 
T19 T20 C21 
(GOODSELL et al., 1995) 

1d30 Número de anéis: 3 , sendo 2 
aromáticos 
Comprimento:  13,12 Å 
Bases em contato com o ligante: 
A17 A18 T19 T20 C21 – A6 T7 
T8 C9 
(LARSEN et al., 1989) 

1m6f Número de anéis: 2 aromáticos
Comprimento:  18,68 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A18 T19 
T20 C21 G22 
(NGUYEN et al., 2002) 

1d64 Número de anéis: 2 aromáticos
Comprimento: 18,20 Å 
Bases em contato com o ligante: 
A17 A18 T19 T20 C21 – A5 A6 
T7 T8 C9 
(EDWARDS et al., 1992) 

1prp Número de anéis: 2 anéis 
aromáticos 
Comprimento: 16,97 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A17 A18 
T19 T20 C21 
(NGUYEN et al., 2002) 

1d86 Número de anéis: 2 anéis de 5 
átomos. 
Comprimento: 18,79 Å 
Bases em contato com o ligante: 
G4 A5 A6 T7 T8 C9 – A17 A18 
T19 T20 C21G22. 
(SRIRAM et al., 1992) 

1vzk Número de anéis: 4, sendo 2 
aromáticos 
Comprimento: 16,83 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A17 A18 
T19 T20 C21 
(MALLENA et al., 2004) 

1zpi Número de anéis: 5 aromáticos
Comprimento: 21,64 Å 
Bases em contato com o ligante: 
G4 C5 A6 T7 T8 C9 – A18 T19 
T20 C21 G22 
(ADAMS et al., 2005) 

2dyw Número de anéis: nenhum
Comprimento:  40,17 Å  
Bases em contato com o 
ligante: C1 G2 C3 G4 A5 A6  
(KOMEDA et al., 2006) 


RESULTADOS e DISCUSSÃO 44   

227d Número de anéis: 3, sendo 2 
aromáticos 
Comprimento: 14,71 Å 
Bases em contato com o ligante: 
A6 T7 T8 C9 – A18 T19 T20 C21 
(LAUGHTON et al., 1996) 

302d Número de anéis: 6, sendo 3 
aromáticos 
Comprimento: 19,22 Å 
Bases em contato com o 
ligante: A5 A6 T7 T8 C9 – A18 
T19 T20 C21 
(CLARK et al., 1996) 

289d Número de anéis: 3, sendo 2 
aromáticos. 
Comprimento: 19,12 Å 
Bases em contato com o ligante: 
A6 T7 T8 C9 G10 – A18 T19 T20 
(TRENT et al., 1996) 

311d Número de anéis: 5, sendo 3 
aromáticos 
Comprimento: 18,66 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 G10 – A17 
A18 T19 T20 C21 
(CLARK et al., 1997) 

298d Número de anéis: 3, sendo 2 
aromáticos. 
Comprimento: 18,25 Å 
Bases em contato com o ligante: 
A6 T7 T8 C9 – A17 A18 T19 T20 
C21
(TRENT et al., 1996) 

328d Número de anéis: 5 anéis 
aromáticos 
Comprimento: 20,85 Å 
Bases em contato com o 
ligante: A5 A6 T7 T8 C9 – A17 
A18 T19 T20 C21 
(SQUIRE et al., 1997) 

2b3e Número de anéis: 6, sendo 2 
aromáticos. 
Comprimento:  19,45 Å 
Bases em contato com o ligante: 
T7 T8 C9 – A17 A18 T19 T20 
C21
(CAMPBELL et al., 2006) 

360d Número de anéis: 3, sendo 2 
aromáticos 
Comprimento: 19,23 Å 
Bases em contato com o 
ligante: A6 T7 T8 C9 – A17 A18 
T19 T20 C21 
(GUERRI et al., 1998) 

2dbe Número de anéis: 2 aromáticos
Bases em contato com o ligante: 
A6 T7 T8 C9 – A18 T19 T20 
(BROWN et al., 1990) 

442D Número de anéis: 6, sendo 4 
aromáticos 
Comprimento:  20,64 Å 
Bases em contato com o 
ligante: A5 A6 T7 T8 C9 – A18 
T19 T20 C21 G22 
(SQUIRE et al., 2000) 

8bna Número de anéis: 6, sendo 3 
aromáticos 
Comprimento:  20,12 Å 
Bases em contato com o ligante: 
G4 A5 A6 T7 T8 C9 – A17 A18 
T19 T20 C21 
(PJURA et al., 1987) 


RESULTADOS e DISCUSSÃO 45   

Tabela 3. 2 Ligantes dos complexos DNA-pequenas moléculas apresentados na Tabela 3.1 

109d 127d 

166d 1d30

1d64
1d86

1fms 1ftd

1ley
1m6f

1prp
1vzk

1zpi 227d 


RESULTADOS e DISCUSSÃO 46   

Tabela 3.2 (continuação)

289d 298d 

2b3e 2dbe

2dyw 302d 

311d 
328d 

360d 
442d 

8bna


RESULTADOS e DISCUSSÃO 47   

As moléculas dos ligantes apresentados na Tabela 3.2 contêm principalmente 

átomos de C, N, O e H exceto os ligantes pertencentes às estruturas de código pdb 

1vzk e 2b3e com um átomo de S, a de 2dyw com 3 átomos de Pt e, finalmente, a  

442d com um átomo de I. 

Observando a geometria destas moléculas, percebem-se conformações 

similares, possivelmente por estarem acomodadas no sulco menor da mesma 

seqüência de DNA. A maior diferença é observada na molécula 2dyw, que é a única 

formada exclusivamente por uma cadeia alifática, enquanto que todas as outras 

moléculas apresentam pelo menos dois anéis não saturados. 

As estruturas escolhidas para serem estudadas foram 1vzk e 2b3e, já que 

ambas possuem S na estrutura dos ligantes e os compostos estudados contém 

crômio com coordenação similar à de S. Mais ainda, deve ser destacado que uma 

das moléculas de crômio possui uma forma geométrica similar às dos ligantes 

apresentados na Tabela 3.2 (DAZJOE) e a outra, uma forma diferente (CR3CN). 

A escolha de 1vzk, conforme foi observado no decorrer do trabalho permitiu a 

realização de estudos de docking tanto no sulco menor como no sulco maior. Um 

levantamento similar ao realizado neste trabalho, foi descrito no trabalho de Evans e 

Neidle (2006), em que analisam resultados de docking somente no sulco menor, 

testando outros programas computacionais (Dock e AutoDock) e analisaram 28 

complexos DNA-pequenas moléculas selecionados do PDB, verificando que  a 

estrutura duplex de DNA do complexo 1vzk foi a mais representativa do conjunto de 

28 receptores.

3.2. ANÁLISE DAS ESTRUTURAS CRISTALOGRÁFICAS DOS COMPLEXOS 
1vzk E 2b3e EXTRAÍDAS DO PDB 

As duas estruturas estudadas são complexos constituídos por B-DNA de duas 

cadeias d(C-G-C-G-A-A-T-T-C-G-C-G)2. Na Figura 3.1 observa-se o pareamento 

das bases desta seqüência, a mesma para 1vzk e 2b3e. 


RESULTADOS e DISCUSSÃO 48   

               Figura 3. 1 O dodecâmero d(C-G-C-G-A-A-T-T-C-G-C-G)2  das estruturas 1vzk e 2b3e.
                                            Os centros dos cálculos são mostrados com as setas indicativas. 

sítio AATTC 

sítio AATTC 

As representações das estruturas obtidas do PDB 1vzk e 2b3e são apresentadas na 

Figura 3.2. As duas foram obtidas por difração de raio X. A primeira foi selecionada 

com base no levantamento feito e descrito na Seção 3.1, e a outra para fins de 

comparação. A estrutura 1vkz (MALLENA et al., 2004) foi utilizada nos estudos de 

redocking e docking. A estrutura 2b3e (CAMPBELL et al., 2006) foi utilizada nos 

estudos de cross-docking. As duas estruturas cristalográficas apresentam inúmeras 

semelhanças.  Em ambos os casos os ligantes estão dentro do sulco menor junto à 

seqüência AATTC (no caso A17 até C21). A mesma seqüência aparece repetida na 

outra cadeia (A5 a C9), como mostrado na Figura 3.1.  A nomenclatura conferida 

aos compostos aparece no trabalho de Campbell et al. (2006).

                       Figura 3. 2 Estruturas tridimensionais 1vzk e 2b3e, com seus respectivos ligantes  
                                                    DB818 e DB819, dentro do sulco menor.


RESULTADOS e DISCUSSÃO 49   

Na Figura 3.3, observa-se o mesmo tipo de representação, mas observando-se o 

ligante a partir de uma perspectiva diferente.

rogênio entre o 

ligan R-1 e hidrogê

átomo do ligante DB818 átomo d or 1vzk dist (Å) 

N25 O2/C9 3,17 
N10 O2/T19 2,68 

Figura 3. 3 Estruturas tridimensionais 1vzk e 2b3e, e seus respectivos ligantes DB818 e DB819 dentro do sulco menor. 

Um ponto importante no que tange à formação do complexo é analisar as interações 

receptor-ligante. Na Figura 3.4 são apresentadas as ligações de hid

te DB818 e o receptor vzk. Há três ligações d nio:

o recept ância 
N22 O2/T20 2,93 

     Figura 3. 4  O ligante DB818 dentro do sulco menor do receptor 1vzk, mostrando as ligações de hidrogênio.


RESULTADOS e DISCUSSÃO 50   

Quando se faz a mesma análise para a estrutura cristalográfica 2b3e, obtém-se: 

átomo do ligante DB819 átomo do receptor 2b3e distância (Å) 
N22 O2/T20 2,89 
N10 O2/T19 2,83 

e a Figura 3.5 mostra o posicionamento do ligante DB819 dentro do sulco. 

  Figura 3. 5 O ligante DB819 dentro do sulco menor do receptor 2b3e, mostrando as ligações de hidrogênio.

 Finalmente, ao se comparar os ligantes DB818 (1vzk) e DB819 (2b3e) 

observa-se que o ligante DB819 apresenta dois imidazóis em lugar dos grupos 

amidino em DB818. (Figura 3.6). 

Figura 3. 6 Os ligantes DB818  e DB819.


RESULTADOS e DISCUSSÃO 51   

3.3. 3BESTUDOS DO MODO DE LIGAÇÃO NO SULCO MENOR DO DNA. 

Neste ponto se inicia o relato dos resultados obtidos a partir dos cálculos de 

docking realizados utilizando o programa GOLD, adotando a opção  GoldScore para 

a função Fitness. Em todos os passos seguiu-se os procedimentos de visualização 

gráfica para a tomada de decisões quanto à seleção da orientação e/ou 

conformação do ligante dentro do sítio receptor. 

3.3.1. 4BResultados do redocking de DB818 no sulco menor de R-1vzk 

Da análise das interações entre DB818 e DNA podem ser extraídas muitas 

informações úteis no processo de compreensão do modo de ligação dos compostos 

em estudo no DNA.  Como visto na Seção 3.2, o composto DB818 liga-se ao sulco 

menor do DNA fazendo interações com uma seqüência de pares de bases descrita 

como AATTC. Este sulco é um importante alvo para a atuação de enzimas de 

controle e transcrição do DNA e tem sido um alvo atrativo para o desenvolvimento 

de agentes sintéticos [EVANS, NEIDLE, 2006], na proposta de novas terapias 

[CHAIRES, 1998, MUNDE et al., 2007] e em estudos que visam no reconhecimento 

seletivo do DNA [MUNDE et al., 2007]. Como pode ser observado no levantamento 

realizado no PDB o sulco menor também é o principal alvo dos estudos 

cristalográficos disponíveis até esta data.  

Primeiramente foi feito o redocking (Seção 2.3.2), cálculos de docking nos 

quais o alvo do receptor e o ligante usado derivam de resultados experimentais, no 

nosso caso, o mesmo complexo cristalográfico.  A fundamental importância deste 

tipo de estudo é que eles permitem além dos estudos estruturais para a formação 

dos complexos e afinidade do ligante pelo sítio receptor, validar as opções de 

cálculo e a capacidade do programa usado de fornecer resultados realísticos e 

confiáveis.  Como foi visto, a partir do levantamento descrito na Seção 3.1, a 

estrutura cristalográfica selecionada foi a 1vzk. Como descrito na Seção 3.2, na 

análise das estruturas cristalográficas, o complexo cristalográfico 1vzk é constituído 

de uma molécula de DNA (a qual será chamada de R-1vzk), e o ligante do complexo 

que passará a ser designado como DB818.  


RESULTADOS e DISCUSSÃO 52   

Na linguagem usada, solução representa cada estrutura do ligante que o cálculo 

de docking ajustou no sítio receptor, um dos possíveis complexos modelados e 

selecionados pelo programa GOLD segundo o valor de escore calculado.  

Orientação representa a posição no sítio que agrupa uma ou mais soluções com 

RMSD baixo e superposição gráfica que permitem afirmar que formam um grupo de 

soluções equivalentes. Um número alto de soluções em um grupo será considerado 

como tendo certo peso estatístico que favorece a orientação por eles definida, e  

uma delas será selecionada como representante da orientação. As duas primeiras 

definições referem-se aos complexos; o termo conformação fica reservado para a 

estrutura tridimensional adotada pelo ligante, independentemente de estar ligado ou 

não.

Após cada cálculo de docking, conforme o procedimento descrito no Capitulo 2 

de Metodologia, foi determinado no input do programa para que fossem fornecidas 

10 soluções. Foi usado um mecanismo de controle interno do programa de forma tal 

que se para 3 soluções de maior escore encontradas durante a otimização fosse 

detectado um RMSD menor que 1,5Å, automaticamente se encerraria o cálculo. Por 

esta razão alguns cálculos têm um número de soluções menor que 10.  Os 

resultados dos cálculos serão apresentados em forma de tabelas de 5 colunas 

sendo elas:  

1) Solução complexo modelado. 

2) Fitness escore de ajuste calculado 

3) S(hb_ext) escore das ligações de hidrogênio entre o ligante e o receptor 

4) S(vdw_ext) escore das forças de interação de van der Waals entre o ligante e o receptor. 

5) S(int) escore de penalidade devido à tensão interna do ligante ao se adaptar ao receptor.  

Uma solução foi selecionada em cada cálculo como representante da 

orientação do seu grupo, sendo que para uma orientação fosse selecionada, 

avaliou-se suas interações com os nucleotídeos do DNA, seu escore de ajuste e o 

número de soluções obtidas com essa orientação. No caso do redocking, a seleção 

da orientação foi feita antes da comparação com o resultado com a estrutura 

cristalográfica.


RESULTADOS e DISCUSSÃO 53   

Nos subitens seguintes serão apresentados os resultados de um estudo de 

varredura do sulco menor de R-1vzk usando para isto 4 pontos onde centrar a 

procura do sítio de ligação:

(a) T19 (leia-se o átomo O2 da base nucleotídica timina 19) 

(b) C15 (leia-se o átomo O2 da base nucleotídica citosina C15) 

(c) T8 (leia-se o átomo O2 da base nucleotídica timina 8) 

(d) C21 (leia-se o átomo O2 da base nucleotídica citosina C21) 

O O2, presente nas bases nucleotídicas pirimidínicas (C e T), foi o átomo 

escolhido porque ele tem um posicionamento central dentro do sulco menor. As 

bases escolhidas respondem a uma separação crescente do centro da seqüência 

simétrica que responde a: primeiro par de bases T19, segundo par T8, terceiro par 

C15, quarto par T21.  Com esta escolha, de um lado e do outro do plano de simetria, 

ao usar um raio de busca de 25Å, todo o sulco menor foi explorado neste estudo.

Como em todos os casos o centro foi o átomo O2, quando estiver assinalado 

que o centro foi a base T19, isto significará, neste trabalho, que o centro foi em O2 

de T19. 

3.3.1.a. 5BRedocking do ligante DB818 no receptor R-1vzk, centrado em T19, com 

raio 10Å

Foram obtidos três grupos de orientações: 

grupo 1: soluções 1 e 4  

grupo 2: soluções 2, 3, 5, 6, 7, 8 e 9   

grupo 3: somente a solução 10 

Na Figura 3.7 é apresentada a superposição, no sítio receptor, da orientação 

da solução selecionada do grupo 1 com a do grupo 2; o grupo 3 não é mostrado, 

pois, sendo os átomos da extremidade flexível (C21 e próximos) perpendiculares 

aos grupos 1 e 2, não é possível a visualização em uma figura bidimensional.  


RESULTADOS e DISCUSSÃO 54   

      Figura 3. 7 Duas orientações representam os dois grupos obtidos no redocking em torno do centro O2/T19.

Por serem muito pequenos e de escores levemente mais baixos os grupos 1 

e 3 foram descartados. A Tabela 3.3 mostra os resultados obtidos, destacando-se 

em negrito a solução escolhida como mais favorável do cálculo. Observa-se que 

justamente este grupo de maior número de soluções é aquele que tem uma 

superposição gráfica em toda a estrutura, ou seja, a mesma conformação.

Este cálculo inicial, o primeiro dos trabalhos, foi realizado com uma versão 

anterior do programa GOLD, diferentemente do resto do trabalho que foi realizado 

com a última versão disponível. Como poderá ser percebido logo adiante, a nova 

versão estabelece valores de penalidade de tensão interna do ligante (quinta coluna 

Tabela 3. 3 Resultados do redocking para o cálculo com o centro T19, raio 10 Å 
(valores em kcal/mol). Em negrito, a orientação escolhida como mais favorável.

Solução Fitness S(hb_ext) S(vdw_ext) S(int) 
1 78,89 10,43 51,82 -2,80 
2 80,80 3,48 57,32 -1,48 
3 78,99 4,00 55,51 -1,34 
4 79,37 10,35 51,48 -1,76 
5 80,23 4,00 56,73 -1,78 
6 80,53 4,00 56,59 -1,28 
7 79,92 4,00 55,97 -1,03 
8 80,34 3,82 56,90 -1,72 
9 79,07 4,00 56,09 -2,05 
10 77,55 7,85 51,95 -1,72 


RESULTADOS e DISCUSSÃO 55   

das tabelas – S(int)) maiores que os obtidos com a versão anterior, ainda que sejam 

usados os mesmos inputs do cálculo inicial. O termo S(int) refere-se escore de 

penalidade devido à tensão interna do ligante ao se adaptar ao receptor.  Os outros 

termos do escore não apresentam variação significante entre ambas as versões do 

programa GOLD, permitindo assim recorrer a um fator de correção com o fim de 

homogeneizar os valores na Tabela 3.9 de análise geral.

Na Figura 3.8 é apresentada a superposição, no sulco menor, da solução 

selecionada com a estrutura cristalográfica do ligante. A coerência estrutural do 

resultado foi evidente e alentadora na continuação dos estudos.  

Figura 3. 8 Superposição da estrutura cristalográfica do complexo DNA-DB818 (stick) com a orientação 
selecionada no redocking (ball-stick). As interações análogas entre essas estruturas são apresentadas.

3.3.1.b. 6BRedocking do ligante DB818 no receptor R-1vzk, centrado em T19, com 
raio 25Å

Para verificar se o resultado anterior não representava um mínimo local, mas 

sim um mínimo global de energia, o raio para exploração das orientações foi 

aumentado para 25 Å. Os resultados obtidos são apresentados na Tabela 3.4. 


RESULTADOS e DISCUSSÃO 56   

Tabela 3. 4 Resultados do redocking para o cálculo com centro T19, raio 25 Å 
(valores em kcal/mol).  Em negrito, a orientação escolhida como mais favorável.
Solução Fitness S(hb_ext) S(vdw_ext) S(int) 

1 74,88 3,98 56,98 -7,45 
2 72,06 5,89 52,85 -6,50 
3 73,66 10,72 51,69 -8,13 
4 74,69 3,87 56,33 -6,63 
5 72,24 2,75 55,19 -6,40 
6 71,82 1,95 55,56 -6,52 
7 74,69 2,60 56,50 -5,60 

Nesta etapa, as soluções foram bastante diferentes umas das outras, sendo 

que somente  1, 4 e 7 foram consideradas equivalentes. Estas três soluções são as 

de maior escore de Fitness, e com um RMSD entre elas menor de 1,5 Å, razão pela 

qual o cálculo forneceu só 7 soluções.  A orientação deste grupo correspondeu à 

orientação cristalográfica. 

Neste cálculo, repetição do anterior, usando os mesmos inputs, ago