RESSALVA Atendendo solicitação do(a) autor(a), o texto completo desta tese será disponibilizada somente a partir de 29/07/2025. Universidade Estadual Paulista “Júlio de Mesquita Filho” Instituto de Biociências de Botucatu Hamine Cristina de Oliveira ESTUDO COMPARATIVO ENTRE DIFERENTES TÉCNICAS BIOFÍSICAS VISANDO APROFUNDAR O ENTENDIMENTO DO MECANISMO DE IMPORTAÇÃO NUCLEAR Botucatu 2024 Programa de pós-graduação em biotecnologia Hamine Cristina de Oliveira ESTUDO COMPARATIVO ENTRE DIFERENTES TÉCNICAS BIOFÍSICAS VISANDO APROFUNDAR O ENTENDIMENTO DO MECANISMO DE IMPORTAÇÃO NUCLEAR Tese de doutorado apresentada ao Instituto de Biociências de Botucatu – UNESP. Marcos Roberto de Mattos Fontes Orientador Thiago Revers Dreyer Coorientador Projeto financiado pela FAPESP Processo: 2019/05239-8 Botucatu 2024 D418e de Oliveira, Hamine Cristina Estudos comparativos entre diferentes técnicas biofísicas visando aprofundar o entendimento do mecanismo de importação nuclear / Hamine Cristina de Oliveira. -- Botucatu, 2024 58 p. Tese (doutorado) - Universidade Estadual Paulista (UNESP), Instituto de Biociências, Botucatu Orientador: Marcos Roberto de Mattos Fontes Coorientador: Thiago Revers Dreyer 1. Biofísica molecular. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Dados fornecidos pelo autor(a). UNIVERSIDADE ESTADUAL PAULISTA Câmpus de Botucatu ATA DA DEFESA PÚBLICA DA TESE DE DOUTORADO DE HAMINE CRISTINA DE OLIVEIRA, DISCENTE DO PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIA, DO INSTITUTO DE BIOCIÊNCIAS - CÂMPUS DE BOTUCATU. Aos 29 dias do mês de julho do ano de 2024, às 14:00 horas, no(a) Departamento de biofísica e farmacologia, realizou-se a defesa de TESE DE DOUTORADO de HAMINE CRISTINA DE OLIVEIRA, intitulada ESTUDO COMPARATIVO ENTRE DIFERENTES TÉCNICAS BIOFÍSICAS VISANDO APROFUNDAR O ENTENDIMENTO DO MECANISMO DE IMPORTAÇÃO NUCLEAR. A Comissão Examinadora foi constituida pelos seguintes membros: Prof. Dr. MARCOS ROBERTO DE MATTOS FONTES (Orientador(a) - Participação Presencial) do(a) Departamento de Biofísica e Farmacologia / Instituto de Biociências de Botucatu Unesp, Prof. Dr. JOÃO RENATO CARVALHO MUNIZ (Participação Virtual) do(a) Departamento de Física e Ciência Interdisciplinar / Instituto de Física de São Carlos - USP, Prof. Dr. CARLOS ALEXANDRE HENRIQUE FERNANDES (Participação Virtual) do(a) Institut de Minéralogie, de Physique des Matériaux et de Cosmochimie (IMPMC) - Sorbonne Université, Prof. Dr. JOEL MESA HORMAZA (Participação Presencial) do(a) Departamento de Biofísica e Farmacologia / Instituto de Biociências de Botucatu - Unesp, Prof. Dr. ANGELO JOSÉ MAGRO (Participação Presencial) do(a) Departamento de Bioprocessos e Biotecnologia / Faculdade de Ciências Agronômicas de Botucatu - UNESP. Após a exposição pela doutoranda e arguição pelos membros da Comissão Examinadora que participaram do ato, de forma presencial e/ou virtual, a discente recebeu o conceito final:_ _ _ _ _ _ _ _ _ _ _ _ _ . Nada mais havendo, foi lavrada a presente ata, que após lida e aprovada, foi assinada pelo(a) Presidente(a) da Comissão Examinadora. Prof. Dr. MARCOS ROBERTO DE MATTOS FONTES Instituto de Biociências - Câmpus de Botucatu - Rua Doutor Antonio Celso Wagner Zanin, s/nº, 18618689 http://www.ibb.unesp.br/#!/pos-graduacao/biotecnologia/CNPJ: 48031918002259. APROVADO Dedico este trabalho a todas as mulheres que sonham e resistem. 4 AGRADECIMENTOS Ao professor Marcos Fontes, meu orientador, pelo apoio em todos os momentos, ensinamentos, disponibilidade, compreensão para além das obrigações acadêmicas, confiança e estímulo nesses 9 anos de jornada acadêmica. Ao Thiago, Ivan, Tainá e demais membros do laboratório de biologia molecular e estrutural que sempre me auxiliaram e tornaram a jornada ainda mais gratificante. Ao Instituto de Biociências de Botucatu, seus docentes e funcionários, que desde 2015 quando ingressei na graduação, me acompanham e contribuem para tornar esse trabalho uma realidade. À FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) pela bolsa concedida, possibilitando a realização da pesquisa (Processo 2019/05239-8). Agradeço a Ogum e todos Àqueles que emocionalmente me mantiveram em pé e no caminho. À minha irmã Luany, meu pai Daniel, meu companheiro Luciano, ao Gustavo, aos meus amigos e irmãos pelo apoio, estímulo e companheirismo. De forma incondicional à minha mãe Gislaine, que apesar de fisicamente ter me deixado no meio dessa jornada, é, e sempre será, minha maior fonte de inspiração e força. 5 “There have been lots of other women who had the talent and ability before me. I think this can be seen as an affirmation that we're moving ahead. And I hope it means that I'm just the first in a long line.” Mae Jemison 6 RESUMO O estudo quantitativo da interação proteínas-ligantes vem se mostrando essencial em diversas áreas. No estudo da importação nuclear, particularmente na chamada via clássica de importação nuclear, estes dados são essenciais, pois a importina-α (Impα) se acopla às proteínas a serem transportadas ao núcleo a partir do reconhecimento de sequências de localização nuclear (NLS). Assim, o aprimoramento no uso de métodos biofísicos de análise da interação macromolécula/ligante tem um papel fundamental. Desta maneira, o presente trabalho tem duas vertentes principais: i) comparar a interação da Impα com NLSs de proteínas cargo por diferentes técnicas, como a calorimetria por titulação isotérmica (ITC), a espectroscopia de fluorescência, a termoforese em microescala (MST) e o docking molecular, analisando as principais diferenças entre cada uma delas. Esta comparação é pouco abordada na literatura e se mostrou promissora, uma vez que apesar de utilizar princípios físicos diferentes as técnicas obtiveram valores na mesma ordem de grandeza. (ii) Desenvolvimento de um algoritmo de código aberto para a análise de dados de ITC, suprindo a dificuldade que os softwares comerciais apresentam no cálculo dos parâmetros em sistemas mais complexos. Os dados de ITC entre a Impɑ e diferentes NLSs foram utilizados como referência para a comparação entre as constantes de afinidade obtidas nas outras técnicas e como validação para o algoritmo. Os mesmos ligantes foram utilizados nos ensaios de espectroscopia de fluorescência, termoforese em microescala e docking molecular. Apesar de bastante distintas, todas as técnicas obtiveram valores da constante de dissociação na mesma ordem de grandeza. Os valores obtidos por docking molecular são superestimados. Como a fluorescência e o MST não diferenciam as constantes para cada sítio de ligação, o valor encontrado representa uma afinidade média de ambos os sítios. Nota-se, uma maior semelhança entre os dados de ITC e fluorescência. O algoritmo de ITC teve resultados similares aos obtidos pelo software do fabricante, sua implementação trará um avanço para a facilitação da análise de dados complexos. 7 ABSTRACT The quantitative study of protein-ligand interactions has been essential in several areas. In the study of nuclear import, particularly in the classical pathway of nuclear import, these data are essential, as importin-α (Impα) binds to proteins to be transported to the nucleus from the recognition of nuclear localization sequences (NLS).Thus, the improvement in the use of biophysical methods of analysis of the macromolecule/ligand interaction has a fundamental role. Thus, the present work has two main aspects: i) to compare the interaction of Impα with NLSs of cargo proteins by different techniques, such as isothermal titration calorimetry (ITC), fluorescence spectroscopy, microscale thermophoresis (MST) and molecular docking, analyzing the main differences between each one of them. This comparison is less discussed in the literature and proved to be promising, since despite using different physical principles, the techniques obtained values in the same order of magnitude.ii) Development of an open source algorithm for analyzing ITC data, overcoming the difficulty that commercial software presents in calculating the parameters in more complex systems.The ITC data between Impɑ and different NLSs were used as a reference for the comparison between the affinity constants obtained in the other techniques and as validation for the algorithm. The same ligands were used in the fluorescence spectroscopy, microscale thermophoresis and molecular docking assays. Despite being quite different, all techniques obtained dissociation constant values in the same order of magnitude. The values obtained by molecular docking are overestimated. As fluorescence and MST do not differentiate the constants for each binding site, the value found represents an average affinity for both sites. Note the greater similarity between the ITC and fluorescence data. The ITC algorithm had results similar to those obtained by the equipment software, its implementation will facilitate the analysis of complex data. 8 LISTA DE FIGURAS Figura 1 - Exemplo de um experimento padrão de calorimetria de titulação isotérmica indicado pelo fabricante 18 Figura 2 - Explicação de um experimento de MST. A. Equipamento utilizado. B. Representação esquemática da óptica MST. C. Sinal típico de um experimento. D. Dados formalizados e analisados. 26 Figura 3 - Visão geral da importação nuclear de proteínas 28 Figura 4 - Estrutura da Importina-α de Mus musculus (MmImpα) destacando-se os dez motivos ARMs e o domínio IBB 29 Figura 5 - Verificação da indução e purificação da MmImpα em gel de poliacrilamida a 12% (SDS-PAGE), destacando a faixa da proteína recombinante, aproximadamente 55 kDa 34 Figura 6 - Cromatograma de purificação da proteína MmImpα por afinidade 35 Figura 7 - Termogramas de ITC da MmImpα complexada com as NLS: A. SV40. B. PMS2. C. MLH1 37 Figura 8 - Termogramas de ITC da MmImpα complexada com as NLS: A. XPG1. B. XPG2 37 Figura 9 - Termogramas de ITC da MmImpα complexada com as NLS: A. MLH1-R472K. B. MLH1-E475A. C. MLH1-R470A 38 Figura 10 - Gráfico de emissão de fluorescência em diferentes comprimentos de onda de excitação da MmImpɑ a 30 µM 39 Figura 11 - Curvas da intensidade de absorbância por comprimento de onda. Cada cor representa a MmImpα depois de n injeções do peptídeo da MLH1, sendo o 0 a amostra isolada e as injeções indo de 1 a 20. 40 Figura 12 - Curvas da intensidade de absorbância normalizada por comprimento de onda. Cada cor representa a MmImpα depois de n injeções do peptídeo da MLH1, sendo o 0 a amostra isolada e as injeções indo de 1 a 20. 41 Figura 13 - Dados obtidos a partir da diferença entre os máximos das curvas de injeção de MLH1 NLS na MmImpα mostradas na figura 12, e a curva vermelha ajustada por uma função sigmóide. 42 Figura 14 - Dados obtidos a partir da diferença entre os máximos das curvas de injeção e a curva vermelha ajustada por uma função sigmóide da MmImpα com os ligantes. A. PMS2. B. SV40. C. XPG1. D. XPG2. E. 43 9 MLH1-R472K. F. MLH1-E475A. G. MLH1-R470A. H. MLH1-S467A. I. FEN1. Figura 15 - Dados de MST gerados com a MmImpα complexada aos ligantes. A. MLH1. B. MLH1a. C. SV40. D. XPG1a. E. XPG1. F. MLH1-S467A. G. FEN1. a Medida realizada com a proteína marcada pela cauda de histidina. 45 Figura 16 - Gráfico de RMSD do peptídeo da MLH1 ligado no sítio principal da MmImpɑ gerado por simulação no GROMACS. 47 Figura 17 - A. Gráfico de dispersão entre os valores de Kd obtidos via espectroscopia de fluorescência e ITC. B. Gráfico de dispersão entre os valores de Kd obtidos via MST e ITC. C. Gráfico de dispersão entre os valores de Kd obtidos via docagem molecular (PyRx) e ITC. D. Boxplot de distribuição das porcentagens de variação entre os valores obtidos em cada técnica e o ITC, variações acima de 1000% entre PyRx e ITC foram considerados outliers e desconsiderados na construção gráfica. 49 Figura 18 - Gráficos de ITC gerados no R 51 10 LISTA DE TABELAS Tabela 1 - Principais técnicas empregadas no estudo da interação proteína:ligante 13 Tabela 2 - Dados termodinâmicos de diferentes peptídeos complexados com a MmImpα 36 Tabela 3 - Dados de Kd gerados por espectroscopia de fluorescência de diferentes peptídeos complexados com a MmImpα 42 Tabela 4 - Dados de Kd gerados por MST de diferentes peptídeos complexados com a MmImpα 46 Tabela 5 - Constantes de dissociação de diferentes peptídeos complexados com a proteína MmImpɑ obtidas por diferentes técnicas 48 Tabela 6 - Constantes de dissociação calculadas pelo software do fabricante e pelo algoritmo 53 11 SUMÁRIO 1 INTRODUÇÃO 12 1.1TÉCNICAS BIOFÍSICAS PARA OBTENÇÃO DE DADOS DE AFINIDADE ENTRE BIOMOLÉCULAS 12 1.2 ITC E O PROCESSAMENTO DE DADOS 16 1.3 TERMOFORESE EM MICROESCALA 25 1.4VIA CLÁSSICA DE IMPORTAÇÃO NUCLEAR 26 1.5ESTRUTURA CRISTALOGRÁFICA DA IMPORTINA-α 28 1.6SEQUÊNCIAS DE LOCALIZAÇÃO NUCLEAR 29 2 OBJETIVO 30 3 MATERIAIS E MÉTODOS 30 3.1 EXPRESSÃO E PURIFICAÇÃO DE IMPORTINA-α TRUNCADA (70-529) 30 3.2CALORIMETRIA POR TITULAÇÃO ISOTÉRMICA 31 3.3 ESPECTROSCOPIA DE FLUORESCÊNCIA 32 3.4 TERMOFORESE EM MICROESCALA 32 3.5 TÉCNICAS DE BIOINFORMÁTICA PARA O CÁLCULO DE CONSTANTE DE AFINIDADE 33 3.6 DESENVOLVIMENTO DE UM ALGORITMO PARA ANÁLISE DE DADOS DE ITC 33 4 RESULTADOS E DISCUSSÃO 34 4.1 EXPRESSÃO E PURIFICAÇÃO 34 4.2CALORIMETRIA POR TITULAÇÃO ISOTÉRMICA 35 4.3ESPECTROSCOPIA DE FLUORESCÊNCIA 38 4.4TERMOFORESE EM MICROESCALA 44 4.5 TÉCNICAS DE BIOINFORMÁTICA PARA O CÁLCULO DE CONSTANTE DE AFINIDADE 46 4.6 ANÁLISE COMPARATIVA ENTRE AS TÉCNICAS 47 4.7 DESENVOLVIMENTO DE UM ALGORITMO PARA ANÁLISE DE DADOS DE ITC 50 5 CONCLUSÃO 54 REFERÊNCIAS 56 12 1 INTRODUÇÃO 1.1 TÉCNICAS BIOFÍSICAS PARA OBTENÇÃO DE DADOS DE AFINIDADE ENTRE BIOMOLÉCULAS Métodos biofísicos vêm sendo cada vez mais utilizados como abordagens complementares às tradicionais na busca do conhecimento aprofundado dos mecanismos moleculares. Assim, técnicas biofísicas aplicadas no estudo da interação proteína/ligantes ou proteínas/proteínas fornecem informações importantes, permitindo não só entender o processo como otimizar e listar compostos com maior afinidade (Holdgate, Anderson et al. 2010). Existem diversas técnicas que predizem a afinidade entre duas ou mais moléculas em solução, entre elas estão calorimetria por titulação isotérmica (Isothermal Titration Calorimetry – ITC), ressonância de plasma de superfície (Surface Plasmon Resonance – SPR), espectrometria de massa (Mass Spectrometry – MS), termoforese em microescala (MicroScaleThermophoresis – MST), ultracentrifugação analítica (Analytical Ultracentrifugation - AUC), técnicas espectroscópicas (ressonância magnética nuclear (Nuclear Magnetic Resonance – NMR) e espectroscopia de fluorescência) entre outras. A tabela 1 apresenta essas técnicas com suas principais vantagens e desvantagens. O ITC é a técnica estabelecida como padrão ouro para medir diretamente a afinidade de ligação e a termodinâmica da reação (Freyer and Lewis 2008). A técnica permite que a afinidade, a entalpia e a estequiometria de uma interação sejam medidas em um único experimento. Além disso, avanços recentes na sensibilidade, a não necessidade de um marcador e a utilização de um baixo volume da amostra em solução trazem vantagens para a escolha do ITC. A técnica envolve a quantificação do calor produzido ou absorvido durante a reação de ligação à temperatura constante (Ladbury 2010). Porém, uma dificuldade na utilização do ITC é o fato do processamento dos dados, em sistemas mais complexos, não ser tão bem resolvidos pelos softwares comerciais disponíveis (Velazquez Campoy and Freire 2005). Outra desvantagem é que proteína e ligante devem estar diluídos no mesmo tampão. Ademais, a utilização de solventes orgânicos em concentrações superiores a 5-10% (volume:volume) para diluição das espécies titulantes ou 13 tituladas não são recomendadas pois podem induzir a erros na determinação das constantes de afinidade e termodinâmicas da reação. Tabela 1 – Principais técnicas empregadas no estudo da interação proteína:ligante Técnica Princípio Físico Vantagens Desvantagens ITC Quantificação do calor gerado ou absorvido na reação Pouca amostra, livre de marcadores, obtenção direta da estequiometria e entalpia da reação Processamento de dados não é tão simples em sistemas complexos e limitação no tampão SPR Alteração do índice de refração devido à massa Pouca amostra e automatizado Apenas proteínas de massa molecular maior e necessário acoplamento ao filme metálico MS Identificação e análise do ligante; concentração do produto da reação Reconhecimento do ligante no caso dele não ser conhecido e há não necessidade de purificar a proteína Utilização de outras técnicas previamente, custo e não há quantificação MST Alterações na mobilidade termoforética Utilização da amostra em qualquer tampão e pouca amostra Necessidade de marcação e uso de capilares para manuseio da amostra AUC Sedimentação de proteínas em solução Alta resolução e estudo do equilíbrio Custo e tempo de aquisição de dados 14 NMR Campos magnéticos locais em torno de núcleos atômicos Informação estrutural Muita amostra e limitação da massa molecular Espectroscopia de Fluorescência Variação na emissão e absorção de luz Não destrutivo e interação de baixa afinidade Necessidade da presença de fluoróforos A Ressonância Plasmônica de Superfície (SPR) é uma técnica poderosa para a análise de afinidade entre biomoléculas, baseada na detecção de mudanças no índice de refração próximo à superfície de um filme metálico quando este é iluminado por luz polarizada sob condições de reflexão interna total. A principal vantagem do SPR é a capacidade de monitorar interações biomoleculares em tempo real, sem a necessidade de marcadores, e de fornecer informações cinéticas e termodinâmicas, como constantes de associação e dissociação (RICH; MORTON, 2005). No entanto, a técnica é mais adequada para moléculas grandes, como proteínas, e apresenta limitações na sensibilidade para moléculas menores. Além disso, a orientação imprecisa das biomoléculas na superfície metálica pode introduzir erros significativos na análise, comprometendo a precisão dos resultados (HUBER; MUELLER, 2006). Apesar dessas desvantagens, o SPR continua sendo amplamente utilizado em estudos de interação molecular devido à sua versatilidade e capacidade de operar em condições próximas ao ambiente fisiológico (SCHASFOORT et al., 2003). A espectrometria de massa (MS) pode ser utilizada no estudo proteína-ligante de quatro formas diferentes: (a) identificação direta do ligante, (b) detecção do complexo proteína:ligante, (c) análise do sítio de ligação e, (d) monitoração do substrato ou a concentração do produto da reação (Holdgate, Anderson et al. 2010). A MS é realizada com o produto de outras técnicas, como por exemplo, ensaios enzimáticos ou ultracentrifugação, isso gera um gasto de amostra e custo muito maiores além de não gerar valores que quantificam a reação. A termoforese em microescala (MST) é uma técnica importante para quantificar as interações biomoleculares. É baseado no movimento dirigido de moléculas em um gradiente de temperatura, que depende fortemente de diversas propriedades moleculares, como tamanho, carga, camada de hidratação ou https://en.wikipedia.org/wiki/Atomic_nucleus https://en.wikipedia.org/wiki/Atomic_nucleus 15 conformação. Assim, é altamente sensível a qualquer alteração nas propriedades moleculares, permitindo uma quantificação precisa de eventos moleculares independentes do tamanho ou natureza da espécie investigada (Jerabek-Willemsen, Wienken et al. 2011). O MST permite uma determinação precisa de constantes de ligação, estequiometria da interação, modos de ligação, análise de desdobramento de proteínas, termodinâmica e cinética enzimática. Uma vantagem é que o MST pode ser realizado em praticamente qualquer tampão, mesmo no plasma e no lisado celular. Desvantagens dessa técnica são a necessidade, na maioria das vezes, de marcar a proteína com fluoróforos e a necessidade de capilares para manuseio da amostra, gerando um custo considerável para sua utilização. A ultracentrifugação analítica (AUC) monitora e interpreta a evolução dos perfis de concentração macromolecular após a aplicação de uma força centrífuga (Zhao, Ghirlando et al. 2015). Atualmente, há três tipos de sistemas ópticos disponíveis para AUC: o espectrofotômetro convencional, o interferômetro Rayleigh e a fluorescência, que oferecem uma ampla gama para a investigação das interações entre proteínas sendo possível calcular constantes de equilíbrio de dissociação e a estequiometria da reação (Zhao, Ghirlando et al. 2015). É um método vantajoso no estudo de interações de proteínas, principalmente porque o forte processo de sedimentação dependente do tamanho da macromolécula leva a uma alta resolução. Além disso, no modelo experimental padrão, apesar de sua velocidade de sedimentação mais alta, os complexos podem se associar novamente durante o processo, de um modo que reflita seu equilíbrio (Zhao, Ghirlando et al. 2015). Porém, apesar de ter sofrido melhorias substanciais em instrumentação, teoria e análise de dados computacionais, o processo de AUC ainda gera um alto custo e um tempo de centrifugação, em muitos casos, longo (Zhao, Ghirlando et al. 2015). Estudos de ligação com NMR podem ser realizados em uma ampla gama de afinidades, no entanto, a maior utilidade dessa técnica é quando há a ligação com baixa afinidade que podem ser detectados de forma confiável (Holdgate, Anderson et al. 2010). NMR é uma técnica espectroscópica que observa campos magnéticos locais em torno de núcleos atômicos. A amostra é colocada sob ação de um campo magnético e o sinal de NMR é produzido pela excitação dos prótons da amostra com ondas eletromagnéticas, que é detectado com receptores de rádio frequência. É uma ferramenta comum para a determinação das relações de https://en.wikipedia.org/wiki/Conformation_Activity_Relationship 16 atividade de conformação onde a estrutura antes e depois da interação com um ligante é comparada. As desvantagens são a utilização de uma grande quantidade de amostra e limitações quanto à massa da proteína (por exemplo 40 kDa dependendo do campo magnético aplicado e outros fatores). Na espectroscopia de fluorescência o sinal é gerado pela quantificação da onda eletromagnética emitida pela amostra excitada por uma luz monocromática em um comprimento de onda específico que é absorvido pela molécula. Em proteínas, a análise na variação do sinal emitido pelos aminoácidos fluorescentes traz informações importantes sobre o estado proteico antes e após a interação (Jameson and Seifried 1999). Essa técnica é adequada para a medição de interações de baixa afinidade (mais especificamente, interações com taxas de dissociação rápidas). Uma vantagem da técnica é que o experimento não é destrutivo, permitindo assim medições repetitivas da mesma amostra sob diferentes condições (por exemplo, temperaturas diferentes) (Rossi and Taylor 2011). Uma das maiores desvantagens da espectroscopia de fluorescência é a necessidade da presença de fluoróforos na amostra. Apesar de existirem, como mencionando, diversas técnicas biofísicas capazes de estimar a estequiometria e as constantes termodinâmicas de uma interação proteica, deve-se ter cautela ao comparar as afinidades obtidas por diferentes técnicas, já que podem não gerar valores similares, assim, um estudo comparativo, para o mesmo maquinário biológico, ganha relevância, podendo, então, entender as especificidades e similaridades de cada técnica em relação à outra. Atualmente, poucos estudos foram realizados visando à comparação de dados obtidos com diferentes técnicas em sistemas biológicos similares (Holdgate, Anderson et al. 2010; Zhao, Ghirlando et al. 2015). 1.2 ITC E O PROCESSAMENTO DE DADOS Calorimetria por titulação isotérmica (ITC) é a metodologia que oferece maior número de parâmetros relativos a uma interação molecular e permite a medida direta da entalpia de qualquer reação em condições isotérmica e isobárica. É o único método capaz de determinar a entalpia, entropia e a energia livre de ligação em apenas uma titulação, em uma única temperatura (Ladbury 2010). Dentre as técnicas experimentais empregadas para estudar a ligação entre https://en.wikipedia.org/wiki/Conformation_Activity_Relationship https://en.wikipedia.org/wiki/Conformation_Activity_Relationship https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/experimentation 17 macromoléculas, o ITC apresenta várias características que o tornam uma ferramenta experimental única: evita o uso de marcadores espectroscópicos não naturais; as amostras estão em solução; e permite determinar simultaneamente a constante de dissociação, a entalpia e a estequiometria de ligação em um único experimento (Freire, Schon et al. 2009). Consequentemente, os dados do ITC são bastante adequados para serem analisados utilizando o formalismo polinomial de ligação. No calorímetro, anteriormente à titulação, uma potência constante é aplicada à célula de referência. Este sinal aciona o aquecedor da célula de reação, e esta potência aplicada representa a linha de base (Figura 1, painel superior, linha vermelha). A quantidade diretamente mensurada em um experimento de ITC é a potência de entrada dependente do tempo para manter as células de referência e de reação à mesma temperatura. Durante a injeção do titulante na célula de reação, calor é absorvido ou liberado dependendo se a natureza da interação entre as macromoléculas é endo ou exotérmica, respectivamente. Para uma reação exotérmica, a temperatura na célula de reação tenderia a subir e com isso, a potência de feedback vai ser diminuída, para manter as duas células à mesma temperatura (Figura 1, painel superior, linha preta). Nas reações endotérmicas, a potência vai ser aumentada para a manutenção da temperatura constante, uma vez que a interação vai retirar energia do ambiente (Velazquez Campoy and Freire 2005). O calor gerado ou absorvido durante a titulação é proporcional à fração de ligação da espécie titulante ao titulado. Por isso, é de extrema importância a correta determinação das concentrações iniciais das espécies titulante e titulada para as injeções iniciais, fazendo com que todo ou quase todo o titulante se ligue ao titulado, resultando em considerável sinal exo ou endotérmico, dependendo da natureza da associação no início da titulação (Pierce, Raman et al. 1999; Freire, Schon et al. 2009). No termograma gerado em um experimento típico de ITC, os calores iniciais decorrentes da reação entre ambas as espécies são maiores que os gerados nas injeções subsequentes do titulante, pois no início da titulação há um excesso de sítios de ligação não ocupados na espécie titulada. Com isso, os calores gerados no início da titulação são resultados da reação “completa” do titulante adicionado. Com o prosseguimento da titulação, menores quantidades de titulante se ligam à espécie https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/enthalpy https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/stoichiometry 18 titulada e novas espécies passam a aparecer na célula de reação: titulante livre, titulado com sítios de ligação não ocupados e complexo formado. Já nas últimas injeções é de fundamental importância que a espécie titulada esteja toda saturada e que o calor gerado ou absorvido seja proporcional ao calor de diluição do titulante (Biswas and Tsodikov 2010), acabando a titulação majoritariamente com moléculas do titulante livres e moléculas do complexo titulante-titulado formadas. No tratamento dos dados gerados pelo calorímetro é possível calcular a variação de calor das reações de titulação através da integração da potência aplicada durante a titulação (µcal/s) normalizada pela concentração do titulante em função da razão molar das espécies titulante e titulada (painel inferior, Figura 1). Com base nesse termograma é possível determinar as variações de entalpia (ΔH), a estequiometria da titulação (n) e a constante de dissociação (Kd) entre as espécies tituladas. Com base nesses parâmetros é possível calcular a variação da entropia (ΔS) e a energia livre de ligação (ΔG). Figura 1 – Exemplo de um experimento padrão de calorimetria de titulação isotérmica indicado pelo fabricante. Titulação de íons cálcio (5 mM) em EDTA (0.4 mM), ambos diluídos em tampão MES (10 mM) à 25 ºC. (Painel superior) Dados brutos de calorimetria de 19 titulação isotérmica (linha preta) e linha de base (linha vermelha). (Painel inferior) Isoterma da titulação, que representa a energia medida em cada injeção normalizada pela molaridade do titulante (eixo das ordenadas) em função da razão molar de titulante por titulado (eixo das abscissas) Considerando-se uma reação química do tipo , em que a substância é uma macromolécula e está alocada na célula de reação, também chamada de titulado, é um ligante e está colocado na pipeta, chamado titulante, e é o complexo formado durante a titulação, o equilíbrio entre as espécies pode ser descrito matematicamente pelas equações (Velazquez Campoy and Freire 2005): (1) (2) em que e representam as concentrações totais do titulado e do titulante e , e as concentrações na condição de equilíbrio do titulado, titulante e do complexo titulado-titulante, respectivamente. A condição de equilíbrio da reação é dada por: (3) em que é a constante de afinidade entre as espécies. Resolvendo as equações (1) e (2) em função da concentração do complexo ( ): (4) obtém-se a equação quadrática a seguir: (5) 20 que dá duas possíveis soluções, sendo a fisicamente relevante, a solução descrita abaixo: (6) Usando o parâmetro adimensional " " introduzido por Wiseman e colaboradores (Wiseman, Williston et al. 1989) a equação seguinte é obtida: (7) em que e . A quantidade de calor total ( ) gerada ou absorvida no calorímetro devido à formação do complexo é dada por (8) em que é o volume da cela de reação e é a entalpia de ligação. A representação da isoterma de Wiseman, forma mais recomendada para apresentação dos resultados de ITC, é obtida pelo cálculo da derivada , que é a forma diferencial equivalente ao calor incremental por injeção, , normalizado pelo incremento molar do ligante injetado na cela de reação, , (9) A derivada com respeito a pode ser convertida em uma derivada relacionada à razão molar, , aplicando a relação (10) 21 que considera a concentração da macromolécula constante durante a titulação. Aplicando-se as equações (9) e (10) à equação (8), obtem-se a isoterma de Wiseman: (11) A isoterma de Wiseman (Wiseman, Williston et al. 1989) é a representação da em função da razão molar, , que é calculada assumindo que não há diluição nem da macromolécula nem do ligante utilizado na titulação que, segundo Velazquez-Campoy (Velazquez Campoy and Freire 2005), é igual à obtida usando-se um quociente incremental ao invés da derivada em função de , e da diluição da macromolécula e do ligante em função das injeções. Isso se deve ao fato que a diluição da macromolécula está implicitamente considerada quando do cálculo dos valores da razão molar ao longo da análise dos dados. Os processos de ajustes dos dados são realizados tendo como base o conhecimento do tipo de interação entre a espécie titulada e titulante, sendo que alguns parâmetros devem ser incluídos no ajuste dos dados baseados nos modelos matemáticos que descrevem o equilíbrio da ligação: (i) estequiometria da reação; (ii) constante de afinidade (associação) ou dissociação, ou , respectivamente; (iii) caracterização das contribuições entálpica e entrópica para a energia livre de ligação; (iv) caracterização de múltiplos sítios e cooperatividade positiva ou negativa para os casos de múltiplos sítios; (v) caracterização da dependência do equilíbrio de ligação com variáveis como pH, força iônica do tampão, entre outros (Freire, van Osdol et al. 1990). Os parâmetros acima relacionados estão abaixo explicados. A estequiometria, , de uma reação descreve as relações quantitativas entre duas ou mais substâncias em uma reação física ou química. Na calorimetria de titulação isotérmica, a determinação da estequiometria de ligação tem um papel fundamental na caracterização dos mecanismos de ligação de macromoléculas biológicas (Doyle 1997). Com base nas concentrações de ambas as espécies em interação, a estequiometria de ligação pode ser determinada através da razão molar das 22 espécies no ponto de inflexão do termograma. No processo de análise de dados, o valor da estequiometria pode ser utilizado como um valor variável, a ser ajustado no processo de minimização de erros dos parâmetros experimentais, como pode ser mantido fixo, caso se tenha informação do sistema em estudo. Uma grande quantidade de fatores pode influenciar o valor da estequiometria, fazendo com que seu valor seja um valor não inteiro. Os principais determinantes para isso são: erro nas concentrações da espécie titulada (Freyer and Lewis 2008), ligação inespecífica, degradação ou baixa qualidade do titulado (estado inativo, sem folding correto) (Tellinghuisen 2004; Tellinghuisen 2004; Gruner, Neeb et al. 2014). Por isso, a análise da estequiometria da reação também pode ser considerada um excelente parâmetro de qualidade na análise de ensaios de ligação de diferentes lotes de proteínas purificadas em diferentes condições, bem como na análise de proteínas recombinantes expressas em diferentes linhagens celulares ou mesmo em testes de estabilidade de congelamento-descongelamento (Doyle 1997). Outra característica que, assim como a variação de entalpia, é medida diretamente na isoterma de ligação é a constante de afinidade ou associação ( ), que está relacionada com a constante de dissociação ( ) através da equação (12) sendo estas diretamente relacionadas à energia livre da ligação ( ) através da equação (13) A energia livre de ligação é o parâmetro termodinâmico mais importante de uma ligação, uma vez que seu valor, em condições específicas de concentrações dos reagentes, direciona o equilíbrio biomolecular. Se o valor de é negativo, a reação de ligação ou transição conformacional será espontânea numa medida ditada pela magnitude do . Se o sinal é positivo, a magnitude da variação específica a quantidade de energia necessária para a formação dos produtos da reação. Além disso, este parâmetro quantifica a afinidade da ligação entre 2 moléculas em uma interação (Ladbury 2010), determina a estabilidade do complexo formado e ainda é 23 uma ferramenta analítica de caracterização fenomenológica da relação estrutura-função (Perozzo, Folkers et al. 2004). Para determinar os parâmetros termodinâmicos relevantes às interações entre as moléculas, geralmente seguem-se alguns passos (Velazquez-Campoy, Ohtaka et al. 2004): 1- Primeiramente, ajusta-se a linha de base no termograma e integra-se os picos. 2- Em seguida, verifica-se as concentrações das espécies tituladas e titulantes, que inicialmente podem ser estimadas pela estequiometria da ligação. Se necessário, realiza-se correções nas concentrações. 3- Depois, estima-se os calores de diluição, seja pelas últimas injeções da titulação realizada ou através de experimentos controle, caso o calor de diluição da espécie titulante dependa da concentração. Este calor de diluição, ou mesmo o de interações inespecíficas, deve ser subtraído dos calores calculados nas injeções da titulação para uma melhor estimativa dos dados termodinâmicos. 4- O passo final é determinar o modelo de ligação a ser utilizado para ajustar os dados da isoterma de ligação da titulação (Velazquez-Campoy, Ohtaka et al. 2004). Os modelos de ligação são descrições matemáticas dos processos biológicos, físicos e químicos que descrevem a interação entre as espécies tituladas. As variáveis dependentes (calor ou fluxo de calor) são definidas como função das variáveis independentes (molaridade de titulante) e de outros parâmetros do modelo. Por isso, usa-se o modelo mais simples possível que corrobore as informações já conhecidas do sistema em estudo, de modo que as equações do modelo sejam utilizadas para determinar os melhores valores para os parâmetros de ajuste à isoterma, como a constante de associação ou dissociação (Ka ou Kd, respectivamente), variação de entalpia (deltaH) e estequiometria (n) (Freyer and Lewis 2008). 5- Caso não se tenham informações acerca do sistema em estudo, diversos modelos podem ser ajustados aos dados experimentais, e o modelo mais adequado, ou seja, o que apresentar melhor ajuste dos dados, pode ser escolhido estatisticamente. 24 Entretanto, o modo padrão de análise dos dados possui algumas limitações significantes. Dentre os problemas frequentemente encontrados na análise dos dados obtidos estão: (a) problemas na determinação da linha de base; (b) análise de dados com modelos de alta complexidade de um sistema sobre o qual não se tenham outras informações obtidas por metodologias ortogonais; (c) variações encontradas na realização do mesmo experimento entre diferentes laboratórios e operadores. Uma macromolécula com dois sítios de ligação apresenta pelo menos seis possíveis mecanismos de ligação diferentes: i) dois sítios de ligação idênticos e independentes; ii) dois sítios idênticos e competitivos; iii) dois sítios idênticos e positivamente cooperativos; iv) dois sítios diferentes e independentes; v) dois sítios diferentes e competitivos e vi) dois sítios diferentes e positivamente cooperativos. Nem todos esses casos são distinguíveis experimentalmente, ou seja, alguns dão origem exatamente à mesma curva de ligação e assim informações extras termodinâmicas são necessárias para elucidar o mecanismo de ligação. Por isso, a análise de dados ainda se apresenta, nesses casos, com limitações significativas. Assim, os experimentos devem ser realizados de modo que as fontes de incertezas sejam minimizadas ou determinadas e subtraídas na análise de dados. As principais fontes de incertezas são: quantificação do calor liberado pelo equipamento, erros nas concentrações das espécies titulada e titulante, erros na linha de base por problema no equipamento ou variações ambientais, variações das soluções tampão utilizadas; problemas nas operações com o equipamento, como bolhas de ar ou uso de velocidades de agitação não ótimas (Tellinghuisen and Nowak 2003; Tellinghuisen 2003; Tellinghuisen 2005; Baranauskiene, Petrikaite et al. 2009; Pethica 2015). O software comercial de análise de dados que acompanha o equipamento (Origin v.7.0, OriginLab) apresenta poucos modelos de ligação já implementados e, por isso, algumas vezes o usuário deve desenvolver suas próprias rotinas de ajuste ou usar as já implementadas assumindo algumas simplificações (Vega, Abian et al. 2015 ). A proteína Importina–α, envolvida no processo de importação nuclear,é um exemplo de sistema complexo que pode ser interessante para o processamento de dados calorimétricos. Esta proteína possui dois sítios de ligação independentes com https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/macromolecule 25 afinidades diferentes pelos ligantes, trazendo desafios quanto ao processamento de dados calorimétricos. Assim, a criação de um algoritmo que analise os dados experimentais de vários graus de complexidade, de interações simples às mais complexas, se faz cada vez mais necessário, no intuito de tornar a interpretação de dados de qualquer sistema mais simplificada. 1.3 TERMOFORESE EM MICROESCALA Moléculas fluorescentes são usadas em ciências biológicas para rastrear e analisar interações moleculares. As técnicas baseadas em fluorescência tornaram-se inestimáveis para uma compreensão quantitativa dos processos biológicos e a termoforese em microescala (MST) é uma abordagem totalmente óptica para caracterizar as propriedades das biomoléculas (Seidel, Dijkman et al. 2013). O fenômeno da termoforese descreve o movimento direcionado de moléculas através de um gradiente de temperatura. A termoforese em microescala (MST) é um método para monitorar o movimento direcionado de moléculas fluorescentes através de gradientes microscópicos de temperatura, permitindo a análise precisa de eventos de ligação em uma solução de poucos microlitros de praticamente qualquer molécula - independente de tamanho ou propriedades físicas (Jerabek-Willemsen, Wienken et al. 2011). Sob condições tampão constantes, a termoforese investiga o tamanho, a carga e a entropia de solvatação das moléculas. A termoforese de uma proteína normalmente difere significativamente da termoforese de um complexo proteína-ligante devido às alterações induzidas pela ligação no tamanho, carga e energia de solvatação. Mesmo que uma ligação não altere significativamente o tamanho ou a carga de uma proteína, a MicroScale Thermoforese ainda pode detectar a ligação devido a alterações induzidas pela ligação na entropia de solvatação das moléculas (Seidel, Dijkman et al. 2013). O funcionamento do MST está desenhado na figura 2. No equipamento (figura 2A), a termoforese é induzida e detectada em pequenos capilares de vidro que contêm uma solução da molécula marcada e um gradiente de concentração do ligante. Um laser infravermelho (IR) produz um gradiente de temperatura, assim os 26 fluoróforos em solução são excitados e a fluorescência emitida é coletada (Figura 2B). Esta configuração permite acompanhar a depleção de fluoróforos dentro do gradiente de temperatura induzido (Figura 2C). Mudanças na termoforese das moléculas fluorescentes devido à ligação ao ligante podem então ser usadas para calcular constantes de ligação de equilíbrio (Figura 2D). Figura 2 – Explicação de um experimento de MST. A. Equipamento utilizado. B. Representação esquemática da óptica MST. C. Sinal típico de um experimento. D. Dados formalizados e analisados. (Jerabek-Willemsen, Wienken et al. 2011). 1.4 VIA CLÁSSICA DE IMPORTAÇÃO NUCLEAR A via clássica de importação nuclear de proteínas permite o transporte de um grande número de proteínas, utilizando o heterodímero importina-α (Impα) e importina-β (Impβ) como transportador, e tem sido estudada em detalhes biológicos e estruturais. O processo de importação nuclear tem como princípio uma cadeia de interações, que precisam ser constantemente reguladas, esse ciclo pode ser convenientemente dividido em quatro etapas: I) Formação do complexo de importação carga proteica/transportador no citoplasma; II) Translocação através de 27 complexos poro-nucleares (Nuclear Pore Complex - NPCs); III) Desligamento do complexo de importação no núcleo; IV) Reciclagem das proteínas transportadoras. Sinais específicos contribuem para a fidelidade desses eventos, dentre os quais as sequências de localização nuclear (Nuclear Localization Signal - NLS) (Stewart 2007). Proteínas que possuem NLS são importadas para o núcleo via heterodímero Impα/Impβ, o qual se liga a estas proteínas através do adaptador Impα (Gorlich and Kutay 1999; Chook and Blobel 2001; Macara 2001; Weis 2003), a qual possui sítios de reconhecimento específicos (Conti, Uy et al. 1998; Conti and Kuriyan 2000; Fontes, Teh et al. 2000; Stewart 2006; Stewart 2007). Esse processo ocorre inicialmente no citoplasma, após a formação do heterodímero (Impα/Impβ), é possível a ligação da proteína a ser importada, via reconhecimento do NLS (Gorlich, Vogel et al. 1995), como ilustrado na figura 1. Em seguida a Impβ ancora o complexo aos filamentos citoplasmáticos do NPC e ocorre o transporte através do poro (NPC) (Moore and Blobel 1993; Gorlich and Mattaj 1996). No núcleo, o complexo proteína-substrato se dissocia com a ligação da proteína Ran ligada a GTP (Ran-GTP) à subunidade β, alterando sua conformação e liberando o domínio auto-inibitório (Importin beta binding - IBB) da Impα. Esse domínio então passa a competir com a NLS da proteína importada, promovendo uma diminuição de afinidade, facilitando a liberação dessa proteína no núcleo (Kobe 1999). Uma otimização do processo de desacoplamento da carga e reciclagem da Impα ocorre com auxílio da nucleoporina (Nup2 em levedura, Nup50 ou Npap60 em vertebrados) (Lange, Mills et al. 2007), que se liga a uma das regiões de ligação do NLS e uma porção C-terminal da Impα, em virtude de maior afinidade com a mesma. A nucleoporina liga-se à superfície estendida do domínio de repetição ARM da Impα, incluindo o sítio de ligação secundário de NLS, liberando a proteína transportada e o sítio de ligação (Matsuura and Stewart 2005). Após a carga ter sido liberada pelo deslocamento do NLS pela nucleoporina, a mesma é deslocada pela ligação com a exportina (Cse1/RanGTP em leveduras ou CAS/RanGTP em vertebrados) na região C-terminal da Impα, e assim a ligação sequencial das nucleoporinas, seguido por exportinas assegura que Impα será reciclada para o citoplasma, após a liberação da sua carga (Cingolani, Bednenko et al. 2002; Lee, Sekimoto et al. 2003; Lange, Mills et al. 2007) (Figura 3). 28 Figura 3 - Visão geral da importação nuclear de proteínas. A. No citoplasma, um complexo de importação entre NLS e o heterodímero Impα/Impβ é formado e B. Ciclos da Ran entre núcleo e citoplasma (Stewart 2007, adaptado). 1.5 ESTRUTURA CRISTALOGRÁFICA DA IMPORTINA-α A Impα pertence à família das proteínas chamadas carioferinas e apresenta cerca de 55 kDa. A Impα apresenta uma estrutura conservada em diferentes organismos, sendo que alguns destes organismos apresentam mais de uma isoforma. Pela análise das sequências dessas proteínas, foi possível classificá-las em três famílias: Kap-α1, Kap-α2, e Kap-α3 (Kohler, Haller et al. 1999). As diferenças entre as proteínas de cada família podem estar relacionadas com especificidades da Impα em cada organismo. Com a elucidação da estrutura molecular da Impα de organismos modelo como Saccharomyces cerevisiae ((Conti, Uy et al. 1998); ScImpα) e Mus musculus ((Kobe 1999); MmImpα), foi possível observar dois principais domínios funcionais responsáveis pela atuação da proteína no mecanismo de transporte celular via reconhecimento de NLSs: o primeiro consiste em uma curta sequência N-terminal envolvida na ligação com a Impβ e formação do complexo de transporte (domínio IBB) (Moore and Blobel 1993; Gorlich and Mattaj 1996) e outro, formado por dez 29 repetições em armadilho (ARM) que formam os dois sítios de ligação para sequências NLSs (Gorlich, Prehn et al. 1994; Peifer, Pai et al. 1994), o sítio principal e secundário (Figura 4). Houve também a elucidação da estrutura da Impα de outros organismos além dos citados: Homo sapiens (Cutress, Whitaker et al. 2008; Chang, Counago et al. 2012), Oryza sativa (Chang, Counago et al. 2012) e Neurospora crassa (Bernardes, Takeda et al. 2015). Figura 4 - Estrutura da Importin-α de Mus musculus (MmImpα) destacando-se os dez motivos ARMs e o domínio IBB (Kobe 1999). 1.6 SEQUÊNCIAS DE LOCALIZAÇÃO NUCLEAR Para a importação nuclear ocorrer a Impα discrimina a proteína a ser transportada de outras proteínas celulares. Proteínas destinadas ao transporte para o núcleo contêm sequências de aminoácidos chamados de sinais ou sequências de localização nuclear (NLSs) (Lange, Mills et al. 2007). As NLSs são sequências que por si só são suficientes para designar uma proteína a ser importada para o núcleo (Dingwall, Sharnick et al. 1982). Os sinais melhor caracterizados são denominados clássicos (cNLS), apresentando um ou mais grupos de aminoácidos básicos (Lange, Mills et al. 2007), essencialmente lisinas e argininas (Christophe, Christophe-Hobertus et al. 2000) em que duas classes podem ser destacadas. As cNLS monopartidas requerem uma lisina na posição P2, seguido de resíduos básicos nas posições P3 e P5 para produzir uma sequência de consenso KR/KXR/K (Lanford and Butel 1984; Lanford, Kanda et al. 1986; Fanara, Hodel et al. 2000; Fontes, Teh et al. 2003; Fontes, Teh et al. 2003), e 56 REFERÊNCIAS Baranauskiene, L., V. Petrikaite, et al. (2009). "Titration calorimetry standards and the precision of isothermal titration calorimetry data." Int J Mol Sci 10(6): 2752-2762. Barros, A. C., A. A. Takeda, et al. (2016). "Structural and Calorimetric Studies Demonstrate that Xeroderma Pigmentosum Type G (XPG) Can Be Imported to the Nucleus by a Classical Nuclear Import Pathway via a Monopartite NLS Sequence." J Mol Biol 428(10 Pt A): 2120-2131. Bernardes, N. E., A. A. Takeda, et al. (2015). "Structure of Importin-alpha from a Filamentous Fungus in Complex with a Classical Nuclear Localization Signal." PLoS One 10(6): e0128687. Biswas, T. and O. V. Tsodikov (2010). "An easy-to-use tool for planning and modeling a calorimetric titration." Anal Biochem 406(1): 91-93. Chang, C. W., R. L. Counago, et al. (2012). "Crystal structure of rice importin-alpha and structural basis of its interaction with plant-specific nuclear localization signals." Plant Cell 24(12): 5074-5088. Chook, Y. M. and G. Blobel (2001). "Karyopherins and nuclear import." Curr Opin Struct Biol 11(6): 703-715. Christophe, D., C. Christophe-Hobertus, et al. (2000). "Nuclear targeting of proteins: how many different signals?" Cell Signal 12(5): 337-341. Cingolani, G., J. Bednenko, et al. (2002). "Molecular basis for the recognition of a nonclassical nuclear localization signal by importin beta." Mol Cell 10(6): 1345-1353. Conti, E. and J. Kuriyan (2000). "Crystallographic analysis of the specific yet versatile recognition of distinct nuclear localization signals by karyopherin alpha." Structure 8(3): 329-338. Conti, E., M. Uy, et al. (1998). "Crystallographic analysis of the recognition of a nuclear localization signal by the nuclear import factor karyopherin alpha." Cell 94(2): 193-204. Cutress, M. L., H. C. Whitaker, et al. (2008). "Structural basis for the nuclear import of the human androgen receptor." J Cell Sci 121(Pt 7): 957-968. de Barros, A. C., A. A. S. Takeda, et al. (2018). "DNA mismatch repair proteins MLH1 and PMS2 can be imported to the nucleus by a classical nuclear import pathway." Biochimie 146: 87-96. de Oliveira, H. C., T. D. da Silva, et al. (2021). "Structural and calorimetric studies reveal specific determinants for the binding of a high-affinity NLS to mammalian importin-alpha." Biochem J 478(13): 2715-2732. Dingwall, C. (1991). "Transport across the nuclear envelope: enigmas and explanations." Bioessays 13(5): 213-218. Dingwall, C., S. V. Sharnick, et al. (1982). "A polypeptide domain that specifies migration of nucleoplasmin into the nucleus." Cell 30(2): 449-458. Doyle, M. L. (1997). "Characterization of binding interactions by isothermal titration calorimetry." Curr Opin Biotechnol 8(1): 31-35. Fanara, P., M. R. Hodel, et al. (2000). "Quantitative analysis of nuclear localization signal (NLS)-importin alpha interaction through fluorescence depolarization. Evidence for auto-inhibitory regulation of NLS binding." J Biol Chem 275(28): 21218-21223. Fontes, M. R., T. Teh, et al. (2003). "Structural basis for the specificity of bipartite nuclear localization sequence binding by importin-alpha." J Biol Chem 278(30): 27981-27987. Fontes, M. R., T. Teh, et al. (2000). "Structural basis of recognition of monopartite and bipartite nuclear localization sequences by mammalian importin-alpha." J Mol Biol 297(5): 1183-1194. Fontes, M. R., T. Teh, et al. (2003). "Role of flanking sequences and phosphorylation in the recognition of the simian-virus-40 large T-antigen nuclear localization sequences by importin-alpha." Biochem J 375(Pt 2): 339-349. 57 Freire, E., A. Schon, et al. (2009). "Isothermal titration calorimetry: general formalism using binding polynomials." Methods Enzymol 455: 127-155. Freire, E., W. W. van Osdol, et al. (1990). "Calorimetrically determined dynamics of complex unfolding transitions in proteins." Annu Rev Biophys Biophys Chem 19: 159-188. Freyer, M. W. and E. A. Lewis (2008). "Isothermal titration calorimetry: experimental design, data analysis, and probing macromolecule/ligand binding and kinetic interactions." Methods Cell Biol 84: 79-113. Gorlich, D. and U. Kutay (1999). "Transport between the cell nucleus and the cytoplasm." Annu Rev Cell Dev Biol 15: 607-660. Gorlich, D. and I. W. Mattaj (1996). "Nucleocytoplasmic transport." Science 271(5255): 1513-1518. Gorlich, D., S. Prehn, et al. (1994). "Isolation of a protein that is essential for the first step of nuclear protein import." Cell 79(5): 767-778. Gorlich, D., F. Vogel, et al. (1995). "Distinct functions for the two importin subunits in nuclear protein import." Nature 377(6546): 246-248. Gruner, S., M. Neeb, et al. (2014). "Impact of protein and ligand impurities on ITC-derived protein-ligand thermodynamics." Biochim Biophys Acta 1840(9): 2843-2850. Holdgate, G. A., M. Anderson, et al. (2010). "Affinity-based, biophysical methods to detect and analyze ligand binding to recombinant proteins: matching high information content with high throughput." J Struct Biol 172(1): 142-157. Huber, W. and F. Mueller (2006). "Biomolecular interaction analysis in drug discovery using surface plasmon resonance technology." Curr Pharm Des 12(31): 3999-4021. Jameson, D. M. and S. E. Seifried (1999). "Quantification of protein-protein interactions using fluorescence polarization." Methods 19(2): 222-233. Jerabek-Willemsen, M., C. J. Wienken, et al. (2011). "Molecular interaction studies using microscale thermophoresis." Assay Drug Dev Technol 9(4): 342-353. Kairys, V., L. Baranauskiene, et al. (2019). "Binding affinity in drug design: experimental and computational techniques." Expert Opin Drug Discov 14(8): 755-768. Knudsen, N. O., S. D. Andersen, et al. (2009). "Nuclear translocation contributes to regulation of DNA excision repair activities." DNA Repair (Amst) 8(6): 682-689. Kobe, B. (1999). "Autoinhibition by an internal nuclear localization signal revealed by the crystal structure of mammalian importin alpha." Nat Struct Biol 6(4): 388-397. Kohler, M., H. Haller, et al. (1999). "Nuclear protein transport pathways." Exp Nephrol 7(4): 290-294. Ladbury, J. E. (2010). "Calorimetry as a tool for understanding biomolecular interactions and an aid to drug design." Biochem Soc Trans 38(4): 888-893. Lanford, R. E. and J. S. Butel (1984). "Construction and characterization of an SV40 mutant defective in nuclear transport of T antigen." Cell 37(3): 801-813. Lanford, R. E., P. Kanda, et al. (1986). "Induction of nuclear transport with a synthetic peptide homologous to the SV40 T antigen transport signal." Cell 46(4): 575-582. Lange, A., R. E. Mills, et al. (2007). "Classical nuclear localization signals: definition, function, and interaction with importin alpha." J Biol Chem 282(8): 5101-5105. Lee, S. J., T. Sekimoto, et al. (2003). "Crystallization and preliminary crystallographic analysis of the importin-beta-SREBP-2 complex." Acta Crystallogr D Biol Crystallogr 59(Pt 10): 1866-1868. Macara, I. G. (2001). "Transport into and out of the nucleus." Microbiol Mol Biol Rev 65(4): 570-594, table of contents. Matsuura, Y. and M. Stewart (2005). "Nup50/Npap60 function in nuclear protein import complex disassembly and importin recycling." EMBO J 24(21): 3681-3689. Moore, M. S. and G. Blobel (1993). "The GTP-binding protein Ran/TC4 is required for protein import into the nucleus." Nature 365(6447): 661-663. Peifer, M., L. M. Pai, et al. (1994). "Phosphorylation of the Drosophila adherens junction protein Armadillo: roles for wingless signal and zeste-white 3 kinase." Dev Biol 166(2): 543-556. 58 Perozzo, R., G. Folkers, et al. (2004). "Thermodynamics of protein-ligand interactions: history, presence, and future aspects." J Recept Signal Transduct Res 24(1-2): 1-52. Pethica, B. A. (2015). "Misuse of thermodynamics in the interpretation of isothermal titration calorimetry data for ligand binding to proteins." Anal Biochem 472: 21-29. Pierce, M. M., C. S. Raman, et al. (1999). "Isothermal titration calorimetry of protein-protein interactions." Methods 19(2): 213-221. Rossi, A. M. and C. W. Taylor (2011). "Analysis of protein-ligand interactions by fluorescence polarization." Nat Protoc 6(3): 365-387. Salvador, G. H. M., E. K. R. Pinto, et al. (2023). "Structural basis of the myotoxic inhibition of the Bothrops pirajai PrTX-I by the synthetic varespladib." Biochimie 207: 1-10. Seidel, S. A., P. M. Dijkman, et al. (2013). "Microscale thermophoresis quantifies biomolecular interactions under previously challenging conditions." Methods 59(3): 301-315. Stewart, M. (2006). "Structural basis for the nuclear protein import cycle." Biochem Soc Trans 34(Pt 5): 701-704. Stewart, M. (2007). "Molecular mechanism of the nuclear protein import cycle." Nat Rev Mol Cell Biol 8(3): 195-208. Tellinghuisen, D. J. and E. J. Nowak (2003). "The inability to ignore auditory distractors as a function of visual task perceptual load." Percept Psychophys 65(5): 817-828. Tellinghuisen, J. (2003). "A study of statistical error in isothermal titration calorimetry." Anal Biochem 321(1): 79-88. Tellinghuisen, J. (2004). "Statistical error in isothermal titration calorimetry." Methods Enzymol 383: 245-282. Tellinghuisen, J. (2004). "Volume errors in isothermal titration calorimetry." Anal Biochem 333(2): 405-406. Tellinghuisen, J. (2005). "Statistical error in isothermal titration calorimetry: variance function estimation from generalized least squares." Anal Biochem 343(1): 106-115. Vega, S., O. Abian, et al. (2015). "A unified framework based on the binding polynomial for characterizing biological systems by isothermal titration calorimetry." Methods 76: 99-115. Velazquez-Campoy, A., H. Ohtaka, et al. (2004). "Isothermal titration calorimetry." Curr Protoc Cell Biol Chapter 17: Unit 17 18. Velazquez Campoy, A. and E. Freire (2005). "ITC in the post-genomic era...? Priceless." Biophys Chem 115(2-3): 115-124. Watzig, H., I. Oltmann-Norden, et al. (2015). "Data quality in drug discovery: the role of analytical performance in ligand binding assays." J Comput Aided Mol Des 29(9): 847-865. Weis, K. (2003). "Regulating access to the genome: nucleocytoplasmic transport throughout the cell cycle." Cell 112(4): 441-451. Wiseman, T., S. Williston, et al. (1989). "Rapid measurement of binding constants and heats of binding using a new titration calorimeter." Anal Biochem 179(1): 131-137. Zhao, H., R. Ghirlando, et al. (2015). "A multilaboratory comparison of calibration accuracy and the performance of external references in analytical ultracentrifugation." PLoS One 10(5): e0126420. 202006100d594f1125018b060a4352b35265107e411be8828de1b16bd5131edd.pdf Tese-Hamine 300824-MF.docx 01cca2e1be3660a8aec4fe50b7845144cc2f091c4bfc05bbc64010d9a25b04bf.pdf 202006100d594f1125018b060a4352b35265107e411be8828de1b16bd5131edd.pdf 6596fb9625c8fcb56bbf727a0e418689dccccc632bd8ed83b7bbf21decb7ce1c.pdf Tese-Hamine 300824-MF.docx