UNIVERSIDADE ESTADUAL PAULISTA - “JÚLIO DE MESQUITA FILHO” INSTITUTO DE BIOCIÊNCIAS DE BOTUCATU Trabalho de Conclusão de Curso Busca de novos alvos terapêuticos no tratamento de câncer de pulmão utilizando ferramentas de biologia de sistemas Rodrigo Teixeira de Abreu Trabalho de conclusão de curso sob ori- entação do Prof. Dr José Luiz Ry- barczyk Filho apresentado ao Instituto de Biociências para a obtenção do t́ı- tulo de Bacharel em F́ısica Médica. Botucatu 2013 ii Agradecimentos Quero agradecer a minha famı́lia, que me apoia em todos os momentos de minha vida. A todos os meus amigos que estiveram presentes durante os quatro anos de graduação e que tornaram esse peŕıodo de conhecimento inesquećıvel. Aos meus amigos mais distantes, com quem preservo fortes laços de amizade apesar da falta da convivência pessoal. Ao meu orientador Professor Doutor José Luiz Rybarczyk Filho, que além de amigo me mostrou os caminhos e o saber da ciência. iii Resumo A quimioterapia é uma das formas de tratamentos para o câncer, cujo processo é pela aplicação de medicamentos que alteram a śıntese de DNA, interrompendo a divisão celular. No caso do câncer de pulmão, a dificuldade está no fato de que as células canceŕıgenas criam quimiorresistência após um determinado peŕıodo de tempo. Se o indiv́ıduo desenvolver o câncer de pulmão novamente, deverá ser aplicado outro quimioterápico no paciente, e assim por diante. Nos tratamentos atuais são utilizados combinações de drogas para contornar o problema da quimiorresistência. Este trabalho utilizou a biologia de sistemas para encontrar novos alvos protéicos para auxiliar no desenvolvimento de novos quimioterápicos para o tratamento do câncer de pulmão. Foi constrúıda uma rede baseada nos alvos protéicos já conhecidos. A rede foi expandida com o intuito de buscar quais são as protéınas que interagem com os alvos protéicos já conhecidos. Após a expansão, foram utilizadas análises de centralidades para evidenciar as protéınas mais importantes na rede, e correlacionamos com informação de expressão gênica para verificar se as protéınas mais importantes do ponto de vista topológico estão diferencialmente sub ou super expressas. A análise de centralidade junto a mostra dos dados de expressão gênica convergiu para um bom resultado, foi posśıvel evidenciar algumas protéınas que podem ser utilizadas como novos alvos quimioterápicos. Sumário 1. Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2. Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3. Materiais e Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.1 Redes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.2 String . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 3.3 DrugBank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3.4 Gene Expression Omnibus (GEO) . . . . . . . . . . . . . . . . . . . . . . . . 8 4. Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.1 Alvos Protéicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.2 Rede de Interação Protéica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4.3 Expressão Gênica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 5. Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Lista de Figuras 4.1 Rede de interação protéica referente aos alvos quimioterápicos utilizados no tratamento de câncer de pulmão . . . . . . . . . . . . . . . . . . . . . . . . . 11 4.2 Mapa de calor para as seis centralidades estudadas. . . . . . . . . . . . . . . 12 4.3 Mapa de Calor para integração rede e informação gênica: (A) tecido normal ex-fumante versus tecido normal de não fumante, (B) tecido normal fumante versus tecido normal de não fumante. . . . . . . . . . . . . . . . . . . . . . . 14 4.4 Mapa de Calor para integração rede e informação gênica: (A) tecido tumoral de não fumante versus tecido normal de não fumante, (B) tecido tumoral de ex-fumante versus tecido normal de não fumante, (C) tecido tumoral de fumante versus tecido normal de não fumante . . . . . . . . . . . . . . . . . 15 Lista de Tabelas 4.1 Relação dos quimioterápicos com os alvos, enzimas e transportadores . . . . . . . 10 4.2 Tabela das 20 protéınas com os maiores valores de centralidades . . . . . . . 13 Caṕıtulo 1 Introdução A definição de“câncer”designa um conjunto altamente heterogêneo de doenças que podem afetar qualquer parte do corpo e que têm em comum o crescimento celular desordenado, a invasão de tecidos e a formação de metástases [1]. A progressão do câncer é um processo complexo envolvendo inúmeras variáveis tais como: escalas temporais e espaciais, um grande número de rotas metabólicas e diferentes tipos celulares [2]. Esta doença pode afetar pessoas de todas as idades, mas o risco para a maioria dos tipos de câncer aumenta com o acréscimo da idade. O câncer é um dos maiores responsáveis pelas mortes no mundo, sendo os cânceres de pulmão, estômago, f́ıgado, cólon e mama os que mais matam [3]. O câncer pulmonar, até o ińıcio do século XX, foi uma doença que raramente ocorria na população, porém a ocorrencia está crescendo durante os últimos anos. Ela está como a primordial causa de morte entre os homens da América do Norte e na Europa, enquanto que na América Latina, África e Ásia a mortalidade vem aumentando consideravelmente [4]. O termo“câncer de pulmão”é usado para os tumores malignos do epitélio respiratório que contribuem com mais de 90% destas malignidades. Este tumor é uma das doenças malignas que mais mata em âmbito mundial, e é uma das três mais incidentes perdendo para o câncer de próstata nos homens e no câncer de mama nas mulheres. Para o ano de 2009, foram estimados, nos Estados Unidos da América, 1.479.350 casos novos. Dentre estes casos, o câncer de pulmão contribui com 219.440 (14,5%) casos, com parcelas de 116.090 e 103.350 para homens e mulheres[4]. Durante as últimas três décadas, os avanços no tratamento Caṕıtulo 1. Introdução 3 do câncer de pulmão de pequenas células foram modestos, e ocorreram principalmente na doença estagiada como limitada. De acordo com o Instituto Nacional do Câncer (INCA), o câncer pulmonar é o mais comum de todos os tumores malignos, apresentando aumento de 2% por ano na sua inci- dência mundial. Em 90% dos casos diagnosticados, este tumor está associado ao consumo de derivados de tabaco. No Brasil, foi responsável por 20.622 mortes em 2008. Altamente letal, a sobrevida média cumulativa total em cinco anos varia entre 13 e 21% em páıses desenvolvidos e entre 7 e 10% nos páıses em desenvolvimento [3]. No fim do século XX, o câncer de pulmão se tornou uma das principais causas de morte evitáveis. Evidências na literatura mostram que pessoas que desenvolvem este tipo de câncer, apresentam risco aumentado para o aparecimento de outros cânceres de pulmão e que irmãos, irmãs e filhos de pessoas que tiveram câncer de pulmão apresentam risco levemente aumentado para o desenvolvimento desse câncer. Entretanto, é dif́ıcil estabelecer o quanto do risco decorre de fatores hereditários e o quanto é devido ao hábito de fumar[3]. A quimioterapia é uma das formas de tratamento e pode ser combinado com a aplicação de um ou mais quimioterápicos. O uso de drogas isoladas (monoquimioterapia) mostrou-se ineficaz em induzir respostas completas ou parciais significativas, na maioria dos tumores, sendo atualmente de uso muito restrito. A poliquimioterapia é de eficácia comprovada e tem como objetivos atingir populações celulares em diferentes fases do ciclo celular, utilizar a ação sinérgica das drogas, diminuir o desenvolvimento de resistência às drogas e promover maior resposta por dose administrada [5]. Tendo em vista a grande preocupação com esse tipo de enfermidade, inúmeras pesquisas são realizadas nesse segmento. O desenvolvimento do câncer está relacionado com inúmeras interações qúımicas entre moléculas e com as células neoplásicas, o que torna o estudo dif́ıcil já que os estudos das caracteŕısticas dessas moléculas são realizados em ensaios isolados com a atividade de uma única droga. Usando as ferramentas de biologia de sistemas podeŕıamos estudar proteinas alvos de quimioterápicos, e sugerir novos alvos para tratamentos para evitar que as células canceŕı- genas desenvolvam quimiorresistência. Caṕıtulo 2 Objetivo O objetivo deste projeto é construir uma rede de interação protéica para o câncer de pulmão através dos principais quimioterápicos utilizados no tratamento e eleger os prováveis candidatos a alvos via análise de centralidade. Prospectar dados de transcriptomas de câncer e correlacionar com a rede obtida, com o intuito de identificar novos alvos potenciais para o tratamento quimioterápico. • Buscar na literatura os quimioterápicos para o tratamento de câncer e os seus respec- tivos alvos protéicos. A partir dos alvos será constrúıda a rede de interação; • Determinar os posśıveis alvos quimioterápicos através de análise de centralidade; • Buscar dados de expressão gênica para câncer em bancos de informações transcricio- nais.; • Projetar a expressão gênica sobre as redes. (análise qualitativa); Caṕıtulo 3 Materiais e Métodos 3.1 Redes Podemos encontrar redes complexas nos mais diversos contextos, como por exemplo: redes sociais, biológicas, tecnológicas, informação, etc. Redes sociais são aquelas formadas por grupos de pessoas que estão ligadas via relações profissionais, familiares, amizade, sexual, ou outros tipos. As redes tecnólogicas são aquelas criadas pelo o homem, como redes de esgoto, água, luz, estrada, aeroportos, etc. Redes de informação dizem respeito a mensagens como por exemplo, as redes de TV, internet, citações, e consistem de inúmeros tipos. E por fim temos os exemplos das redes biológicas, como cerébro que é formado por uma rede de neurônios muito conectados entre si, o sistema vascular que pode ser considerado como uma rede, ou o genoma. Existem alguns modelos matemáticos de redes que podem ser usados para modelar algumas redes reais [6, 7, 8]. Uma rede é constitúıda por nodos e arestas, no caso de redes protéicas, o nodo é a protéına e a aresta é a interação entre as protéınas. A rede será analisada através do programa Cytoscape v.2.8.3 [9], a fim de verificar quais os pontos mais cŕıticos à sua estabilidade. Os ı́ndices utilizados para esse tipo de análise são os seguintes: • Conectividade: representada por ki , determina com quantos nodos vizinhos funci- onais cada elemento da rede se conecta; • Coeficiente de Clusterização: determinado matematicamente pela fórmula C(i) = 2ni ki(ki−1) , onde ni é o número de conexões dos vizinhos de um dado nodo i entre eles mesmos, e ki , sua conectividade; Caṕıtulo 3. Materiais e Métodos 6 • Grau de Intermediação: Medida muito similiar ao estresse, informa o quanto um nodo espećıfico está em relação aos demais nodos da rede. Auxilia na definição de módulos do sistema; • Grau de Proximidade: É o ńıvel de proximidade de um nódo relacionada ao outros nodos da rede. • Sobreposição Topológica: reflete a interconectividade entre quaisquer dois nodos na rede e permite a determinação das classes funcionais dos elementos da rede. Esse tipo de análise pode ser complementado com dados de ontologia dos elementos, buscados em bancos de dados como o Gene Ontology [10]; • Conectividade média dos vizinhos: calculado pela média de conectividade dos vizinhos de um determinado nodo. Oferece informações a respeito da modularidade da região de centralidade desse nodo; Esses ı́ndices fornecem informações relevantes sobre o funcionamento de uma rede e nos permitirão inferir os genes cŕıticos à sua estabilidade e quais fármacos ou combinações de fármacos possuem maior possibilidade de desestruturar o sistema como um todo. 3.2 String STRING (Search Tool for the Retrieval of Interacting Genes/Proteins) é um banco de dados de interação protéica, sendo mantido pelo Laboratório Europeu de Biologia Mole- cular (European Laboratory for Molecular Biology - EMBL) desde 2000 [11]. Atualmente encontra-se na versão 9.05. A parte interessante deste banco de dados disponibilizado pelo EMBL é justamente o controle da qualidade e origem da informação. Assim, escolhendo um organismo, por exemplo, podemos formar uma rede de interação em que as protéınas são os nodos e as interações são listadas controladamente, escolhendo-se ńıveis de confiança que controlem falsos positivos e falsos negativos adequadamente. O STRING considera duas categorias de relações entre protéınas: interações f́ısicas (diretas) e associativas (indi- retas), que são dados provenientes de rotas metabólicas. Estas categorias são subdividas em Caṕıtulo 3. Materiais e Métodos 7 quatro tipos de informações: Contexto Genômico, Alta-Performance, Co-Expressão e Co- nhecimento Prévio. Estes, por sua vez, são subdivididos em sete métodos de obtenção dos dados: Neighborhood, Gene Fusion, Co-Ocurrence, Coexpression, Experimentos, Database e Textmining. Tais métodos estão explicados no que segue. • Neighborhood, Gene Fusion e Co-ocurrence: todos os três tipos têm o obje- tivo de identificar pares de genes que parecem ter sofrido pressão seletiva em comum durante o processo de evolução e que hoje funcionam de maneira associada. • Coexpression: aponta pares de genes que estão sendo co-expressos no mesmo orga- nismo. • Experimentos: é uma lista de interação protéına-protéına retirada de outros bancos de dados de interação protéica tais como: BIND, DIP, GRID, HPRD, IntAct, MINT, PID. • Databases: é idêntico aos “Experimentos”, porém são retirados de banco de dados de rotas metabólicas, estes dados são avaliados por especialistas. Exemplos: Biocarta, BioCyc, GO, KEGG, Reactome. • Textmining: fornece uma lista de grupos de associação protéica que é retirada dos resumos de artigos que estão armazenados no PUBMED. Se dois genes ou protéınas estão citados no resumo, mesmo que não possuam nenhum tipo de interação, é o suficiente para dizer que existe uma associação entre elas. O STRING nos possibilita combinar todos os métodos para a composição de uma rede de interações protéına-protéına, pela escolha de um escore, dado por: S = 1− 7∏ i=1 (1− Si), (3.1) onde S é o escore ponderado sobre os sete métodos de predição, mas pode-se escolher o conjunto de métodos a serem considerados, Si é o escore individual de cada um dos métodos escolhidos. Este cálculo é feito para cada par de interação. Caṕıtulo 3. Materiais e Métodos 8 As probabilidades (escores) invididuais são calculados tomando como base o KEGG [12]. A razão disso é que no KEGG os dados são analisados (curados) manualmente, vários organismos são disponibilizados e diferentes áreas funcionais são consideradas. Mais ainda, o KEGG está em constante atualização sendo portanto, indicado como padrão ouro para verificação da existência ou não de uma associação protéica. Os escores fornecem informação sobre a probabilidade de, dado que o STRING encontre associação entre duas protéınas, elas interajam em uma mesma rota metabólica do KEGG. 3.3 DrugBank O DrugBank (http://www.drugbank.ca/ ) [13] é um banco de dados disponibilizado pela Universidade de Alberta (Canadá), sendo o único recurso de bioinformática e quimioinfor- mática que combina informações detalhadas de medicamentos qúımicos e farmacológicos com informações dos alvos (seqüência, estrutura qúımica, via metabólica, etc.) de cada droga. O DrugBank contém atualmente o registro de 6827 drogas, dentre elas: drogas expe- rimentais, nutracêuticos, drogas de moléculas pequenas e drogas biotecnológicas aprovadas pelo órgão governamental norte-americano de Administração de Alimentos e Medicamentos (Food and Drug Administration - FDA). 3.4 Gene Expression Omnibus (GEO) . Os microarranjos são empregados na detecção e quantificação dos ńıveis de expressão de ácidos nucléicos provenientes de amostras biológicas (expressão gênica), os quais são postas para hibridizar com o DNA fixado no arranjo. Estas amostras são o objeto de estudo do pesquisador, sejam elas preparadas a partir de células normais, cancerosas, tecido neuronal, etc. Os dados de expressão gênica serão resgatados do repositório publico GEO (http://www.ncbi.nlm.nih.gov/projects/geo/ ) [14], o qual possui uma enorme quantidade de experimentos com chips de cDNA sobre genes expressos em diferentes situações celulares. Atualmente existem cerca de 10262 experimentos para Homo sapiens. Caṕıtulo 4 Resultados 4.1 Alvos Protéicos Nos primeiros meses da pesquisa foram dedicados para a construção da rede de interação proteica, para isto foi necessária a busca de todos os alvos protéicos de todos os quimioterá- picos utilizados no tratamento de câncer. Esta busca foi realizada via a leitura de artigos. A maioria dos artigos focaliza a ação de um novo tratamento comparando-o com o utilizado habitualmente. Dentre as drogas encontradas as mais importantes são: cisplatina, paclita- xel, docetaxel, vinorelbine [13]. Com esses nomes dos quimioterápicos para o tratamento do câncer de pulmão, foi feita uma tabela para uma análise posterior no DrugBank. A tabela 4.1 contém além dos nomes dos quimioterápicos, o mecanismo de ação, a interação da droga, os alvos, os transportadores e as enzimas. 4.2 Rede de Interação Protéica Para construção da rede de interação protéica foram utilizados as protéınas alvos contidas na tabela 4.1. Ao todo foram inseridas 31 protéınas humanas no banco de dados STRING usando apenas os métodos de predição de interação “Databases” e ”Experimentos” com um escore de 0.9. Como resposta, o banco de dados retornou todas as protéınas que interagem com estas 31 protéınas previamente selecionadas. A figura 4.1 apresenta a rede obtida, ao todo temos 575 nodos e 13182 interações protéicas. A análise de centralidade da rede foi conduzida utilizando o plugin Network Analyser Caṕıtulo 4. Resultados 10 Droga Alvos Enzimas Transportadores FLAVOPIRIDOL CDK2 CDK5 CDK9 CDC2 CDK6 EGFR CDK2deltaT CDK4 CDK8 CDK7 PYGM ABCG2 VINORELBINA TUBB CYP3A4 CYP2D6 ABCB1 PEMETREXED TYMS ATIC DHFR GART DCK SLC29A1 GEFITINIB EGFR CYP3A4 CYP2D6 ABCB1 ABCG2 LAPATINIB EGRF ERBB2 CYP3A4 CYP3A5 CYP2C8 CYP2C19 ABCB1 TAP1 DOCETAXEL TUBB1 BCL2 CYP3A4 CYP3A5 CYP3A7 CYP1B1 ABCB1 ABCC10 GEMCITABINA RRM1 TYMS CMPK CDA CDK ABCB1 ABCC1 CLC29A1 ERLOTINIBE EGFR NR1I2 CYP3A4 CYP3A5 CYP1A2 CYP1A1 CYP2D6 CYP2C8 CYP1B1 ABCG2 ABCB1 PLACLITAXEL TUBB1 BCL2 CYP2C9 CYP3A5 CYP3A7 CYP2C8 CYP3A4 CYP19A1 CYP1B1 ABCB11 ABCB1 ABCC1 ABCC10 EPOTHILONE D TUBA3C TUBB TUBB1 TUBB2C TUBB4 TUBA4A TUBB3 TUBA1C TUBA8 TUBB4Q TUBA1B TUBA1A EPOTHILONE B TUBA3C TUBB TUBB1 TUBB2C TUBB4 TUBA4A TUBB3 TUBA1C TUBA8 TUBB4Q TUBA1B TUBA1A BEXAROTENE RXRA RXRB RXRG CYP3A4 CYP2C9 CISPLATINA DNA ABCC3 ABCC5 ABCC2 SLC22A2 SLC31A1 SLC31A2 ABCC6 ABCB1 ATP7B ATP7A ETOPOSIDE TOP2A CYP3A4 CYP1A2 CYP2C8 CYP2E1 CYP3A5 ABCC3 ABCC6 ABCC1 ABCC1 ABCC10 ABCC2 ABCG2 IRINOTECANO TOP1 TOP1MT CYP3A4 CYP3A5 CES1 CYP3A7 CYP2B6 UGT1A1 UGT1A9 SLC22A3 SLCO1B1 ABCC1 ABCG2 TOPOTECANO TOP1 TOP1MT DNA CYP3A4 ABCG2 ABCB1 IFOSFAMIDAL DNA CYP2B6 CYP3A4 CYP3A5 CYP2C19 CYP2C9 CYP2C8 CYP2A6 CYP2C18 PTGS1 CYP3A7 IXABEPILONAL TUBB3 CYP3A4 Tab. 4.1: Relação dos quimioterápicos com os alvos, enzimas e transportadores do software Cytoscape [9]. As centralidades foram utilizadas para medir a importância de um nodo na rede e se este nodo esta diretamente ligado com a sinalização celular. Foram Caṕıtulo 4. Resultados 11 Fig. 4.1: Rede de interação protéica referente aos alvos quimioterápicos utilizados no tra- tamento de câncer de pulmão utilizadas as seguintes centralidades: grau de proximidade, grau de intermediação, coefi- ciente de clusterização, sobreposição topológica, conectividade e conectividade média dos vizinhos. A figura 4.2 apresenta um mapa de calor - este mapa foi gerado com o uso do plugin Galant [15] - para cada uma das centralidades estudas. As cores vermelho e azul significam respectivamente alta e baixa importância da centralidade para a rede. A tabela 4.2 apresenta as protéınas com os maiores valores de centralidades. Caṕıtulo 4. Resultados 12 Fig. 4.2: Mapa de calor para as seis centralidades estudadas. Caṕıtulo 4. Resultados 13 T a b . 4 .2 : T ab el a da s 20 pr ot éı n as co m os m ai or es va lo re s de ce n tr al id ad es G e n e G ra u d e In te rm e d ia ç ã o G ra u d e P ro x im id a d e C o e fi c ie n te d e C lu st e ri z a ç ã o C o n e c ti v id a d e C o n e c ti v id a d e M é d ia d o s V iz in h o s S o b re p o si ç ã o T o p o ló g ic a T P 5 3 0 .1 5 6 4 1 3 7 5 0 .4 7 6 9 8 7 4 5 0 .2 9 5 6 7 9 0 1 8 1 4 2 .3 8 2 7 1 6 0 5 0 .0 9 2 9 1 7 4 8 E G F R 0 .1 2 2 8 5 0 6 5 0 .4 1 6 6 6 6 6 7 0 .1 0 5 7 4 2 3 1 2 0 1 7 .5 5 0 .0 5 8 2 2 2 5 9 M Y C 0 .1 0 7 8 9 2 0 8 0 .4 4 1 5 1 8 2 0 .1 6 6 5 3 0 6 1 5 0 3 0 .6 2 0 .0 7 8 6 1 1 8 3 C D K 2 0 .0 6 8 4 3 5 8 3 0 .4 2 7 9 2 7 9 3 0 .2 6 7 9 0 4 5 1 1 1 7 3 9 .3 2 4 7 8 6 3 2 0 .1 2 3 1 9 4 8 1 E S R 1 0 .0 4 7 6 7 3 3 6 0 .3 9 4 7 3 6 8 4 0 .3 9 6 8 6 2 7 5 5 1 3 2 .2 5 4 9 0 1 9 6 0 .1 1 2 3 1 8 1 C C N H 0 .0 4 6 0 2 6 4 5 0 .4 1 8 1 9 5 1 6 0 .3 7 9 7 4 6 8 4 8 0 4 4 .1 2 5 0 0 0 .1 3 2 9 0 6 6 3 U B C 0 .0 4 2 8 0 8 8 6 0 .4 4 1 1 7 6 4 7 0 .4 7 5 7 4 9 7 2 7 4 5 0 .2 2 9 7 2 9 7 3 0 .1 3 0 7 7 1 4 C T N N B 1 0 .0 4 0 4 7 0 5 8 0 .4 0 2 5 4 2 3 7 0 .1 7 9 4 8 7 1 8 3 9 3 2 .4 1 0 2 5 6 4 1 0 .1 0 0 6 5 2 9 7 R X R A 0 .0 3 9 0 3 0 5 4 0 .3 8 0 7 6 1 5 2 0 .3 1 6 9 9 9 4 5 8 2 4 .6 8 9 6 5 5 1 7 0 .1 0 4 3 9 8 0 1 C C N D 1 0 .0 3 7 3 7 7 5 9 0 .4 3 3 1 3 0 7 0 .3 4 7 2 8 9 8 4 7 9 4 5 .5 9 4 9 3 6 7 1 0 .1 2 0 6 2 1 5 3 C D K N 1 A 0 .0 3 6 7 1 5 0 .4 2 9 2 1 6 8 7 0 .3 1 2 9 9 6 7 3 9 3 4 4 .6 0 2 1 5 0 5 4 0 .1 3 0 0 0 4 0 8 C D K 7 0 .0 3 5 1 6 7 3 4 0 .4 1 3 0 4 3 4 8 0 .3 7 1 5 4 5 8 3 8 6 4 2 .4 3 0 2 3 2 5 6 0 .1 3 6 8 7 1 7 2 E G F 0 .0 2 7 7 8 0 3 6 0 .3 7 3 2 8 0 9 4 0 .1 4 8 1 1 0 3 2 8 9 2 0 .1 0 1 1 2 3 6 0 .0 8 3 7 5 4 6 8 P C N A 0 .0 2 5 8 6 5 1 5 0 .3 8 6 1 7 8 8 6 0 .3 2 8 8 2 8 8 3 3 7 3 2 .7 0 2 7 0 2 7 0 .1 2 3 8 7 3 8 7 P O L R 2 A 0 .0 2 5 3 7 6 2 3 0 .3 8 3 0 6 4 5 2 0 .4 3 0 5 5 5 5 6 8 1 3 9 .2 5 9 2 5 9 2 6 0 .1 7 7 5 3 1 9 8 M E D 1 0 .0 2 4 3 6 9 2 7 0 .3 4 6 9 2 6 3 5 0 .6 3 4 0 5 7 9 7 2 4 2 5 .2 9 1 6 6 6 6 7 0 .1 6 2 1 2 6 0 7 A K T 1 0 .0 2 3 7 0 7 7 9 0 .3 9 2 2 9 1 8 1 0 .1 8 2 6 2 4 1 1 4 8 2 6 .5 2 0 8 3 3 3 3 0 .0 9 3 5 6 5 9 6 R A C 1 0 .0 2 2 4 3 6 3 7 0 .3 8 8 0 1 9 0 6 0 .2 7 3 1 1 5 2 2 3 8 2 6 .9 7 3 6 8 4 2 1 0 .1 0 2 9 5 2 9 9 H D A C 1 0 .0 2 2 3 3 0 2 6 0 .3 9 0 4 1 0 9 6 0 .3 1 7 2 4 1 3 8 3 0 2 8 .7 3 3 3 3 3 3 3 0 .1 0 3 7 3 0 4 5 U B A 5 2 0 .0 2 1 6 3 0 7 7 0 .3 8 5 1 3 5 1 4 0 .5 6 3 4 9 5 7 4 5 0 .2 1 6 2 1 6 2 2 0 .1 8 3 9 4 2 1 8 Caṕıtulo 4. Resultados 14 4.3 Expressão Gênica Os dados referente a câncer de pulmão foram retirados do banco de dados GEO. O con- junto analisado está armanezado no GEO sob o código GSE10072, esta amostra é composta de 107 microarranjos de tecido normal e tecido tumoral de homens e mulheres. As amos- tras foram divida em fumantes (16 normais e 24 tumorais), ex-fumantes (18 normais e 17 tumorais), e não fumantes (15 normais e 16 tumorais). A figura 4.3 e figura 4.4 apresenta a integração da rede protéica e os dados de microarranjo dos tecidos tumorais e normais oriundos do pulmão. Ambas figuras apresentam uma perfil de expressão muito similar, com a exceção da figura 4.4 (C) que apresenta um nivel de expressão diferenciado das demais. Se compararmos a figura 4.2 e a figura 4.4 podemos notar que ambas áreas vermelhas são similares. Isso indica que as protéınas com altos valores de centralidades tem um papel fundamental no câncer de pulmão e que estes poderiam ser estudados com mais afinco no desenvolvimento de novas drogas. Fig. 4.3: Mapa de Calor para integração rede e informação gênica: (A) tecido normal ex- fumante versus tecido normal de não fumante, (B) tecido normal fumante versus tecido normal de não fumante. Caṕıtulo 4. Resultados 15 Fig. 4.4: Mapa de Calor para integração rede e informação gênica: (A) tecido tumoral de não fumante versus tecido normal de não fumante, (B) tecido tumoral de ex- fumante versus tecido normal de não fumante, (C) tecido tumoral de fumante versus tecido normal de não fumante Caṕıtulo 5 Conclusão As análises mostra uma correlação da expressão gênica com a rede proteica com altos valores de centralidade. As protéınas selecionadas como posśıveis alvos quimioterápicos mostram que o método foi capaz de indicar alvos já conhecidos, como o caso das protéınas EGPR e CDK’s e observa-se que outras protéınas podem ser posśıveis novos alvos quimi- oterápicos, como é o caso do TP53, MYC, CCNH e ESR1 que são protéınas importante relacionadas a outros tumores [16, 17, 18, 19]. Referências Bibliográficas [1] KUFE D. W.; POLLOCK, R. E. W. R. R. B. R. C. G. T. S. H. J. F. . F. E. Cancer Medicine. [S.l.]: BC Decker, 2003. [2] ANDERSON, A. R.; QUARANTA, V. Integrative mathematical oncology. Nature Re- views Cancer, Nature Publishing Group, v. 8, n. 3, p. 227–234, 2008. Dispońıvel em: . [3] (INCA), I. N. de C. Atlas de Mortalidade por CÃncer. setembro 2011. Dispońıvel em: . [4] ZAMBONI, M. CÃncer do pulmão. Revista da Sociedade de Pneumologia e Tisiologia do Estado do Rio de Janeiro, v. 4, p. S1–S2, 2009. [5] ROSADO, J. O.; HENRIQUES, J. A.; BONATTO, D. A systems pharmacology analysis of major chemotherapy combination regimens used in gastric cancer tre- atment: predicting potential new protein targets and drugs. Current cancer drug targets, Bentham Science Publishers, v. 11, n. 7, p. 849–869, 2011. Dispońıvel em: . [6] RAVASZ, E. et al. Hierarchical organization of modularity in metabolic networks. sci- ence, American Association for the Advancement of Science, v. 297, n. 5586, p. 1551–1555, 2002. Dispońıvel em: . [7] BARABASI, A.-L.; OLTVAI, Z. N. Network biology: understanding the cell’s functional organization. Nature Reviews Genetics, Nature Publishing Group, v. 5, n. 2, p. 101–113, 2004. Dispońıvel em: . Referências Bibliográficas 18 [8] BOLLOBAS, B. Random graphs. [S.l.]: Cambridge university press, 2001. [9] SHANNON, P. et al. Cytoscape: a software environment for integrated models of biomo- lecular interaction networks. Genome research, Cold Spring Harbor Lab, v. 13, n. 11, p. 2498–2504, 2003. Dispońıvel em: . [10] ASHBURNER, M. et al. Gene ontology: tool for the unification of biology. Na- ture genetics, Nature Publishing Group, v. 25, n. 1, p. 25–29, 2000. Dispońıvel em: . [11] FRANCESCHINI, A. et al. String v9. 1: protein-protein interaction networks, with increased coverage and integration. Nucleic acids research, Oxford Univ Press, v. 41, n. D1, p. D808–D815, 2013. Dispońıvel em: . [12] KANEHISA, M. et al. The kegg databases at genomenet. Nucleic acids re- search, Oxford Univ Press, v. 30, n. 1, p. 42–46, 2002. Dispońıvel em: . [13] WISHART, D. S. et al. Drugbank: a comprehensive resource for in silico drug discovery and exploration. Nucleic acids research, Ox- ford Univ Press, v. 34, n. suppl 1, p. D668–D672, 2006. Dispońıvel em: . [14] BARRETT, T.; EDGAR, R. Gene expression omnibus: Micro- array data storage, submission, retrieval, and analysis. Methods in enzymology, Elsevier, v. 411, p. 352–369, 2006. Dispońıvel em: . [15] CAMILO, E. et al. Galant: a cytoscape plugin for visualizing data as functional landscapes projected onto biological networks. Bioinforma- tics, Oxford Univ Press, v. 29, n. 19, p. 2505–2506, 2013. Dispońıvel em: . Referências Bibliográficas 19 [16] COOPER, W. A. et al. Molecular biology of lung cancer. Journal of thoracic disease, Pioneer Bioscience Publishing Company, v. 5, n. Suppl 5, p. S479, 2013. [17] JI, Q. et al. Resveratrol inhibits invasion and metastasis of colorectal cancer cells via malat1 mediated wnt/β-catenin signal pathway. PLOS ONE, Public Library of Science, v. 8, n. 11, p. e78700, 2013. [18] ZHANG, L. et al. Association between single nucleotide polymorphisms (snps) and toxicity of advanced non-small-cell lung cancer patients treated with chemotherapy. PloS one, Public Library of Science, v. 7, n. 10, p. e48350, 2012. [19] ATMACA, A. et al. The validation of estrogen receptor 1 mrna expression as a predictor of outcome in patients with metastatic non-small cell lung can- cer. International Journal of Cancer, Wiley Online Library, 2013. Dispońıvel em: .