Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina

dc.contributor.advisorLemke, Ney [UNESP]
dc.contributor.advisorAcencio, Marcio Luis [UNESP]
dc.contributor.authorReis, Esther Camilo dos [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2016-08-12T18:48:37Z
dc.date.available2016-08-12T18:48:37Z
dc.date.issued2015-01-23
dc.description.abstractAn important question raised after the first complete genome sequencing was: how many genes are essential for the cell life? Single deletion experiments carried out with the bacteria Escherichia coli unveiled that less than 10% of their genes are essential, which means that the inativation of each one leads to the total bacteria inviability. The network theory provides an abstract representation of a biological system, where a set of nodes are the biological components (protein, genes, metabolites, etc) and the set of edges are the interactions (protein-protein physical interactions, metabolic interactions, transcriptional regulational interactions, etc) that link each two biological components. The position of the biological components in a network indicates its importance for the maintenance of the biological system. In general, components located in central positions in a network are those key components for the system integrity. In this work, we decided to survey the position of the 90% genes considered not essential in integrated network of gene interactions (INGI) of the E. coli. Specifically, we investigated the conditionally essential genes, i. e. those genes essential under some type of stress. Moreover, we also investigated the network position of gene pairs that constitute aggravating genetic interaction, i. e. genes pairs that when deleted simultaneously aggravates the organism viability. Using a purely computational approach based on machine learning and topological properties of the INGI, we created preditive decision trees models to define how those conditionally essential genes and the aggravating genetic interaction are distributed in the INGI. A list with the probability of classification for each gene/interaction were obtained. The performance evaluation of our models demonstrates that this methodology can be applied with success in predicting conditionally essential genes. The prediction of genetic interactions also ...en
dc.description.abstractUma importante questão levantada logo após o primeiro sequenciamento completo do genoma de um organismo foi: quantos genes são essenciais para a vida celular? Experimentos de deleção individual realizados com a bactéria Escherichia coli revelaram que menos de 10% dos seus genes apresentam essa condição, ou seja, a inativação de cada um deles leva a total inviabilidade da bactéria. A teoria de redes fornece uma representação abstrata de um sistema biológico, onde o conjunto de nodos são os componentes biológicos (proteínas, genes, metabólitos, etc) e o conjunto de arestas são as interações de natureza biológica (interação física entre proteínas, interações metabólicas, interações de regulação transcricional, etc) que conectam cada dois componentes biológicos. A posição dos componentes biológicos em uma rede indica sua importância para a manutenção do sistema biológico. De forma geral, componentes localizados em posições centrais em uma rede biológica são aqueles componentes chaves para a integridade do sistema. Neste trabalho, decidimos investigar a posição dos restantes 90% dos genes considerados não-essenciais na rede integrada de interações gênicas (RIG) de E. coli. Especificamente, investigamos os genes condicionalmente essenciais, isto é, genes que são essenciais somente em determinadas condições de estresse. Além disso, investigamos também a posição na rede de pares de genes que constituem interações genéticas agravantes, isto é, pares de genes que quando deletados conjuntamente agravam a viabilidade do organismo. Utilizando uma abordagem puramente computacional baseada em aprendizado de máquina e propriedades topológicas da RIG, nós criamos modelos preditivos de árvores de decisão para definirmos como esses genes condicionalmente essenciais e as interações genéticas agravantes estão distribuídas na RIG. Ainda, uma lista com as probabilidades de classificação de cada...pt
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.format.extent108 f.
dc.identifier.aleph000865635
dc.identifier.capes33004064026P9
dc.identifier.citationREIS, Esther Camilo dos. Predição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquina. 2015. 108 f. Tese (doutorado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Instituto de Biociências de Botucatu, 2015.
dc.identifier.filehttp://www.athena.biblioteca.unesp.br/exlibris/bd/cathedra/05-07-2016/000865635.pdf
dc.identifier.lattes7977035910952141
dc.identifier.urihttp://hdl.handle.net/11449/142957
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.sourceAleph
dc.subjectSistemas biologicospt
dc.subjectEscherichia colipt
dc.subjectAprendizado do computadorpt
dc.subjectFenotipopt
dc.subjectPredição (Logica)pt
dc.titlePredição de fenótipos de Escherichia coli através de redes biológicas e aprendizado de máquinapt
dc.typeTese de doutorado
unesp.advisor.lattes7977035910952141
unesp.campusUniversidade Estadual Paulista (Unesp), Instituto de Biociências, Botucatupt
unesp.graduateProgramCiências Biológicas (Genética) - IBBpt
unesp.knowledgeAreaGenéticapt
unesp.researchAreaBiofísica de processos e sistemaspt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
000865635.pdf
Tamanho:
5.76 MB
Formato:
Adobe Portable Document Format