Publicação:
Análise de sequências de DNA através de códigos corretores de erros

dc.contributor.advisorBenedito, Cintya Wink de Oliveira [UNESP]
dc.contributor.authorBassi, Mariana Venezian Musto [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2021-03-10T12:55:42Z
dc.date.available2021-03-10T12:55:42Z
dc.date.issued2019
dc.description.abstractInformation and coding theory as well as genetics are concerned with the transfer and storage of information. For decades, scientists have studied the integration of these theories, but there is a great difficulty in determining a mathematical structure related to the structure of DNA (deoxyribonucleic acid). In the present work, based on a genetic import system model proposed in [ROCHA 2010] through BCH codes (Bose-Chaudhuri-Hocquenghem) on the Galois ring extension, we implemented an algorithm capable of identifying and reproducing two sequences of DNA, with different biological functions and length of 63 nucleotides, using for both the same six primitive polynomials and generators of degree 6. For this, we need to associate the nitrogen bases of the DNA (adenine, thymine, guanine and cytosine) to the elements of the alphabet of the finite ring Z4 = f0; 1; 2; 3g. This process is called labeling and, in the two results obtained, applying the same generator polynomial, we find 8 codewords with the same labeling. These codewords differ a nucleotide from the original sequence, where the exchanges of nitrogen base occurred in different positions, causing different bases, codons and amino acids. The algorithm is also capable of analyzing mutations in DNA sequences. To exemplify this application, we used the sequence related to exon 14 of the BRCA1 gene (Breast Cancer1) with length 127 analyzing nonsense and missense point mutations through a generation polynomial of degree 7. From the identification and reproduction functions, we find codewords to be used as reference in these analysis. Subsequently, applying each mutation punctually, we observe that the code is able to retrieve the original sequence. Pointing to a mathematical structure associated with error-correcting codes for single strand of DNA, this algorithm can contribute to the development of a methodology that can reduce laboratory time and costs...en
dc.description.abstractA teoria da informação e codificação, bem como, a genética preocupam-se com a transferência e armazenamento de informações. Há décadas, os cientistas estudam o casamento dessas teorias, porém, há uma grande dificuldade em determinar uma estrutura matemática relacionada à estrutura do DNA (ácido desoxirribonucleico). No presente trabalho, baseado em um modelo de sistema para importação genética proposto em [ROCHA 2010] através de códigos BCH (Bose-Chaudhuri-Hocquenghem) sobre a extensão de anel de Galois, implementamos um algoritmo capaz de identificar e reproduzir duas sequências de DNA, com funções biológicas distintas e comprimento de 63 nucleotídeos, utilizando para ambas os mesmos seis polinômios primitivos e geradores de grau 6. Para isso, precisamos associar as bases nitrogenadas do DNA (adenina, timina, guanina e citosina) aos elementos do alfabeto do anel finito Z4 = f0; 1; 2; 3g. Esse processo denomina-se rotulamento e, nas duas sequências analisadas de comprimento 63, aplicando um mesmo polinômio gerador, encontramos 8 palavras-código ambas com o mesmo tipo de rotulamento. Essas palavras-código distam um nucleotídeo da sequência original, onde as trocas de base nitrogenada ocorreram em posições distintas, ocasionando diferentes bases, códons e aminoácidos. O algoritmo também é capaz de analisar mutações em sequências de DNA. Para exemplificar esta aplicação, utilizamos a sequência relacionada ao éxon 14 do gene BRCA1 (Breast Cancer 1) com comprimento 127 analisando mutações pontuais nonsense e missense através de um polinômio gerador de grau 7. A partir das funções de identificação e reprodução, encontramos palavras-código para serem utilizadas como referência nessas análises. Posteriormente, aplicando cada mutação pontualmente, observamos que o código é capaz de recuperar a sequência original. Apontando uma estrutura matemática...pt
dc.format.extent84 f.
dc.identifier.aleph990009130290206341
dc.identifier.citationBASSI, Mariana Venezian Musto. Análise de sequências de DNA através de códigos corretores de erros. 2019. 84 f. Trabalho de conclusão de curso (bacharelado - Engenharia de Telecomunicações) - Universidade Estadual Paulista Julio de Mesquita Filho, Câmpus Experimental de São João da Boa Vista, 2019.
dc.identifier.filehttp://www.athena.biblioteca.unesp.br/exlibris/bd/capelo/2019-03-19/000913029.pdf
dc.identifier.lattes7916375574050821
dc.identifier.orcid0000-0002-4806-3399
dc.identifier.urihttp://hdl.handle.net/11449/203138
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso aberto
dc.sourceAlma
dc.subjectCódigos corretores de erros (Teoria da informação)pt
dc.subjectCodigo genéticopt
dc.subjectDNA - Análisept
dc.subjectTelecomunicaçõespt
dc.subjectDNA - Analysispt
dc.subjectError-correcting codes (Information theory)pt
dc.subjectGenetic codept
dc.subjectTelecommunicationpt
dc.titleAnálise de sequências de DNA através de códigos corretores de errospt
dc.title.alternativeAnalysis of DNA sequences through error-correcting codesen
dc.typeTrabalho de conclusão de curso
dspace.entity.typePublication
unesp.advisor.lattes7916375574050821
unesp.advisor.orcid0000-0002-4806-3399
unesp.campusUniversidade Estadual Paulista (Unesp), Faculdade de Engenharia, São João da Boa Vistapt
unesp.undergraduateEngenharia de Telecomunicações - CESJBVpt

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
000913029.pdf
Tamanho:
692.15 KB
Formato:
Adobe Portable Document Format