Logo do repositório

Desenvolvimento de funções para formatação de arquivos para análises genéticas no R

dc.contributor.advisorFonseca, Ricardo da [UNESP]
dc.contributor.authorAntonio, Miriam Aparecida Carvalho Basilio [UNESP]
dc.contributor.institutionUniversidade Estadual Paulista (Unesp)
dc.date.accessioned2025-09-15T17:37:53Z
dc.date.issued2025-07-25
dc.description.abstractA avaliação genética animal depende da análise de grandes volumes de dados fenotípicos, de pedigree e genômicos. Nos últimos 20 anos, diversos softwares foram desenvolvidos para esse fim, sendo os mais utilizados: ASReml, VCE, DMU, Wombat e BLUPF90. O ASReml manteve-se como o software mais citado nas publicações científicas, mas sua exigência de licenciamento pago restringe o acesso para pesquisadores em ambientes acadêmicos e institucionais com recursos limitados. Por essa razão, este trabalho concentrou-se no desenvolvimento de funções voltadas aos softwares BLUPF90 e Wombat, que são gratuitos, amplamente utilizados e frequentemente atualizados. Existe um problema de falta de padronização na maneira de como os dados devem ser organizados para imputar dentro de cada software, sendo que cada software tem sua própria especificidade, ou seja, os dados devem ser organizados de maneira diferente dependendo do software que será usado nas análises genéticas, afetando a reprodutibilidade e abrindo espaço para erros. Para enfrentar esse desafio, este trabalho apresenta o desenvolvimento do pacote LZFF, que automatiza a preparação e formatação de arquivos para análises genéticas, minimizando erros e promovendo padronização. Os dados percorrem um fluxo estruturado: do formato livre (L) ao padrão (P) e, por fim, ao formato final (F), compatível com os softwares de destino. Foram desenvolvidas quatro funções principais: rrcData, que realiza a leitura, recodificação e verificação dos dados; rrcPed, voltada à estruturação de arquivos de pedigree com recodificação apropriada; formatA, que prepara os dados no formato exigido pelo BLUPF90; e formatB, que ajusta os dados para uso com o Wombat. Para validar o pacote, foram implementados testes automatizados com o uso do pacote testthat, garantindo a robustez do processo de leitura, recodificação e integridade estrutural dos dados processados. O pacote LZFF oferece uma solução eficiente e acessível para a preparação de dados em análises genéticas, reduzindo o tempo de formatação manual e potencializando a reprodutibilidade dos resultados.pt
dc.description.abstractAnimal genetic evaluation relies on the analysis of large volumes of phenotypic, pedigree, and genomic data. Over the past 20 years, several software packages have been developed for this purpose, with the most widely used being ASReml, VCE, DMU, Wombat, and BLUPF90. ASReml has remained the most frequently cited software in scientific publications; however, its paid licensing requirement restricts access for researchers in academic and institutional environments with limited resources. For this reason, the present work focused on developing functions tailored for BLUPF90 and Wombat, which are free, widely used, and frequently updated. A major challenge lies in the lack of standardization regarding how data must be organized for each software, as each program has its own specific requirements. Consequently, data must be formatted differently depending on the chosen software for genetic analyses, which undermines reproducibility and increases the risk of errors. To address this issue, this work introduces the development of the LZFF package, which automates the preparation and formatting of files for genetic analyses, minimizing errors and promoting standardization. The data follow a structured workflow: from free format (L) to standardized format (P), and finally to the final format (F), compatible with the target software. Four main functions were developed: rrcData, which performs data reading, recoding, and verification; rrcPed, designed for structuring pedigree files with appropriate recoding; formatA, which prepares the data in the format required by BLUPF90; and formatB, which adjusts the data for use with Wombat. To validate the package, automated tests were implemented using the testthat package, ensuring robustness in the processes of data reading, recoding, and structural integrity of the processed datasets. The LZFF package thus provides an efficient and accessible solution for data preparation in genetic analyses, reducing the time required for manual formatting and enhancing the reproducibility of results.en
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorshipIdFAPESP: 2024/10028-4
dc.identifier.capes33004099086P8
dc.identifier.citationANTÔNIO, Miriam Aparecida Carvalho Basilio. Desenvolvimento de funções para formatação de arquivos para análises genéticas no R. 2025. 78 f. Dissertação (Mestrado em Ciência e Tecnologia Animal) - Universidade Estadual Paulista (UNESP), Dracena, 2025.
dc.identifier.lattes7036663056801164
dc.identifier.orcid0009-0006-8595-3485
dc.identifier.urihttps://hdl.handle.net/11449/313627
dc.language.isopor
dc.publisherUniversidade Estadual Paulista (Unesp)
dc.rights.accessRightsAcesso abertopt
dc.subjectGenética animalpt
dc.subjectEstatística matemática Programas de computadorpt
dc.subjectAnimais Melhoramento genéticopt
dc.titleDesenvolvimento de funções para formatação de arquivos para análises genéticas no Rpt
dc.title.alternativeDevelopment of functions for data formatting for genetic analyses in Ren
dc.typeDissertação de mestradopt
dspace.entity.typePublication
relation.isAuthorOfPublication48fb2750-756f-44d8-97f3-5295b29e71d2
relation.isAuthorOfPublication.latestForDiscovery48fb2750-756f-44d8-97f3-5295b29e71d2
relation.isOrgUnitOfPublication645fc506-d696-4eff-bf29-45e82e484198
relation.isOrgUnitOfPublication.latestForDiscovery645fc506-d696-4eff-bf29-45e82e484198
unesp.campusUniversidade Estadual Paulista (UNESP), Faculdade de Ciências Agrárias e Tecnológicas, Dracenapt
unesp.embargoOnlinept
unesp.examinationboard.typeBanca públicapt
unesp.graduateProgramCiência e Tecnologia Animal - FCAT/FEISpt
unesp.knowledgeAreaProdução animalpt
unesp.researchAreaMelhoramento, nutrição e qualidade de produtos de origem animalpt

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
antonio_macb_me_dra.pdf
Tamanho:
1.46 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.14 KB
Formato:
Item-specific license agreed upon to submission
Descrição: