Comparação de modelos aditivo, aditivo-dominante e de machine learning (LightGBM) na predição de híbridos de milho
Loading...
Date
Authors
Advisor
Perecin, Dilermando 

Coadvisor
Schuster, Ivan
Graduate program
Agronomia (Genética e Melhoramento de Plantas) - FCAV
Undergraduate course
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Estadual Paulista (Unesp)
Type
Master's thesis
Access right
Acesso aberto

Abstract
Abstract (portuguese)
A escolha do método estatístico para predição dos valores genéticos genômicos em estudos de seleção genômica ampla (GWS) é fundamental para obtenção de elevadas acurácias preditivas. O objetivo deste estudo foi avaliar e comparar a performance de modelos paramétricos contendo efeito Aditivo (rrBLUP) e Aditivo-Dominante (BL), além de um modelo não paramétrico baseado em Machine Learning (LightGBM). Tais modelos foram aplicados na seleção genômica de híbridos de milho avaliados em três locais (Jataí-GO, Rolândia-PR e Sorriso-MT) para duas características importantes, produtividade e ciclo. Através dos resultados foi demonstrado que o modelo BL apresenta ótima estabilidade em termos de capacidade preditiva, porém sua performance computacional no treinamento dos modelos é consideravelmente inferior aos métodos rrBLUP e LightGBM. Caso o tempo computacional seja um gargalo para o desenvolvimento do estudo de seleção genômica, o modelo LightGBM que apresenta alta eficiência computacional, pode ser utilizado, entretanto essa utilização pode implicar em perda significativa de acurácia preditiva. Além disso, foi observado que a herdabilidade das características afeta a acurácia de predição dos modelos, e que os efeitos genéticos provenientes de herdabilidades menores podem ser capturados de maneira mais eficiente com o uso de modelos que incorporem efeitos aditivo-dominantes ou modelos de Machine learning.
Abstract (english)
The choice of statistical method for predicting genomic breeding values in genomic wide selection (GWS) is essential to obtain high prediction accuracy. The aim of this study was to evaluate and compare the performance of parametric models containing Additive (rrBLUP) and Additive-Dominant (BL) effects, as well as a non parametric model based on Machine Learning (LightGBM). Such models were applied in the genomic selection of corn hybrids evaluated in three locations (Jataí-GO, Rolândia-PR and Sorriso-MT) for two important traits, yield and maturity. Through the results it was demonstrated that the BL model presents excellent stability in terms of predictive ability, however its computational performance in the model training is considerably inferior to the rrBLUP and LightGBM methods. If computational time is a bottleneck for the development of the genomic selection study, the LightGBM model, which has high computational efficiency, can be used, however this use may imply a significant loss of predictive accuracy. Furthermore, it was observed that the heritability of the traits affects the prediction accuracy of the models, and the genetic effects from lower heritabilities can be captured more efficiently using models that incorporate additive-dominant effects or machine learning models.
Description
Keywords
aditivos, genomas, seleção genética
Language
Portuguese
Citation
MISSIMA, J. O. D. Comparação de modelos aditivo, aditivo-dominante e de machine learning (LightGBM) na predição de híbridos de milho. 2023. 27 f. Dissertação (Mestrado em Agronomia (Genética e Melhoramento de Plantas)) – Faculdade de Ciências Agrárias e Veterinárias, Universidade Estadual Paulista "Júlio de Mesquita Filho", Jaboticabal, 2023.

