Logo do repositório

Desvendando perspectivas genômicas e fenômicas sobre características relacionadas à floração na cana-de-açúcar por intermédio de aprendizado de máquina

Carregando...
Imagem de Miniatura

Orientador

Silva, Luciana Rossini Pinto Machado da

Coorientador

Romanel, Elisson Antonio da Costa

Pós-graduação

Agronomia (Genética e Melhoramento de Plantas) - FCAV

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

Cana-de-açúcar (Saccharum spp.) é uma gramínea de alta capacidade fotossintética e acúmulo de sacarose, sendo de suma importância para o setor sucroenergético e o agronegócio brasileiro. O florescimento é um dos processos fisiológicos que afeta negativamente, tanto a qualidade da matéria prima como a produtividade, porém é importante para o melhoramento genético na obtenção de novas cultivares, sendo portanto relevante uma busca de padrões fenotípicos e genotípicos associados à característica. Neste sentido, objetivou-se a implementação de fenotipagem de alto rendimento para avaliação dos caracteres envolvidos na floração e um estudo de associação genômica ampla (GWAS) em um painel de acessos utilizando caracteres fenotípicos coletados tradicionalmente e via fenômica. Um painel de 154 genótipos foi instalado na estação de hibridação do Programa de Melhoramento Genético de Cana-de-Açúcar do Instituto agronômico de campinas (IAC), localizado em Uruçuca-BA. Foram avaliados fenotipicamente em cana-planta (2023) e primeira soca (2024) com voos de drone realizados durante as fases de florescimento com posterior processamento de ortomosaicos e métricas para análises com abordagens de aprendizado de máquina. A genotipagem foi realizada via sequenciamento para em conjunto com dados fenótipicos realizar-se o GWAS. O primeiro capítulo abrange uma pequena revisão introdutória sobre os principais temas da tese como um histórico da cana-de-açúcar, além dos principais aspectos relacionados a floração, mapeamento associativo, fenômica e aprendizado de máquina. O segundo capítulo aborda a fenômica, onde um modelo de aprendizado profundo de redes neurais convolucionais (CNN) para detecção e contagem de inflorescências obteve uma acurácia de 84% e sua correlação com dados de campo variaram de R² = 0.29 – 0.72. Já o modelo de aprendizado de máquina supervisionado para classificação de resposta ao florescimento por redes neurais perceptron multicamadas obtiveram acurácia de até 87%. Por fim, dentre os modelos de regressão testados, o algoritmo xgboost teve a melhor performance com R² = 0.52, indicando que fenômica é uma abordagem promissora para complementação de dados fenotípicos a nível de campo. O capítulo três aborda o mapeamento associativo, por intermédio da prospecção de 19.139 single nucleotide polymorphism (SNPs), na análise de associação foram encontrados 54 marcadores associados significativamente com dados fenotípicos tradicionais e 69 marcadores associados a dados de fenotipagem de alto rendimento. Além disso, um modelo de classificação por redes neurais após a etapa de seleção de atributos, com um conjunto de dados de apenas 136 SNPs selecionados, atingiu 100% de acurácia na classificação em resposta ao tempo para o florescimento a modelagem para mesma tarefa com dados de fenômica atingiu 87%. Por fim o capítulo 4 traz as considerações finais destacando os principais resultados que ressaltam o poder preditivo de dados de fenotipagem de alto rendimento e GWAS, como ferramentas conjuntas que podem auxiliar os melhoristas e produtores a lidarem com a característica do florescimento em cana-de-açúcar.

Resumo (inglês)

Sugarcane (Saccharum spp.) is a grass distinguished by its remarkable photosynthetic efficiency and notable sucrose accumulation, making it essential to the sugar-energy sector and a cornerstone of Brazilian agribusiness. The physiological process of flowering adversely affects both the quality of the raw material and the overall yield; nevertheless, it holds significant importance for genetic breeding endeavours aimed at developing novel varieties. Therefore, it is crucial to delineate phenotypic and genotypic patterns associated with this trait. In this regard, the primary objective of the present research was to implement high-throughput phenotyping to evaluate traits pertinent to flowering, in conjunction with conducting a genome-wide association study (GWAS) utilizing a diverse panel of germplasm accessions. Both traditional and phenomics methodologies were used to assess the phenotypic traits. A total of 154 genotypes were planted at the sugarcane crossing station of the Instituto Agronômico de Campinas (IAC) located in Uruçuca, Bahia. These cultivars underwent phenotypic evaluation during the plant-cane stage in 2023 and the first ratoon stage in 2024, employing Unmanned Aerial Vehicles (UAV) flights throughout the flowering season. This process was complemented by the generation of orthomosaics and the computation of vegetative indices and metrics for subsequent analysis utilizing machine learning techniques. Genotyping was conducted via genotyping by sequencing (GBS) to support the GWAS. The first chapter provides an introductory overview of the main thesis topics, including sugarcane history, as well as aspects of flowering, association mapping, phenomics, and machine learning. The second chapter of this thesis specifically addresses high-throughput phenotyping. A sophisticated deep learning framework employing a convolutional neural network (CNN) for the detection and quantification of inflorescences achieved an accuracy of 84%, with correlation to the ground truth ranging from R² = 0.29 to 0.72. Moreover, neural network classification models, particularly multi-layer perceptrons (MLP), attained classification accuracies of up to 87%. Among the regression models assessed, the XGBoost algorithm demonstrated superior efficacy, achieving an R² = 0.52, indicating its potential as an ancillary approach to phenotypic data acquisition in field environments. The third chapter is dedicated to association mapping. Through the examination of 19,139 single-nucleotide polymorphisms (SNPs) via GBS, 54 markers were identified in the GWAS as significantly correlated with field data, while an additional 69 markers displayed associations with high-throughput phenotyping data. Notably, post-feature selection, a neural network classification model achieved a classification accuracy of 100% concerning flowering time responses with a restricted dataset of 136 selected. Lastly, the fourth chapter brings the final considerations, highlighting the key findings that underscore the predictive capacity of integrating high-throughput phenotyping data with GWAS methodologies, which can significantly assist breeders and producers in the management of flowering traits in sugarcane.

Descrição

Palavras-chave

Genética quantitativa, Cana-de-açúcar, Drone, Bioinformática

Idioma

Português

Citação

SANTOS, P. H. S. Unraveling genomic and phenomics insights into flowering-related traits in sugarcane through machine learning approaches. - 2025. 121 p. - Tese (Doutorado em Agronomia) - Universidade Estadual Paulista "Júlio de Mesquita Filho", Jaboticabal, 2025.

Itens relacionados

Unidades

Item type:Unidade,
Faculdade de Ciências Agrárias e Veterinárias
FCAV
Campus: Jaboticabal


Departamentos

Cursos de graduação

Programas de pós-graduação