Logo do repositório

Predição da qualidade fisiológica de sementes de soja usando aprendizado de máquina

Carregando...
Imagem de Miniatura

Orientador

Sartori, Maria Márcia Pereira

Coorientador

Silva, Anderson Rodrigo da

Pós-graduação

Agronomia (Agricultura) - FCA

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

Para o sucesso do estande e a obtenção de altas produtividades, é imprescindível o uso de sementes de boa qualidade. A qualidade fisiológica compreende o potencial das sementes em originarem plântulas normais (germinação), a velocidade de emergência (vigor) e a capacidade de armazenamento (longevidade). A germinação, sob o ponto de vista da tecnologia de sementes, refere-se à formação de uma plântula normal. O vigor abrange características associadas à uniformidade, velocidade de germinação e tolerância a condições ambientais adversas. Já a longevidade é definida como a capacidade da semente em manter sua viabilidade ao longo do tempo. A determinação do potencial fisiológico de um lote é tradicionalmente feita através do teste de germinação e de testes de vigor, como envelhecimento acelerado e condutividade elétrica, no caso da soja. A avaliação da longevidade, por sua vez, geralmente não é realizada pela indústria, pois requer tempo e infraestrutura específica. No Capítulo 1, o objetivo foi predizer a longevidade de sementes de soja (p50) utilizando modelos de aprendizado de máquina (ML), com base em atributos de qualidade fisiológica, componentes de produção e variáveis climáticas. As sementes foram obtidas em dois ambientes tropicais de produção. Foram avaliadas 22 variáveis, que, após diagnóstico de multicolinearidade, foram reduzidas para 13 (VIFs < 6; número de condição = 6,78). A base de dados foi composta por 296 observações, divididas em 70% para treino e 30% para teste. Quatro algoritmos foram utilizados: Regressão Linear (RL), Support Vector Machine (SVM), Random Forest (RF) e Redes Neurais Artificiais (ANN), todos validados por reamostragem cruzada (5 vezes). Os modelos RF e ANN apresentaram os melhores desempenhos. O RF obteve os menores erros, com RMSE de 9,11 dias e R² = 0,88, seguida pela ANN, com RMSE de 10,16 dias e R² = 0,86. As variáveis mais importantes para a predição foram temperatura mínima, precipitação e temperatura máxima. Os resultados demonstraram o potencial de uso de ML para a predição da longevidade, permitindo decisões mais eficientes no armazenamento e escoamento de lotes na indústria, além de auxiliar na gestão de bancos de germoplasma. No Capítulo 2, avaliou-se o desempenho de sementes de soja aplicando modelos de ML para a predição da germinação e classificação do vigor. Para a predição da germinação, foram avaliados os algoritmos RF, SVM, ANN e Gaussian Process Regression (GPR); para a classificação do vigor, foram usados Análise Discriminante Linear (LDA), Análise Discriminante Quadrática (QDA), SVM e RF. A Random Forest apresentou o melhor desempenho em ambas as tarefas, com predição de germinação com RMSE abaixo de 13% e classificação de vigor com acurácia de 99% nas fases de treinamento e teste. Fatores climáticos e de produção influenciaram a germinação, enquanto variáveis fisiológicas, como primeira contagem, plântulas anormais e comprimento de raiz, foram determinantes para o vigor. Conclui-se que modelos de ML, baseado em dados simples de campo e laboratório, são estratégias rápidas, precisas e eficazes para avaliação do desempenho fisiológico das sementes, com grande potencial de aplicação no controle de qualidade das empresas, especialmente em situações com acesso limitado a tecnologias multiespectrais.

Resumo (inglês)

For successful crop establishment and high yields, the use of high-quality seeds is essential. Physiological seed quality encompasses the potential of seeds to produce normal seedlings (germination), the speed of emergence (vigor), and storage potential (longevity). From a seed technology perspective, germination refers to the formation of a normal seedling. Vigor includes traits related to uniformity, germination speed, and tolerance to adverse environmental conditions. Longevity, in turn, is defined as the seed’s ability to maintain viability over time. The physiological potential of a seed lot is traditionally assessed through germination and vigor tests, such as accelerated aging and electrical conductivity, especially in soybean. However, longevity assessment is rarely performed by the seed industry, as it requires time and specific infrastructure. In Chapter 1, the objective was to predict soybean seed longevity (p50) using machine learning (ML) models, based on physiological quality traits, production components, and climatic variables. Seeds were obtained from two tropical production environments. A total of 22 variables were initially evaluated, which were reduced to 13 after multicollinearity diagnostics (VIFs < 6; condition number = 6.78). The dataset was composed of 296 observations, split into 70% for training and 30% for testing. Four algorithms were used: Linear Regression (LR), Support Vector Machine (SVM), Random Forest (RF), and Artificial Neural Networks (ANN), all validated using 5-fold cross-validation. RF and ANN models showed the best performance. RF presented the lowest prediction errors, with RMSE of 9.11 days and R² = 0.88, followed by ANN with RMSE of 10.16 days and R² = 0.86. The most important variables for longevity prediction were minimum temperature, precipitation, and maximum temperature. These results demonstrate the potential of ML models for predicting seed longevity, enabling more efficient decision-making for storage and seed lot distribution, and assisting in germplasm bank management. In Chapter 2, the performance of soybean seeds was evaluated by applying ML models for germination prediction and vigor classification. For germination prediction, the algorithms RF, SVM, ANN, and Gaussian Process Regression (GPR) were assessed; for vigor classification, Linear Discriminant Analysis (LDA), Quadratic Discriminant Analysis (QDA), SVM, and RF were used. Random Forest showed the best performance in both tasks, with germination prediction RMSE below 13%, and vigor classification accuracy of 99% in both training and testing phases. Climatic and production factors influenced germination, while physiological variables such as first count, abnormal seedlings, and root length were decisive for vigor. It is concluded that ML models based on simple field and laboratory data are fast, accurate, and effective strategies for evaluating the physiological performance of seeds, with great application potential in quality control routines, especially in contexts with limited access to multispectral technologies.

Descrição

Palavras-chave

Soja, Predição da longevidade (p50), Aprendizado de máquina, Predição da germinação

Idioma

Português

Citação

REZENDE, B. R. Predição da qualidade fisiológica de sementes de soja usando aprendizado de máquina. 2025. Tese (Doutorado em Agricultura) – Faculdade de Ciências Agronômicas, Botucatu, 2025.

Itens relacionados

Financiadores

Unidades

Item type:Unidade,
Faculdade de Ciências Agronômicas
FCA
Campus: Botucatu


Departamentos

Item type:Departamento,

Cursos de graduação

Programas de pós-graduação