Aprendizado de máquina na predição da produtividade e mapeamento da qualidade da fibra em campos comerciais de algodão

Carregando...
Imagem de Miniatura

Data

2022-12-09

Orientador

Silva, Rouverson Pereira da

Coorientador

Pós-graduação

Agronomia (Ciência do Solo) - FCAV

Curso de graduação

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Tese de doutorado

Direito de acesso

Acesso restrito

Resumo

Resumo (português)

A agricultura digital faz uso intensivo de tecnologias proporcionando a utilização de técnicas de aprendizado de máquina na predição da produtividade de culturas com base em sensoriamento remoto. Nesse contexto, este trabalho foi elaborado com o intuito de auxiliar produtores e gerenciadores de dados na antecipação de informações sobre a produtividade do algodão, bem como explorar tecnologias presentes nas colhedoras de algodão que proporciona a rastreabilidade e o mapeamento da qualidade da fibra do algodão em campos comerciais. Dessa forma, o trabalho foi constituído de quatro fases distintas, sumarizadas em quatro capítulos que originaram a tese. O primeiro se trata de um referencial teórico aos temas abordados. O segundo capítulo apresenta resultados inéditos de comparação do desempenho de algoritmos de aprendizado de máquina (K-Nearest Neighbors (KNN), Multilayer Perceptron (MLP), Random Forest, Linear Regression, e AutoML) na predição da produtividade do algodão baseado em índices de vegetação (IV) em campos comerciais no Mato Grosso. O terceiro capítulo fundamenta-se na exploração de tecnologia existente nas colhedoras de algodão (Radio Frequency Identification - RFID), porém pouco explorada, com resultados coletados em duas etapas (Brasil e EUA), apresentando abordagens inéditas, que objetiva vincular as informações de localização de colheita dos módulos com as informações de classificação da fibra recebidas na algodoeira e, por meio da geoespacialização das áreas colhidas dos módulos, resultar na geração de mapas de parâmetros de qualidade da fibra. Para alcançar o objetivo do segundo capítulo que foi identificar o quão cedo, qual índice e com qual algoritmo consegue-se predizer a produtividade do algodão no âmbito de fazenda, otimizou-se a predição e por seleção de variáveis (stepwise), avaliou-se apenas o melhor IV em cada campo, e detectou-se que dentre os oito IVs, o Simple Ratio, impulsionado pelo algoritmo KNN apresentou a melhor performance, predizendo com apenas 0.26 e 0.28 t ha-1 de RMSE e MAPE de 5.20%; antecipando com baixo erro em ±143 dias a produtividade de algodão. No terceiro capítulo, conclui-se que é possível mapear os parâmetros de qualidade da fibra em campos comerciais, desde que se vincule os dados de identificação do módulo com a etiqueta criada na algodoeira para os fardos beneficiados. Os parâmetros de qualidade da fibra apresentam variabilidade em cada módulo e em cada método de coleta, para uma mesma área, e a qualidade do processo de classificação da fibra apresentou pontos fora de controle de maneira isolada. O mapeamento da qualidade da fibra auxiliou na visualização em campo dos parâmetros que sofreram ágios e deságios na comercialização devido à sua classificação atender ou não os padrões do mercado nacional ou internacional.

Resumo (inglês)

Digital agriculture intensively uses technologies to improve machine learning techniques on yield predictions based on remote sensing. Following the context, this research was written to inform farmers and data managers about cotton yield information beforehand. Also, to explore embedded technologies such as Radio Frequency Identification (RFID) in cotton harvesters that provide traceability and mapping of cotton fiber quality on commercial fields in Mato Grosso State, Brazil. This thesis was divided into a four-chapter: the first treats a theoretical reference around themes covered by this research. The second chapter presents unprecedented results comparing the machine learning algorithms' performance (k-Nearest-Neighbours - KNN, Multilayer Perceptron - MLP, Random Forest Linear Regression - RF and Automatic Machine Leaning - AutoML) in cotton yield prediction based on vegetation indices (VI). The third chapter explored existing technology to analyze data from Brazil and the USA about the rarely used cotton harvesters (RFID), presenting distinctive approaches and linking information from the area harvested per module with the fiber quality from the gin to generate geospatial maps of fiber quality parameters. To achieve the objective in the second chapter, the prediction was optimized by the variables selection (stepwise) using only the most essential VI among eight VI in each field. As a result, it was detected that Simple Ratio, aided by KNN, showed the best metrics predicting with only 0.26 and 0.28 t ha-1 of RMSE and MAPE of 5.20%, anticipating cotton yield by ±143 days with low error. Finally, in the third chapter, it was observed that it is possible to map the fiber quality parameters in commercial fields if the module identification data is linked to the label created in the cotton plant for the processed bales. However, the fiber quality parameters showed variability in each module and each collection method for the same area, and the quality of the fiber classification process presented points out of control in an isolated way. Nevertheless, quality mapping is possible and assists in visualizing the parameters that suffered premiums and discounts in the commercialization due to its classification meeting or not the national or international market standards.

Descrição

Idioma

Português

Como citar

Itens relacionados

Financiadores