Publicação:
Modelagem da produtividade de cana-de-açúcar a partir de algoritmos de aprendizado de máquina

Carregando...
Imagem de Miniatura

Data

2023-08-03

Orientador

Panosso, Alan Rodrigo

Coorientador

Pós-graduação

Curso de graduação

Engenharia Agronômica - FCAV

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Estadual Paulista (Unesp)

Tipo

Trabalho de conclusão de curso

Direito de acesso

Acesso abertoAcesso Aberto

Resumo

Resumo (português)

A cana-de-açúcar é uma das culturas de maior interesse do mercado agrícola brasileiro. Algoritmos de aprendizado de máquina têm sido cada vez mais empregados para modelagens agronômicas e podem fornecer informações que contribuam para melhorar o planejamento, gestão e, consequentemente, aumentar a produção agrícola. Dessa forma, o objetivo foi criar modelos estatísticos por meio de técnicas de aprendizado de máquina, incluindo as estratégias de aplicação, para a previsão da produção da cana-de-açúcar em toneladas de cana por hectare (TCH) no Estado de São Paulo. Os dados experimentais foram coletados nos anos de 2016, 2017 e 2018, sendo provenientes de duas unidades produtivas, localizadas nas intermediações dos municípios de Potirendaba e Catanduva, SP. Foram utilizadas 20, 12 e 10 mil observações para os anos de 2016, 2017 e 2018, respectivamente. Os dados foram padronizados com o objetivo de identificar os atributos do solo e manejos específicos, que são variáveis independentes e, que melhor explicam a variabilidade espaço temporal do rendimento da cana-de-açúcar em toneladas de cana por hectare (TCH). As modelagens foram realizadas por meio do modelo de árvores de decisão e Random forest. O algoritmo Random forest apresentou melhor desempenho preditivo para a cultura de cana-de-açúcar quando comparado ao modelo de árvore de decisão. Em termos numéricos, para o Random forest, obteve-se R2 superior à 56% e RMSE inferior a 18,2 t ha-1, enquanto que para a árvore de decisão, o R2 obtido foi superior à 43% e RMSE inferior à 23,4 t ha-1. As variáveis foram avaliadas quanto ao nível de importância entre elas na produção de cana-de-açúcar. A variável corte apresentou maior nível de importância na predição da cultura, no mínimo 3,5 vezes superior, em relação às outras variáveis de manejo subsequentes como variedade, idade e mês. Além disso, o açúcar total recuperável (ATR), bem como os níveis de potássio (K+), fósforo disponível (P) e matéria orgânica do solo (MOS), também se apresentaram inferiores à nível de importância para a predição em relação às demais variáveis.

Resumo (inglês)

Sugarcane is one of the crops of most interest to the Brazilian agricultural market. Machine learning algorithms have been increasingly used for agronomic modeling and can provide information to help improve planning and management and, consequently, increase agricultural production. Therefore, the objective was to create statistical models using machine learning techniques, including application strategies, to estimate sugarcane production in tons of cane per hectare (TCH) in the state of São Paulo. The experimental data was collected in 2016, 2017 and 2018 from two production units located in the middle of the municipalities of Potirendaba and Catanduva, SP. The study used 20,000, 12,000 and 10,000 observations for 2016, 2017 and 2018, respectively. The data was standardized in order to identify the soil attributes and specific managements that are independent variables and that best explain the spatiotemporal variability of sugarcane yields in tons of cane per hectare (TCH). The modeling was conducted using decision trees and Random forest. The Random forest algorithm showed better predictive performance for the sugarcane crop when compared to the decision tree model. In numerical terms, the Random forest obtained an R2 of more than 56% and an RMSE of less than 18.2 t ha-1, while the decision tree obtained an R2 of more than 43% and an RMSE of less than 23.4 t ha-1. The variables were evaluated according to their level of importance in sugarcane production. The variable cut showed the highest level of importance in predicting the crop, at least 3.5 times higher than the other subsequent management variables such as variety, age and month. In addition, the total recoverable sugar (ATR), as well as the levels of potassium (K+), available phosphorus (P) and soil organic matter (MOS), were also lower in terms of importance for prediction than the other variables.

Descrição

Idioma

Português

Como citar

Itens relacionados

Unidades

Departamentos

Cursos de graduação

Programas de pós-graduação