ANDRÉ STEFANINI JIM IDENTIFICAÇÃO E CARACTERIZAÇÃO ESPECTRAL DA FERRUGEM (Austropuccinia psidii) DO EUCALIPTO POR IMAGENS DE ALTA RESOLUÇÃO OBTIDAS DE VEÍCULOS AÉREOS NÃO TRIPULADOS (VANT) E EM LABORATÓRIO (ESPECTRORADIÔMETRO) Botucatu 2018 ANDRÉ STEFANINI JIM IDENTIFICAÇÃO E CARACTERIZAÇÃO ESPECTRAL DA FERRUGEM (Austropuccinia psidii) DO EUCALIPTO POR IMAGENS DE ALTA RESOLUÇÃO OBTIDAS DE VEÍCULOS AÉREOS NÃO TRIPULADOS (VANT) E EM LABORATÓRIO (ESPECTRORADIÔMETRO) Tese apresentada à Faculdade de Ciências Agronômicas da Unesp Câmpus de Botucatu, para obtenção do título de Doutor em Ciência Florestal. Orientador: Prof. Dr. José Raimundo de Souza Passos Botucatu 2018 FOLHA DE APROVAÇÃO (É providenciada pela Seção de Pós-Graduação, conforme o item 5.6 do Manual) Deve ser digitalizada e inserida como imagem nesta página) Deve ser inserida na página impar – anverso (frente da folha) Deixe o verso em branco À minha mãe, Regina e meu pai, Jorge (in memorian), dedico. AGRADECIMENTOS A meus pais, Jorge Jim (in memorian) e Regina de Lima Stefanini Jim, que me concederam a vida. A minha mãe, Regina, pelo apoio incondicional. À minhas irmãs Alessandra e Letícia, minha sobrinha Laura, por estarem presentes nestes momentos da vida, alegrando e trazendo experiências ricas. Aos colegas e amigos no caminho, Alexandre Martins Fragoso, Vitor Flávio Furtado Damasceno, João Ricardo Favan, por estarem presentes em diversos momentos preciosos de conversas, repletas de entusiasmo e oportunidades. Um agradecimento especial à Lara Tatiane Avelino, por ter me acompanhado e ajudado nas fases cruciais para o desenvolvimento deste trabalho. À Profa. Dra. Liciana Vaz de Arruda Silveira, pela energia positiva e resoluta, pelo apoio e preciosas opiniões oferecidas de forma espontânea e que sempre colaboraram e enriqueceram o desenvolvimento deste trabalho. Ao Prof. Dr. Edson Luiz Furtado, por oferecer profundos conhecimentos sobre a fitopatologia e diagnose de plantas, pela amizade que se formou durante o período, e por todos os conselhos que enriqueceram minha pessoa. À pesquisadora Dra. Adimara Bentivoglio Colturato, pela parceria e colaboração com o desenvolvimento deste trabalho, em particular por ter disponibilizado dados levantados em seu projeto e oferecido todas as informações necessárias. Ao Prof. Dr. José Raimundo de Souza Passos, pela amizade, pela compreensão, orientação, ensinamentos, paciência e exemplo de professor, pelos profundos conhecimentos na área de estatística e matemática, essenciais ao presente trabalho e por permanecer sempre sereno, mesmo nos momentos mais tensos e, oferecendo oportunidades de crescimento em todas as circunstâncias. À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pela bolsa de estudos concedida. À Universidade Estadual Paulista “Júlio de Mesquita Filho”, Campus de Botucatu, por sua estrutura e serviços oferecidos. “All that we do, we should do with love and with the wish to bring benefit to others.” “Tudo o que fazemos, devemos fazer com amor e com o desejo de trazer benefício para os outros.” MILAREPA RESUMO Plantios de eucalipto podem sofrer reduções na produção de até 48% devido à ferrugem das mirtáceas causada por Autropuccinia psidii. A identificação e quantificação da doença, ou fitopatometria, e o diagnóstico precoce de doenças é fator chave no manejo florestal. Em campo, o levantamento é realizado por amostragens, que alcançam apenas 5% da área total plantada e são realizadas por equipes de avaliadores por meio do uso de escalas diagramáticas. O uso do SIG na silvicultura tem sido bem-sucedido na detecção de diversos fatores considerados favoráveis às doenças. O termo Silvicultura de Precisão consiste na adoção de ferramentas de sensoriamento remoto embarcadas em distintas plataformas juntamente com sistemas computacionais para o processamento das múltiplas informações. Dentro do campo de sensores, uma plataforma alternativa para o diagnóstico é o emprego de VANTs (Veículos Aéreos Não Tripulados) com câmeras digitais de alta resolução espacial (pixels/cm²), apresentando diversas vantagens em relação aos dados advindos de satélites. Enquanto as informações espectrais coletadas por VANTs são misturas espectrais de dosséis, o espectroradiômetro pode coletar informações de objetos, ao nível de folha, sendo assim uma importante ferramenta para comparação de resultados de análises. Diante da necessidade de se criar uma metodologia para identificação e diagnóstico de doenças em florestas, o objetivo deste trabalho foi o de associar as informações espectrais aos procedimentos estatísticos multivariados, técnicas de regressão logística e bootstrap, de modo a obter modelos de classificação consistentes quanto à identificação e separação dos níveis de severidade para a ocorrência da ferrugem das mirtáceas em plantios jovens de eucalipto. Os resultados demonstraram que a regressão logística associada à função linear discriminante alcançaram as melhores taxas de acerto para dados de laboratório (espectroradiômetro), ao passo que a análise multivariada (por componentes principais) associada à função quadrática discriminante obtiveram as melhores taxas de acerto para dados de campo (VANT). O estudo permitiu concluir que as ferramentas empregadas foram adequadas para a diferenciação de plantas sadias de plantas infectadas por A. psiidi em plantios de Eucalyptus spp. Pôde-se concluir que o uso das imagens de VANT’s oferece uma análise preliminar ampla, possibilitando determinar áreas a receberem uma investigação mais detalhada, que eventualmente, pode ser via uso de espectroradiômetro. Quanto à caracterização do patógeno, observou-se que a técnica stepwise, coincidentemente, selecionou reflectâncias próximas à atividade das clorofilas a e b, excluindo a faixa espectral do verde. Palavras-chave: Assinatura espectral, Silvicultura de Precisão, Análise Multivariada, Modelos lineares generalizados, Bootstrap. ABSTRACT Eucalyptus plantations may suffer reductions in yield of up to 48% due to myrtle rust caused by Autropuccinia psidii. The disease identification and quantification, or phytopatometry, and the early diagnosis are a key factor in forest management. In the field, the survey is carried out by samplings, which reach only 5% of the total planted area and are carried out by teams of raters through the use of diagrammatic scales. The GIS use in forestry has been used in detecting several factors considered favorable to diseases. The term Precision Forestry consists in the adoption of remote sensing tools embedded in different platforms with computational systems for the processing of the multiple information. In terms of sensors, an alternative platform for early diagnosis is the use of UAVs equipped with high spatial resolution digital cameras (pixels / cm²), presenting several advantages compared to the satellite's data. While the spectral information collected by VANTs are canopies spectral mixtures, the spectroradiometer can collect information from objects at the leaf level and thus is an important tool for comparing results analysis. The need to create a methodology for early identification and diagnosis of forest diseases, the aim of the present work was to associate spectral information with multivariate statistical procedures, logistic regression techniques, and bootstrap, in order to obtain consistent classification models, identification of severity levels of myrtle rust in young eucalyptus plantations. The results showed that the logistic regression associated with the linear discriminant function achieved the best hit rates for laboratory data (spectroradiometer), while the multivariate analysis (by main components) associated with the discriminant quadratic function obtained the best data set rates field (UAV). We could conclude that the tools used were adequate for the differentiation of healthy plants of plants infected by A. psidii in plantations of Eucalyptus spp. It was concluded that the use of VANT's images offers a preliminary extensive analysis, making it possible to determine areas to receive a more detailed investigation, which may be via the use of a spectroradiometer. As for the characterization of the pathogen, it was observed that the stepwise technique, coincidentally, selected reflectances close to the activity of chlorophyll a and b, excluding the spectral range of green. Keywords: Spectral signature. Precision Forestry. Multivariate analysis, Generalized linear models, Bootstrap. LISTA DE ABREVIATURAS E SIGLAS ACP – Análise de Componentes Principais RL – Regressão Logística CP – Componentes Principais CP-1, 2, 3, 4 – 1º, 2º, 3º e/ou 4º Componente Principal 2CP – Dois primeiros Componentes Principais provenientes de uma ACP 4CP – Quatro primeiros Componentes Principais provenientes de uma ACP FLD – Função Linear Discriminante FQD – Função Quadrática Discriminante SWL – Método Stepwise pelo comando Proc Logistic SWS – Método Stepwise pelo commando Proc Stepdisc 2N – Duas categorias resposta (Sadia=1, Doente=2) 4N – Quatro categorias resposta (Sadia=1, Doente/Severidade= 2, 3 e 4) Vant – Referente aos dados espectrais da imagem proveniente do VANT Espc – Referente aos dados espectrais provenientes do espectroradiômetro SUMÁRIO 1 INTRODUÇÃO ............................................................................................. 19 2 REVISÃO DE LITERATURA ........................................................................ 22 2.1 O EUCALIPTO NO BRASIL ........................................................................ 22 2.2 A FERRUGEM DAS MIRTÁCEAS ............................................................... 23 2.2.1 Ciclo do patógeno ...................................................................................... 24 2.2.2 Perdas e danos ........................................................................................... 26 2.2.3 Amostragem e controle .............................................................................. 27 2.3 REFLECTÂNCIA FOLIAR ........................................................................... 30 2.3.1 Aspectos fisiológicos ................................................................................. 33 2.3.2 Aquisição de dados espectrais ................................................................. 39 2.3.3 Espectrometria de doenças em plantas ................................................... 43 2.3.4 Análise Multivariada Aplicada à Reflectância .......................................... 47 3 MATERIAL E MÉTODOS ............................................................................. 51 3.1 MATERIAL ................................................................................................... 51 3.2 MÉTODOS ................................................................................................... 53 3.2.1 Modelagem e validação utilizando todo o conjunto de dados ............... 56 3.2.2 Técnica Bootstrap ...................................................................................... 59 3.2.3 Nomenclatura dos modelos obtidos ......................................................... 60 4 RESULTADOS E DISCUSSÃO ................................................................... 61 4.1 TÉCNICAS MULTIVARIADAS (VANT) ........................................................ 65 4.1.1 METODOLOGIA STEPWISE (VANT) .......................................................... 68 4.1.2 REGRESSÃO LOGÍSTICA (VANT) ............................................................. 70 4.2 TÉCNICAS MULTIVARIADAS (Espectroradiômetro) – 4 níveis .............. 70 4.2.1 METODOLOGIA STEPWISE (Espectroradiômetro) – 4 níveis ................. 74 4.2.2 REGRESSÃO LOGÍSTICA (Espectroradiômetro) – 4 níveis .................... 75 4.3 TÉCNICAS MULTIVARIADAS (Espectroradiômetro) – 2 níveis .............. 77 4.3.1 METODOLOGIA STEPWISE (Espectroradiômetro) – 2 níveis ................. 80 4.3.2 REGRESSÃO LOGÍSTICA (Espectroradiômetro) – 2 níveis .................... 82 4.3.3 A Técnica Bootstrap ................................................................................... 83 4.4 DISCUSSÃO GERAL ................................................................................... 88 5 CONCLUSÕES ............................................................................................ 93 REFERÊNCIAS ............................................................................................ 95 19 1 INTRODUÇÃO O setor brasileiro de árvores plantadas representou cerca de 6,2% do PIB industrial no ano de 2016, com 7,84 mi ha, dos quais o eucalipto responde por 5,63 mi ha (IBA, 2017). O eucalipto foi introduzido comercialmente no Estado de São Paulo e, embora tenha se mantido livre de doenças até o início de 1970, a expansão das áreas plantadas para regiões mais quentes e úmidas, associado ao uso de materiais susceptíveis favoreceu a incidência de várias doenças (ALFENAS et al., 2009). Os fatores que determinam a produtividade de uma floresta plantada se resumem à adaptação climática da espécie ou clone à região ou local de implantação, à nutrição adequada, à disponibilidade de água em quantidades adequadas de acordo com cada fase de desenvolvimento da planta (SANTANA et al., 2008) e às questões fitossanitárias, isto é, relativas às pragas e doenças, entre outros fatores (BRANDELERO; ANTUNES; GIOTTO, 2007). Neste cenário, uma das doenças que prejudica a produtividade dos plantios de eucalipto é a ferrugem das mirtáceas causada pelo patógeno Austropuccinia psidii (G. Winter) Beenken, reportado pela primeira vez no Brasil ocorrendo em goiabeiras (WINTER, 1884 apud STEWARD et al., 2017), e em 1944, em mudas de Corymbia citriodora no município de Itaguaí-RJ (JOFFILY, 1944 apud ZAURA et al., 2008, p.830, ROSS-DAVIS et al., 2018, p.186), O patógeno, anteriormente conhecido como Puccinia psidii Winter, teve sua posição taxonômica recentemente redefinida da família Pucciniales para a família Sphaerophragmiaceae (MCTAGGART et al., 2017; BEENKEN, 2017 apud GRANADOS et al., 2017). A ferrugem incide em plantas jovens em viveiro e no campo, sendo as condições favoráveis a temperatura na faixa de 18-25ºC com períodos de molhamento foliar (RUIZ et al., 1989 apud ALFENAS et al., 2009, p.255). Estas condições climáticas são encontradas nas regiões central e sul do estado de São Paulo, onde a doença pode causar sérios danos e perdas em plantios de dois anos ou menos (KETTENER et al., 2018). A doença afeta a capacidade fotossintética das plantas afetadas, resultando em redução do rendimento volumétrico dos plantios (AUER et al., 2017). Quantitativamente falando as perdas podem representar de 30 a 40% no incremento anual de plantios de eucalipto (FURTADO et al. 2009; TAKAHASHI, 2002). 20 As técnicas clássicas de diagnose e quantificação da ocorrência de doenças em florestas são realizadas por meio das equipes de campo, que se limitam a amostrar um percentual não maior que 5% da área total plantada (FURTADO; PASSOS, 2015). O uso da escala diagramática é considerado um dos métodos mais rápidos para a detecção da severidade da doença em campo (SANTOS, 2006), mas a eficiência prática é relativamente baixa, dadas as proporções das áreas a serem amostradas e a velocidade da equipe no solo. A silvicultura de precisão vem, através de certas técnicas, a suprir a crescente demanda de informações no setor florestal, seja especialmente por meio dos novos sistemas sensores orbitais de alta resolução, de câmeras digitais (que atuam tanto na região do visível quanto do infravermelho próximo, sistemas GPS com elevada exatidão, além dos demais avanços tecnológicos (VETTORAZZI; FERRAZ, 2000). O emprego de técnicas de sensoriamento remoto na avaliação de doenças tem embasamento nas reflectância foliar (BERGAMIN FILHO; AMORIM, 1996). Estes comprimentos de ondas refletidos, ou curvas de energia no espectro eletromagnético, são próprias de cada objeto alvo, isto é, são singulares para cada alvo, podendo ser chamadas de assinaturas espectrais (LIU, 2015). As propriedades espectrais das folhas podem ser afetadas também por fatores como idade, deficiência de nutrientes e doenças (NAUE et al., 2010, PEDRALI et al., 2016). Os sensores para a coleta de dados espectrais, diferem quanto às plataformas nas quais podem estar embarcados, como em satélites, em VANTs ou no solo, de acordo com a necessidade e urgência na obtenção dos dados (FURTADO; PASSOS, 2015). Uma outra classificação aborda os sensores como imageadores e não- imageadores (NAUE et al. 2010). Os espectroradiômetros são classificados no segundo grupo. Na área da patologia florestal estudos espectrais devem comprovar e validar a quantidade e qualidade dos dados obtidos. Para tal, torna-se necessário se comparar as informações obtidas por VANTs com outros métodos de obtenção de medidas espectrais onde se possa ter maior controle, como é o caso dos dados obtidos por espectroradiômetro, realizados em ambiente laboratorial. 21 Deve-se considerar que, enquanto os dados obtidos de instrumentos imageadores, dos quais estão incluídas as câmeras digitais embarcadas em VANTs, são misturas espectrais de folhas doentes, sadias, solo, outros objetos não-alvo (SHIMABUKURO; PONZONI, 2017). Por outro lado, em experimentos controlados em laboratório, os dados advindos de espectroradiômetro são representados por misturas espectrais de regiões de folhas ao nível de folhas individualizadas. Este elevado controle permite detectar a resposta espectral de alvos específicos, em laboratório, reduzindo as interferências decorrentes de fatores ambientais presentes em outros métodos de aquisição de informação espectral (SILVA et al., 2012). Este detalhamento espectral possibilita a obtenção de respostas espectrais desde plantas sadias até gradações de sintomas, cuja severidade tenha sido avaliada por metodologia apropriada – escala diagramática, sendo, portanto, de factível a comparação dos resultados com os alcançados com imagens de VANTs. A hipótese deste trabalho é de que os indivíduos da espécie Eucalyptus spp., sadios e infectados por A. psiidi, possuem assinaturas espectrais distintas, podendo ser diferenciadas utilizando-se as respostas espectrais de amostras obtidas por sensores VANT e espectroradiômetro na região do visível por meio de técnicas multivariadas e modelos lineares generalizados. Portanto, os objetivos elencados foram o emprego de imagens digitais espectrais obtidas por câmera digital embarcada em VANTs e dados espectrais obtidos em ambiente laboratorial, por espectroradiômetro, para plantas sadias e infectadas por ferrugem do eucalipto causada por Austropuccinia psidii (G. Winter) Beenken, visando na classificação e validação dos resultados utilizando-se uma abordagem multivariada, com modelos lineares generalizados e técnica bootstrap para a validação dos modelos obtidos e, finalmente, sua caracterização. 22 2 REVISÃO DE LITERATURA 2.1 O EUCALIPTO NO BRASIL O setor brasileiro de florestas plantadas foi responsável por 6,2% do PIB (Produto Interno Bruto) industrial no país no ano de 2016, com 7,84 milhões de hectares de reflorestamento em 2016, 0,5% maior em relação ao ano anterior, impulsionado especialmente pelo aumento das áreas com eucaliptos. Do total de área de reflorestamento, as áreas com eucalipto representam 5,63 milhões de hectares, com maiores áreas nos estados de Minas Gerais (24%), São Paulo (17%) e no Mato Grosso do Sul (15%). O estado do MS tem liderado a expansão, registrando um crescimento médio de 13% ao ano (IBÁ, 2017). No aspecto mundial, a competitividade dos produtos florestais brasileiros estava se deteriorando frente aos seus principais concorrentes internacionais, em função das condições estruturais brasileiras (custo de financiamento oneroso, infraestrutura deficitária, tributação alta e outros), incluindo a economia internacional desfavorável, cenário que proporcionou oportunidades para o setor, priorizando a melhoria dos processos industriais e silviculturais, como a inovação tecnológica (ABRAF, 2013). Nestes termos tecnológicos, a produtividade brasileira permaneceu na liderança do ranking mundial, com média de 35,7m³/ha ao ano para plantios de eucalipto (IBÁ, 2017). O eucalipto foi introduzido comercialmente no Estado de São Paulo e os plantios se mantiveram livres de doenças até o início de 1970 (AUER et al., 2017). Contudo, a expansão das áreas plantadas para regiões mais quentes e úmidas, associado ao uso de materiais susceptíveis favoreceu a incidência de várias doenças, das quais se destacam a ferrugem (Austropuccinia psidii), o cancro do eucalipto (Chrysoporthe cubensis), murcha de Ceratocystis (Ceratocystis fimbriata) e outros (ALFENAS et al., 2009). Os fatores que determinam a produtividade de uma floresta plantada se resumem à adaptação climática da espécie ou clone à região ou local de implantação, à nutrição adequada, à disponibilidade de água em quantidades adequadas de acordo com cada fase de desenvolvimento da planta (SANTANA et al., 2008) e às questões fitossanitárias, isto é, relativas às pragas e doenças, entre outros fatores (BRANDELERO; ANTUNES; GIOTTO, 2007). 23 2.2 A FERRUGEM DAS MIRTÁCEAS No Brasil, a ferrugem do eucalipto causada pelo patógeno Austropuccinia psidii (G. Winter) Beenken foi reportado pela primeira vez ocorrendo em goiabeiras (WINTER, 1884 apud STEWARD et al., 2017), sendo descrito em 1944, em mudas de Corymbia citriodora no município de Itaguaí-RJ (JOFFILY, 1944 apud ZAUZA et al., 2008, p.830, ROSS-DAVIS et al., 2018, p.186). O patógeno causador da ferrugem das mirtáceas, anteriormente conhecido como Puccinia psidii Winter, teve sua posição taxonômica recentemente redefinida da família Pucciniales para a família Sphaerophragmiaceae (MCTAGGART et al., 2017; BEENKEN, 2017 apud GRANADOS et al., 2017). O patógeno tem ampla distribuição geográfica no Brasil, sendo considerado importante nos estados de São Paulo e Bahia, podendo provocar danos consideráveis, dependendo do local, manejo silvicultural e das espécies, procedências e clones utilizados (KRUGNER; AUER, 2005). A ferrugem incide em plantas jovens em viveiro e no campo, sendo as condições favoráveis a temperatura na faixa de 18-25ºC com períodos de molhamento foliar (RUIZ et al., 1989 apud ALFENAS et al., 2009, p.255). Estas condições climáticas são encontradas nas regiões central e sul do estado de São Paulo, onde a doença pode causar sérios danos e perdas em plantios de dois anos ou menos (KETTENER et al., 2018). Em termos quantitativos, as perdas podem representar de 30 a 40% no incremento anual de plantios de eucalipto (FURTADO et al. 2009; TAKAHASHI, 2002). É considerada uma das principais causas de danos e prejuízos aos reflorestamentos de eucalipto, pois o fungo ataca mudas e árvores jovens, reduzindo a fotossíntese e o crescimento das plantas severamente afetadas pela doença (AUER; SANTOS; BORA, 2010). Em outro estudo, Bora et al. (2016) realizaram um zoneamento da favorabilidade climática para a ferrugem do eucalipto para o estado do Paraná, concluindo que as estações do ano mais favoráveis à ocorrência natural da doença foram a primavera e o verão, tendo como base a temperatura e o período de molhamento foliar para a germinação de urediniósporos. Moraes et al. (2014) foram pioneiros no uso do software ArcGis 9.2TM para elaborarem o mapa de distribuição espaço-temporal da ocorrência da ferrugem 24 considerando a influência das condições climáticas no ciclo de vida do patógeno, o plantio de eucalipto em épocas e em locais desfavoráveis à ocorrência e desenvolvimento do mesmo nos estados do Espírito Santo e extremo Sul da Bahia. O estudo concluiu que os meses de maio a novembro foram os mais favoráveis à doença, validando, igualmente, as ferramentas de geoprocessamento para a tomada de decisão no planejamento e manejo estratégico da cultura do eucalipto. Outra abordagem estudada para avaliar zonas de favorabilidade climática à ocorrência da ferrugem em eucaliptos, no Brasil, foi a de Alvares et al. (2016), que utilizou conceitos de patologia florestal, meteorologia, climatologia e ecologia associadas às técnicas de geoprocessamento. A metodologia aplicada foi a do modelo de Ruiz (1989), utilizado para estimar a severidade de infecção a partir de uma equação quadrática que considera a temperatura do ar e a influência da umidade da folha no grau de infecção. Os resultados demonstraram que em áreas de clima desfavorável à ocorrência da doença as práticas de manejo silvicultural devem ser aplicadas da mesma forma que em áreas vulneráveis, especialmente devido ao patógeno ter quebrado a resistência de clones em várias plantações do sudeste do Brasil. Apesar dos resultados otimistas, as limitações do estudo se devem ao fato de que o mapeamento é embasado em dados meteorológicos históricos, que resulta em mapas ou zonas de favorabilidade “médias”. O emprego do SIG, por sua vez, se mostrou de grande utilidade, especialmente para a redução das incertezas sobre a previsão da severidade da ferrugem nas distintas regiões do Brasil. Stewart et al. (2017), com base em variáveis bioclimáticas e ocorrências documentadas de A. psidii, observaram que a diversidade genética deve ser considerada ao se avaliar o risco de ocorrência do patógeno e que, em futuros estudos, devem ser incluídos isolados de áreas geográficas adicionais, de modo a prever, com maior precisão, as áreas geográficas climaticamente susceptíveis à disseminação global do patógeno (STEWART et al., 2017; ROSS-DAVIS et al., 2018). 2.2.1 Ciclo do patógeno No que se refere ao ciclo do patógeno, os sintomas surgem inicialmente nos tecidos jovens de folhas e caule ainda em desenvolvimento, iniciando-se por pontuações cloróticas que se transformam em pústulas ou soros, onde massas pulverulentas de urediniósporos (de coloração amarelo-ouro) se expõe com o 25 rompimento da epiderme vegetal (Figura 1). Ataques intensos do patógeno podem recobrir toda a superfície das brotações do eucalipto, tendo como consequência a morte e seca dos tecidos, que adquirem a coloração negra, se assemelhando à uma folha queimada. A planta pode emitir novas brotações, dependendo das condições ambientais, e as massas amarelas de urediniosporos desaparecem, dando lugar a lesões salientes, rugosas e de coloração marrom. Devido ao ataque ocorrer antes da formação das folhas, as mesmas acabam ficando deformadas (KRUGNER; AUER, 2005). Árvores cujo ataque foi intenso tem seu crescimento comprometido devido à redução da capacidade fotossintética das plantas (AUER et al., 2017). Desde que não sejam dominadas pelas árvores adjacentes (não infectadas pela doença), ainda que afetadas pela doença, as árvores podem se recuperar (KRUGNER; AUER, 2005). A fonte de inoculo para a doença pode vir de mudas ou plantios jovens de eucalipto ou ainda proveniente de mirtáceas nativas, hospedeiras do fungo. (SANTOS; AUER; JUNIOR, 2001). Ataques mais severos ocorrem nas fases iniciais (mudas ou plantios recentes), quando a planta está com cerca de 3-12 meses de idade, observando-se quando as condições ambientais são favoráveis para a ocorrência da doença. O ambiente que favorece ataques severos do patógeno consiste na combinação de temperaturas moderadas e elevados índices de umidade relativa do ar, mais especificamente, períodos noturnos de molhamento foliar iguais ou superiores a 8 horas associadas a temperaturas entre 15 e 25ºC (SANTOS; AUER; JUNIOR, 2001; KRUGNER; AUER, 2005). Figura 1 - Ferrugem do Eucalipto Fonte: KRUGNER (2005). 26 Silva et al. (2017) estudaram estágios de pré-infecção da A. psidii em epiderme de folhas de eucalipto com diferentes graus de resistência. O patógeno foi inoculado em folhas de diferentes estágios de desenvolvimento para diferentes clones (e níveis de resistência), sob condições adequadas para o desenvolvimento da doença. As amostras foram avaliadas com uso de microscópio eletrônico e os resultados mostraram que o clone resistente não apresentou sintomas em nenhuma fase de desenvolvimento da folha; o primeiro estágio foliar de um clone não resistente apresentou maior susceptibilidade, sendo que no terceiro estágio do mesmo clone a percentagem de urenidiósporos germinados e apressórios diminuiu. Pelo fato de que o fungo necessita de tecidos jovens para infectar e desenvolver a doença, materiais genéticos cuja fase juvenil é mais extensa são mais susceptíveis devido ao maior tempo de exposição (AUER et al., 2017). 2.2.2 Perdas e danos Zadoks (1985) realizou uma revisão de conceitos acerca dos termos utilizados na quantificação das perdas e danos. Por tanto, embora os termos possam sofrer alterações futuras, o entendimento básico requer que sejam estabelecidos como “organismo nocivo” qualquer agente biológico que venha a causar injúrias à uma determinada cultura de interesse; “produção” vem a ser o produto mensurável de valor econômico advindo de uma plantação; “injúria” significa qualquer sintoma visível e mensurável causado por um organismo nocivo; “dano”, o qual corresponde a redução da quantidade e/ou qualidade da produção; e, finalmente, o termo “perda”, que representa a redução do retorno financeiro por unidade de área em função da ação de organismos nocivos. A presença e ação de um organismo nocivo tende a gerar injúrias, as quais costumam levar aos danos, que por sua vez, podem ser traduzidas em termos financeiros por meio das perdas. Quando as injúrias não afetam a qualidade/quantidade da produção é empregado o termo “injúria aparente”. Outros termos que são derivados dos estudos de perdas e danos são representados pela “severidade” ou “intensidade”, caracterizada como sendo a intensidade da “injúria” causada por uma determinada doença, as quais irão compor uma função de dano (BERGAMIN FILHO; AMORIM,1996). Diferentemente das funções de danos, os mesmos autores retratam que a função de perda é mais difícil 27 de ser determinada, pois dependem de fatores econômicos dos países em determinado momento. Para estudar a influência da ferrugem em plantios de eucalipto, Santos (2006) encontrou uma redução média de produtividade na ordem de 48,3%. Furtado et al. (2009) afirmavam danos na ordem de 30% do incremento anual. Contudo, estudos mais detalhados foram realizados por Takahashi (2002), visando preencher uma lacuna de informações referentes aos danos causados pela A. psidii em Eucalyptus spp. Na ocasião foram comparados índices de infecção de plantios de duas regiões distintas do Estado de São Paulo, utilizando-se de um modelo matemático proposto por Ruiz et al. (1989). Para a determinação do índice de infecção levou-se em conta dados climáticos diários de temperatura e período de molhamento foliar. O estudo constatou reduções na produção da ordem de 20% a 41%, variando entre os ambientes, idade de plantio e genótipos. O estudo revelou que a utilização de genótipos susceptíveis pode acarretar em sérios prejuízos às empresas florestais. A mesma autora ainda constatou que, no aspecto temporal, o mês mais favorável à ocorrência da doença foi o mês de setembro e a idade máxima de ocorrência de 1,5 ano (18 meses). Pode-se, deste modo, caracterizar a importância da identificação, quantificação e controle patógeno em plantios de eucalipto. Abilio (2017) avaliou a influência da época de plantio de eucalipto em função da intensidade da ferrugem, concluindo que plantios realizados no inverno constituem em uma estratégia de escape para materiais de interesse comercial susceptíveis à ferrugem devido à baixa favorabilidade climática. Quando analisados os estágios mais susceptíveis da planta, os plantios realizados no verão apresentam quantidade de dias de clima favorável ao patógeno. O estudo, no entanto, não revelou as perdas finais provenientes do patógeno, sendo necessário acompanhamento até a fase de corte. 2.2.3 Amostragem e controle A mensuração da intensidade da doença é essencial na fitopatologia, pois somente por meio desta que se torna possível a avaliação das perdas das culturas e demais aplicações em epidemiologia (KRANZ, 1988), sendo a fitopatometria o termo que define a quantificação de doenças (BERGAMIN FILHO; AMORIM, 1996). 28 A quantificação dos danos é essencial para o desenvolvimento de um programa bem-sucedido de controle de doenças, e para tal, deve se basear em estimativas confiáveis dos prejuízos causados pelos patógenos (BERGAMIN FILHO; AMORIM, 1996). A avaliação das perdas em culturas abrange diversos métodos experimentais em epidemiologia, que vão desde experimentos controlados em câmaras de crescimento, medição de doenças e patógenos, fatores climáticos e parâmetros do hospedeiro, envolvendo, em certos casos, estudos de resistência à fungicidas ou identificação de variáveis uteis em previsão e avaliação das perdas (KRANZ; ROTEM, 1988). Segundo Junghans (2000), a escolha de um método para quantificar uma doença deve levar em consideração fatores como tempo, praticabilidade, custo e acurácia. Santos (2006) revisou os métodos de avaliação da severidade da ferrugem do eucalipto (A. psidii) e seus resultados indicaram que o uso da escala diagramática desenvolvida por Takahashi & Furtado (n.p.)1 mostrou-se mais adequado devido à rapidez e facilidade de uso em campo, bem como a correlação de seus resultados. Um outro ponto importante é o método de avaliação e quantificação da doença em plantios de eucalipto. Junghans, Alfenas e Maffia (2003), visando avaliar a severidade da doença, utilizam critérios relativos ao tamanho das pústulas e do número de soros, desenvolvendo uma escala diagramática de quatro notas. O objetivo dos autores foi o de se criar uma metodologia padronizada e de fácil aplicação para analisar a severidade da ferrugem A. psidii em grande número de plantas de eucalipto. A escala de notas utilizou plantas artificialmente inoculadas, considerando-se a classe de severidade de acordo com o tamanho da pústula (Figura 2). Nesta escala, porém, o fator de maior impacto na acurácia dos resultados se deveu não à escala, em si, mas ao treinamento de avaliadores. De outro modo, a praticidade e a rapidez constituíram em um aspecto forte da metodologia, sendo indicada na seleção de material resistente para fins científicos, plantios comerciais ou programas de melhoramento. Anteriormente a este trabalho, Junghans (2000), afirmou que a escolha de um método para quantificar uma doença deve levar em consideração fatores como tempo, praticabilidade, custo e acurácia. 1 Referência: TAKAHASHI, S.S., FURTADO, E.L., CAMARGO, F.R.A., RAMIRO, G.A. Teste de modelo para estimativa da incidência e evolução da ferrugem do eucalipto A. psidii em duas regiões de plantio no Estado de São Paulo. In: Forest: Congresso e Exposição Internacional sobre Florestas, 5, Curitiba, 1999. 29 Tendo-se em vista a necessidade de se atribuir graus de severidade de uma doença florestal de modo padronizado e confiável, Damasceno, Furtado e Ferreira Filho (2014) compararam dois métodos de validação de escala diagramática para a quantificação da severidade da mancha de uma outra doença foliar, Cylindrocladium, em eucalipto. Em seu trabalho, as folhas foram digitalizadas por meio de escâner e submetidas à dois procedimentos. No primeiro, utilizou-se um software fornecido pela EMBRAPA, AFSoft, que utiliza artifícios de inteligência artificial para análise de folhas a partir de cores pré-estabelecidas e, no segundo procedimento, efetuou-se a delimitação manual das áreas lesionadas e sadias por meio de mesa digitalizadora e tratamento via software GIMP e ImageJ. As folhas foram também submetidas à avaliação de severidade (sem e com escala) à cinco avaliadores e, finalizou-se com uma análise de regressão. Os resultados indicaram uma boa repetitividade nas estimativas realizadas pelos avaliadores e uma ligeira vantagem para a escala elaborada com delimitação manual com auxílio da mesa digitalizadora. O software AFSoft implicou em rapidez nos resultados. Furtado (2002) considerou que o melhor método de controle visando evitar os danos causados por A. psidii foi a utilização de plantas geneticamente resistentes. Para Krugner e Auer (2005), além da escolha de materiais resistentes, pode-se utilizar plantas de rápido crescimento (reduzir o tempo de exposição na fase crítica de ocorrência da doença), bem como adotar o controle químico, porém, restritos à Figura 2 – Escala de notas para avaliação da resistência à ferrugem do eucalipto (Eucalyptus sp.), com quatro classes de severidade: S0=imunidade ou reação de hipersensibilidade do tipo "fleck" ou necrótico; S1=pústulas<0,8mm de diâmetro; S2=pústulas de 0,8 a 1,6mm de diâmetro; e S3=pústulas>1,6mm de diâmetro. Fonte: JUNGHANS, ALFENAS; MAFFIA (2003). 30 viveiros, sendo no campo, viável apenas para materiais de elevado valor de comercialização. Zauza et al. (2008) testaram o efeito curativo e protetor de fungicidas sistêmicos em ambiente controlado, concluindo, como já exposto, uma elevada eficácia quando aplicados no início da doença (até quatro dias após a inoculação). No que se refere à ensaios de fungicidas em campo, o mesmo foi realizado por Masson et al. (2011), em um manejo de brotação de material clonal susceptível à doença, localizado no norte da Bahia. Os resultados obtidos permitiram concluir que o efeito curativo dos fungicidas é significativo se aplicados até os sete dias da inoculação, inibindo o desenvolvimento do haustório e do crescimento micelial no interior dos tecidos. Contudo, os autores afirmam a necessidade de se efetuar um estudo de viabilidade econômica dentro do contexto do manejo integrado da ferrugem, tratando especialmente da eficiência de produtos e custo de operação em função da avaliação criteriosa da severidade da doença observada em campo. As mudanças climáticas afetam diversas variáveis, como a temperatura, precipitação, umidade, ventos etc. (HAMADA; GHINI; OLIVEIRA, 2017) sendo que o ambiente está diretamente relacionado à ocorrência de pragas e doenças, podendo causar alterações na ocorrência e intensidade (BETTIOL et al., 2017). Considerando-se as projeções climáticas futuras, torna-se essencial desenvolver pesquisas relacionadas aos efeitos diretos da temperatura sobre a A. psiidi, assim como a resposta dos clones comerciais e a sua respectiva resistência às mudanças climáticas, sendo estes, pontos estratégicos para o controle da ferrugem das mirtáceas em cenários futuros (AUER et al., 2017). É importante observar que nos trabalhos referentes à controle do patógeno citados, o método de avaliação da severidade foi realizado com o auxílio da escala diagramática, expressa em percentual de área foliar lesionada, método este que é fator limitante para a estimação dos danos em um plantio comercial. No item 2.3.3 (página 43) serão abordados aspectos mais específicos quanto às técnicas de levantamento fitossanitário em culturas e florestas por meio de informação espectral. 2.3 REFLECTÂNCIA FOLIAR A reflectância foliar pode ser entendida como um processo de interação entre a radiação eletromagnética e a absorção desta radiação por parte dos pigmentos 31 fotossintetizantes como as clorofilas, chantofilas e carotenos, absorção esta que não é indistinta ao longo do espectro eletromagnético, ocorrendo especificamente na região do visível, entre 400nm e 720nm (PONZONI; SHIMABUKURO, 2009; NOVO, 2010). Segundo Moraes (2002), a energia eletromagnética pode ser ordenada de forma contínua em função do comprimento de onda ou frequência e, esta disposição é chamada de Espectro Eletromagnético. De acordo com o INPE (2014), pode-se dizer que o Sol emite energia em, praticamente, todos os comprimentos de onda do espectro eletromagnético permeados pelas diversas linhas de absorção. Porém, cerca de 44% de toda essa energia emitida se concentra entre 400nm e 700nm (denominado espectro visível), sendo o restante dividido entre radiação ultravioleta, com cerca de 7%, infravermelho próximo (de 700nm a 1500nm), com cerca de 37% e infravermelho (> 1500nm), com 11% (Figura 3). Menos de 1% da radiação emitida concentra-se acima da região do infravermelho, como micro-ondas e ondas de rádio, e abaixo da região ultravioleta, como raios X e raios gama (Figura 3). A radiação eletromagnética emitida pelo Sol constitui a fonte para o estudo de qualquer alvo terrestre mediante as técnicas de sensoriamento remoto. Contudo, esta mesma energia sofre diversas interações antes de alcançar a superfície da Terra. Assim, de forma resumida, a Figura 4 representa a intensidade de fluxo radiante em cada comprimento de onda e seu respectivo comportamento ao penetrar na atmosfera até que se torne disponível às interações na superfície terrestre. A linha Figura 3 - Distribuição da energia emitida pelo Sol. Fonte: INPE (2014). 32 de cor cinza-clara representa o fluxo radiante que alcança o topo da atmosfera terrestre. A linha de cor preta, com oscilações ao longo dos diversos comprimentos de onda, caracteriza a energia radiante do Sol que atinge a superfície terrestre ao nível do mar. Nota-se que tais oscilações representam atenuações devido à interferência de diferentes componentes contidos na atmosfera, como o O3 (Ozônio), H2O (Água – Vapor), O2 (Oxigênio), CO2 (Gás carbônico). A linha tracejada representa a curva de irradiância de um corpo negro teórico, à temperatura de 5.900ºK (PONZONI; SHIMABUKURO, 2009). Além do exposto, é importante salientar que inúmeros fatores interferem nas respostas espectrais dos objetos sensoriados, como acontece quando se considera em um dossel de vegetação a radiação incidente será espalhada por componentes das plantas, tendo como fundo a superfície do solo (FORMAGGIO, 2017). Em um próximo nível de enfoque é válido salientar que a radiação eletromagnética ainda sofre alterações durante as fases de registro da informação. As imagens digitais são representadas por números digitais adimensionais (ou pixel, equivalente à uma certa área superficial), cujo valor varia de acordo com a intensidade Figura 4 - Intensidade de fluxo radiante emitido pelo Sol. Adaptado de Swain e Davis (1978). Fonte: PONZONI; SHIMABUKURO (2009). 33 de fluxo radiante incidente sobre um detector ou sensor (SHIMABUKURO; PONZONI, 2017). Os mesmos autores caracterizam o fenômeno denominado mistura espectral, que surge da não uniformidade dos cenários naturais, como por exemplo solo, vegetação, rocha e água, tornando-se mais complexo quando assumidas as distintas proporções contidos dentro de um mesmo pixel. Weiss et al. (2015), evidenciaram a importância de se validar dados obtidos por sensores orbitais (satélites) com os valores in situ coletados por meio de espectroradiômetros. Molin (2015), classificou o uso de sensores próximos à planta como sendo Sensoriamento Proximal, cujo princípio de funcionamento predominante é baseado nas características de reflectância das culturas. Dentre estes, enquadram-se uma grande variedade de sensores terrestres. Por fim, a informação espectral de um dado alvo, já caracterizado ao longo do processo descrito, pode vir a compor uma curva singular de energia no espectro eletromagnético, ou, em outras palavras, ser caracterizado por meio de uma assinatura espectral – que geralmente é descrita como um conjunto de valores de energia em certas bandas-chave, os quais podem servir para distinguir um determinado objeto sensoriado de outro (LIU, 2015). Apresentadas as bases para a compreensão do princípio da reflectância foliar pode-se partir para os aspectos da fisiologia vegetal de plantas sadias e doentes. 2.3.1 Aspectos fisiológicos A fotossíntese, é único processo de importância biológica que pode aproveitar energia Solar, sendo capaz de armazená-la em moléculas que posteriormente serão utilizadas nos processos biossintéticos de proteínas, impulsionando o desenvolvimento da planta (TAIZ; ZEIGER, 2010). São três os fenômenos que acontecem simultaneamente em uma folha que recebe radiação eletromagnética: a reflexão, a transmissão e a absorção (Figura 5). As propriedades óticas de folhas são caracterizadas pela transmissão da luz através dela, da luminosidade absorvida pelas substâncias químicas presentes no interior da folha (pigmentos, água, açúcares, lignina e aminoácidos), e, por último, a luminosidade pode ser refletida, seja a partir do conteúdo interior das folhas ou diretamente da sua superfície (MAHLEIN, 2016). No entanto, o termo mais adequado 34 é radiação eletromagnética, mais abrangente, uma vez que luz está associado ao espectro visível apenas. A Figura 6.a e 6.b exibe a atividade de absorção da energia solar considerando-se o espectro eletromagnético solar incidente na superfície terrestre, acrescida da atividade da clorofila e evidenciando o pico de absorção de energia solar na região do azul (aproximadamente aos 430nm) e vermelho (aproximadamente aos 660nm) do espectro. A baixa eficiência de absorção de energia na região do verde (na região visível) garante à nossos olhos as tonalidades verdes às plantas, no geral (TAIZ; ZEIGER, 2010). Jensen (2009) e Formaggio (2017) descreveram os limites para a atividade da clorofila, sendo as faixas de 450–520nm (na região do azul) e 630–690nm (na região do vermelho). Observando a fisiologia das plantas, em particular, da sua pigmentação, é possível ponderar sobre o estado de estresse em função das alterações de absorção pela atividade da clorofila. Se uma planta se encontrar em estresse, ou por algum motivo houver menor quantidade de clorofila nos tecidos, o resultado será uma menor absorção de energia nas regiões características de absorção, ou seja, haverá uma alta reflexão de comprimentos de ondas que serão captadas pelo sensor. Jensen (2009) e Formaggio (2017) afirmaram que a reflectância no infravermelho próximo é indicador de estresse em plantas somente quando ocorre Figura 5 – Interação luminosa na folha. Fonte: MAHLEIN (2016). 35 severa desidratação foliar. O item 2.3.3 (Espectrometria de doenças em plantas) retomará o tema com ênfase na questão fitossanitária. A reflectância espectral característica da folha vegetal verde e sadia, considerando-se o intervalo de comprimento de onda entre 0,4µm e 2,6µm, pode ser observada na Figura 7. Os fatores dominantes que controlam a reflectância foliar são os vários pigmentos foliares existentes no mesófilo paliçádico (por exemplo, as clorofilas a e b, e o β-caroteno), o espalhamento da energia infravermelha no mesófilo esponjoso e a quantidade de umidade na planta. A principais bandas de absorção pela clorofila ocorrem em 0,43-0,45µm e em 0,65-0,66µm na região do visível. As principais bandas de absorção pela água ocorrem em 0,97; 1,19; 1,45; 1,94 e 2,7 µm (JENSEN, 2009; LIU, 2015; FORMAGGIO, 2017). No nível de análise da resposta espectral de um dossel, porém, deve-se considerar que há camadas de folhas sobrepostas através da qual o fluxo radiante incidente irá atravessar e/ou refletir. Jensen (2009) afirmou que numa folha verde sadia, a camada correspondente ao mesófilo esponjoso controla a quantidade de energia do infravermelho próximo que será refletida (observar Figura 7 – mesófilo Figura 6 – a) Espectro solar e sua relação com o espectro de absorção da clorofila. b) Espectros de absorção das clorofilas a e b. Ir ra d iâ n c ia W m n m -2 -1 Comprimento de onda,  Espectro Visível A) Emissão solar C) Absorção da clorofila B) Energia na superfície da Terra Clorofila a Clorofila b Espectros de Absorção das Clorofilas e a b A b so rç ão Comprimento de onda, violeta azul verde amarelo vermelho a. b. Fonte: TAIZ; ZEIGER (2010). Fonte: JENSEN (2009). 36 esponjoso, legenda acima do gráfico, atuando na faixa do infravermelho próximo – legenda abaixo do gráfico). Na região do infravermelho próximo, uma vegetação sadia apresentará uma alta reflectância, na ordem de 40% a 60%. Diversos trabalhos anteriores (desde a década de 60) vem demonstrando uma relação direta entre o infravermelho próximo e a biomassa, ou seja, quanto maior a biomassa, maior a reflectância. Outra relação tem sido revelada, porém, inversamente proporcional quando associada aos comprimentos de onda na faixa do visível (particularmente na faixa espectral do vermelho). Isto pode ser visualizado com facilidade por meio da Figura 8. Novo (2010) explica que, em teoria, se fosse possível medir a reflectância de um objeto em faixas espectrais adjacentes e estreitas poder-se-ia construir um gráfico representativo da sua “assinatura espectral”. Entretanto, se uma folha à qual Figura 7 - Espectro de reflectância de uma folha verde e sadia. Fonte: JENSEN (2009). 37 se deseja obter a assinatura espectral tiver sua posição modificada, encontrar-se-á outra assinatura que não a primeira. Além disso, Formaggio (2017) afirmou que o comportamento espectral da vegetação se modifica ao longo do seu ciclo vegetativo. Ferraz et al. (2007) realizaram um trabalho evidenciando o efeito do desenvolvimento fenológico sobre o comportamento espectral da cultura do feijão, incluindo a tomada de dados a partir de três ângulos distintos de visada, conforme a Figura 9. Neste experimento, pode-se observar que, enquanto as reflectâncias na região do vermelho (considerando os três ângulos de visada) pouco se alteram com o decorrer do desenvolvimento da cultura, na região do infravermelho as diferenças são mais evidentes, especialmente em relação ao ângulo de 45º de visada, que apresentou diferenças estatisticamente significativas (5% de probabilidade) em relação aos demais ângulos. Brandelero (2010), utilizou-se de 12 bandas espectrais para a caracterização espectrorradiometrica de visível e infravermelho próximo, abrangendo comprimentos de onda de 475nm a 980nm em Eucalyptus grandis W. Hill ex Mainden. O estudo estudou os aspectos nutricionais, sazonais, em diferentes idades, de Figura 8 – a) Distribuição de todos os pixels em uma cena, no espaço multiespectral do vermelho x infravermelho próximo equivale à área sombreada; b) Movimentação do “pixel” que representa a vegetação agrícola ao longo do ciclo fenológico. Fonte: JENSEN (2009). 38 preparo de solo para avaliar folhas de E. grandis, por meio de espectrorradiometria, e gerar modelos capazes de estimar os teores de macro e micronutrientes a partir de dados de reflectância. O estudo revelou que a reflectância de folhas de E. grandis é estatisticamente afetada pelas estações verão e primavera, que as amostras de material vegetativo podem ser coletadas independentemente do tipo de manejo do solo, que as bandas espectrais que melhor expressaram o comportamento da vegetação foram as bandas 12, 8, 7 e 3 e que na análise dos componentes principais, as bandas 8, 11 e 12 eram responsáveis por um total de 98,10% dos valores de reflectância em estudo. Silva et alli (2012) realizaram medidas espectrais considerando os pontos cardeais (norte, sul, leste e oeste) de árvores de Euclyptus grandis Hill ex Maiden, utilizando os intervalos espectrais do visível (400nm a 700nm) e do infravermelho próximo (700nm e 1.100nm). O objetivo foi de verificar se existia diferenças significativas entre a posição, ou localização cardeal, das folhas na árvore. Os dados espectrais foram coletados com espetroradiômetro e os resultados demonstraram que a resposta espectral das folhas se revelaram estatisticamente diferentes. Além disso, foi observado (Figura 10) um pico de reflectância na região do verde (550), que nada Figura 9 - Efeito do ciclo fenológico e do ângulo de visada sobre o comportamento espectral da cultura do feijão na região do vermelho e infravermelho. Fonte: FERRAZ et al. (2007). 39 mais significa que está ocorrendo uma alta absorção de energia na região espectral azul (450nm) e vermelha (650nm). Figura 10 - Gráfico da reflectância pelo comprimento de onda (400 a 700nm). Fonte: SILVA et al. (2012). 2.3.2 Aquisição de dados espectrais Novo (2010) define sensores como sendo “sistemas responsáveis pela conversão da energia proveniente dos objetos em um registro na forma de imagem ou gráfico que permita associar a distribuição da radiância, emitância, ou retroespalhamento com suas propriedades físicas, químicas, biológicas ou geométricas”. Os sistemas sensores podem ainda ser classificados de acordo com atributos como, quanto à fonte de energia, passivos (que detectam a radiação solar refletida ou a emitida pelos objetos da superfície) ou ativos (os que produzem sua própria radiação); quanto à captura dos dados, podendo ser imageadores (exemplo: sistemas de sensores acoplados em satélites) e não-imageadores (exemplo: espectroradiômetros, cuja saída é em forma de gráficos que exibem a distribuição da reflectância do alvo/objeto). 40 Quanto aos tipos de resolução a serem conceituadas, tem-se a resolução espectral, que é caracterizada pelo número e dimensão de intervalos de comprimentos de onda específicos (chamados de bandas ou canais) no espectro eletromagnético aos quais um instrumento de sensoriamento remoto é sensível. O espectroradiômetro também apresenta tal característica, contudo, não se trata de um sensor remoto. A resolução espacial, que é a medida da menor separação angular ou linear entre dois objetos que pode ser determinada pelo sistema de sensoriamento remoto. A resolução temporal, que é representada pela frequência com a qual um mesmo sensor registra imagens de uma área específica na superfície terrestre. Há também a resolução radiométrica de um sistema sensor, que equivale à sensibilidade de um detector remoto quanto a diferenças de potência do sinal à medida que ocorre o registro (JENSEN, 2009; NOVO, 2010; LIU, 2015). Recentemente, os veículos aéreos não tripulados vem assumindo proeminência no mercado da geoinformação (SOUSA, 2017). Históricamente, o primeiro registro de aplicação prática de VANT se deu em 1849, remontando à Guerra travada entre Áustria e Veneza, ocasião na qual austríacos lançaram balões não tripulados carregados de bombas contra Veneza. Considerando-se uma linha histórica associada às guerras, da qual se pode citar a Segunda Guerra Mundial, na qual os VANTs já eram capazes de operar com câmera de vídeo a bordo, a partir de 1982 surgiu a primeira iniciativa de desenvolvimento de VANT no Brasil, sendo custeada pela Companhia Brasileira de Tratores (CBT) (MUNARETTO, 2017). Segundo Munaretto (2017), a nomenclatura VANT vem caindo em desuso devido à nomenclatura oficial adotada pela ANAC (Agência Nacional de Aviação Civil) e pelo DECEA (Departamento de Controle do Espaço Aéreo), que faz uso da mesma nomenclatura utilizada pela ICAO (International Civil Aviation Organization), a qual se dirige aos VANTs como RPA (Remotely Piloted Aircraft) ou ARP (Aeronave Remotamente Pilotada). Para fins de definição, um Sistema VANT é um sistema formado pelo veículo aéreo, a estação de controle e qualquer outro elemento necessário para permitir o voo, como, comando e controle dos enlaces, sistemas de comunicação e elementos de decolagem e de pouso (MUNARETTO, 2017). Diversos tipos de sensores podem ser utilizados em VANTs, como sensores de espectro visível (RGB – Red, Green, Blue, ou, Vermelho, Verde e Azul), sensores de infravermelho próximo e infravermelho termal (ou ondas longas), 41 sensores multiespectrais (variando de 450 a 30.000 nm), sensores hiperespectrais (alcançando até 10.000 nm) (MUNARETTO, 2017; FORMAGGIO; SANCHES, 2017), podendo ainda operar com ondas RADAR e LIDAR (sistemas ativos que emitem a própria energia), sendo este último uma tecnologia capaz de mapear objetos do terreno determinando a altura da camada vegetal e do solo, permitindo se estimar diâmetro de árvores e atributos geométricos da vegetação (MUNARETTO, 2017). Furtado e Passos (2015), construíram um quadro comparativo das diferentes tecnologias para detecção de estresse em cultivos (Tabela 1). Neste comparativo, foram abordadas as principais vantagens e desvantagens de cada tecnologia, reafirmando a maior qualidade dos avaliadores por terra, bem como seu baixo rendimento e a necessidade de se avaliar por amostragens. Neste sentido, a solução vinda do uso de VANTs no desenvolvimento de técnicas de detecção de estresses em cultivos, incluindo as doenças florestais e, na necessidade de estudos que forneçam bases teórica e metodológica, a qual inclui a modelagem matemática e estatística. Molin (2015), Furtado e Passos (2015) abordaram o uso de veículos aéreos não-tripulados (VANTs) no monitoramento de doenças, fazendo um comparativo entre as diferentes tecnologias para detecção de estresse em cultivos. O monitoramento via satélite apresenta a vantagem de os sensores serem multiespectrais, mas há desvantagens, como quanto à qualidade devido à obstrução por nuvens, efeito de altitude – a atmosfera filtra os componentes espectrais –, a periodicidade – que depende do tempo de espera para que o satélite recubra a mesma área de interesse –, e a resolução espacial relativamente baixa. Imagens aéreas obtidas por veículos aéreos tripulados possuem um histórico de utilização com bons resultados, mas o principal obstáculo é a exigência de uma alta infraestrutura para seu emprego, como laboratórios e profissionais especializados e o alto custo da aeronave utilizada. Os avaliadores por terra são empregados com resultados muito bons, contudo, sua velocidade de levantamento das informações é baixa, havendo necessidade de levantamento das áreas infectadas por amostragens, o que atinge ao redor de 5% da área apenas. 42 Tabela 1 - Comparativo entre diferentes tecnologias para detecção de estresse em cultivos. A) SATÉLITES PRÓ (1): Contra (7): 1. Vigilância com sensibilidade multi-espectral está disponível, existem distribuidores e os preços acessíveis. 1. Apenas imagens vencidas e de baixa resolução estão disponíveis a baixo preço; 2. Obstrução por nuvens; 3. Efeito da altitude, pois a atomosfera filtra os componentes espectrais essenciais; 4. Tempo de processamento longo; 5. Impossibilidade de revisitação imediata; 6. Imagem a cada 16 dias (Landsat); 7. Baixa resolução. B) IMAGENS AÉREAS PRÓ (1): Contra (4): 1. Tem sido utilizada por mais de 60 anos com bons resultados; Sensibilidade multi-espectral nos comprimentos de onda pertinentes estão disponíveis. 1. Requer laboratórios especiais para processo de filmes; 2. Requer profissionais experientes na identificação de estresses; 3. Requer extenso processo fotogramétrico para estabelecer conhecimento amplo; 4. Aeronave tripulada tem alto custo da equipe e da manutenção; C) AVALIADORES POR TERRA PRÓ (2): Contra (1): 1. Usado com resultados muito bons; 1. Velocidade baixa (máximo de 4km/h), necessita avaliar por amostragem, via transectos, atingindo 5% da área; 2. Um avaliador treinado pode verificar as folhas diretamente, coletar amostras do solo. D) VANTs – uma solução que permite: 1. Utilizar aeronave leve (VANTs) adaptada com tecnologia optrônica multi-espectral, GPS e escâner para o georreferenciamento da área avaliada; 2. Utilizar software de última geração de fotogrametria para registrar dados a partir da câmera digital de alta resolução (40 Mpixel) e gerar mapas vetoriais em camadas ao detectar mudanças nas copas das árvores e realçar os estresses automaticamente em cada voo, como gerar relatórios para cada situação avaliada ou até recomendar um controle assim que for necessário; 3. Processamento fotogramétrico ainda no ar; 4. Permite a presença de tripulantes treinados nas missões de vigilância e monitoramento que enviarão esses dados já processados à área de gererenciamento da empresa, para tomada de decisão muito próximo ao tempo real; 5. Permite estudar e planejar as áreas antes mesmo do plantio; 6. Permite revisitar as áreas quantas vezes forem necessárias. Fonte: FURTADO; PASSOS (2015). 43 Os VANTs representam uma solução potencial para o levantamento de dados de doenças florestais em campo, tendo a vantagem das câmeras de alta resolução espacial, capazes de realizar o processamento fotogramétrico ainda em voo, e garantindo informações revisáveis para tomadas de decisão muito próximas ao tempo real (FURTADO; PASSOS, 2015). Contudo, os dados obtidos por estes sistemas geralmente demandam técnicas de processamento de imagens, sendo fundamental o conhecimento do que se deseja avaliar e inferir (MOLIN, 2015). Felix et al. (2017), afirmaram que o há um uso crescente de VANT nos estudos ambientais, mas que ainda foram pouco explorados nos estudos de cobertura vegetal e monitoramento florestal. Os resultados de seu trabalho demonstraram a necessidade de melhorias, haja vista que se detectou dificuldades de distinção dos diferentes tipos de vegetação da área estudada e, pelos índices selecionados. O autor concluiu como alternativa para a resolução destes problemas, a avaliação sazonal das respostas espectrais, uso de sensores infravermelhos e o desenvolvimento de novos índices do espectro visível, bem como do visível conjugado com o infravermelho, visando a validação dos métodos de estudo. Furlanetto et al. (2017) avaliou o potencial uso de sensores multiespectrais embarcados em VANT, os quais ainda não permitem a exploração de todo o espectro eletromagnético, pois os sistemas multiespectrais embarcados em VANT não alcançam a mesma resolução espectral dos sistemas imageadores de satélites. O VANT opera com 4 bandas, aproximadamente, enquanto os satélites híperespectrais possuem 363 bandas. Apesar disto, o uso dos VANTs está em ascensão, onde o foco principal tem se voltado à criação de modelos matemático-estatísticos, sendo estes, em conjunto com o uso de filtros para a resolução de problemas específicos, representam uma ferramenta potencialmente rápida e precisa nas avaliações de campo, podendo substituir os métodos laboratoriais, geralmente de processamento lento e de alto custo. 2.3.3 Espectrometria de doenças em plantas Odum (1983), descreve que “a vegetação absorve comprimentos de onda azul e vermelho visíveis e infravermelho longo, menos fortemente o verde e muito fracamente o infravermelho próximo. Sendo o verde e o infravermelho próximo refletidos pela vegetação, estas faixas espectrais são empregadas no sensoriamento 44 remoto e fotogrametria aéreos e de satélite para revelar os padrões de vegetação natural, a condição das culturas, a presença de plantas doentes etc.” Furtado e Passos (2015) afirmaram que é possível “associar a reflectância foliar de plantas como sendo uma assinatura digital ou espectral, um padrão de resposta, podendo variar, para um binômio patógeno–hospedeiro, segundo dois componentes: o temporal (associado a evolução da doença, e para um dado tempo do processo infeccioso), e aos comprimentos de onda (resultado de interação do espectro eletromagnético com a estrutura foliar)”. Bock et alli (2010) descreveu que a área da patologia florestal que realiza a avaliação de doenças de plantas recebeu o nome de patometria de plantas ou fitopatometria (do grego phyto=planta; pathos=doença, metron=medida). Mahlein (2012) afirmou que as doenças podem causar alterações na cor dos tecidos, na taxa de transpiração, na densidade e na morfologia da produção da copa como na variação na interação da radiação solar com as plantas, resultando na modificação das propriedades óticas dos tecidos. Naue et al., (2011) afirmou que a detecção de doenças de plantas, ou sua quantificação, baseia-se na quantidade de radiação refletida a partir das folhas. Contudo, plantas infectadas por fitopatógenos, mas assintomáticas ao olho humano, podem ser diagnosticadas por meio de sensores que mostram mudanças no comportamento espectral da planta. O termo comumente utilizado para determinar o comportamento espectral de um alvo, seja de uma cultura, do solo ou da água, ao longo do espectro eletromagnético é denominado “assinatura espectral” ou “curva de reflectância”. Jorge e Inamasu (2014) descreveram a assinatura espectral como tendo relação direta com as propriedades físicas e químicas, estrutura atômica, que, em conjunto, compõe as feições espectrais diagnósticas. Bravo et al. (2003) verificou a diferença entre as reflectâncias de plantas de trigo sadias e infectadas por Puccinia striiformis (ferrugem linear ou ferrugem amarela do trigo) (Figura 11). As reflectâncias foram coletadas utilizando um espectrômetro de campo montado na altura da barra de pulverização (Figura 12) e a classificação das plantas doentes e sadias feita por um modelo de classificação baseado em discriminação quadrática. Após a aplicação de uma metodologia stepwise, que identificou 4 comprimentos de onda que, significativamente (pelo teste F), incrementavam o modelo discriminante, o autor observou que as taxas de erros caíram de 12% para 4%, conforme se pode observar na Figura 13. 45 Figura 11 - Típico sintomas da ferrugem linear ou amarela do trigo em folhas de trigo após completo desenvolvimento; presença de pústulas amarelas de esporos com listras de áreas cloróticas. Fonte: BRAVO et al. (2003). Figura 12 - Veículo no qual o espectrômetro foi montado; o sistema podia se mover livremente sobre o dossel. Fonte: BRAVO et al. (2003). 46 Figura 13 - Reflectância das folhas de trigo saudáveis e infectadas com ferrugem linear ou amarela (Puccinia striiformis) Fonte: BRAVO et al. (2003). Mahlein et al. (2012), por meio de imagens hiperspectrais de folhas de beterraba, buscou identificar regiões espectrais significativamente diferentes que pudessem diferenciar plantas sadias de plantas infectadas por três doenças. Os resultados (Figura 14) enfatizaram regiões espectrais de alto interesse na faixa do visível e infravermelho próximo das assinaturas espectrais avaliadas. Figura 14 - Assinaturas espectrais de diferentes doenças em folhas de beterraba no visível, infravermelho próximo e infravermelho de ondas curtas. Fonte: MAHLEIN et al. (2012). 47 Lippert et al. (2015), analisou o comportamento espectral de folhas de Eucalyptus globulus atacadas por quatro diferentes níveis de severidade pelo fungo Mycosphaerella spp. em diferentes posições na copa da árvore – base, meio e extrato superior da copa), levando ainda em consideração quatro estações climáticas e as regiões do espectro visível e infravermelho próximo. O equipamento utilizado para as medidas foi o espectroradiômetro e a metodologia proposta foi a de blocos ao acaso, com experimento bifatorial para análise dos valores de reflectância para cada estação, avaliando-se a interação entre os fatores pela análise de variância e teste Tukey (5%). O estudo concluiu que a resposta espectral das folhas é distinta em níveis altos da ocorrência do patógeno, tanto na região do visível quanto na região do infravermelho próximo, nas diferentes posições da copa e estações climáticas. Pietrzykowski et al. (2007) usaram imagens multiespectrais em Eucalyptus globulus visando prever a severidade do ataque causado por Mycosphaerella spp. Os resultados demonstraram que as imagens de alta resolução podem ser usadas para mapear a distribuição e severidade dos sintomas causados pela Mycosphaerella spp. em pequenas plantações de Eucalyptus globulus. Este estudo foi realizado com base em modelos de desfolha e classes de severidade de necrose, desenvolvidos por meio de métodos regressão linear. As variáveis de reflectância e os índices espectrais foram selecionados com base nos coeficientes de determinação e erros quadrados médios. Os modelos lineares foram validados pela técnica bootstrap, com 1000 interações e nível de confiança em 95%. 2.3.4 Análise Multivariada Aplicada à Reflectância Kranz (1990) ressaltou que a epidemiologia, que estuda as doenças das plantas em níveis populacional e comunitário, exige matemática e modelos destinados à análise, descrição, caracterização de modo que os resultados da pesquisa possam se tornar operacionais no nível de proteção das culturas. Uma das metas da análise multivariada é resumir os dados em uma dimensão menor que a original sem perder as informações essenciais (KOCH, 2014). A Análise Multivariada tem se sido muito utilizada nos últimos anos em decorrência, em primeiro lugar, da facilidade da coleta de grandes quantidades de dados por advento do desenvolvimento tecnológico e, em segundo, pela alta complexidade dos dados coletados, com consequente dificuldade de se extrair a 48 compreensão dos mesmos (LATTIN, 2011). Simplificadamente, os métodos de estatística multivariada visam simplificar e/ou facilitar a interpretação do fenômeno que está sendo estudado por meio da construção de variáveis alternativas que sintetizam a informação original (MINGOTI, 2005). Sankaran et al. (2010) fizeram um levantamento das técnicas de monitoramento fitossanitário e a detecção de doenças em plantas e árvores. O estudo revela que as equipes de avaliadores de campo constituem no método mais empregado, contudo tem elevado custo, trabalho intenso, além de ser um processo lento. As técnicas moleculares para diagnose exigem, por sua vez, amostragens e procedimentos de análise detalhadas. No entanto, a avaliação fitossanitária precoce das culturas e a identificação de doenças é ponto chave para o manejo visando produtividade e retorno econômico. Neste sentido, o estudo procurou evidenciar algumas associações de técnicas de processamento de imagens à fitopatometria foram utilizadas na construção de índices visando a mensuração de doenças de plantas a partir das respectivas faixas espectrais observadas (Tabela 2). Seguindo na mesma linha de metodologias para diagnose de doenças, Martinelli et al. (2014) fizeram um resumo de diferentes técnicas utilizadas na literatura, separando-as em sensores não-imageadores e imageadores e a respectiva técnica utilizada (Tabela 3). A problemática associada à identificação de doenças em plantas por meio de imagens tem recebido uma considerável atenção nas duas últimas décadas. Contudo, o desenvolvimento de um sistema computacional para diagnóstico de doenças e a respectiva gravidade é uma tarefa desafiadora, que traz consigo muitos problemas a serem resolvidos, tais como o monitoramento de vastas áreas e, em tempo real, os quais dependem da disponibilidade de computadores mais potentes e de imagens com qualidade superior à custos acessíveis, base sob a qual será possível desenvolver ferramentas de análise de imagens mais precisas e poderosas (BARBEDO, 2016). 49 Tabela 2 - Exemplos de estudos na detecção de doenças de plantas usando técnicas de imagens. Planta Doença/dano Métodos estatísticos Faixa espectral ótima Referência Trigo Sarna (Fusarium head blight Análise discriminante 568 e 715 nm (550, 605, 623, 660, 697 e 733 nm) Delwiche & Kim (2000) Tomate Requeima Transformação da fração de ruído mínimo e classificação baseada no ângulo espectral (componentes principais) 700-750 nm, 750-930 nm , 950-1030 nm e 1040-1130 nm. Zhang et al. (2003, 2005) Trigo Ferrugem amarela, e deficiência de nutrientes Redes neurais baseados em mapas de auto-organização, análise discriminante quadrática 650, 725, e 750 nm Moshou et al. (2005,2006) Trigo Ferrugem amarela Análise de regressão - Huang et al. (2007) Greapfruit Cancro cítrico Análise de componentes principais 553, 667, 718 e 858 nm Qin et al. (2008) Cebola Doença das escamas Análise de imagens 1150-1280 nm Wang et al. (2009) laranja Bolor azul e podridão marrom Diferenças em reflectância 540 e 680 nm Sighicelli et al. (2009) Fonte: adaptado de SANKARAN et al (2010). 50 Tabela 3 - Resumo da avaliação por sensoriamento remoto (RS) de aplicações de doenças de plantas. Tipo Sensor Técnica utilizada Referência N ã o -i m a g e a d o r Espectroscópio- espectroradiômetro IEV específico, mineração de dados e classificação, AME, RNA, decomposição espectral (wavelets), análise de regressão Nutter (1989), Malthus and Madeira (1993), Jacquemoud and Ustin (2001), Bravo et al. (2003), Graeff et al. (2006), Mirik et al. (2006), Costa et al. (2007) Delalieux et al. (2007), Yang et al. (2007), Chen et al. (2008), Naidu et al. (2009), Purcell et al. (2009), Grisham et al. (2010), Rumpf et al. (2010), Huang et al. (2012), Stilwell et al. (2013), Yuan et al. (2014), and Zhang et al. (2014) Espectroscópio de fluorescência Extração de características, mineração de dados, análise de regressão, fluorescência passiva Lins et al. (2009) Im a g e a d o r Câmeras RGB Avaliação visual e análise de imagens Smith and Dickson (1991), Nilsson (1995), Nutter and Schultz (1995), Johnson et al. (2003), Seiffert and Schweizer (2005), Bock et al. (2008), Camargo and Smith (2009), and Bock et al. (2010) Imagens Multiespectral- Hiperespectral IEV, ICA-PCA, classificação de imagens, extração de características, AME, RNA, parâmetros bio- óticos de vegetação Delwiche and Kim (2000), Bravo et al. (2003), Zhang et al. (2003), Moshou et al. (2004), Moshou et al. (2005), Okamoto et al. (2007), Blasco et al. (2007), Gowen et al. (2007), Huang et al. (2007), Sighicelli et al. (2009), Rumpf et al. (2010), Bauriegel et al. (2011); Hillnhütter et al. (2011), Mewes et al. (2011), Mirik et al. (2011), Mahlein et al. (2012a), Mahlein et al. (2012b), Reynolds et al. (2012), Wang et al. (2012), Mahlein et al. (2013), Mirik et al. (2013), Calderón et al. (2013), and Berdugo et al. (2014) Imagem termal ICA, PCA, classificação de imagens Chaerle et al. (1999, 2003), Chaerle and Van der Straeten (2000), Oerke et al. (2006), Costa et al. (2013), and Berdugo et al. (2014) Imagem fluorescente Extração de características, mineração de dados, análise de regressão Lichtenthaler et al. (1996), Chaerle et al. (2003), Moshou et al. (2005), Blasco et al. (2007), Sighicelli et al. (2009), Agati et al. (2013), Calderón et al. (2013), and Berdugo et al. (2014) O u tr o s Radiometria de Microondas Passiva Avaliação de Emissividade de Água Hadjiloucas et al. (2009) Ressonância magnética nuclear PCA Choi et al. (2004) IEV – Índice Espectral de Vegetação; AME – Análise de Mistura Espectral; RNA – Redes Neurais Artificiais; RGB – Câmeras red-green-blue; ICA-PCA – Análise de componentes independentes- principais; PCA (ACP) – Análise de componentes principais Fonte: MARTINELLI et al. (2014). 51 3 MATERIAL E MÉTODOS 3.1 MATERIAL Foram utilizados os dados do trabalho de pós-doutorado da pesquisadora Dra. Adimara Bentivoglio Colturato2. O experimento de referência foi realizado em área ocupada por Eucalyptus grandis x E. urophylla - clone H13, com idade de 1 ano e ocorrência de ferrugem causada por Austropuccinia psidii (G. Winter) Beenken, referenciada à 23°2'30.30"S e 48°37'27.10"O, município de Itatinga-SP. De acordo com a classificação de Koeppen, o clima do da região é Cwa, com altitude de 840m, temperatura média anual de 19,7ºC, com média mínima de 9,1ºC (no mês de Julho), média máxima de 28ºC (nos meses de janeiro e fevereiro), pluviosidade de 1.372,7mm, com chuvas concentradas no verão (42,6%), 22,3% no outono, 24,2% na primavera e 11% no inverno (CEPAGRI, 2018). a. Imagens de VANT A aquisição das imagens foi realizada em 29 de abril de 2014, utilizando o VANT SenseFly Ltd., modelo eBee – DRONE de mapeamento profissional, munido de câmera Canon WX RBG de 18,2MP, com resolução do solo a 100m de 2,75cm, com salvamento automático em JPG. As características principais do modelo são envergadura de 96cm, peso (com bateria e câmera) de aproximadamente 0,69kg, alcance da ligação de rádio de até 3km, software de planejamento de voo eMotion 3, autonomia de até 50 minutos de voo e cobertura máxima de 12km² (vide manual). Em adição, foram utilizados os softwares Postflight Terra 3D (para confecção dos mosaicos das imagens). A Figura 15 exibe a etapa do planejamento do levantamento das imagens em campo. Os dados de reflectância das imagens foram obtidos por meio do programa ColourWorker – image-based colour measurement, sendo coletadas 30 medições de plantas sadias e 30 medições de plantas com sintomas da ferrugem A. psidii. Neste caso, não foi possível separar os dados de plantas doentes por níveis de severidade, obtendo-se apenas um grupo para sadias e outro para doentes. 2 Pós-doutorado no Instituto de Ciências Matemáticas e de Computação (ICMC) da Universidade de São Paulo (USP) de São Carlos (2014). FONTE: http://bv.fapesp.br/pt/pesquisador/681013/adimara-bentivoglio-colturato/ 52 b. Dados por Espectroradiômetro Os dados referentes ao espectroradiômetro foram levantados por meio da coleta de 30 folhas de plantas sadias e 30 folhas de plantas doentes para cada nível de severidade observado (1, 2 e 3) vide escala diagramática (ZAMPROGNO et al., 2008). A coleta foi realizada em diversas plantas cujas folhas, misturadas, foram acondicionadas em sacos plásticos e armazenadas em uma caia de isopor com gelo (para evitar/reduzir a perda de água) para transporte, sendo acondicionadas em geladeira até o momento da leitura da reflectância em laboratório. As medições espectrais foram realizadas no Laboratório de Fotônica e Ótica da Embrapa Instrumentação, situada em São Carlos-SP e utilizou um espectrôrradiômetro USB2000 da Ocean Optics, com amplitude de leitura situada entre 450nm até 720nm. Este equipamento foi montado com uma fibra ótica (no campo do espectro visível), luz de LED e a respectiva fonte de alimentação, uma lente para não haver espalhamento da luz, um anteparo e uma mesa (Figura 16). Foi utilizada uma distância focal de 12cm. Foram realizadas 30 medições de folhas individuais, sadias e doentes (em seus respectivos níveis de severidade). Figura 15 - Demonstração do planejamento da missão de ferrugem em Itatinga-SP. Fonte: COLTURATO (2014). 53 c. Análises Estatísticas e Modelagem Para a modelagem estatística dos dados oriundos dos arquivos das imagens obtidas, utilizou-se o programa estatístico SAS – Free Statistical Statistical Software, SAS University Edition. 3.2 MÉTODOS As abordagens metodológicas apresentaram certa complexidade, sendo necessária a adoção de fluxogramas de processos que, a posteriori, serviram de guia para compreender as linhas de comandos no programa estatístico e para sumarizar a discussão dos resultados gerados. Foram três, os fluxogramas concebidos. O primeiro tratou da avaliação das imagens do VANT (Figura 17). O segundo foi dirigido às reflectâncias originadas pelo espectroradiômetro (Figura 18). O terceiro tratou das técnicas bootstrap (Figura 19). No primeiro fluxograma (Figura 17), as reflectâncias provenientes do VANT, cuja dimensão foi de 59 medidas, entre 400 – 690nm, geradas pelo equipamento, foram tratadas como variáveis resposta. A seguir, se procedeu a redução da dimensionalidade dos dados originais por meio da análise de componentes principais, dos quais foram solicitados os quatro primeiros componentes. Primeiramente foram usados dois componentes principais (CP1 e CP2) nas duas funções discriminantes de classificação – linear e quadrática, cujos resultados foram modelos com suas respectivas taxas de acertos e erros. O mesmo procedimento foi empregado, a seguir, Figura 16 - Visualização do sistema de medição da reflectância foliar em laboratório. Fonte: COLTURATO (2014). 54 porém considerando-se os quatro componentes principais (de CP1 a CP4). Da mesma forma, os resultados foram sendo colecionados. Na fase seguinte, utilizou-se o método stepwise por meio do comando proc stepdisc, o qual realizou o teste das variáveis mais importantes quanto à performance do modelo. Este procedimento (stepwise) também possibilita a redução da dimensionalidade dos dados originais, porém, por meio de exclusão de variáveis (reflectâncias) que não contribuem para a performance do modelo. A última abordagem foi a da regressão logística que, neste caso, foi implementada para duas categorias de resposta (binomial). No segundo fluxograma (Figura 18), cujos dados de origem são do espectroradiômetro, os mesmos procedimentos já mencionados anteriormente foram igualmente aplicados. A ressalva é para a maior dimensionalidade dos dados, com 768 medidas de reflectâncias distribuídas entre 450 – 720nm, e para o fato de que Figura 17 - Fluxograma de processos dirigidos aos dados obtidos por VANT. ACP Análise de Componentes Principais SW STEPWISE FLD Função Linear Discriminante FQD Função Quadrática Discriminante 2 CP 2 Componentes Principais 4 CP 4 Componentes Principais ACP 2 CP FLD FQD 4 CP FLD FQD SW FLD FQD Vars. Resp. 59 Ri's SW FLD FQD REGRESSÃO LOGÍSTICA MULTIVARIADA Vars. Resp. 2 níveis Sadia (1) /Doente (2) Covar. - 59 Ri's. Proc stepdisc Vant (IMG) Proc Logistic 55 originalmente os dados foram gerados para 4 níveis de severidade da ferrugem causada por A. psidii. Em virtude disto, os procedimentos foram aplicados duas vezes, sendo que na primeira rodada os modelos foram programados para discriminar os quatro níveis de severidade e, na segunda, os modelos discriminaram em apenas dois níveis de severidade, isto é, para plantas sadias e para doentes (os níveis de severidade foram agrupados em uma única categoria de doença). Na modelagem estatística das assinaturas digitais obtidas pelo VANT – imagens digitais das plantas com ferrugem no campo, como também com as assinaturas digitais das plantas com ferrugem do espectroradiômetro obtidas em laboratório, foram utilizadas técnicas de análise multivariada (JOHNSON; WICHERN, 2007; MORRISON, 2004) e de modelos lineares generalizados (NELDER; WEDDERBURN, 1972; DIGGLE et al., 2002). Figura 18 – Fluxograma de processos dirigidos aos dados obtidos por Espectroradiômetro. ACP 2 CP FLD FQD 4 CP FLD FQD SW FLD FQD Espectr. (Lab.) SW FLD FQD ACP Análise de Componentes Principais SW STEPWISE FLD Função Linear Discriminante FQD Função Quadrática Discriminante 2 CP 2 Componentes Principais 4 CP 4 Componentes Principais MULTIVARIADA Vars. Resp. 768 Ri's Vars. Resp. 4 níveis Sadia (1) /Doente (2,3,4) Covar. - 768 Ri's. REGRESSÃO LOGÍSTICA MULTINOMIAL Vars. Resp. 2 níveis Sadia (1) /Doente (2+3+4) Covar. - 768 Ri's. SW FLD FQD REGRESSÃO LOGÍSTICA BINOMIAL Proc Logistic Proc stepdisc Proc Logistic 56 Para as assinaturas digitais das plantas com ferrugem do espectroradiômetro, obtidas em laboratório, foram consideradas duas abordagens: quatro níveis de categorias (1=sadia ou 2, 3, 4=níveis da doença) ou dois níveis (1 e 2), em que a categoria 2 corresponde às plantas doentes (2, 3 e 4) agrupadas. A metodologia estatística está dividida em dois tópicos: modelagem e validação utilizando todo o conjunto de dados e modelagem com 50% do conjunto de dados e validação com os 50% restantes, utilizando a técnica de bootstrap (EFRON, 1979). 3.2.1 Modelagem e validação utilizando todo o conjunto de dados Na redução da dimensionalidade e validação dos dados, duas abordagens foram adotadas: A. TÉCNICAS MULTIVARIADAS A.1. Utilizando-se a metodologia de análise de componentes principais (ACP), considerando as combinações de dois e quatro primeiros componentes com o uso de funções lineares e não lineares discriminantes. Assim, podemos obter quatro combinações:  Componentes principais com dois ou quatro componentes combinados com funções lineares discriminantes considerando variâncias comuns (“pool”) com matriz de covariância comum nas distribuições normais multivariadas;  Componentes principais com dois ou quatro componentes combinados com função quadrática discriminante considerando variâncias distintas nas distribuições normais multivariadas. A ACP constrói combinações lineares das variáveis aleatórias (reflectâncias para um dado comprimento de ondas) com propriedades ótimas em termos de variância. Em essência, busca-se uma transformação de variáveis (coordenadas) que maximize a variância de modo que estas não sejam correlacionadas entre si. A ACP, também chamada de PCA (Principal Components Analyzis), é uma técnica que foi introduzida por Karl Person em 1901, tendo sida 57 fundamentada por Harold Hotelling em artigo publicado em 1933, cujo objetivo principal era o de “explicar a estrutura de variância e covariância de um vetor aleatório, composto de p-variáveis aleatórias, através da construção de combinações lineares das variáveis originais”. As combinações lineares resultado da técnica são denominadas componentes principais, não sendo correlacionadas entre si (MINGOTI, 2005). Uma outra ferramenta útil na abordagem multivariada é fornecida pelos métodos de identificação das variáveis mais importantes para a construção da função discriminante, cuja qualidade não só depende da identificação correta da distribuição de probabilidades do vetor resposta em cada população de interesse, mas especialmente nas variáveis escolhidas para a sua elaboração. Neste procedimento, uma comparação é realizada através de análise de variância entre os vários grupos que estão sendo considerados e, as variáveis cujos valores F forem mais significativos se tornam mais importantes para a discriminação dos grupos. Há, no entanto, o inconveniente de que o método analisa cada variável de forma individualmente, não levando em consideração a correlação das variáveis entre si (MINGOTI, 2005). A técnica da função discriminante linear, que tem como base a classificação de k grupos através de funções lineares no espaço multidimensional utilizando-se de métricas como distância euclidianas e distância de Mahalanobis – que leva em consideração a matriz de variância e covariância das observações. Após a aplicação desta técnica podemos obter a validação cruzada – probabilidade de má classificação, que nos informa sobre o percentual de acerto e de erro do modelo obtido via componentes principais. A.2. Metodologia stepwise Este procedimento proc stepdisc do programa SAS – Free Statistical Statistical Software, SAS University Edition realiza análise discriminante linear para selecionar um grupo de variáveis quantitativas que será utilizada nas funções lineares discriminantes. Por hipótese, as variáveis são consideradas com distribuições normais multidimensionais e com matriz variância comum (“pool”). Do mesmo modo, foram aplicadas, após o procedimento stepdisc, as funções lineares e quadráticas discriminantes considerando as duas estruturas de covariância – comum (“pool”) ou distintas. 58 O procedimento stepdisc possui as seguintes características: o método permite as opções de seleção forward (as variáveis são incluídas aos poucos no modelo e retiradas e incluídas segundo um critério definido) e backward (todas variáveis são incluídas no modelo e retiradas e incluídas segundo um critério definido) (MINGOTI, 2005). Os critérios de inclusão ou permanência das variáveis podem ser: o nível de significância do teste F da análise de covariância em que, as variáveis já selecionadas funcionam como covariáveis e a variável em análise é a variável dependente; ou o coeficiente de correlação parcial quando do ajuste do modelo considerando as variáveis já selecionadas anteriormente (SAS – Free Statistical Statistical Software, SAS University Edition). B. Modelos lineares generalizados Nesta abordagem, as variáveis resposta – comprimentos de onda (nm) utilizadas na abordagem anterior, foram consideradas como covariáveis num modelo linear generalizado, cujas variáveis resposta são binomiais (1=sadia ou 2=doente) ou multinomiais (1=sadia ou 2, 3, 4=níveis da doença). Assim, foram ajustados modelos lineares generalizados com distribuição binomial ou multinomial com função de ligação logito ou glogito, respectivamente. Foi utilizado o procedimento proc logistic do programa SAS – Free Statistical Statistical Software, SAS University Edition. Para os modelos em que foram usadas distribuições binomiais e ligação logito, foram construídas as curvas ROC (EGAN, 1975) com o objetivo de validação do modelo ajustado. A curva ROC (Receiver Operating Characteristic) é um método gráfico para avaliação e seleção de sistemas de diagnósticos, como também de predição, proposto nos anos setenta na análise de sinais elétricos com ruídos. Na prática, é constituído um gráfico cujo eixo das abscissas com a taxa de falsos positivos e no eixo das ordenas com a taxa de verdadeiros positivos. Após o ajuste do modelo, quanto mais distante a curva estiver da diagonal principal, melhor o desempenho do método de classificação – que pode ser expresso obtendo-se a área abaixo da curva. 59 3.2.2 Técnica Bootstrap Nesta etapa, foi utilizada somente a técnica multivariada de redução da dimensionalidade e validação dos dados, componentes principais, considerando as combinações de dois e quatro primeiros componentes com o uso de funções lineares e não lineares discriminantes. O método de bootstrap (EFRON, 1979) aplicado neste contexto, consiste em amostrar 50% das observações em cada grupo (1=sadia ou 2=doente) ou (1=sadia ou 2, 3, 4=níveis da doença) procedendo a metodologia descrita no item 3.2.1 - A.1. A Figura 19 traz o fluxograma desta fase. Este processo foi repetido extensivamente, resultando em 1.000 simulações para cada grupo. Para cada simulação foi feita a validação dos métodos. Deste modo, foram obtidas as distribuições empíricas ou histogramas das taxas de acerto dos modelos ajustados, fornecendo assim, informações o seu grau de incerteza. Figura 19 - Fluxograma das abordagens de processos dirigidos aos dados de VANT e Espectroradiômetro. Vant (IMG) 100% Análises Multivar. Reg.Log. % Resultados 2ª Abordagem BOOTSTRAP 1ª Abordagem Multivariada e Regressão Logistica Dim. 59 Ri's Níveis 2 Espectr. (Lab.) 100% % Resultados Dim. 768 Ri's Níveis 4 e 2 Vant (IMG) Análises Multivar. % Resultados 50% 50% Dim. 59 Ri's Níveis 2 Espectr. (Lab.) Análises Multivar. % Resultados Dim. 768 Ri's Níveis 4 e 2 50% 50% Análises Multivar. Reg.Log. Dados usados na modelagem e validação (100%). Dados usados na modelagem (50%) e validação (50%). 1.000 repetições 1.000 repetições 60 O procedimento utilizado foi proc surveyselect do programa estatístico SAS – Free Statistical Statistical Software, SAS University Edition. 3.2.3 Nomenclatura dos modelos obtidos Como os resultados da metodologia são combinações de (a) duas origens de dados, (b) das técnicas de redução da dimensionalidade, (c) da função discriminante de classificação, (d) do número de categorias respostas, foi adotada uma codificação visando facilitar a comparação dos diversos modelos na discussão dos resultados. A estrutura da nomenclatura está explicada na Figura 20. Figura 20 - Estrutura de nomenclatura dos modelos obtidos pela combinação de a) Origem dos dados; b) Técnicas de redução da dimensionalidade dos dados de origem; c) Técnicas de classificação dos agrupamentos; d) Número de categorias resposta. Vant_2CP-FLD Espc_SWS-FQD-4N a. Origem dos dados b. Técnica de redução da dimensionalidade c. Técnica de classificação d. Número de categorias resposta SIGLAS UTILIZADAS NA CODIFICAÇÃO DOS MODELOS Vant – Imagens do VANT Espc – Espetroradiômetro a. Origem dos dados: CP – Componentes Principais (2 ou 4) SWS – Stepwise, proc Stepdisc SWL – Stepwise, proc Logistic b. Tecnicas de redução da dimensionalidade: c. Tecnicas de classificação: FLD – Função Linear Discriminante FQD – Função Quadrática Discriminante d. Número de Categorias Resposta: 2N – Dois níveis (1 – sadia; 2+3+4 – doente) 4N – Quatro níveis (1 - sadia; 2, 3, 4 – doente) (se ausente, originalmente são 2 categorias) 61 4 RESULTADOS E DISCUSSÃO Os resultados serão discutidos na mesma sequência na qual se organizou a metodologia. A dimensão dos dados oriundos da imagem do VANT, de 59 reflectâncias (variando de 400nm a 690nm), conjuntamente com as 30 repetições para cada nível (1 e 2) foram expressas nos gráficos (boxplot) de distribuição das reflectâncias normalizadas em função do comprimento de onda (nm) para plantas sadias (Figura 21.a) e doentes (Figura 21.b). Devido à elevada dimensionalidade e complexidade dos dados espectrais originários do espectroradiômetro (768 reflectâncias por 30 repetições, divididas em 4 níveis de severidade), o gráfico boxplot não pôde ser elaborado. Os gráficos de médias de reflectância para cada nível de severidade (folhas sadias - Figura 22.a, folhas doentes com nível de severidade 1 - Figura 22.b, nível 2 - Figura 22.c, e nível 3 - Figura 22.d). Na Figura 23 estão apresentados o gráfico das médias e dos percentis para o comportamento das assinaturas espectrais das folhas ao longo do espectro. Foi realizado um quadro resumindo as principais características dos dados espectrais (Tabela 4), onde se pode observar diferenças que os sensores operam na mesma faixa espectral, mas com sensibilidades muito distintas. Tabela 4 - Características dos dados espectrais, VANT e Espectroradiômetro. VANT-imagem Espectroradiômetro nº de variáveis (nº de leituras) 59 768 Faixa espectral (nm) 400 - 690 450,21 - 720,27  (nm) 690 − 400 = 𝟐𝟗𝟎 720,27 − 450,21 = 𝟐𝟕𝟎, 𝟎𝟔 Categorias 2 níveis 1 (sadia) 2 (doente) 4 níveis 1 (sadia) 2, 3, 4 (doentes) 2 níveis 1 (sadia), 2(2+3+4) (doentes) Sensibilidade (nm) 290 59⁄ = 4,92 270,06 768⁄ = 0,35 62 Figura 21 – Gráficos boxplot da reflectância em função dos comprimentos de onda (nm) para os dados da imagem de VANT e 2 categorias (a. Folhas Sadias, b. Folhas Doentes) considerando a ocorrência da doença causada por A. psidii em Eucalyptus spp. a b 63 F ig u ra 2 2 - G rá fi c o s d a s r e fl e c tâ n c ia s m é d ia s e m f u n ç ã o d o s c o m p ri m e n to s d e o n d a ( n m ) c o m o s p e rc e n ti s 2 ,5 % e 9 7 ,5 % , p a ra o s d a d o s d o e s p e c tr o ra d iô m e tr o , s e p a ra d o p o r n ív e is d e s e v e ri d a d e d a d o e n ç a c a u s a d a p o r A . p s id ii e m E u c a ly p tu s s p p . (F o lh a s S a d ia s , n ív e l 1 : a .; F o lh a s D o e n te s , n ív e l d e s e v e ri d a d e 2 , 3 , 4 : b ., c ., d ., r e s p e c ti v a m e n te ). 64 F ig u ra 2 3 - G rá fic o s d a re fle c tâ n c ia m é d ia e m fu n ç ã o d o s c o m p rim e n to s d e o n d a (n m ) p a ra o s d a d o s d o e s p e c tro ra d iô m e tro , n o s 4 n ív e is d e s e v e rid a d e (1 = S a d io ; 2 , 3 , 4 = N ív e is d e s e v e rid a d e d a d o e n ç a c a u s a d a p o r A . p s id ii e m E u c a ly p tu s s p p .). 65 4.1 TÉCNICAS MULTIVARIADAS (VANT) A redução da dimensionalidade por meio da metodologia dos componentes principais, em dados provenientes do VANT, resultou na Tabela 5 com os quatro componentes principais (CP). O CP-1 acumulou 86,93% da variabilidade e, a partir do CP-2, houve acúmulo de 13,07% do restante da variabilidade, completando 100% da variabilidade dos dados. A classificação realizada a seguir foi a partir da função linear discriminante (FLD), considerando-se primeiramente 2 CPs. Os resultados, expressos na Tabela 6, revelaram que o modelo Vant_2CP-FLD (Tabela 6) teve um maior percentual de acertos na classificação das plantas doentes (83,33%), onde o modelo classificou corretamente 25 plantas doentes das 30 previamente identificadas como plantas doentes. Os outros 5 dados foram classificados incorretamente como sendo plantas sadias (falso-positivos), já que a planta estava doente-negativo e foi classificada como sadia. A taxa de acerto das sadias foi de 66,67%, ou seja, dos 30 dados reais de plantas sadias, 20 foram identificados corretamente pelo modelo (e 10 foram falsos- negativos, onde a planta estava doente e foi identificada como sadia pelo modelo). A taxa global de acertos foi calculada atribuindo-se pesos à cada classe, que multiplicada pela taxa de erro e somada, resultou em 25% de erros ou 75% de acertos (Tabela 6). Após realizada a classificação via FLD com 2 CPs, foi repetido o mesmo procedimento, porém com 4 CPs. Embora não se tenha observado acúmulo de variabilidade nos CP-3 e CP-4, os resultados (Tabela 7, Vant_4CP-FLD) Tabela 5 – Proporção da variância explicada segundo componentes e proporção acumulada dados obtidos por meio de VANT para ferrugem A. psidii em Eucalyptus spp. . Componente Proporção Acumulado 1 0,8693 0,8693 2 0,1307 1,0000 3 0,0000 1,0000 4 0,0000 1,0000 66 demonstraram mudanças na classificação. A taxa de acertos para plantas sadias aumentou para 70% (1 acerto a mais que no modelo anterior) e as taxas de acerto p