BEATRIZ CIRINO LUCCHETTA ESTIMAÇÃO DA CONCENTRAÇÃO DE CLOROFILA-A EM UM SISTEMA DE AQUACULTURA A PARTIR DE IMAGENS MULTIESPECTRAIS OBTIDAS VIA ARP DISSERTAÇÃO PRESIDENTE PRUDENTE - SP 2024 BEATRIZ CIRINO LUCCHETTA ESTIMAÇÃO DA CONCENTRAÇÃO DE CLOROFILA-A EM UM SISTEMA DE AQUICULTURA A PARTIR DE IMAGENS MULTIESPECTRAIS OBTIDAS VIA ARP Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Ciências Cartográficas - PPGCC, da Universidade Estadual Paulista - Unesp, Faculdade de Ciências e Tecnologia - FCT, campus de Presidente Prudente, como parte dos requisitos para obtenção do título de Mestre em Ciências Cartográficas. Orientador(a): Profª. Drª. Fernanda Sayuri Yoshino Watanabe Co-orientador(a): Drª Nariane Marselhe Ribeiro Bernardo do Carmo PRESIDENTE PRUDENTE - SP 2024 C578e Cirino Lucchetta, Beatriz Estimação da concentração de clorofila-a em um Sistema de Aquacultura a partir de Imagens Multiespectrais obtidas via ARP / Beatriz Cirino Lucchetta. -- Presidente Prudente, 2024 115 p. Dissertação (mestrado) - Universidade Estadual Paulista (UNESP), Faculdade de Ciências e Tecnologia, Presidente Prudente Orientadora: Fernanda Sayuri Yoshino Watanabe Coorientadora: Nariane Marselhe Ribeiro Bernardo do Carmo 1. Sens. Remoto da Cor da Água. 2. Alta Resolução Espacial. 3. Modelagem Bio-Óptica. 4. Dados Radiométricos. 5. Monitoramento da Qualidade da Água. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Dados fornecidos pelo autor(a). DESCRIÇÃO DO IMPACTO ESPERADO NA SOCIEDADE O presente estudo busca avançar na ciência e tecnologia do monitoramento da qualidade da água por meio do sensoriamento remoto (SR) com Aeronaves Remotamente Pilotadas (ARPs). O trabalho apresenta potencial inovador ao superar desafios ópticos e fotogramétricos, utilizando novos sensores (câmera Agrowing) para estimar concentrações de clorofila-a (chl-a), facilitando a tomada de decisões na gestão da piscicultura. A chl-a é um indicador essencial da qualidade da água, impactando diretamente a produtividade e sustentabilidade da atividade. A pesquisa está alinhada aos Objetivos de Desenvolvimento Sustentável (ODS). Em relação ao ODS 6 (água potável e saneamento), contribui para a gestão eficiente dos recursos hídricos. No ODS 9 (indústria, inovação e infraestrutura), fomenta soluções tecnológicas para o monitoramento ambiental. Para mais, o ODS 14 (vida na água), promove a conservação e uso sustentável dos ecossistemas aquáticos. O estudo tem forte inserção regional ao investigar corpos d'água no Centro Nacional de Pesquisa e Conservação de Peixes Continentais (CEPTA), referência na pesquisa e conservação da ictiofauna no Brasil, localizado em Pirassununga/SP. Sua posição estratégica permite o monitoramento de ecossistemas locais e a geração de dados relevantes para a biodiversidade. O monitoramento contínuo de corpos d’água de pequenas dimensões, por meio do SR, pode servir de subsídio para que autoridades ambientais tomem decisões baseadas em dados preditivos para implementar políticas mais eficazes de conservação. A modelagem bio-óptica avançada (com o uso de algoritmos de aprendizado de máquina), otimizada pelo SR e tecnologias de automação, reduz custos operacionais e promove um controle ambiental mais acessível e eficiente. Por fim, o estudo reforça a interdisciplinaridade entre ciência ambiental e inteligência artificial, consolidando-se como uma abordagem promissora para a gestão sustentável dos recursos hídricos e a conservação da biodiversidade aquática. UNIVERSIDADE ESTADUAL PAULISTA Estimação da concentração de clorofila-a em um sistema de aquicultura a partir de imagens multiespectrais obtidas via ARP TÍTULO DA DISSERTAÇÃO: CERTIFICADO DE APROVAÇÃO AUTORA: BEATRIZ CIRINO LUCCHETTA ORIENTADORA: FERNANDA SAYURI YOSHINO WATANABE COORIENTADORA: NARIANE MARSELHE RIBEIRO BERNARDO DO CARMO Aprovada como parte das exigências para obtenção do Título de Mestra em Ciências Cartográficas, área: Aquisição, Análise e Representação de Informações Espaciais pela Comissão Examinadora: Profa. Dra. FERNANDA SAYURI YOSHINO WATANABE (Participaçao Virtual) Departamento de Cartografia / Universidade Estadual Paulista “Júlio de Mesquita Filho” - Faculdade de Ciências e Tecnologia Prof. Dr. NILTON NOBUHIRO IMAI (Participaçao Virtual) Departamento de Cartografia / Universidade Estadual Paulista “Júlio de Mesquita Filho” - Faculdade de Ciências e Tecnologia Prof. Dr. CLÁUDIO CLEMENTE FARIA BARBOSA (Participaçao Virtual) Divisão de Processamento de Imagens / Instituto Nacional de Pesquisas Espaciais - INPE Presidente Prudente, 21 de novembro de 2024 Faculdade de Ciências e Tecnologia - Câmpus de Presidente Prudente - Rua Roberto Simonsen, 305, 19060900 http://www.fct.unesp.br/pos-graduacao/--ciencias-cartograficas/CNPJ: 48.031.918/0009-81. Dedico aos meus pais, Silvia e Renato, ao meu irmão, Leonardo, e aos meus amigos, por todo apoio, confiança e paciência. Sem vocês nada seria possível. AGRADECIMENTOS A todos que contribuíram para a realização desse projeto, mesmo que direta ou indiretamente, deixo aqui o meu singelo agradecimento: Primeiramente, agradeço à Deus por permitir que eu viva um sonho, por ajudar a enfrentar todos os desafios, porque sei que Ele está sempre comigo. Aos meus pais, Silvia e Renato, ao meu irmão, Leonardo, e aos meus amigos, Fernanda, Ricardo, Gustavo Roncolato, Emanuele, Beatriz, Mariana, Breno, Gustavo Martines e Tatiana, pela paciência, apoio, confiança e incentivo. Por me lembrarem todos os dias que eu sou capaz de conquistar o que almejo. Sempre saberei que posso contar com vocês. À minha orientadora, Profª Fernanda Sayuri Yoshino Watanabe, muito obrigada por confiar em mim todos esses anos, por todos os ensinamentos e por todas oportunidades alcançadas. Obrigada por ser meu exemplo, alguém que eu me espelho. Aos meus colegas, Gustavo, Rafael, Renata e Otávio, pelo auxílio nas campanhas em campo, por enfrentarem os “perrengues” comigo, além de tudo, eu me diverti muito com vocês. Aos membros da Inspectral, sobretudo, à Nariane e ao Alisson, pela confiança e suporte no desenvolvimento das partes teóricas e práticas desse projeto. Espero de alguma forma ter contribuído com vocês, de tal modo grandioso que me permitiram realizar esse trabalho. Aos servidores do CEPTA/ICMBio, que nos receberam muito bem e não mediram esforços para o bom andamento dos trabalhos em campo. Fernando, Izabel, Davi, Carla, Luciana e os barqueiros, obrigada! Ao PPGCC e a FCT/Unesp, aos professores do programa de pós graduação, em especial, aos professores Nilton Nobuhiro Imai, Maria de Lourdes Bueno Trindade Galo e Antonio Maria Garcia Tommaselli, pelo conhecimento compartilhado e suporte no desenvolvimento desse trabalho. Aos funcionários do departamento de Cartografia, a Cinthia e a Aline da seção de pós-graduação, muito obrigada! À Fundação de Amparo à Pesquisa do Estado de São Paulo – FAPESP pelo Projeto Temático (Processo Nº 2021/06029-7) e pelo Projeto PIPE 2 (Processo Nº 2021/11296-4); também à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES (88887.310313/2018-00) e ao Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq (303670/2018-5), pelo financiamento e concessão de bolsas de pesquisa durante o desenvolvimento do trabalho de mestrado e auxílio financeiro para as campanhas de campo. Somewhere, something incredible is waiting to be known. (Carl Sagan) RESUMO A clorofila-a (chl-a) é um importante indicador da produção primária e, consequentemente, da qualidade da água, essencial para a existência de ecossistemas aquáticos. O monitoramento da qualidade da água pode ser realizado por meio de imagens provenientes de sensores remotos: satélites e aeronaves remotamente pilotadas (ARPs). ARPs são um método alternativo para monitorar pequenos recursos hídricos, uma vez que permitem a coleta de dados com alta resolução espacial. Entretanto, desafios como reflexão especular e homogeneidade espectral da água podem dificultar o alinhamento fotogramétrico e precisam ser contornados. A trajetória de voo deve ser planejada para minimizar reflexos indesejados da luz solar. O presente estudo foi realizado em tanques de piscicultura, duas represas para alimentação dos tanques e um trecho do rio Mojiguaçu, localizados no Centro Nacional de Pesquisa e Conservação da Biodiversidade Aquática Continental – CEPTA, em Pirassununga/SP. A análise da qualidade da água do sistema de aquacultura foi realizada por meio da tomada de imagens da área com uma câmara Agrowing acoplada à ARP DJI Matrice 300 RTK. Para compatibilizar imagens capturadas pelo sensor multiespectral e a resposta espectral da superfície da Terra, medidas com espectrorradiômetro, foram aplicados dois métodos de calibração radiométrica, baseados em linha empírica, linear e exponencial. Os métodos foram testados com diversos alvos de calibração, incluindo alvos de água, para corrigir valores negativos de reflectância. O método exponencial revelou-se mais apropriado, com uma acurácia superior em relação ao método linear. Técnicas de regressão de aprendizado de máquina: Random Forest (RF) e Multilayer Perceptron (MLP), além da Regressão Linear Multivariada (MLR), foram usadas para construir modelos bio-ópticos para a estimação e mapeamento da concentração de chl-a. Dois voos (VOO1 e VOO2) foram realizados para abranger toda a área de estudo. A MLR e o RF resultaram em métricas satisfatórias para ambos os voos, de aproximadamente 12 µg/L para o RMSE, 20% para a NRMSE, -1 para o bias e 0,7 para o R2. Por sua vez, o modelo baseado em MLP não gerou bons resultados para o VOO2. O presente estudo demonstrou um grande potencial para a utilização de dados de alta resolução espacial para a estimação do conteúdo de chl-a de corpos d’água de pequenas extensões, pouco estudados quando comparados à grandes rios e reservatórios. Palavras-chave: Sensoriamento Remoto da Cor da Água; Alta Resolução Espacial; Modelagem Bio-Óptica; Dados Radiométricos; Monitoramento da Qualidade da Água. ABSTRACT Chlorophyll-a (chl-a) is an important indicator of primary production and, consequently, of water quality, essential for the existence of aquatic ecosystems. Water quality monitoring can be carried out using images from remote sensors: satellites and remotely piloted aircraft (RPAs). RPAs are an alternative method for monitoring small water bodies, as they allow data collection with high spatial resolution. However, challenges such as specular reflection and the spectral homogeneity of water can hinder photogrammetric alignment and need to be addressed. The flight path should be planned to minimize unwanted sunlight reflections. The present study was conducted in aquaculture tanks, two reservoirs supplying the tanks, and a section of the Mojiguaçu River, located at the National Research and Conservation Center for Continental Aquatic Biodiversity – CEPTA, in Pirassununga/SP, Brazil. The water quality analysis of the aquaculture system was performed using images captured by an Agrowing camera mounted on a DJI Matrice 300 RTK RPA. To align the images captured by the multispectral sensor with the spectral response of the Earth's surface, as measured with a spectroradiometer, two radiometric calibration methods were applied: empirical line- based, both linear and exponential. These methods were tested with various calibration targets, including water targets, to correct negative reflectance values. The exponential method proved to be more suitable, with greater accuracy compared to the linear method. Machine learning regression techniques—Random Forest (RF) and Multilayer Perceptron (MLP)—as well as Multivariate Linear Regression (MLR), were used to develop bio-optical models for estimating and mapping chl-a concentration. Two flights (Flight 1 and Flight 2) were conducted to cover the entire study area. MLR and RF produced satisfactory metrics for both flights, with approximately 12 µg/L for RMSE, 20% for NRMSE, -1 for bias, and 0.7 for R². On the other hand, the MLP-based model did not yield good results for Flight 2. This study demonstrated significant potential for using high spatial resolution data to estimate chl-a content in small water bodies, which are less studied compared to large rivers and reservoirs. Keywords: Remote Sensing of Water Color; High Spatial Resolution; Bio-Optical Modeling; Radiometric Data; Water Quality Monitoring. LISTA DE FIGURAS Figura 1 — Interações da luz entre componentes aquáticos e sensores. Fonte: DORNHOFER; OPPELT (2016). .................................................................................. 20 Figura 2 — Espectros de absorção (linha sólida) e de espalhamento (linha pontilhada) da água pura. Fonte: Barbosa et al. (2019). ......................................................................... 25 Figura 3 — Reflectância da superfície da água variando com o aumento das concentrações de chl-a, sendo (a) concentrações entre 340 e 2190 µg/L e (b) concentrações entre 156 e 277 µg/L. Fonte: Rundquist et al. (1996). ............................ 27 Figura 4 — Estrutura do algoritmo RF Regression. ...................................................... 32 Figura 5 — Estrutura básica de uma rede neural MLP. ................................................ 33 Figura 6 — Fluxograma com os procedimentos metodológicos desenvolvidos nesse trabalho. .......................................................................................................................... 35 Figura 7 — Mapa da área de estudo, em que (a) corresponde a região do CEPTA/ICMBio, com destaque para os corpos d’água de interesse para o estudo; (b) a localização do CEPTA no município de Pirassununga e (c) a localização no estado de São Paulo. .............................................................................................................................. 37 Figura 8 — Fotos dos tanques de piscicultura, os quais apresentam diferentes características físicas e bio-ópticas. ................................................................................ 38 Figura 9 — Fotos dos reservatórios e rio Mojiguaçu, que apresentam diferentes aspectos da cor da água e, portanto, diferentes características físicas e bio-ópticas. .................... 39 Figura 10 — (a) Sonda multiparâmetros (Horiba U-50) com monitor, cabo de 30 m e sonda submersível; (b) monitor mostrando variáveis registradas. ................................. 41 Figura 11 — Espectrorradiômetro ASD FieldSpec® HandHeld UV/NIR utilizado para obtenção de medidas de radiométricas in situ. ............................................................... 43 Figura 12 — Câmara Sony Alpha 7RXXX (Agrowing), com seis cabeças e 14 bandas espectrais. ....................................................................................................................... 44 Figura 13 — Respostas espectrais dos filtros (luz colimada) da câmara Agrowing (Adaptado de https://Agrowing.com/products/alpha-7riv-sextuple/). ............................ 46 Figura 14 — ARP Matrice 300 RTK sobre uma lona pronta para a decolagem. .......... 47 Figura 15 — Placa cinza de campo, cuja radiância foi medida em laboratório, com o auxílio de uma lanterna de luz halógena e um espectrorradiômetro. ............................. 49 Figura 16 — Alvos de referência em quatro cores: branco (1AV e 1CO), cinza claro (2AV e 2CO), cinza escuro (3CO) e preto (3AV e 4CO), para a calibração radiométrica das imagens. ................................................................................................................... 52 Figura 17 — Alvos nos corpos d'água (tanque A62 e tanque A30) utilizados para calibração radiométrica das imagens como espectros de menor reflectância. ............... 53 Figura 18 — Respostas espectrais em Rrs, estimadas a partir dos dados de L, coletadas in situ. (a) são as curvas espectrais de todas as amostras dos tanques de psicultura, (b) curvas espectrais do rio, (c) curvas espectrais dos reservatórios. ................................... 64 Figura 19 — Ortomosaicos gerados a partir das imagens coletadas via ARP em ND. . 66 Figura 20 — Ajuste linear (VOO1) das bandas 560 nm, 650 nm, 685 nm, 710 nm e 735 nm, juntamente com a equação da reta e o coeficiente de determinação correspondente. ........................................................................................................................................ 69 Figura 21 — Bias aplicado como uma correção por banda, por meio de uma multiplicação, posteriormente a calibração radiométrica linear, do VOO1. .................. 70 Figura 22 — Ajuste exponencial (VOO1) das bandas 560 nm, 650 nm, 685 nm, 710 nm e 735 nm, juntamente com a equação da reta e o coeficiente de determinação correspondente. ............................................................................................................... 71 Figura 23 — Bias aplicado como uma correção por banda, por meio de uma multiplicação, posteriormente a calibração radiométrica exponencial, do VOO1. ........ 72 Figura 24 — Ajuste linear (VOO2) das bandas 560 nm, 650 nm, 685 nm, 710 nm e 735 nm, juntamente com a equação da reta e o coeficiente de determinação correspondente. ........................................................................................................................................ 73 Figura 25 — Bias aplicado como uma correção por banda, por meio de uma multiplicação, posteriormente a calibração radiométrica linear, do VOO2. .................. 74 Figura 26 — Ajuste exponencial (VOO2) das bandas 560 nm, 650 nm, 685 nm, 710 nm e 735 nm, juntamente com a equação da reta e o coeficiente de determinação correspondente. ............................................................................................................... 75 Figura 27 — Bias aplicado como uma correção por banda, por meio de uma multiplicação, posteriormente a calibração radiométrica exponencial, do VOO2. ........ 75 Figura 28 — Buffer box de 3x3 pixels, ao redor da coordenada de coleta de chl-a, cujo valor de concentração era conhecido. ............................................................................. 77 Figura 29 — Gráficos de dispersão dos valores de chl-a (µg/L), considerando os valores medidos em campo e os valores preditos pelos modelos MLR, RF e MLP, gerados a partir dos dados provenientes da calibração radiométrica linear. ............................................ 79 Figura 30 — Gráficos de dispersão dos valores de chl-a (µg/L), considerando os valores medidos em campo e os valores preditos pelos modelos MLR, RF e MLP, gerados a partir dos dados provenientes da calibração radiométrica exponencial. .................................. 80 Figura 31 — Os gráficos de dispersão dos modelos MLR, RF e MLP, dos voos 1 e 2, apenas para o método de calibração radiométrica exponencial. ..................................... 83 Figura 32 — Mapa da distribuição espacial de chl-a, estimada por meio do modelo bio- óptico RF, oriundo das imagens calibradas radiometricamente pelo método exponencial. ........................................................................................................................................ 85 Figura 33 — Mapa da distribuição espacial de chl-a, estimada por meio do modelo bio- óptico MLP, oriundo das imagens calibradas radiometricamente pelo método exponencial. .................................................................................................................... 86 LISTA DE TABELAS Tabela 1 - Quantidade de pontos coletados nos diferentes tipos de corpos d’água, em cada campanha de campo realizada. ....................................................................................... 40 Tabela 2 - Comprimentos de ondas centrais, região espectral e largura de banda (Full Width Half Maximun - FWHM) de cada uma das 14 bandas da câmara Agrowing. .... 45 Tabela 3 - Características da câmara Sony Alpha 7RXXX e lente multiespectral, da Agrowing. ....................................................................................................................... 45 Tabela 4 - Tabela contendo os índices espectrais de estimação de chl-a testados para a construção dos modelos bio-ópticos para a estimação das concentrações de chl-a do sistema de aquacultura, no CEPTA/ICMBio. Na tabela estão contidas a identificação do índice espectral ou algoritmo, a fórmula adaptada para as bandas da câmara Agrowing, a significância, área de aplicação e referência. ................................................................. 56 Tabela 5 - Estatísticas descritivas dos parâmetros limnológicos coletados in situ, por meio da sonda multiparâmetros (Turbidez, OD, STD, Temperatura, pH e Condutividade Elétrica), disco de Secchi (Profundidade do disco de Secchi) e destinados a análises laboratoriais (chl-a)......................................................................................................... 61 Tabela 6 - Dados utilizados para o desenvolvimento dos modelos de calibrações radiométricas linear e exponencial do VOO1................................................................. 68 Tabela 7 - Dados utilizados para o desenvolvimento dos modelos de calibrações radiométricas linear e exponencial do VOO2................................................................. 73 Tabela 8 - Resultados da performance da aplicação dos modelos linear e exponencial, depois da aplicação do bias como fator de correção, expressos em RMSE, NRMSE e bias. ........................................................................................................................................ 76 Tabela 9 - Performance dos modelos MLR, RF e MLP, para as amostras coletadas em julho de 2023, de acordo com ajuste radiométrico linear ou exponencial. .................... 78 Tabela 10 - Desempenho dos modelos MLR, RF e MPL na estimação da concentração de chl-a em diferentes datas e diferentes corpos d’água que compõem o sistema de aquacultura, considerando o voo realizado e o método de calibração radiométrico das imagens. .......................................................................................................................... 81 Tabela 1A - Tabela com os experimentos para a seleção dos atributos de entradas para a construção dos modelos bio-ópticos, em que estão dispostos, o número de amostras utilizadas, qual o modelo aplicado, o valor do k-fold e quatro métricas avaliativas. ... 108 LISTA DE ABREVIATURAS µm – Micrometro; A – Absortância; a – Coeficiente de Absorção; AdaBoost - Adaptive Boosting; ARP – Aeronaves Remotamente Pilotadas; AV – Avulso; b – Coeficiente de Espalhamento; B – Escaterância; bb – Retroespalhamento; bf – Espalhamento Frontal; C – Celsius; c – Coeficiente de Atenuação; c – Velocidade no Vácuo; CDOM – Matéria Orgânica Dissolvida Colorida; CEPTA - Centro Nacional de Pesquisa e Conservação da Biodiversidade Aquática Continental; CO – Conjunto; COAs – Componentes Opticamente Ativos CO2 – Dióxido de Carbono; E – Irradiância; E.V.A - Etil Vinil Acetato; Ed – Irradiância Descendente; ENVI - Environmental for Visualizing Images; Eu – Irradiância Ascendente; FAPESP - Fundação de Amparo à Pesquisa no Estado de São Paulo; FC – Fator de Correção; FWHM - Full Width Half Maximun; GNSS - Global Navigation Satellite System; GSD - Ground Sample Distance; H – Constante de Planck; ICMBio – Instituto Chico Mendes de Biodiversidade; J – Joules; Js – Joule segundo; Kd – Coeficiente de Atenuação Vertical; km – Quilômetros; L – Radiância; Lg – Radiância Uniforme da Placa Cinza de Calibração de Campo; LS – Radiância Incidente do Céu; Lt – Radiância Total; m – Metros; m/s – Metros por segundo; MAE – Mean Absolut Error; mg/m3 – Miligrama por metro cúbico; ml – Mililitro; MLP – Multilayer Perceptron; MLR – Regressão Linear Multivariada; mS/cm - Micro-Siemens por centímetro; Mtry – Nós da árvore; mV – Milivolt; N – Número de Amostras; NAN – Valores Nulos; ND – Números Digitais; NIR – Infravermelho Próximo; Nm – Nanômetros; NRMSE - Normalized Root Mean Square Error; Ntree – Número de árvores; º - Graus; O2 – Gás Oxigênio; OD – Oxigênio Dissolvido; PAR – Radiação Fotossinteticamente Disponível; POA – Propriedades Ópticas Aparentes; POI – Propriedades Ópticas Inerentes; PPK - Post Processed Kinematic; QGIS – Quantum GIS; R – Coeficiente de Correlação; r – Rspessura; R2 – Coeficiente de Determinação; RAE – Relative Absolut Error; RF – Random Forest; Rg – Valor do fator de correção proveniente das placas lambertianas medidas em laboratório, multiplicado pela medida de radiância da placa cinza de campo; RMSE - Root Mean Square Error; Rrs – Reflectância de Sensoriamento Remoto; RTK - Real Time Kinematic; S – South; SB – Função de Filtro Espectral; SP – São Paulo; SR – Sensoriamento Remoto; sr -1 - Inverso do esferorradiano; STD – Sedimentos Totais Dissolvidos; TSS – Sólidos Totais em Suspensão; W – West; W/m2 – Watts por metro quadrado; Weka - Waikato Enviroment for Knowledge Analysis; XGBoost - Extreme Gradient Boosting; β – Espalhamento Volumétrico; ε – Fóton; θ – Ângulo Zenital; θn – Ângulo Nadir; λ – Comprimento de Onda; ρ – Fator de proporcionalidade (0,028) relacionado a velocidade do vento e o ângulo zenital solar, no instante da leitura; υ – Frequência; ϕ – Ângulo Azimutal; Φ – Fluxo Radiante; ω - Direção; SUMÁRIO 1 INTRODUÇÃO ........................................................................................................... 18 2 OBJETIVOS ................................................................................................................ 22 2.1 Objetivos Específicos ......................................................................................... 22 3 FUNDAMENTAÇÃO TEÓRICA .............................................................................. 22 3.1 Sistema de Aquacultura ...................................................................................... 22 3.2 Sensoriamento Remoto da Cor da Água ............................................................. 23 3.2.1 Resposta espectral da água .............................................................................. 23 3.3 Modelagem Bio-Óptica ...................................................................................... 28 3.4 Modelos Regressivos .......................................................................................... 30 3.4.1 Multivariate Linear Regression (MLR) ..................................................... 30 3.4.2 Random Forest Regressivo ........................................................................ 31 3.4.3 Multilayer Perceptron (MLP) .................................................................... 32 3.5 Imagens Multiespectrais Obtidas por meio de ARPs ......................................... 33 4 MATERIAIS E MÉTODOS ........................................................................................ 34 4.1 Área de Estudo .................................................................................................... 36 4.1.1 Características dos corpos d’água .............................................................. 37 4.2 Levantamentos em Campo ................................................................................. 39 4.2.1 Coleta de água e medição de parâmetros físico-químicos ......................... 41 4.2.2 Aquisição de dados com o espectrorradiômetro ........................................ 42 4.2.3 Aquisição das Imagens .............................................................................. 44 4.3 Determinação da reflectância de sensoriamento remoto (Rrs) ........................... 47 4.3.1 Simulação de Bandas ................................................................................. 49 4.4 Processamento da Imagens ................................................................................. 50 4.4.1 Calibração Radiométrica das Imagens ....................................................... 51 4.5 Calibração do Modelo Bio-Óptico ..................................................................... 54 4.5.1 Seleção de atributos de entrada .................................................................. 55 4.5.2 Validação do modelo bio-óptico ................................................................ 59 5 RESULTADOS E DISCUSSÕES ............................................................................... 60 5.1 Estatística Descritiva dos Parâmetros Limnológicos adquiridos in situ e em Laboratório ..................................................................................................................... 60 5.2 Comportamento Espectral da Rrs ....................................................................... 63 5.3 Ortomosaico gerado a partir das imagens coletadas via ARP ............................ 66 5.4 Calibração radiométrica das imagens por linha empírica usando modelos linear e exponencial......................................................................................................................67 5.5 Estimação da concentração de chl-a por meio dos modelos MLR, RF e MLP, baseado nos diferentes métodos de calibração radiométrica .......................................... 76 5.6 Concentrações de Chl-a Estimadas Espacialmente ...................................... 84 6 CONSIDERAÇÕES FINAIS E RECOMENDAÇÕES PARA TRABALHOS FUTUROS ...................................................................................................................... 87 REFERÊNCIAS ............................................................................................................. 90 18 1 INTRODUÇÃO A biodiversidade aquática é composta por seres que vivem seu ciclo biológico parcial ou totalmente em ecossistemas aquáticos continentais, costeiros ou marinhos. Corpos d’água abundantes nutridos pela energia em forma de radiação solar, dióxido de carbono (CO2) e minerais são favoráveis ao desenvolvimento de espécies vegetais e micro-organismos, como o fitoplâncton, os quais compõem diferentes ecossistemas aquáticos (KIRK, 2011). O fitoplâncton é o produtor primário mais abundante em águas interiores e oceânicas, e a comunidade fitoplanctônica possui alta significância na produção do gás oxigênio (O2) global e ciclos biogeoquímicos do planeta (FIELD et al., 1998). Por sua vez, o enriquecimento excessivo de um corpo d’água com nutrientes, processo chamado de eutrofização, pode levar a uma produção descontrolada de organismos fitoplanctônicos, resultando em floração de algas. A alta taxa de eutrofização reduz a qualidade da água, altera propriedades físico-químicas, prejudica fauna e flora, e gera condições inadequadas para o consumo humano (SMITH et al., 1999; ANSARI et al., 2011). Dessa forma, o monitoramento regular de parâmetros, como a clorofila-a (chl- a), podem ser essenciais para gestão sustentável dos recursos hídricos e detecção precoce de problemas de degradação da água (FALKOWSKI e RAVEN, 2013). O monitoramento da abundância do fitoplâncton nos corpos d’água, os quais são opticamente complexos, é realizado a partir do pigmento fotossintético chl-a (MATTHEWS, 2017). A chl-a é uma componente opticamente ativa, cujos picos de absorção espectral estão nas regiões do azul e vermelho do espectro eletromagnético. Bricaud et al., (1995) determinaram que a chl-a apresenta absorção entre os comprimentos de onda de 430 até 676 nm (pico da absorção). Gitelson et al. (1992) ainda encontraram uma alta absorção na região do vermelho e um mínimo de absorção no infravermelho próximo (NIR). Dados de sensoriamento remoto (SR) multiespectral e hiperespectral são amplamente empregados em diversos estudos para a estimativa da concentração de chl-a em corpos d'água. A maior parte dos trabalhos se baseiam no uso de algoritmos e/ou razão de bandas espectrais, por meio de uma relação empírica entre valores de radiância ou reflectância com a concentração de chl-a (DALL’OLMO et al., 2005; GITELSON et al., 2008; LE et al., 2009; MISHRA & MISHRA, 2012). 19 Diferentes algoritmos foram desenvolvidos para estimar a concentração da chl-a, sendo a maioria baseados em duas feições espectrais específicas: a baixa absorção da luz na borda do vermelho (red egde), aproximadamente 705 nm, e o pico de absorção na região do vermelho, próximo a 675 nm (DALL’OLMO et al., 2005; GITELSON et al., 2008; LE et al., 2009; MISHRA & MISHRA, 2012). Gitelson et al. (2003) otimizaram um modelo de três bandas, utilizando os comprimentos de onda de 684 nm, 700 nm e 720 nm, para estimar a concentração de chl-a em águas turvas na costa da Rússia. Gurlin et al. (2011) utilizaram bandas centradas nos comprimentos de onda de 665 nm, 705 nm e 740 nm para estimar chl-a em águas eutrofizadas, por meio sensores MERIS e MODIS. Algoritmos que utilizam, principalmente, reflectâncias no azul e verde (440 nm – 560 nm) são empregados na estimativa do conteúdo de chl-a em águas oceânicas (GORDON e MOREL, 1983; CARDER et al., 1999; IOCCG, 2000). Comprimentos de onda do vermelho (650 nm) e NIR (a partir de 780 nm) geralmente são utilizados para a recuperação do parâmetro chl-a em água turvas, com excesso de matéria orgânica dissolvida colorida (CDOM) (GITELSON et al., 2007). CDOM é altamente absorvido nos comprimentos de onda azul (430 nm) e verde da luz e é espalhado por fluorescência (GILERSON et al., 2010; LUO et al., 2021), mascarando as feições espectrais da chl-a. Métodos utilizando multibandas espectrais, equações de regressão e equações diferenciais de primeira ordem também são comparados na estimativa da concentração de chl-a, com base em dados de SR multiespectral e hiperespectral. A análise multibanda se destaca quando comparada ao uso de apenas uma ou duas bandas espectrais, oferecendo uma maior capacidade de detecção e precisão na estimativa de parâmetros, em ambientes aquáticos complexos (ZHU et al., 2014). Apesar da dificuldade da estimação da concentração de chl-a em águas turvas (opticamente complexas), Ansper e Alikas (2018) mostraram que para concentrações de chl-a até 150 mg/m3 , algoritmos de três bandas, utilizando os comprimentos de onda do vermelho e NIR são promissores. Em contrapartida, algoritmos de quatro bandas são favoráveis na eliminação dos efeitos de sólidos totais em suspensão (TSS). Modelos semi-empíricos de duas e três bandas, usando dados de reflectância e dados de radar, foram avaliados por Zhang et al. (2018), por meio da regressão linear multivariada (MLR) e uma rede multilayer perceptron (MLP), em que o MLR se mostrou mais estável do que o MLP. Por sua vez, Pahlevan et al. (2020) são pioneiros na introdução de modelos de aprendizado de máquina e Mixture Density Network. Eles utilizaram um banco de dados com 2943 amostras de chl-a e dados radiométricos 20 coletados in situ para treinamento, os quais foram aplicados a diferentes corpos d’águas, interiores e costeiros, alcançando ótimo desempenho quando comparados a algoritmos ajustados por mínimos quadrados A aquisição de dados para o monitoramento da chl-a pode ser realizado por meio de técnicas de SR, sobretudo o imageamento por satélites de diferentes resoluções espaciais e temporais, aviões e aeronaves remotamente pilotadas (ARPs). A Figura 1 mostra a interação entre a luz solar e os componentes que qualificam a água, a interação com a atmosfera, bem como os sensores que captam a luz refletida. Figura 1 — Interações da luz entre componentes aquáticos e sensores. Fonte: DORNHOFER; OPPELT (2016). A maioria dos estudos sobre a estimação de parâmetros limnológicos por SR utiliza sensores orbitais de média ou baixa resolução espacial para aplicações em recursos hídricos de grandes extensões (WANG & CHEN, 2024; SANTOS et al., 2024; MPAKAIRI et al., 2024; SINGH et al., 2024; JANG et al., 2024; TAN et al., 2024). No entanto, esses produtos não são adequados para monitorar pequenos corpos d’água, em decorrência da resolução espacial. Recentemente, imagens multiespectrais obtidas por ARPs têm sido exploradas como uma alternativa promissora para estimativas de chl-a em pequenos corpos d'água, permitindo uma maior precisão na análise, uma vez que capturam cenas com altíssima 21 resolução espacial, chegando à escala centimétrica (OLIVETTI et al., 2020; CHENG et al., 2020; ALVAREZ et al., 2021; HASHEMI-BENI & GEBREHUWOT, 2021; ISGRÓ et al., 2022; XIAO et al., 2023; CHEN et al., 2024; SONG et al., 2024). Para mais, o uso de imagens provenientes de ARPs pode reduzir ou excluir a necessidade de laboriosas coletas de dados in situ, além de gerar uma fonte complementar de dados (ROTTA et al., 2011; NOVO et al., 1989). A alta resolução espacial centimétrica pode contribuir com valiosas informações sobre qualidade da água, sobretudo de corpos d’água interiores de pequenas dimensões pouco explorados (CILLERO CASTRO et al., 2020), como lagos, açudes, represas, pântanos, riachos, brejos e tanques escavados para a aquacultura. Contudo, a alta resolução espacial também resulta em um maior efeito especular, sendo necessárias, em alguns casos, alternativas para correção de sunglint. As plataformas de ARPs podem fornecer alta resolução espacial e temporal e, também, alta resolução espectral dependendo da câmara a ser transportada. A hipótese deste trabalho é que imagens de alta resolução obtidas de câmaras multiespectrais embarcadas em ARP sejam adequadas para a geração de modelos bio-ópticos de estimação do conteúdo de chl-a, em corpos d’água de pequenas dimensões. Neste estudo, foi utilizada a câmara multiespectral Sony Alpha 7RXXX Sextuple, da Agrowing, que possui seis cabeças (lentes ópticas) e registra 14 bandas espectrais. Ela foi acoplada à ARP Matrice 300 RTK (DJI Innovations) para capturar imagens, que foram usadas para desenvolver modelos bio-ópticos, por meio de algoritmos regressivos estatísticos e de aprendizado de máquina, para a recuperação da concentração de chl-a em pequenos corpos d’água. Com o objetivo é desenvolver uma metodologia para monitorar corpos d’água de pequeno porte, o estudo foi conduzido em um sistema de aquacultura localizado no Centro Nacional de Pesquisa e Conservação da Biodiversidade Aquática Continental – CEPTA. Embora o CEPTA apresente um ambiente controlado para pesquisas, avaliar a qualidade da água pode servir de base para outros locais onde a aquacultura é praticada. Esta dissertação estava inserida no contexto do projeto PIPE fase 2, Processo Nº 2021/03110-8, financiado pela Fundação de Amparo à Pesquisa no Estado de São Paulo - FAPESP, em desenvolvimento pela empresa Inspectral, que tinha o objetivo gerar um método de monitoramento contínuo, integrado e automatizado de macrófitas, além de outros parâmetros limnológicos, independente de análises de campo, coletas e análises laboratoriais. 22 2 OBJETIVOS O objetivo principal deste estudo foi desenvolver modelos de estimação de concentração de chl-a, a partir de imagens multiespectrais de alta resolução espacial para águas interiores que compõem um sistema de tanques de criação de peixes. 2.1 Objetivos Específicos Os objetivos específicos deste projeto consistem em: a. Definir um fluxo de processamento para a tomada e manipulação das imagens multiespectrais de alta resolução espacial da câmara Agrowing para aplicação em corpos d’água; b. Avaliar a contribuição de atributos espectrais (bandas e índices espectrais) no desempenho de modelos predição de chl-a; c. Comparar o desempenho da técnica mínimos quadrados com abordagens baseadas em aprendizado de máquina para o ajuste dos modelos de predição; d. Analisar a distribuição espacial do conteúdo de chl-a ao longo de um sistema represas-tanques-rio; e. Avaliar a qualidade da água em um sistema de aquacultura por meio da concentração de chl-a, estimada a partir de imageamento remoto. 3 FUNDAMENTAÇÃO TEÓRICA 3.1 Sistema de Aquacultura O cultivo de organismos, cujo ciclo de vida acontece parcial ou totalmente no meio aquático, é chamado de aquacultura (ou piscicultura, quando o cultivo é exclusivamente de peixes). A aquacultura pode ser desenvolvida dentro do leito de rios ou por meio da construção de tanques escavados. Para a instalação de um sistema de aquacultura com tanques escavados, alguns critérios são levados em consideração, como: • demanda e qualidade da água, fontes próximas, potáveis e em quantidade adequada para abastecer os viveiros (ONO et al., 2002); 23 • topografia deve ser plana, com suaves declives, não superiores a dois metros; tipo de solo, preferencialmente, argiloso e de baixa permeabilidade (RIBEIRO, 2001); • clima da região deve ser compatível com exigências vitais das espécies a serem produzidas (KUBITZA, 1999); e • a luz, diante de todos os elementos para o desenvolvimento da aquacultura, é um fator primordial, que afeta o crescimento, reprodução e outros comportamentos dos organismos aquáticos (BOYD, 1990). A existência de uma infraestrutura de rede de energia elétrica e vias de fácil acesso (de pelo menos 4,5 m de largura) também são características essenciais para viabilizar a instalação de viveiros escavados. Os taludes devem possuir fácil acesso para o manejo, alimentação, limpeza e despesca da aquacultura. Os tanques de aquacultura são, geralmente, retangulares, com profundidades variantes de 1,20 m a 1,50 m, devido a declividade de fundo para o auto esvaziamento, do sentido da entrada à saída de água (REZENDE e BERGAMIN, 2013). O sistema de abastecimento de água de tanques de aquacultura ocorre por meio de tubulações de PVC, adequadas ao volume de água que deve passar pela estrutura (CASSOL e DEBASTIANI, 2020). O sistema de drenagem dos viveiros é indispensável, pois a retenção de água ou água parada favorece o acúmulo de poluição e o desenvolvimento de doenças. A retirada da água pela superfície pode ser realizada quando há excesso de macrófitas emersas, mesmo sendo um trabalho laborioso (SILVA et al., 2020). O sistema de drenagem também pode ser chamado de sistema de recirculação, em que a troca de água favorece a remoção de excrementos dos animais, resíduos de ração e a manutenção da qualidade da água. A falta da recirculação de água em viveiros afeta diretamente a alimentação e crescimento dos peixes, além de contribuir para o desenvolvimento de deformidades, úlceras e lesões nos organismos, quando a taxa de acumulação de nitratos, nitritos, sólidos em suspensão e matéria orgânica é alta (CASSOL e DEBASTIANI, 2020). 3.2 Sensoriamento Remoto da Cor da Água 3.2.1 Resposta espectral da água 24 A obtenção de informações sobre as propriedades abaixo da superfície da água por meio do SR é possível devido a luz retroespalhada por moléculas de água e outras partículas que compõem as águas naturais, como a chl-a presente no fitoplâncton, CDOM composto de substâncias húmicas que influenciam na coloração da água, e TSS que são sedimentos minerais, argila e silte, por exemplo (KUSTER, 2009) 3.2.1.1 Água Pura A água pura não contém concentrações de matéria orgânica ou inorgânica e apresenta um comportamento espectral particular. A luz incidente e descendente na coluna d’água é alterada na sua intensidade e composição espectral por meio da absorção ou do espelhamento seletivos. Nos comprimentos de onda do azul e do verde, a água pura possui baixa absorção, se tornando significativa a partir de 550 nm. Em contrapartida, nos comprimentos do vermelho e NIR a absorção da luz pela água pura é alta. Acima de 750 nm, a radiação incidente é absorvida no primeiro centímetro de profundidade da coluna d’água, se convertendo em calor (BARBOSA et al., 2019). O espalhamento na região do violeta e azul e a alta absorção nos comprimentos de onda do verde até o vermelho, caracteriza o tom azulado da água pura, visto nos oceanos, onde os corpos d’água são definidos como profundos e não túrbidos. A Figura 2 mostra o comportamento espectral da absorção e do espalhamento da água pura em um intervalo de comprimentos de onda entre 200 e 800 nm, determinadas em laboratório por Smith e Baker (1981). 25 Figura 2 — Espectros de absorção (linha sólida) e de espalhamento (linha pontilhada) da água pura. Fonte: Barbosa et al. (2019). 3.2.1.2 Componentes Opticamente Ativos (COAs) Os sistemas aquáticos possuem inúmeros componentes dissolvidos ou em suspensão, de diferentes tamanhos e composições químicas. As substâncias, as quais estão presentes na água e são capazes de interagir com a radiação eletromagnética, por meio dos processos de absorção e espalhamento, são chamadas de componentes opticamente ativos (COAs). Em outras palavras, os COAs têm propriedades ópticas que lhes são inerentes (POIs) (BARBOSA et al., 2019). As propriedades ópticas da água são divididas em duas classes: POIs e Propriedades Ópticas Aparentes (POAs). Segundo Preisendorfer (1961), em um determinado comprimento de onda, é possível especificar coeficientes de espalhamento e absorção, e a função de espalhamento volumétrico, referidos como POIs. A magnitude destes coeficientes provém de substâncias que compõem o meio aquático, independentes da geometria do campo de luz que pode penetrá-lo. Em contrapartida, o conceito de POAs incorpora variáveis radiométricas para a descrição do campo de luz em um meio aquático. As propriedades dependem tanto do meio, quanto da geometria direcional do campo de luz, que devem apresentar determinadas regularidade e estabilidade para descreverem um corpo d’água. As POAs comumente utilizadas são o cosseno médio (µ) e os diversos coeficientes de atenuação difusos (MOBLEY, 1994). 26 Os coeficientes difusos, coeficientes de absorção e espalhamento para fluxos descendentes ou ascendentes são função da distribuição da radiância local e, por consequência, da profundidade. Preisendorfer (1961) classificou os coeficientes de absorção e espalhamento difusos como propriedades ópticas híbridas, por serem derivadas de POIs e propriedades do campo de luz. Kirk (2011) prefere definir como propriedades ópticas quase-inerentes, visto que ambas diferem apenas nas características do fluxo radiante que se imagina incidir sobre a fina camada do meio. Uma vez que as propriedades ópticas inerentes (POIs) dos COAs foram conhecidas, se torna possível a estimação da concentração dos componentes na coluna d’água. A chl-a, CDOM e TSS são COAs que coexistem em diferentes proporções, interagindo simultaneamente com a radiação solar, interferindo nos processos de absorção e espalhamento, concomitantemente. Assim, as interações entre COAs, suas concentrações e a luz que penetra na superfície da água determinam o comportamento espectral dos corpos hídricos (BARBOSA et al., 2019). A chl-a é o pigmento fotossintetizante mais importante presente em todas as espécies de fitoplâncton, usado como indicador da qualidade da água, diretamente relacionado ao estado trófico de um ambiente aquático (BARBOSA et al., 2019). O fitoplâncton pode ser encontrado mesmo em ambientes oligotróficos, ou seja, de baixa carga de nutrientes, e pode ser detectado por meio da análise da assinatura espectral da chl-a (MOREL e BRICAUD, 1986). A Figura 3 mostra como o comportamento espectral da água se altera com o aumento da concentração de chl-a. Na feição (A), conforme o aumento da concentração de chl-a, na região do azul, entre 400 nm e 500 nm, maior é absorção da luz. A alta reflectância no comprimento de onda em torno de 560 nm (B) é decorrente da menor absorção da luz verde pelo fitoplâncton. Em contrapartida, o valor mínimo em 675 nm (D) é devido a alta absorção da luz vermelha pela chl-a (GITELSON, 1992; RUNDQUIST et al.; 1996). Em torno de 700 nm (E), região do red edge ou vermelho limítrofe, a baixa absorção está relacionada ao espalhamento do fitoplâncton (GITELSON et al., 1993). Segundo Gitelson (1992), o leve pico de absorção em torno de 620 nm (C) em curvas espectrais de águas naturais é consequência da presença de ficocianina, um pigmento acessório que pode ser encontrado nas cianobactérias. As inflexões em torno de 640 nm (entre C e D) estão associadas ao retroespalhamento devido a substâncias orgânicas dissolvidas e pigmentos acessórios. A absorção pela água pura aumenta na 27 região do NIR (BRABOSA et al., 2019), enquanto que com o aumento da concentração de chl-a, existe um maior espalhamento luz, diminuindo a absorção (F). Figura 3 — Reflectância da superfície da água variando com o aumento das concentrações de chl-a, sendo (a) concentrações entre 340 e 2190 µg/L e (b) concentrações entre 156 e 277 µg/L. Fonte: Rundquist et al. (1996). O CDOM, oriundo da decomposição da fauna e flora escoada para os corpos d’água e da atividade biológica de organismos presentes na água, que forma um composto complexo de substâncias húmicas, possui um alto impacto no processo de absorção da 28 luz pela coluna d’água (KIRK, 2011). A absorção do CDOM possui um comportamento similar ao da água pura, com altos valores na região ultravioleta (UV) do espectro eletromagnético, os quais decrescem exponencialmente conforme os comprimentos de onda aumentam, atingindo valores mínimos próximos ao red edge e NIR (BARBOSA et al., 2019). De acordo com Kirk (2011), o CDOM é absorvido em 440 nm, logo o coeficiente de absorção em 440 nm, (440), é utilizado como indicador do CDOM em águas naturais. O TSS é caracterizado por uma composição de fitoplâncton e partículas não algais (NAP), as quais podem ser orgânicas ou inorgânicas, em suspensão. O NAP inorgânico é resultante do intemperismo de rochas, enquanto o NAP orgânico advém de processos antrópicos, da agricultura e indústria, e de células mortas de organismos fitoplanctônicos e de subprodutos da vegetação (BARBOSA et al., 2019). A absorção por meio do NAP é baixa, uma vez que as partículas espalham fortemente a luz, dependendo da composição, tamanho e forma das partículas. 3.3 Modelagem Bio-Óptica A modelagem bio-óptica é baseada nos componentes opticamente ativos da água e nos parâmetros usados para descrever suas características ópticas, ou seja, POIs e POAs. Gordon et al. (1975) e Dekker (1993) derivaram os primeiros modelos bio-ópticos aplicados às águas oceânicas e águas interiores, respectivamente. Os modelos bio-ópticos para a estimativa da concentração de chl-a podem ser definidos a partir das propriedades ópticas do corpo d’água, com base na interação da luz com os componentes biológicos e não biológicos presentes na água (MOREL, 1991) ou por meio da teoria da transferência radiativa (MOBLEY, 1999). A modelagem bio-óptica da chl-a pode ser realizada por meio de diferentes abordagens, sendo modelos analíticos (JORGE et al., 2021), modelos semi-analíticos (ZHANG et al., 2021), modelagem por meio de classificação (BOTHA et al., 2020) e modelos empíricos, os quais são relacionados com medidas reais coletadas in situ (SU et al., 2021; SHI et al., 2022). Tais abordagens são amplamente utilizadas no SR da qualidade da água, cada uma com suas vantagens e limitações conforme a complexidade óptica do ambiente analisado. Os modelos analíticos são baseados nos mecanismos de transmissão da radiação pela interface da água, utilizando POIs para a descrição dos processos de absorção e 29 espalhamento. Os modelos semi-analíticos, além de considerarem as POIs, também incorporam as POAs e as interações com campo de luz subaquático, permitindo uma melhor caracterização dos processos ópticos. Os modelos de classificação baseiam-se na segmentação dos corpos d’água em diferentes categorias, avaliando suas características ópticas e físico-químicas para definir padrões específicos. Em contrapartida, modelos empíricos estabelecem relações estatísticas entre dados observacionais, correlacionando medições espectrais e concentrações de parâmetros limnológicos, sem a necessidade de relacionar os processos físicos envolvidos. Vale destacar que as abordagens por meio de algoritmos de aprendizado de máquina também são empíricas, uma vez que a calibração dos hiperparâmetros dos modelos se fundamenta em dados e observações. As vantagens da utilização de modelos empíricos relacionam-se com a facilidade de aplicação e processamento, enquanto a principal desvantagem é que essa modelagem é restritiva a área de estudo (ODERMATT, 2012). Outra desvantagem apontada por Ogashawara (2015) é que modelos empíricos demandam de laboriosas campanhas de campo para coleta de dados para a calibração e validação. De acordo com Sagan et al. (2020), os modelos empíricos para estimar a qualidade da água podem ser desenvolvidos em função de razão de bandas espectrais. Um problema a ser enfrentado é o comportamento homogêneo da água. Nesses casos, a implementação dos modelos baseados em razão de bandas pode gerar erros significativos de estimativas e baixa precisão da estimação da concentração de COAs (MOREAL, 1974). Estudos recentes (SAGAN et al., 2020; TOPP et al., 2020; DENG et al., 2024) indicam que modelos bio-ópticos baseados em aprendizado de máquina são utilizados para estimar a concentração de chl-a. Zhang et al. (2024) utilizaram três algoritmos de aprendizado de máquina, Random Forest (RF), Adaptive Boosting – AdaBoost e Extreme Gradient Boosting (XGBoost), para recuperar a concentração de chl-a do Lago Hulun, no norte da China, juntamente com imagens do satélite Sentinel-2 e medidas de chl-a in situ. Diferentemente, Irie et al. (2024) utilizaram imagens obtidas por meio ARPs e dados físicos coletados in situ, para estimação da concentração de chl-a em períodos de floração de algas com modelos classificatórios e em períodos de não floração, com modelos regressivos, XGBoost, de aprendizado de máquina, em um reservatório no Japão. 30 3.4 Modelos Regressivos 3.4.1 Multivariate Linear Regression (MLR) A regressão linear multivariada (Multivariate Linear Regression - MLR) é um método de mineração de informações numéricas, de grande quantidade de dados, e predição de características de um conjunto de dados (USHARAMI e KUNGUMARAJ, 2015). Em suma, a análise da MLR é realizada para determinar se uma ou mais variáveis dependentes podem ser previstas por meio de variáveis independentes ou preditoras (Equação 1). A variável Y é dependente da soma de observações, n, da variável X independente, e β0, ..., βn são os coeficientes de regressão de cada observação. = + + + ⋯ + (1) Os modelos de MLR para estimar parâmetros de qualidade da água são baseados na relação entre medidas radiométricas obtidas in situ, como a reflectância de SR (Rrs). A MLR utiliza combinações entre bandas de sensores remotos e dados coletados in situ para realizar as estimativas (OUMA et al. 2020). No caso da Equação 1, X representa a Rrs para cada comprimento de onda, λ1, ..., λn, de interesse, sendo que Y e X são as variáveis dependente e independente do modelo, respectivamente. Segundo Ta et al. (2021), a MLR é um dos modelos estatísticos mais populares para a calibração de modelos de estimação da concentração de chl-a, por ser uma análise simples de ser executada, de rápido ajuste e útil quando as variáveis não são complexas. Para a aplicação da MLR são realizados testes de hipótese dos dados, uma ferramenta estatística que tem por objetivo avaliar a distribuição dos dados e se o modelo não contém multicolinearidade, ou seja, relação linear entre as variáveis dependentes e independentes; e heterocesdasticidade, que qualifica se resíduos de uma observação para outra possuem mesma variância (ALITA, 2021). A avaliação do desempenho da regressão é determinada com base na pequena diferença entre o valor obtido e o valor real, ou por meio do cálculo de erros, em que pequenos erros indicam bons desempenhos (LINNET, 1993). 31 3.4.2 Random Forest Regressivo Algoritmos de aprendizado de máquina são técnicas computacionais utilizadas para gerar conclusões a partir de um conjunto de dados. As técnicas de aprendizado de máquina possuem diversas aplicações em SR, sendo usadas em tarefas de classificação e predição baseadas em imagens. Entre os algoritmos de aprendizado de máquina mais usados destaca-se o RF. Proposto por Breiman (2001), é um algoritmo que possui amplas aplicações em mineração de dados, a partir de uma abordagem não paramétrica baseada em árvores de decisão, que combinam atributos de vizinhos mais próximos para inferência de dados, por meio do “agrupamento” de árvores de dados correlacionados. O RF é um algoritmo habilitado para a seleção, predição e/ou classificação de dados (ISHWARAN, 2010). As vantagens da utilização do RF são a eficiência em trabalhar com grandes bancos de dados e o fornecimento da estimativa de importância das variáveis de entrada para a seleção, predição e/ou classificação. Além disso, é um algoritmo robusto e computacionalmente leve, ou seja, não demanda de grande quantidade de memória para sua execução, além de prevenir a covariância das variáveis e evitar o overfitting dos dados para o modelo (BREIMAN, 2001). O RF possui como unidade uma árvore binária, que são aplicadas em metodologias de classificação ou regressão, que se dividem em diferentes nós homogêneos ou quase homogêneos. Destaca-se que cada árvore cultivada traz amostras iniciais dos dados originais, uma vez que faz uso do processo de randomização, ou seja, probabilidades são atribuídas a todos os pontos do espaço amostral, cujo objetivo é descorrelacionar as árvores para que haja baixa variância dentro do conjunto de dados (BREIMAN, 2001). O RF regressivo (Figura 4) é um método robusto de aprendizado de máquina que constrói múltiplas árvores de decisão com o mesmo número de amostras em cada árvore, que constituem uma floresta aleatória (KUHN e JOHNSON, 2013). O algoritmo é iniciado por meio de uma amostragem aleatória de um conjunto de dados (bagging), formando conjuntos de amostras por meio da ferramenta bootstrap. Alguns elementos não são incluídos (out-of-bag ou OOB), pois serão utilizados como amostra teste. No conjunto amostral de treinamento, um número de atributos é selecionado aleatoriamente como nós de ramificação da árvore de classificação (Mtry), para ser construída uma árvore de regressão. O coeficiente de Gini, uma estatística que mede a desigualdade, é 32 usado para estimar a impureza das variáveis, e as árvores de regressão são geradas para cada amostra de treinamento sem a remoção prévia de ramos irrelevantes ou excessivos, resultando na formação do modelo de regressão. Posteriormente, o valor de OOB é obtido, e a predição para cada pixel é feita a partir da média das previsões de cada árvores (Ntree) do modelo. Figura 4 — Estrutura do algoritmo RF Regression. 3.4.3 Multilayer Perceptron (MLP) O MLP, proposto por Rumelhart et al. (1986), é um modelo de rede neural artificial não linear, o qual pertence a categoria de técnicas de inteligência artificial. Como mostrado na Figura 5, a estrutura básica do MLP possui três camadas principais, sendo a primeira de entrada, onde são introduzidas as variáveis independentes; uma ou mais camadas ocultas; e a camada de saída que contém a variável dependente a ser estimada. Além disso, os parâmetros do modelo são pesos e vieses. O número de nós da camada oculta depende da complexidade da função a ser aproximada (KEINER e YAN, 1998). Quanto maior o número de nós, maior é o tempo de processamento para modelar corretamente a função (DARWISH et al., 2014). O MLP possui ainda uma função de ativação (comumente sigmoide) nos nós da camada oculta e uma função identidade linear na camada de saída. A Equação 2, calculada de acordo com Ramchoun et al. (2016), mostra a saída do modelo MLP, em que Y é o vetor de saída; X é o vetor de entrada; f1 e f2 são funções de transferência da camada oculta 33 e de saída, sigmoide e linear, respectivamente; b1 e b2 são vieses da camada oculta e de saída, respectivamente; e W1 e W2 são os pesos da camada de entrada e oculta, respectivamente. Ainda, o treinamento do MLP é realizado por meio do algoritmo de retropropagação de erro (backpropagation), que ajusta os pesos da rede de forma iterativa. Esse processo envolve a propagação do erro da saída para as camadas anteriores, utilizando o gradiente da função de custo para atualizar os pesos por meio do método de descida do gradiente, reduzindo assim a diferença entre as saídas previstas e os valores reais. = ( ( + ) + ) (2) Figura 5 — Estrutura básica de uma rede neural MLP. 3.5 Imagens Multiespectrais Obtidas por meio de ARPs O monitoramento de pequenos corpos d’água pode ser realizado por meio da combinação de tecnologias emergentes, as quais incluem a utilização de câmaras multiespectrais e ARPs, que contornam limitações de imagens de satélite e pesquisas tradicionais in situ (SALANDRA et al., 2021). Elas garantem a aquisição sob demanda de dados de altíssima resolução espacial e permitem a geração de ortomosaicos para a extração, previsão ou recuperação de características físicas, hidrogeomorfológicas ou 34 limnológicas (CASADO et al., 2015). Da literatura existente (WASEHUN et al., 2024; BAI et al., 2024; YAN et al., 2023), as imagens provenientes de ARPs são vantajosas quando comparadas a imagens de satélite e dados de pesquisa de campo, pois a aquisição de dados é mais rápida, com maior resolução espacial, baixo custo e não são acometidas de interferências atmosféricas (ANSARI et al., 2021). Apesar da necessidade reduzida de correções dos efeitos atmosféricas em virtude da baixa altura de voo, alguns fatores como a geometria de iluminação (azimute e ângulo de inclinação solar) e sombreamento, relacionados com o dia e horário do voo, restrições tecnológicas e razão sinal-ruído do instrumento podem dificultar o ajuste radiométrico usando alvos de calibração e a radiometria de campo (NICOLÁS et al., 2021). Outro fator a ser considerado é a resposta espectral homogênea da água, que dificulta a detecção de pontos homólogos para a realização do alinhamento de imagens coletadas, as quais possuem altíssima resolução espacial (FRASER et al., 2024). 4 MATERIAIS E MÉTODOS Nesta seção são apresentadas a área de coleta de dados, materiais, equipamentos e aplicativos utilizados, assim como os procedimentos metodológicos de aquisição e processamento dos dados e como serão analisados os resultados. A Figura 6 mostra as etapas de execução deste estudo esquematizadas em um fluxograma. O fluxograma inicia mostrando a aquisição de dados: amostras de água, medidas limnológicos, leituras radiométricos, e imagens multiespectrais. As amostras de água foram destinadas à análise laboratorial para determinação das concentrações de chl-a. Os dados limnológicos foram estatisticamente descritos considerando todo o sistema de aquacultura e todas as campanhas de campo realizadas. Em relação à aquisição dos dados radiométricos, as medidas foram realizadas seguindo o protocolo proposto por Mueller (2003) e a Rrs foi calculada de acordo com Mobley (1999). As imagens multiespectrais foram posteriormente processadas, aplicando separação das bandas, georreferenciamento, geração de ortomosaico e calibração radiométrica. Para compatibilizar a Rrs obtida in situ com as medidas da imagem, foi aplicada uma simulação das bandas da câmara multiespectral Agrowing, com base em uma função gaussiana, a partir de um processo de convolução. Em seguida, foi realizado uma seleção de atributos (bandas espectrais e índices espectrais) para entrada na calibração dos 35 modelos bio-ópticos, utilizando os algoritmos MLR, RF e MLP. Após a calibração dos modelos, eles foram avaliados a partir do processo de validação cruzada. Os modelos com os melhores resultados foram aplicados às imagens para estimar o conteúdo de chl-a e construção de mapas da distribuição espacial horizontal da chl-a. Figura 6 — Fluxograma com os procedimentos metodológicos desenvolvidos nesse trabalho. 36 4.1 Área de Estudo O estudo foi conduzido em um centro especializado do Instituto Chico Mendes de Biodiversidade (ICMBio), o Centro Nacional de Pesquisa e Conservação da Biodiversidade Aquática Continental – CEPTA, localizado no município de Pirassununga, Estado de São Paulo, limitado pelas coordenadas 47º22’22,01” W e 47º22’43,93” W e 21º55’35,69” S e 21º55’31,33” S. Foram analisados os corpos d’água que integram um sistema de aquacultura, composto por duas represas que alimentam 128 tanques escavados para piscicultura; os tanques escavados em operação; e um trecho do rio Mojiguaçu. A Figura 7 apresenta um mapa da área de interesse, onde estão destacados em azul os corpos d’água avaliados neste estudo e em vermelho os pontos de coleta. A água represada é oriunda do Córrego da Barrinha, pequeno afluente do rio Mojiguaçu. O represamento é necessário para que a água receba oxigenação suficiente para a utilização em tanques de piscicultura. O CEPTA possui 128 tanques escavados, entre eles, 32 possuem base de concreto e dimensões de 1,20 m × 3,50 m. A maior parte dos tanques possui paredes de barro assentadas e maiores dimensões, chegando a 60 m × 130 m. Durante a coleta dos dados, cerca de 35 tanques escavados não estavam sendo utilizados e estavam tomados por grande quantidade de vegetação rasteira e arbustiva. O lançamento dos efluentes dos tanques é feito no rio Mojiguaçu. 37 Figura 7 — Mapa da área de estudo, em que (a) corresponde a região do CEPTA/ICMBio, com destaque para os corpos d’água de interesse para o estudo; (b) a localização do CEPTA no município de Pirassununga e (c) a localização no estado de São Paulo. O objetivo de se avaliar o sistema de aquacultura é verificar as alterações na qualidade da água desde a sua captação, utilização nos tanques de psicultura, que possuem diferentes dimensões, características físicas e manejo, devido às diferentes espécies de peixes, até o descarte no rio Mojiguaçu. Destaca-se que produtos químicos não são adicionados aos viveiros, logo, as modificações da qualidade da água são ocasionadas pelo despejo de ração para alimentação dos peixes, excrementos dos animais e/ou erosão das bordas dos tanques escavados. 4.1.1 Características dos corpos d’água Os corpos d’águas de interesse nesse estudo possuem diferentes características físicas e bio-ópticas, como mostrado nas Figuras 8 e 9. Os tanques I, II, III, IV e VIII (Figura 9) são exemplos de tanques com base de argila assentada e são rodeados por vegetação rasteira, enquanto os tanques V, VI e VII possuem sua base de concreto. Em alguns tanques, macrófitas emersas se acumulam por quase toda superfície da água (tanques III e IV). A espécie de macrófita mais comum encontrada nos tanques é a 38 Ludwigia Sedoides, comumente conhecida como “planta mosaico” ou “canário de água”. Tal espécie de macrófita é frequente e dominante em ambientes de água lêntica ou parada e influenciam o desenvolvimento da ictiofauna (VIANA et al., 2020). Nos pequenos tanques de concreto, notou-se a presença de musgos nas paredes. Visualmente, a cor da água na maioria dos tanques é esverdeada e pouco túrbida (tanques I, II, V e VI), em contrapartida, outros tanques possuem águas amarronzadas. Segundo servidores do CEPTA/ICMBio, tanques que apresentam um aspecto barrento (tanque VIII) abrigam espécies de peixes acometidos por um parasita que causa coceira e, por este motivo, os peixes se esfregam nas paredes dos tanques causando um leve assoreamento. Alguns tanques possuíam uma cobertura de scum sobre a água. Para a coleta de amostras foram selecionados tanques com características físicas distintas e de fácil acesso. Alguns tanques eram rodeados por matagais que impediam o acesso para a coleta de água e medição de variáveis físico-químicas in situ. Outro fator considerado na seleção dos tanques foi a quantidade de água, visto que certos tanques não estavam cheios, impossibilitando o acesso à superfície da água. Figura 8 — Fotos dos tanques de piscicultura, os quais apresentam diferentes características físicas e bio- ópticas. Ambos os reservatórios são rodeados por faixas de vegetação arbórea densa e na água nota-se a presença de plantas aquáticas. Os reservatórios possuem águas esverdeadas e medianamente túrbidas. O local também é habitat de grandes roedores, como capivaras. Em contrapartida, o rio Mojiguaçu, que possui sua nascente no município de Bom Repouso, Serra da Mantiqueira, Estado de Minas Gerais, a cerca de 150 km do município 39 de Pirassununga/SP, é demasiadamente antropizado e poluído. A água possui uma coloração marrom barrenta, túrbida e com alta concentração de sólidos em suspensão. Espuma branca e restos de lixo provenientes do escoamento superficial da área urbana também foram notados na água. A Figura 9 mostra imagens dos reservatórios e do rio Mojiguaçu, respectivamente. Destaca-se que o reservatório I é o de maior porte e o reservatório II de menor porte. Figura 9 — Fotos dos reservatórios e rio Mojiguaçu, que apresentam diferentes aspectos da cor da água e, portanto, diferentes características físicas e bio-ópticas. 4.2 Levantamentos em Campo Neste estudo, três campanhas de campo foram realizadas, sendo a primeira em 16 e 17 de fevereiro de 2022, a segunda em 14, 15 e 16 de fevereiro de 2023, e a última em 21 de julho de 2023. Nos dois primeiros levantamentos de campo, foram coletadas apenas amostras de água, dados limnológicos e radiométricos terrestres, e no terceiro, além dessas medidas, foram tomadas as imagens com uma câmara multiespectral Agrowing A7RXXX Sextuple acoplada a uma ARP Matrice 300 RTK, da fabricante DJI Innovations, em conjunto com um sistema de navegação Post Processed Kinematic (PPK), que coleta e armazena as coordenadas de voo acuradamente, e um par de receptores Real Time Kinematic (RTK), que coleta as coordenadas de forma instantânea, com o auxílio de um outro receptor (Rover). Os levantamentos em campo objetivaram a coleta de amostras de água para a estimação da concentração de chl-a em laboratório; a aquisição de dados limnológicos para a avaliação da qualidade dos corpos d’água estudados; a aquisição de dados radiométricos terrestres; e imagens multiespectrais aéreas, para a construção de modelos empíricos de estimação da concentração de chl-a em todo o sistema de aquacultura. Cabe 40 mencionar que na primeira campanha de campo, houve a captura das imagens, entretanto, devido a um erro de configuração da câmara, não foi possível utilizá-las. No primeiro levantamento de campo foram coletados um total de 30 elementos amostrais, no segundo foram amostrados 43 pontos e no último levantamento foram amostrados 10 pontos. As campanhas de campo foram realizadas em diferentes períodos sazonais, visando abranger a variabilidade óptica existente. É esperado que no período chuvoso e de altas temperaturas (fevereiro) haja condições mais favoráveis à produção primária (fitoplâncton) e maior quantidade de sedimentos escoados para os corpos d’água, sendo o contrário para o período seco e frio (julho). A primeira e a terceira campanhas de campo foram realizadas em dias ensolarados, sem a presença de nuvens, com temperaturas superiores a 28ºC. Em contrapartida, o segundo levantamento de campo foi realizado posteriormente a dias chuvosos e havia uma variação de iluminação devido à nebulosidade, com leves garoas, principalmente do meio para o final da tarde. Apesar da variação climática, as temperaturas estavam elevadas, alcançando 31ºC. A Tabela 1 apresenta o número de elementos amostrais coletados em cada campanha de campo e em cada corpo d’água. Embora o total de elementos amostrais obtidos seja 83, alguns foram excluídos, pois apresentavam resposta espectral de vegetação aquática emersa ou espectros de reflectância incoerentes aos da água, como valores de radiância negativos. Destaca-se que para a coleta de amostras no rio e nos reservatórios foi necessário o uso de uma embarcação, devido a extensão e profundidade dos corpos d’água. Tabela 1 - Quantidade de pontos coletados nos diferentes tipos de corpos d’água, em cada campanha de campo realizada. Corpos d’água Campo 16 e 17 de fevereiro de 2022 Campo 14, 15 e 16 de fevereiro de 2023 Campo 21 de julho de 2023 Rio Mojiguaçu 6 7 - Reservatório I 7 8 - Reservatório II - 5 - Tanques (diversos) 17 23 10 Total de amostras 30 43 10 41 4.2.1 Coleta de água e medição de parâmetros físico-químicos Em cada ponto amostral, parâmetros físico-químicos foram registrados a partir de uma sonda multiparâmetros, modelo Horiba U-50 (HORIBA Advanced Techno Co., Ltd., Kyoto, Japão) (Figura 10). Foram registrados os seguintes parâmetros: temperatura (ºC); pH; condutividade elétrica (mS/cm); turbidez (NTU); oxigênio dissolvido - OD (mg/L e %); propriedades oxidantes - ORP (mV); e sedimentos totais dissolvidos - STD (g/L). Além disso, a profundidade da coluna d’água (m) e a transparência do disco de Secchi (m) também foram medidas, por meio de uma ecossonda para barcos e disco de Secchi, respectivamente. Os dados limnológicos foram medidos apenas para os dois primeiros trabalhos em campo, devido a indisponibilidade do equipamento na terceira campanha. Em poucos pontos amostrais, medidas limnológicas também não foram registradas, no primeiro e segundo levantamentos de campo, por falha no instrumento de medição. Após a medição dos parâmetros físico-químicos e radiométricos, a coleta de água foi realizada em cada ponto. As amostras foram armazenadas em galões de cinco litros envoltos com papel alumínio e fita adesiva marrom, para impedir a entrada de luz e evitar atividade fotossintética pelos organismos fitoplanctônicos. Os recipientes foram estocados em caixas de isopor com gelo, para a conservação da água e de seus constituintes, até que fosse realizada a filtragem, feita no mesmo dia. Figura 10 — (a) Sonda multiparâmetros (Horiba U-50) com monitor, cabo de 30 m e sonda submersível; (b) monitor mostrando variáveis registradas. 42 Para determinação da chl-a em laboratório, foi realizada a filtragem das amostras de água em filtros de fibra de vidro Whatman GF/F (GE Heathcare, Chicago), de 47 mm de diâmetro e 0,7 µm de porosidade. O processo foi feito em ambiente escuro, de modo a minimizar os efeitos de fotodegradação. Esses filtros são guardados em envelopes separadamente, armazenados em frasco escuro contendo sílica-gel e mantidos a temperaturas inferiores a 0º C até a análise. As amostras filtradas foram encaminhadas para a Associação Instituto Internacional de Ecologia e Gerenciamento Ambiental – Laboratório de Análises da Qualidade da Água 1, para determinação da concentração de chl-a em laboratório. A análise foi realizada segundo a metodologia de Nush (1980), em que a chl-a é extraída em solução de etanol 80%, em alta temperatura (75ºC), durante cinco minutos, em tubos de ensaio. Em seguida, os tubos são mergulhados em água gelada, temperatura próxima a 0º C, para causar um choque térmico. A extração é mantida por um período de 6 a 24 horas em um refrigerador, sem iluminação. Após a refrigeração, as soluções são passadas para tubos de vidros âmbar, de 20 ml. As leituras de absorbância são realizadas por espectofotometria, em cubetas de quartzo de 50 mm, nos comprimentos de onda de 750 nm e 665 nm. Os valores obtidos foram utilizados para calcular a concentração de chl-a. Esses dados foram usados para calibrar um modelo bio-óptico de predição do conteúdo de chl-a. Vale ressaltar que a coleta de água para a estimação do conteúdo de chl-a em laboratório foi realizada em três campanhas de campo, totalizando 83 amostras. Das 83 amostras, apenas 69 foram utilizadas para o desenvolvimento dos modelos bio-ópticos, uma vez que foram excluídos outliers e nem todos os pontos, em que as amostras de água foram coletadas, foram possíveis mensurar a radiância. A medição radiométrica foi comprometida devido ao horário e à inclinação do sol (após às 15 horas). 4.2.2 Aquisição de dados com o espectrorradiômetro O espectrorradiômetro foi utilizado para a aquisição de medidas radiométricas da superfície dos corpos d’água, usadas como verdade terrestre. O instrumento para coleta dos dados radiométricos in situ foi o espectrorradiômetro FieldSpec® HandHeld UV/NIR, do fabricante ASDInc (Analytical Spectral Devices, Colorado, Estados Unidos), utilizando uma lente de abertura de 1º (um grau). O equipamento registra a radiância no intervalo de 350 nm a 1075 nm, com uma resolução espectral de 1 (um) nm (Figura 11). O software 43 utilizado para o registro das medidas foi o RS3TM, também do fabricante ASDInc. Para a conversão dos dados provenientes do espectrorradiômetro para arquivos de texto foi utilizado o aplicativo ViewSpecProTM, da ASDInc. Os valores de radiância medidos in situ com o uso de espectrorradiômetro portátil foram obtidos cerca de 30 cm acima da superfície da água, cujos dados brutos são base para a estimativa da concentração de chl-a (SATHYENDRANATH, 2000). Para as medições foi seguido o protocolo de Mueller (2003). Após a calibração do equipamento, foram medidas a radiância da placa cinza (placa Spectralon® de 5” de diâmetro) (Lg); a radiação incidente do céu (Lsky), com o sensor apontado a 45º em relação ao zênite; e a radiância total (Lt), correspondente a radiância que emerge da água (Lw) mais a radiância refletida pela superfície da água (Lr), com o instrumento apontada a 45º em relação ao nadir e ortogonalmente ao plano azimutal solar, onde não houvesse projeção de sombra na superfície da água. As amostras que dependiam de embarcações para serem coletadas, ou seja, nos reservatórios e rio, tiveram a proa do barco direcionada para o sol e as medidas foram tomadas ortogonalmente. Dez espectros de radiância foram coletados de cada medida em cada ponto. As amostras coletadas foram analisadas individualmente e espectros com radiâncias com magnitude ou formas discrepantes das demais (outliers) foram excluídos para o cálculo das reflectâncias espectrais, a fim que os espectros não resultassem em uma resposta espectral equivocada. Posteriormente, foi calculada a média dos espectros de radiância, com o intuito de minimizar variações das medições, causadas por mudanças de iluminação. Figura 11 — Espectrorradiômetro ASD FieldSpec® HandHeld UV/NIR utilizado para obtenção de medidas de radiométricas in situ. 44 4.2.3 Aquisição das Imagens As imagens foram adquiridas por meio da câmara multiespectral Sony Alpha 7RXXX Sextuple, da Agrowing (Rishon LeZion, Israel), acoplada à ARP Matrice 300 RTK (Figura 14), do fabricante DJI Innovations. Cabe ressaltar que dois voos foram realizados (VOO1 e VOO2), para que fosse possível capturar imagens de toda área de estudo. O VOO1 abrangeu o rio Mojiguaçu e parte dos tanques escavados da seção norte da Figura 7, da área de estudo. enquanto que o VOO2 abrangeu o tanque de maior porte, os tanques concretados e ambos reservatórios (parte sul/sudoeste da área de estudo). A câmara multiespectral da Agrowing, possui seis cabeças (lentes ópticas) e registra 14 bandas espectrais, que abrangem as regiões do visível (VIS) e NIR (até 850 nm). A Figura 12 mostra a câmara Agrowing e a distribuição das bandas em cada lente. Os comprimentos de ondas centrais das 14 bandas da câmara estão apresentados na Tabela 2. As especificações e características da câmara Agrowing estão dispostas na Tabela 3. Figura 12 — Câmara Sony Alpha 7RXXX (Agrowing), com seis cabeças e 14 bandas espectrais. Detetores baseados em filtro RGB não filtram a radiação infravermelha. Neste caso, o Q3 capta apenas a radiação no NIR, cujo comprimento de onda central é de 850 45 nm. Uma vez que a reflexão infravermelha é específica, é necessário que haja um filtro que transmita apenas comprimentos de onda ou canal espectral da luz infravermelha (KISE et al., 2010). Os demais filtros RGB, captam a radiação nas regiões do VIS, não necessariamente nos três canais (Q2 e Q5), sendo essa característica definida pelo desenvolvedor da câmara. Tabela 2 - Comprimentos de ondas centrais, região espectral e largura de banda (Full Width Half Maximun - FWHM) de cada uma das 14 bandas da câmara Agrowing. Bandas Região espectral Comprimento de onda central (nm) FWHM (nm) 1 UV 405 25 2 VIS 430 25 3 VIS 450 25 4 VIS 490 25 5 VIS 525 25 6 VIS 550 25 7 VIS 560 25 8 VIS 570 25 9 VIS 630 25 10 VIS 650 25 11 VIS 685 25 12 Red edge 710 10 13 Red edge 735 10 14 NIR 850 15 Fonte: https://Agrowing.com/products/alpha-7Rxxx-sextuple/ Tabela 3 - Características da câmara Sony Alpha 7RXXX e lente multiespectral, da Agrowing. Características Parâmetros Tipo Montagem única – lente de seis cabeças Campo de visada Diagonal: 45,9º Horizontal: 35º Vertical: 26,6º Distorção das lentes <1% Distância focal 21,6 mm Tipo e intervalo de foco Manual 2,5mm para o infinito Tamanho da lente 60 mm x 35,2 mm Peso da lente 180 g Peso total com a bateria 845 g Fonte: https://Agrowing.com/products/alpha-7riv-sextuple/ A sensibilidade de cada canal da câmara Agrowing é função da transmitância dos filtros. Filtros são materiais opacos e/ou transparentes para diferentes comprimentos de onda da luz, os quais mostram as qualidades de transmissão ou absorção de diferentes 46 canais espectrais (GAT, 2000). O modelo da câmara utilizada neste estudo possui seis cabeças com filtros de transmissão, os quais permitem a aquisição de suas respectivas bandas. A Figura 13 apresenta os espectros de transmitância de cada banda da câmara Agrowing. Figura 13 — Respostas espectrais dos filtros (luz colimada) da câmara Agrowing (Adaptado de https://Agrowing.com/products/alpha-7riv-sextuple/). A ARP (Figura 14) possui um design para fotografia aérea profissional, com quatro hélices, peso máximo de decolagem de 9 kg, bateria de 5.935 mAh e tempo estimado de voo de 20 minutos, aproximadamente (DJI Innovations). O método de aerolevantamento convencional, com sobreposição de 60% entre as faixas horizontais e 70% frontalmente entre as fotos, foi empregado para a aquisição das imagens. A velocidade do voo foi de 5,9 m/s, sendo as imagens tomadas a cada 2 segundos, a uma altura de voo de 104 m, resultando em um GSD (Ground Sample Distance) de aproximadamente 1,8 cm. O GSD equivale ao valor do tamanho do pixel da imagem (0,0037 mm) dividido pela escala (E = 1/4831). 47 Figura 14 — ARP Matrice 300 RTK sobre uma lona pronta para a decolagem. Durante o voo foi utilizado um sistema de navegação Global Navigation Satellite System (GNSS) por meio da técnica PPK, embarcado na aeronave, o qual coleta e armazena coordenadas de voo com alta acurácia posicional, sendo uma acurácia planimétrica de 2 cm e uma acurácia altimétrica de 3 cm, após o processamento da imagem. As coordenadas posteriormente foram processadas e corrigidas para georreferenciar as imagens. Ao longo da coleta de coordenadas de toda área de estudo, também foram coletadas por meio do RTK 39 pontos de apoio foto-identificáveis. Os pontos de apoio foram auxiliares para a correção de possíveis distorções no processamento e construção do ortomosaico. 4.3 Determinação da reflectância de sensoriamento remoto (Rrs) As medidas de radiância coletadas in situ com espectrorradiômetro foram utilizadas para calcular a reflectância de SR (Rrs), utilizando Equação 3, proposta por Mobley (1999). = − (3) 48 Em que, Lt – radiância total; ρ – fator de proporcionalidade (0,028) relacionado a velocidade do vento e o ângulo zenital solar, no instante da leitura; LS – radiância incidente do céu; Lg – radiância uniforme da placa cinza de calibração de campo e; Rg – valor do fator de correção proveniente das placas lambertianas medidas em laboratório, multiplicado pela medida de radiância da placa cinza de campo. Antes do cálculo da Rrs, as medidas de radiância da placa cinza de campo foram corrigidas. Para isso, em laboratório foram medidas as radiância (L) da placa de referência Spectralon® (superfície lambertiana) de 10” × 10” de dimensão, mantida em laboratório, e da placa cinza de campo (5” de diâmetro). O objetivo da medição da radiância das placas de calibração é gerar um fator de correção (FC) calculado pela divisão entre a radiância da placa cinza de campo e a radiância da Spectralon®, ambas medidas em laboratório, dividido por um fator k, correspondente a reflectância espectral da placa de referência, fornecido pelo fabricando da placa (Labsphere, Estados Unidos). O FC de correção é multiplicado pela medida de radiância da placa cinza de campo (Lg), cujo resultado é expresso por Rg, na Equação 3 do cálculo da Rrs (MOBLEY, 1999; LEE et al., 2010). A placa cinza de campo, devido ao seu manuseio, com o passar do tempo ela perde a capacidade de reflexão lambertiana quase ideal, assim, o FC visa alcançar perfeitas condições, comparadas as medições realizadas em laboratório, tanto de geometria, quanto de iluminação (JENSEN, 2014). O ambiente da tomada das medidas das variáveis que compõem o FC era controlado, com a sala escura e o entorno revestido por placas de etil vinil acetato (E.V.A.) e tecidos da cor preta, para que minimizar efeitos de iluminação externos que interferissem no valor de radiância medido das placas. Para a medição das placas, foi utilizada uma lâmpada halógena para iluminar os alvos (placas) a um ângulo de 45º em relação ao nadir e 90º em azimute em relação a fonte de iluminação, como mostra a Figura 15. 49 Figura 15 — Placa cinza de campo, cuja radiância foi medida em laboratório, com o auxílio de uma lanterna de luz halógena e um espectrorradiômetro. 4.3.1 Simulação de Bandas Uma vez que os valores de Rrs foram calculados, a próxima etapa consistiu em compatibilizar as Rrs determinadas pelas medidas do espectrorradiômetro e as reflectâncias das bandas da câmara Agrowing por meio de uma simulação de bandas. A simulação de bandas é um procedimento realizado mediante a uma convolução espectral, multiplicando os dados espectrais pela função de filtro espectral (SB), integrando o resultado para os comprimentos de onda de cada canal e normalizando pela largura de cada banda (BURGRAAFF, 2020), conforme mostrado na Equação 4. = ∫ ( ) ( ) ∫ ( ) ( ) (4) Em que, LW (λ) – radiância deixando a água espectral; Ed (λ) – irradiância descendente espectral; SB (λ) – função resposta espectral de cada banda (B); 50 SB(λ) da câmara Agrowing não é disponibilizada pelo fabricante e, por isso, foi aproximada para uma função gaussiana. A Equação 5 mostra a função de distribuição normal. ( ) = √ ( ) (5) Em que, – Rrs de um pixel de uma banda espectral; – valor da Rrs no comprimento de onda central; – dispersão dos valores de Rrs, ou seja, FWHM; As bandas simuladas foram utilizadas na calibração radiométrica das imagens multiespectrais e na calibração e validação do modelo de predição de chl-a. Antes do voo, com o auxílio do espectrorradiômetro, foram medidas em campo as radiâncias de alvos de calibração. Os alvos de calibração das imagens foram placas (0,5 m × 0,5 m) de E.V.A., em quatro cores diferentes: branco, cinza claro, cinza médio e preto. Os valores de radiância dos alvos de calibração também transformados em valores reflectância Rrs e a simulação de bandas também foi aplicada a esses dados. 4.4 Processamento da Imagens O processamento das imagens foi iniciado utilizando o software Agrowing Basic (Agrowing, Rishon LeZion, Israel). No software, foi feita o alinhamento e separação das imagens capturadas em 14 bandas espectrais, registradas por meio das seis lentes ópticas. O processo de alinhamento das cenas é feito manualmente, utilizando a lente óptica Q1 (Figura 13) como referência. O alinhamento das bandas é necessário, uma vez que elas são tomadas por diferentes ópticas, que estão deslocadas entre si. Depois de alinhadas as imagens, é efetuada a separação automática dos 14 canais espectrais, além de transformar os dados na extensão .RAW para a extensão .TIFF, em números digitais (ND), quantizado em uma resolução radiométrica de 8 bits (ND – 0 a 255). Vale ressaltar, que apesar da resolução radiométrica de 8 bits ser considerada baixa, podendo reduzir a acurácia dos 51 processamentos, o parâmetro foi escolhido pois não foi possível fazer o processamento fotogramétrico posteriormente com 16 bits. Com as imagens alinhadas e bandas salvas separadamente, foi realizado o processamento geométrico por meio do software Agisoft Metashape, versão 1.7.4, (Agisoft LLC, Rússia). As etapas efetuadas consistem em: importação das imagens em .TIFF e importação das coordenadas coletadas; alinhamento e triangulação fotogramétrica entre as imagens, resultando nos parâmetros de orientação interior e exterior (POI e POE, respectivamente), além da nuvem de pontos (Cloud Points), a demarcação dos pontos GNSS utilizando pontos de verificação da qualidade do alinhamento, como referência; densificação dos Tie Points; construção de um modelo tridimensional da superfície; desenvolvimento de um modelo digital da superfície (MDS) e; geração do ortomosaico. Vale ressaltar que dois voos foram realizados, devido a dimensão da área de estudo, logo foram gerados dois ortomosaicos. 4.4.1 Calibração Radiométrica das Imagens A calibração radiométrica das imagens é realizada para converter os NDs em Rrs, para que os modelos de predição de chl-a possam ser aplicados às imagens, uma vez que os modelos foram calibrados com os dados terrestres. As reflectâncias tomadas das placas de calibração (quatro cores) foram utilizadas para ajustar um modelo de conversão, utilizando a técnica de linha empírica (SMITH e MILTON, 1999). Apesar da câmara Agrowing possuir 14 bandas espectrais, apenas 5 foram utilizadas, visto que os canais centrados em 560 nm, 650 nm, 685 nm, 710 nm e 735 nm, foram adotadas como atributo de entrada para o desenvolvimento dos modelos bio-ópticos, a partir dos índices espectrais. Tais comprimentos de onda são comumente utilizados para o desenvolvimento de modelos bio-ópticos para águas interiores. Duas funções foram testadas para converter NDs em Rrs, linear e exponencial, descritas pelas Equações 6 e 7. = × ( ) + (6) = × ( ) (7) As placas utilizadas como alvos de calibração possuíam as cores branco, cinza claro, cinza escuro e preto, como mostra a Figura 16. Além das placas de calibração, 52 foram adicionadas duas amostras radiométricas de água, uma para cada voo, com menor Rrs para compor o modelo de calibração (Figura 17). Essas amostras foram utilizadas porque os alvos de referência mais escuros (cor preta) têm valores de Rrs maiores do que os alvos de água, resultando em valores negativos de Rrs aos pixels. Para o primeiro voo realizado, os alvos de calibração utilizados foram: branco (1CO), cinza escuro (3CO), preto (4CO) e o ponto de identificação na água A62, coletado em julho de 2023. O segundo voo teve como alvos de calibração das imagens: cinza escuro (3CO), preto (4CO), tatame avulso (3AV) preto e o ponto de identificação na água A30, coletado em julho de 2023. As placas AV possuíam 0,5 × 0,5 m, enquanto as placas CO possuíam 0,5 × 0,25 m cada (o conjunto 0,5 × 1 m). Figura 16 — Alvos de referência em quatro cores: branco (1AV e 1CO), cinza claro (2AV e 2CO), cinza escuro (3CO) e preto (3AV e 4CO), para a calibração radiométrica das imagens. 53 Figura 17 — Alvos nos corpos d'água (tanque A62 e tanque A30) utilizados para calibração radiométrica das imagens como espectros de menor reflectância. A calibração radiométrica foi realizada manualmente por meio do software Excel, do pacote Microsoft Office, e para a aplicação do modelo de ajuste radiométrico e construção dos mapas finais, mostrando a distribuição espacial da chl-a, foi utilizado o software Quantum GIS (QGIS). Cabe mencionar que o software Environmental for Visualizing Images (ENVI) possui ferramentas para aplicação automática da linha empírica para a calibração das imagens e foi testado. Entretanto, não foram capazes abrir as imagens, uma vez que possuíam um tamanho não suportado pelo software. A calibração radiométrica foi validada por meio das métricas: coeficiente de determinação (R2), Root Mean Square Error (RMSE), Normalized Root Mean Square Error (NRMSE) e bias (Equações 8, 9, 10 e 11). Para a validação foram utilizadas um total de 26 amostras para o VOO1 e 45 amostras para o VOO2. Destaca-se que com o objetivo de melhorar os resultados avaliados, uma vez que a magnitude das curvas era 54 muito diferente daquelas tomadas em campo, a métrica bias, calculada por banda, foi multiplicada como uma correção para assim ser possível alcançar modelos significativamente acurados. = − ∑( − ) ∑( − ) (8) = ( − ) (9) = − (10) = ( − ) (11) Em que, x é a variável do modelo; ̅ é a média do valor de x; é o valor predito a partir da variável x; xmax e xmin são os valores máximos e mínimos de x; i são os i-ésimos valores de x; e n é o número total de amostras. 4.5 Calibração do Modelo Bio-Óptico Três algoritmos foram testados para ajustar os modelos de predição da concentração de chl-a: MLR, RF e MLP. Um total de 69 amostras foram utilizadas para o ajuste dos modelos. A MLR é um modelo estatístico empregado para prever uma variável dependente com base em duas ou mais variáveis independentes, baseado em uma relação linear entre os atributos de entrada e a variável resposta, minimizando o erro da predição por meio do método dos mínimos quadrados. Em contrapartida, o RF é um algoritmo de aprendizado de máquina baseado em um conjunto de árvores de decisão, enquanto o MLP é uma rede neural rasa, também caracterizada como aprendizado de máquina. Os modelos bio-ópticos foram calibrados no software Waikato Enviroment for Knowledge Analysis (Weka), livre de domínio da licença GLP (Licença Pública Geral GNU é uma licença de software livre proeminente criada pela Free Software Foundation 55 sob a liderança de Richard Stallman), criado por pesquisadores da Universidade de Waikato, Nova Zelândia. O Weka está implementado na linguagem Java, tornando sua utilização possível em diversos sistemas operacionais, devido a sua portabilidade. O software é capaz de pré-processar dados, aplicar diversos algoritmos de aprendizado de máquina de maneira rápida e possui ferramentas de visualização de dados para solucionar problemas de mineração e para comparação de dados de saída (https://www.cs.waikato.ac.nz/ml/people.html). Os atributos de entrada para modelos regressivos correspondem às variáveis explicativas utilizadas para prever a variável de interesse. No contexto deste trabalho, foram testados como atributos de entrada as bandas espectrais capturadas pelo sensor Agrowing e alguns índices espectrais de chl-a fitoplanctônica, que fornecem informações sobre a resposta espectral da superfície da água e sua relação com a concentração de chl- a. Para a calibração dos modelos, foram utilizados índices espectrais disponíveis na literatura e, pelo menos, quatro bandas espectrais da câmera Agrowing. As diferentes combinações de atributos de entrada testados estão apresentadas na Tabela A1 do Apêndice. A validação cruzada k-fold foi empregada para avaliar o desempenho dos modelos preditivos. O método consiste em dividir o conjunto de dados em ‘k’ subconjuntos (folds), de tamanhos iguais, os quais são treinados k-1 e usado o k restante para teste, em cada iteração. O objetivo é reduzir o risco de super ajustamento (overfitting) e aprimorar a capacidade de generalização do modelo. A k-fold Cross Validation é uma técnica de reamostragem e múltiplas iterações para a avaliação de modelos (GERÓN, 2022). Cabe mencionar que diferentes valores de k-fold foram testados, dentre eles, o valor igual a 10 e também igual ao número máximo de amostras para os modelos determinados (67 ou 69). 4.5.1 Seleção de atributos de entrada Os atributos de entrada testados para a calibração dos modelos bio-ópticos foram apenas atributos espectrais: valores de Rrs das bandas simuladas da câmara Agrowing, e índices espectrais para estimação de chl-a na água, disponíveis na literatura. 56 4.5.1.1 Índices Espectrais No total foram testados como atributos de entrada 15 índices espectrais, propostos por diferentes autores (Tabela 4), considerando as bandas disponíveis na câmara Agrowing. Os índices espectrais para estimação de chl-a tabelados serviram de base para diferentes estudos que estimaram a concentração do constituinte chl-a ao longo do tempo, fazendo uso de canais com comprimentos de onda na região do visível e NIR. Tabela 4 - Tabela contendo os índices espectrais de estimação de chl-a testados para a construção dos modelos bio-ópticos para a estimação das concentrações de chl-a do sistema de aquacultura, no CEPTA/ICMBio. Na tabela estão contidas a identificação do índice espectral ou algoritmo, a fórmula adaptada para as bandas da câmara Agrowing, a significância, área de aplicação e referência. Índice