UNIVERSIDADE ESTADUAL PAULISTA - UNESP CÂMPUS DE JABOTICABAL ESTIMATIVA DA CONCENTRAÇÃO ATMOSFÉRICA DE CO2 (XCO2) NO ESTADO DO AMAZONAS, BRASIL: UMA ABORDAGEM DE SÉRIES TEMPORAIS. Felipe Facco Silva Engenheiro Agrônomo 2024 UNIVERSIDADE ESTADUAL PAULISTA - UNESP CÂMPUS DE JABOTICABAL ESTIMATIVA DA CONCENTRAÇÃO ATMOSFÉRICA DE CO2 (XCO2) NO ESTADO DO AMAZONAS, BRASIL: UMA ABORDAGEM DE SÉRIES TEMPORAIS. Felipe Facco Silva Orientador: Prof. Dr. Alan Rodrigo Panosso Coorientador: Prof. Dr. Newton La Scala Jr Dissertação apresentada à Faculdade de Ciências Agrárias e Veterinárias – UNESP, Câmpus de Jaboticabal, como parte das exigências para a obtenção do título de Mestre em Agronomia (Ciência do Solo). 2024 F138e Facco Silva, Felipe Estimativa da concentração atmosférica de co2 (xco2) no estado do amazonas, brasil: uma abordagem de séries temporais. / Felipe Facco Silva. -- Jaboticabal, 2025 37 p. : il., tabs., mapas Dissertação (mestrado) - Universidade Estadual Paulista (UNESP), Faculdade de Ciências Agrárias e Veterinárias, Jaboticabal Orientador: Alan Rodrigo Panosso Coorientador: Newton La Scala Júnior 1. Concentração de Gases de Efeito Estufa. 2. Modelagem Estatística. 3. Sensoriamento Remoto. I. Título. Sistema de geração automática de fichas catalográficas da Unesp. Dados fornecidos pelo autor(a). Impacto potencial desta pesquisa O presente trabalho projeta seu impacto sobre as esferas cientifíca, social e ambiental. Sob a perspectiva científica, contribui para a ampliação do conhecimento sobre a dinâmica da concentração de CO2 em uma região crítica para o equilíbrio climático global, oferecendo subsídios para a formulação de soluções futuras em questões ambientais. No âmbito social, os resultados possuem aplicabilidade na formulação de políticas públicas e na promoção do bem-estar coletivo, com destaque para a conscientização acerca da importância da preservação da floresta amazônica. Ambientalmente, o estudo proporciona bases sólidas para o monitoramento contínuo e a mitigação dos impactos das alterações climáticas na região. Potential impact of this research This study envisions its impact across the scientific, social, and environmental domains. From a scientific perspective, it contributes to the expansion of knowledge regarding the dynamics of CO2 concentration in a critical region for global climate balance, providing a foundation for the development of future solutions to environmental challenges. Socially, the findings hold relevance for the formulation of public policies and the promotion of collective well-being, emphasizing the importance of raising awareness about the preservation of the Amazon rainforest. Environmentally, the research establishes a robust basis for continuous monitoring and the mitigation of the impacts of climate change in the region. DADOS CURRICULARES DO AUTOR FELIPE FACCO SILVA – Nascido em Jaboticabal, São Paulo, no dia 27 de maio de 1996, filho de Maria Aparecida Facco e Everaldo Nunes Silva. Cursou Engenharia Agronômica, pela Faculdade de Ciências Agrária e veterinária da Universidade Estadual Paulista (FCAV-UNESP), Campus de Jaboticabal-SP, entre janeiro de 2016 e fevereiro de 2020. Durante este período foi bolsista pelo programa de Iniciação Científica em dois projetos de autoria própria com bolsa CNPq, no qual desenvolveu trabalhos abordando os assuntos: gases de efeito estufa, mudanças climáticas e impacto das mudanças no uso do solo. Ingressou em 2020 no curso de Mestrado em Agronomia (Ciência do Solo), da FCAV-UNESP, no departamento de Ciências Exatas, sob orientação do Prof. Dr. Alan Rodrigo Panosso. Atua principalmente nos temas: Gases de efeito estufa, sensoriamento remoto e modelagem matemática aplicada a agricultura e meio ambiente. “O espírito, como um pássaro, não se lhe deu da corrente dos anos, arrepiou o vôo na direção da fonte original, e foi beber da água fresca e pura, ainda não mesclada do enxurro da vida.” (Machado de Assis – Memórias póstumas de Brás Cubas) VIII SUMÁRIO Página RESUMO .................................................................................................................... X ABSTRACT ............................................................................................................... XI 1 INTRODUÇÃO ..................................................................................................... 1 2 REVISÃO DE LITERATURA ................................................................................ 2 2.1 Área de Estudo, Amazonas Brasil .................................................................... 2 2.2 Ciclo do Carbono .............................................................................................. 4 2.3 Sensoriamento remoto para aquisição de dados de CO2 ................................. 5 2.4 Técnica não supervisionada para o agrupamento de regiões .......................... 6 2.5 Modelagem de séries temporais ....................................................................... 7 3 MATERIAL E MÉTODOS ..................................................................................... 8 3.1 Descrição da área de estudo ............................................................................ 8 3.2 Observatório do Carbono em Órbita (OCO-2) ................................................ 10 3.2.1 Aquisição e processamento dos dados .......................................................... 10 3.2.2 Estatística Descritiva....................................................................................... 12 3.2.3 Análise hierárquica de clusters ....................................................................... 12 3.3 Criação e modelagem estatística das séries temporais .................................. 13 3.3.1 Modelo Suavização Exponencial .................................................................... 13 3.3.2 Modelo ARIMA ................................................................................................ 15 3.3.3 Teste de independência dos resíduos ............................................................ 16 3.3.4 Critérios para avaliação dos modelos ............................................................. 17 4 RESULTADOS ................................................................................................... 17 4.1 Estatistica Descritiva ....................................................................................... 17 4.2 Análise Hierárquica de Clusters ...................................................................... 18 4.3 Séries Temporais ............................................................................................ 20 4.3.1 Dados Brutos .................................................................................................. 20 4.3.2 Dados Sem Tendência ................................................................................... 21 4.4 Modelos Ets E Arima ...................................................................................... 22 4.4.1 Indicadores dos Modelos ................................................................................ 23 IX 4.4.2 TESTE ACF e teste de resíduos de Ljung-box ............................................... 24 5 DISCUSSÃO ...................................................................................................... 27 6 CONCLUSÕES .................................................................................................. 28 7 REFERÊNCIAS .................................................................................................. 30 X ESTIMATIVA DA CONCENTRAÇÃO ATMOSFÉRICA DE CO2 (XCO2) NO ESTADO DO AMAZONAS, BRASIL: UMA ABORDAGEM DE SÉRIES TEMPORAIS. RESUMO - As mudanças climáticas, intensificadas pelo aumento das concentrações de CO2 atmosférico nas últimas décadas, são um desafio global. Sensores remotos em satélites coletam dados sobre a dinâmica desse gás, e, por meio da modelagem, permitem inferências precisas sobre suas fontes e sumidouros. Este estudo teve como objetivo avaliar o desempenho de modelos estatísticos para identificar e caracterizar a concentração de gases de efeito estufa (GEE) no estado do Amazonas, Brasil, utilizando os modelos autorregressivos de médias móveis (ARIMA) e de suavização exponencial (ETS). Os dados da concentração média de CO2 na coluna de ar atmosférico (XCO2) foram coletados na plataforma OCO-2, da Nasa. Para avaliar o efeito local do XCO2, foi aplicada a remoção da tendência por meio de regressão linear sobre os dados brutos. A área foi agrupada por métodos não supervisionados, tanto para dados com e sem tendência. Foram analisadas as médias mensais do XCO2 para o período de 2015 a 2022, com aplicação de estatística descritiva e dos modelos estatísticos citados. A média do XCO2 com tendência foi de 407,55 ± 0,01 ppm, enquanto a série sem tendência apresentou 390,20 ± 0,00 ppm. Para avaliar o desempenho dos modelos utilizamos os indicadores MAPE, RMSE, AIC e BIC. A remoção da tendência aumentou o poder preditivo dos modelos, com o MAPE médio mostrando uma redução de 0,2743 (com tendência) para 0,1985 (sem tendência) nos modelos de teste. Na fase de treino, não foram observadas diferenças significativas entre os métodos ARIMA e ETS. No entanto, na fase de teste, o modelo ARIMA apresentou melhor desempenho, especialmente nos dados com tendência, com MAPE médio de 0,2533 para ARIMA e 0,2953 para ETS. Os resultados mostraram que ambos os modelos são eficazes na previsão e modelagem das concentrações de XCO2 no estado do Amazonas, Brasil. Palavras-chave: Concentração de Gases de Efeito Estufa, Modelagem Estatística, Sensoriamento Remoto. XI ESTIMATION OF ATMOSPHERIC CO2 CONCENTRATION (XCO2) IN THE STATE OF AMAZONAS, BRAZIL: A TIME SERIES APPROACH. ABSTRACT - Climate change, intensified by the increase in atmospheric CO2 concentrations over recent decades, poses a global challenge. Remote sensing technologies on satellites collect data on the dynamics of this gas and, through modeling, allow precise inferences about its sources and sinks. This study aimed to evaluate the performance of statistical models in identifying and characterizing the concentration of greenhouse gases (GHG) in the state of Amazonas, Brazil, using autoregressive integrated moving average (ARIMA) and exponential smoothing (ETS) models. Data on the average atmospheric column CO2 concentration (XCO2) were collected from NASA's OCO-2 platform. To assess the local effect of XCO2, trend removal was applied through linear regression on the raw data. The area was grouped using unsupervised methods for both trend and detrended data. Monthly averages of XCO2 were analyzed for the period from 2015 to 2022, with the application of descriptive statistics and the models. The mean XCO2 with a trend was 407.55 ± 0.01 ppm, while the detrended series had a mean of 390.20 ± 0.00 ppm. To evaluate the models’ performance, indicators such as MAPE, RMSE, AIC, and BIC were utilized. Trend removal enhanced the predictive power of the models, with the average MAPE decreasing from 0.2743 (with trend) to 0.1985 (without trend) in the test models. During the training phase, no significant differences were observed between the ARIMA and ETS methods. However, in the testing phase, the ARIMA model performed better, particularly for data with a trend, showing an average MAPE of 0.2533 for ARIMA and 0.2953 for ETS. The results demonstrated that both models are effective in forecasting and modeling XCO2 concentrations in the state of Amazonas, Brazil. Keywords: Greenhouse Gas Concentration, Statistical Modeling, Remote Sensing. 1 1 INTRODUÇÃO Os gases de efeito estufa (GEE) desempenham um papel essencial no aquecimento global. O aumento contínuo de suas concentrações na atmosfera, causado principalmente pela queima de combustíveis fósseis, alterações no uso da terra e desmatamento, tem contribuído para o gradual aumento da temperatura do planeta (SCHNEIDER et al., 2001). Estima-se que as atividades antrópicas tenham aumentado em até 1 °C (± 0.2 °C) acima dos níveis pré-industriais (Olsson et al., 2019). No Brasil a mudança do uso do solo representa o setor de maior emissão de GEE, em 2022 sua participação representou 48,3% do total das emissões brasileiras (SEEG., 2022). O Painel Internacional sobre Mudanças Climáticas (IPCC) divulga relatórios frequentes minuciando diferentes cenários e regiões quanto a sua pegada de Carbono, além de elencar atividades que veem sendo empregadas na mitigação dessas emissões. A comunidade científica considera a adição de gases à atmosfera um efeito “estufa adicional”, que é basicamente um aumento do efeito estufa natural (FORSTER et al., 2007; HORTON et al., 2015). Uma série de acordos e protocolos foi criado visando mitigar o efeito estufa adicional, entre elas destaca-se o acordo de Paris e os Objetivos de desenvolvimento sustentável (ODS). Devido à complexidade deste fenômeno e sua relevância, cientistas de todo o mundo estão tentando compreender a forma como ocorrem as trocas gasosas entre a terra e a atmosfera, bem como as principais causas do aumento da concentração desses gases e possíveis fontes e sumidouros globais de GEE (FISHER et al., 2009; PARAZOO et a., 2016; BORDONAL et al., 2017). O Brasil tem despertado entre autoridades e pesquisadores uma preocupação com o desmatamento de regiões da Amazônia legal brasileira, principalmente devido ao crescente debate sobre o tema e seu impacto nos GEE (CARVALHO, 2014). Cada região possui atividades únicas e relevantes para a economia local; acredita-se que essas atividades tenham impactos diferentes na pegada de carbono (SENEVIRNE et al., 2010). No país a atividade humana e a agricultura estão intrinsecamente ligadas, SEEG (2022) indica uma emissão de 617 milhões de toneladas de CO2 equivalente (CO2 eq) no Brasil, valor que representa 26,6% do total. 2 A análise de vastas extensões territoriais para dados de GEE criou uma demanda por robustos métodos de coleta de dados, situação em que o sensoriamento remoto trouxe inúmeros avanços, existindo satélites para obtenção de frações molares médias de CO2 para a coluna de ar atmosférico, apresentando modelos em escalas globais e locais (ELDERING et al., 2017). A detecção remota é uma técnica vantajosa para derivar as frações molares de ar seco de coluna média de CO2 (XCO2) para inversões atmosféricas (SCHWANDNER et al., 2017). Recentemente já é possível detectar fontes e sumidouros de carbono, graças aos lançamentos de satélites específicos como o GOSAT e o OCO-2 (YOKOTA et al., 2009; BUTZ et al., 2011). A estatística multivariada e inteligência artificial tornam possível agrupar fatores, método que é capaz de categorizar padrões para a emissão de CO2 em regiões de um país. Como exemplo a técnica de clusters, uma metodologia recorrente na literatura, onde se utiliza os clusters para a categorização de regiões no que diz respeito as suas condições climáticas (DE SOUZA et al., 2012; DE SOUZA et al., 2020). Dados distribuídos ao longo do tempo, como a média mensal [XCO2], podem ser representados como séries temporais (TS), uma ferramenta muito eficaz na compreensão de diferentes características dos eventos analisados ao longo do tempo. Dentro da composição das TS existem diferentes componentes, em que cada componente nos permite compreender o comportamento da série em diferentes aspectos (MAKRIDAKIS & WHEELWRIGHT, 1982). A utilização de modelos para TS criadas a partir de dados de sensoriamento remoto já vem sendo estudada e relatada na literatura, como Silva et al. (2008), que utilizou modelos de séries temporais a fim de prever a temperatura média, com dados coletados por sensoriamento remoto, chegando a resultados consistentes quanto a sua acurácia e aplicabilidade. O objetivo do trabalho foi avaliar, de forma comparativa, a modelagem e as estimativas de XCO2 para o estado do Amazonas, Brasil, obtidas por modelos estatísticos ARIMA e ETS. 2 REVISÃO DE LITERATURA 2.1 Área de Estudo, Amazonas Brasil O estado do Amazonas, fica localizado na região norte do Brasil. Ocupando uma área de aproximadamente 1,56 milhões de km2 (IBGE, 2022), fazendo fronteira 3 ao norte e Oeste com estado de Roraima e os países Colômbia, Equador e Venezuela, e a leste e sul com os estados do Pará, Mato Grosso, Rondônia e Acre. É o estado de maior extensão territorial do Brasil, representando 18,3% da área total do país. Está inserido na bacia hidrográfica do Amazonas. A região amazônica desempenha um papel importante no ciclo de carbono da Terra e pode ser considerada uma região de alto risco do ponto de vista dos impactos das mudanças climáticas. Salati (2001) acredita que o atual equilíbrio dinâmico da atmosfera amazônica é afetado pelas forças de transformação que levam às mudanças climáticas e pode ser estudado sob três aspectos diferentes: Variações climáticas globais ocasionadas naturalmente; Mudanças climáticas de origem antrópica decorrentes da mudança do uso do solo em escala regional; Alterações climáticas decorrente de atividades antrópicas em escala global. As atividades humanas têm diversos impactos sobre as mudanças do clima regional e global. O avanço do desmatamento sobre regiões da Amazonia gera diferentes consequências ao clima, em cenários de conversão em grande escala de florestas tropicais para áreas de pastagem ou culturas anuais podem levar a mudanças climáticas. Nobre et al. (1991), utilizando modelos numéricos identificou que, em situações de transição de floresta tropicais amazônicas para pastagens degradadas há um aumento significativo na temperatura média da superfície (cerca de 2,5 °C) e diminuição da evapotranspiração anual (30%), precipitação (25%) e escoamento superficial (20%), houve também indícios do aumento da estação seca anual na metade sul da bacia Amazônica, situação na qual o reestabelecimento das florestas tropicais após o desmatamento se torna muito complexo. Outros estudos (COHEN et al., 2007; CORREIA et al., 2007; PHILLIPS et al., 2009; MALHI, 2010) investigaram a variabilidade climática em resposta às alterações no uso da terra, evidenciando uma redução de 15 a 30% na evapotranspiração e uma diminuição de 5 a 20% na precipitação, além de influências consideráveis no ciclo do carbono. Solos sobre florestas tropicais representam uma parte crítica do processo de emissão e sequestro de carbono, pois podem atuar como fonte ou sumidouro de carbono, dependendo do seu uso e gestão (Funk et al., 2015; Pourbakhtiar et al., 2017). Ações antrópicas têm ocasionado pressões ambientais sobre a Amazônia na última década, pressões que ocorrem de forma direta ao desmatamento e incêndios 4 florestais como por forma indireta relacionado ao aquecimento global, de modo que essa conjuntura ameaça a estabilidade climática, ecológica e ambiental das florestas amazônicas (OLIVEIRA et al., 2008). O estado do Amazonas tem um importante papel dentro de todos esses processos, sendo uma unidade federal chave nas discussões de mudanças climáticas e GEE no Brasil. 2.2 Ciclo do Carbono O carbono é um componente essencial das moléculas orgânicas, está presente na atmosfera, solos, oceanos e crosta terrestre, sendo estes definidos como reservatórios de C. O estoque presente na vegetação e nos solos dos ecossistemas tropicais representam de 20 a 25% do C terrestre mundial (CERRI et al., 2001), tendo um importante papel no ciclo do C regional e mundial, movimentações ou fluxos entre os reservatórios são comuns ocorrendo de forma natural, entretanto mudanças no uso da terra e floresta, sobretudo vinculadas ao desmatamento, tem impacto no balanço de C entre seus reservatórios, atuando de maneira direta como fonte de emissões de GEE (Le Quéré et al., 2015). Figura 1. Subciclo dentro do ciclo global de carbono. Mostrando o movimento contínuo do carbono entre a atmosfera, plantas e solos mediados pelos processos da fotossíntese, respiração, colheita, fogo e decomposição (adaptado de ...UNH, 2019). 5 Dióxido de carbono (CO2) e os GEE são continuamente reciclados na terra, o projeto “Global Carbon Cycle” da Universidade de New Hampshire (UNH, 2019) descreve a existência de regiões que atuam como acumuladoras de carbono, tendo um balanço positivo quanto a absorção em relação a emissão, e regiões onde as emissões sobressaem a absorção do C, de modo que estas áreas são denominadas como sumidouros e fontes de C, respectivamente. Para entender o potencial de fixação e estocagem do solo é necessário analisar uma série de fatores, como condição climática local, relevo, drenagem e o tipo de manejo adotado, além de outras variáveis intrínsecas as diferentes regiões do planeta (LAL, 2005; SMITH, 2008). A fotossíntese é o principal mecanismo de fixação deste carbono atmosférico pelas plantas, utilizando CO2, água e luz para sintetizar seus compostos orgânicos (MARENGO et al., 2014). O bioma amazônico desempenha um importante papel dentro desse ciclo, estima-se que o bioma armazene cerca de 86 bilhões de toneladas de C, distribuídas entre dossel de plantas, raízes e material em decomposição (SAATCHI et al., 2007). Os solos sob cobertura de florestas tropicais também representam um compartimento chave nos processos de sequestro e armazenamento do carbono, podendo atuar como fonte ou sumidouro de C dependendo de seu uso e manejo (FUNK et al., 2015; POURBAKHTIAR et al., 2017). 2.3 Sensoriamento remoto para aquisição de dados de CO2 Sensores vem sendo empregados na captura de informações e imagens de maneira automatizada. Esses dados podem ser compilados em imagens vetorizadas que se apresentam na forma de um grid de pixels, para cada fração do grid ou para cada pixel é carregada uma informação única (CROSTA, 1999; JENSEN et al., 2009). Os pixels possuem características que refletem a qualidade do sensor empregado para sua coleta, dentre as características das imagens de sensoriamento remoto podemos citar suas resoluções, sendo elas, resolução espacial, definida como o tamanho real que a menor unidade de uma imagem consegue obter de maneira precisa, ou seja objetos menores que a resolução espacial não serão observados, resolução temporal que apresenta o intervalo de releitura para um mesmo ponto ou região, e pôr fim a resolução espectral, representa as bandas espectrais que o sensor 6 é capaz de captar ao realizar suas observações, quanto mais bandas maior é a gama de informações que o sensor é capaz de coletar (CROSTA 1999). Ao longo das últimas décadas o sensoriamento remoto evoluiu rapidamente, os satélites tiveram um importante papel nesse avanço. Jensen et al. (2009) cita que os satélites são uma ótima forma de coleta de dados para grandes extensões de área, fornecendo dados de alta qualidade e relativamente baratos quando analisados por km2, o autor apresenta projetos de vários países que lançaram seus satélites e obtiveram sucesso em suas missões, com os mais diversos objetivos. Satélites para observação de dados de carbono se mostraram um método interessante, utilizando sensores passivos foi possível monitorar o CO2 atmosférico em grandes escalas (ZHANG et al., 2021). Em 2014 os EUA lançaram o Observatório de Carbono em órbita-2 (“The Orbiting Carbon Observatory-2”, OCO-2), que foi equipado com três espectrômetros de alta resolução (OYAFUSO et al., 2017; ZENG et al., 2020). O OCO-2 disponibiliza entre seus produtos dados de CO2 atmosférico, CH4 e a fluorescência induzida pela clorofila (SIF), com resolução espacial de 1 – 2 km e uma ampla faixa de monitoramento (ZHANG et al., 2021). O OCO-2 é capaz de fornecer dados de CO2 da atmosfera de forma precisa, permitindo avaliar não só sua concentração, mas também suas tendências (ELDERING et al., 2017), Crisp et al. (2014) cita que a estimativa média da fração molar em ar seco da coluna de CO2(XCO2) fornece uma análise precisa que permite a identificação de fontes e sumidouros de C em menores escalas, Rayner et al. (2001) também demonstrou resultado semelhante. 2.4 Técnica não supervisionada para o agrupamento de regiões É possível realizar o agrupamento de regiões utilizando técnicas não supervisionadas de machine learning, metodologia que permite analisar de forma segmentada regiões com padrões diferentes. A análise de cluster é uma das técnicas exploratória não supervisionadas, que tem por objetivo agrupar as observações em grupos homogêneos internamente e heterogêneos externamente (FÁVERO et al., 2017). Yuan et al. (2012) cita em seu trabalho a utilização da análise de clusters para delimitar regiões homogêneas quanto ao padrão de emissões de CO2 e fatores locais 7 relacionados, objetivando traçar as melhores estratégias para atingir a meta de redução da intensidade de CO2 na china. Para a aplicação do método de clusterização é necessário o cumprimento de algumas premissas, a definição entre o método hierárquico Aglomerativo onde se decide o número de clusters ao longo da análise e o método não hierárquico K-means, onde o número de clusters é definido a priori, a padronização de variáveis em diferentes unidades ou escalas, comumente se aplica a transformação ZScore (variáveis com média zero e desvio padrão 1), necessidade de que se escolha a medida de dissimilaridade (distância) e o método de encadeamento das observações, e por fim evitar a presença de outliers (FÁVERO et al., 2017; DURAN et al., 2013). Para determinar a dissimilaridade uma série de fórmulas são aplicáveis, dentre elas, 3 das principais, são: 𝑑𝑝𝑞 = √∑ (𝑍𝑋𝑗𝑝 − 𝑍𝑋𝑗𝑞)² 𝑘 𝑗=1 (1) 𝑑𝑝𝑞 = ∑ (𝑍𝑋𝑗𝑝 − 𝑍𝑋𝑗𝑞)² 𝑘 𝑗=1 (2) 𝑑𝑝𝑞 = ∑ |𝑍𝑋𝑗𝑝 − 𝑍𝑋𝑗𝑞|𝑘 𝑗=1 (3) Distância euclidiana (eq.1), euclidiana quadrática (eq. 2) e distância de Manhattan (eq. 3) entre os pontos (FÁVERO et al., 2017). A aplicação prática desses modelos é muito comum em diversas áreas do conhecimento, a exemplo Zhang et al. (2024) utilizou o método K-means para agrupar 31 províncias e cidades da China quanto a suas emissões de CO2 no transporte, por meio de dados como a escala de desenvolvimento populacional, intensidade de emissão de CO2, participação econômica do transporte e eficiência do uso de energia, criou medidas eficientes e específicas para cada região. 2.5 Modelagem de séries temporais Modelos matemáticos tem uma ótima capacidade de descrever processos reais. A escolha do modelo e o ajuste de seus parâmetros é fundamental, de modo a considerar os fatores que influenciam a eficiência descritiva das informações, como conhecimento prévio do sistema (linear, não linear, atraso), propriedades do modelo (complexidade), definição da medida de erro a ser minimizada, presença ou não de ruídos (JOHANSSON, 1993; COELHO et al., 2004). 8 Dados distribuídos em TS tem um grande poder descritivo, carregando diversas informações a respeito do evento analisado. Makridakis et al. (1982) cita os diferentes componentes de uma série temporal: (a) tendência, que se refere à direção geral na qual uma série temporal se desenvolve; (b) periodicidade, oscilações ou desvios recorrentes de longo prazo; (c) sazonalidade, resumida em oscilações com padrões entre períodos; (d) termos aleatórios, ocorrem como variações inexplicáveis na sequência dos dados. Para que cada componente possa ser avaliado de forma independente é necessário realizar a decomposição da série temporal, o método clássico de decomposição é composto por dois procedimentos, o aditivo e multiplicativo (HYNDMAN at al., 2018). A equação básica para uma série temporal (Eq. 4) e a equação descritiva para os métodos de decomposição aditivo (Eq. 5) e multiplicativo (Eq. 6) é descrita abaixo: {𝑋}𝑡=1 𝑛 = {𝑋1, 𝑋2, … , 𝑋𝑛} (4) 𝑦𝑡 = 𝑆𝑡 + 𝑇𝑡 + 𝑅𝑡 (5) 𝑌𝑡 = 𝑆𝑡 . 𝑇𝑡. 𝑅𝑡 (6) em que X é o conjunto de observações ordenadas no tempo, T é o termo de tendência, S refere-se ao efeito sazonal, R os componentes aleatórios, respectivamente, todos para o instante t (HYNDMAN at al., 2018). De acordo com Hosseini et al. (2019) é possível realizar predições para dados de CO2 com o uso de modelos matemáticos, como exemplo, o emprego da regressão múltipla para avaliar a evolução da emissão de CO2 no Irã. 3 MATERIAL E MÉTODOS 3.1 Descrição da área de estudo O trabalho foi desenvolvido considerando uma área que compreende as extremidades do estado do Amazonas, Brasil. Os limites definidos para longitude foram das coordenadas -73 a -56, para latitude os extremos foram -10 e 2, valores em coordenadas geográficas (graus decimais). 9 Figura 2. Mapa da área de estudo, localizando o estado do Amazonas, Brasil. O clima da região é definido como tipo A na classificação de Köppen, com presença de três subclimas, sendo eles, Equatorial chuvoso (Af) caracterizado pelas altas precipitações acumuladas, médias acima de 2000 mm ano-1, apresentando período de seca muito pequeno ou até mesmo ausente, Tropical de monção (Am) caracterizado por ter uma precipitação anual semelhante ao Af, porém com a existência de um período seco que pode durar de 1 a 3 meses, e por fim o subclima Tropical seco úmido (Aw) onde o período de seca e chuva são bem definidos, podendo a seca durar de 4 a 6 meses(BASTOS, 1982). De acordo com Maia (2010), os tipos de solo mais encontrados no Amazonas, os Argissolos, representam cerca de 45% do território do estado, Latossolos representam 26%, principalmente os Latossolos Amarelos, que em maioria se concentram na região central do estado. Gleissolos Háplicos e Neossolos Flúvicos são os tipos de solo mais comuns nas várzeas e representam cerca de 9%, sendo a maioria fértil quando localizados às margens de rios. Os Espodossolos ocupam mais de 7% do território do estado e estão localizados principalmente na região norte do 10 Amazonas. Plintissolos tem uma área aproximada de 3,5%, estando presente nos campos e florestas do sul do estado. Outras classes ocorrem em menor percentual da área total, como os Cambissolos da região do Alto Solimões (COELHO et al., 2005). Nas áreas secas da região Amazônica há o predomino de Neossolos Quartzarenos (MARTINS et al., 2007). 3.2 Observatório do Carbono em Órbita (OCO-2) O resultado principal do Orbiting Carbon Observatory-2 é uma série de estimativas georreferenciadas da concentração de CO2 atmosférico (XCO2). XCO2 é a concentração média de dióxido de carbono numa coluna de ar seco que se estende desde a superfície da Terra até a atmosfera. As estimativas de XCO2 são derivadas da medição da proporção de dióxido de carbono para oxigênio molecular no caminho óptico entre o Sol, a superfície da pegada e o instrumento, que é então multiplicado pela concentração média de oxigênio na coluna (0,20935). Essas concentrações de dióxido de carbono e oxigênio são derivadas de espectros de alta resolução coletados pelo instrumento de micro-ondas, que concentra oxigênio no comprimento de onda de 0,765 nm e dióxido de carbono em 1,61 e 2,6 mícrons (Crisp et al., 2012). 3.2.1 Aquisição e processamento dos dados Disponíveis na plataforma GES DISC (“Goddard Earth Siences Data and Information Services Center”) da NASA, os dados do OCO-2 (“Orbiting Carbon Observatory-2”) foram coletados na versão 11.1r, até o presente momento a versão mais recente disponível. O intervalo de leituras baixados para o trabalho foi do período de setembro de 2014 a março de 2023, com uma resolução temporal de 16 , entretanto para criação dos modelos utilizou-se apenas os anos completos, logo de 2015 a 2022. O download das informações foi feito no software R (R CORE TEAM, 2024), bem como seu posterior processamento. Para a aquisição e processamento das informações foi seguido o fluxograma descrito na Figura 3. 11 Figura 3. Fluxograma descrevendo a aquisição e análise dos dados. Os dados coletados anualmente foram processados para criação da série temporal das médias mensais do XCO2. Este processamento inclui as etapas de download, conversão dos arquivos, filtragem para área de interesse, e a validação e tratamento das datas de acordo com o período definido. A vasta extensão dos dados criou a necessidade do processamento particionado, de modo que os anos foram coletados e trabalhados de maneira individual. Cada data frame (DF) anual possui as variáveis: Coordenadas geográficas; time, intervalo de tempo em segundos a partir de 1990; valor estimado do XCO2, valores em ppm; incerteza referente ao valor estimado, valores em ppm; flag de qualidade, valor binomial definido em 0 ou 1. É importante ressaltar que o tratamento das datas se fez necessário, uma vez que era desejável obtê-las em formado de dia, mês e ano. A filtragem das coordenadas seguiu os limites já citados anteriormente. Após a realização dos passos para cada ano, criou-se um DF unindo todas as informações, de modo que o “XCO2_DF” é a união completa dos dados já tratados entre os anos de 2015 e 2022. Download do repositório presente na GES DISC Processamento dos dados Brutos, criação dos Data Frames Delimitação e recorte para o Amazonas Tratamento dos dados Análise de cluster para o agrupamento das regiões Estatística descritiva Criação das Séries temporais Análise temporal da concentração de XCO2 Modelagem estatística das Séries Avalição dos modelos e seus parâmetros 12 3.2.2 Estatística Descritiva A análise descritiva dos dados foi feita com a análise dos parâmetros, como dados faltantes, outliers, valores máximos e mínimos e do cálculo da média, mediana, desvio padrão. As médias foram submetidas à análise de variância com medidas repetidas no tempo (Teste F) para obtenção do erro padrão da média. A avaliação visual da distribuição do XCO2 é feita pela função densidade probabilidade normal, que segue a equação: 𝑓(𝑥) = 1 𝜎√2𝜋 ∗ 𝑒− (𝑥−𝜇)2 2𝜎² (7) Em que: μ e σ representam a média e desvio padrão, respectivamente, da distribuição de probabilidade. 3.2.3 Análise hierárquica de clusters A criação dos clusters necessitou do agrupamento dos dados em regiões representativas. Os dados brutos foram então agregados em quadrantes de 1 por 1 grau decimal, de modo que o par dos valores inteiros das coordenadas nomeia cada quadrante. Logo uma coordenada de longitude -64,4612 e latitude -5,5467 ficará no par -64 e -5. Os pares tiveram como valor analisado as médias anuais, em que cada coluna da análise era a média de um ano, considerando o intervalo de 2015 a 2022, cada linha o agrupamento dos valores em um par de coordenadas respectiva ao seu quadrante. Para o cálculo da dissimilaridade dos quadrantes foi utilizada a distância euclidiana, descrita pela equação abaixo: 𝑑𝑝𝑞 = √∑ (𝑍𝑋𝑗𝑝 − 𝑍𝑋𝑗𝑞)² 𝑘 𝑗=1 (8) A análise hierárquica comumente é ilustrada utilizando um dendrograma, uma exibição visual do processo de agrupamento. As linhas verticais do dendrograma representam agrupamentos de clusters, elas também indicam a distância entre dois clusters conectados. À medida que os grupos se tornam mais heterogêneos, as linhas verticais ficarão mais à direita do gráfico porque representam valores de distância maiores. Enquanto as linhas verticais são indicativas da distância entre os clusters, as 13 linhas horizontais representam as diferenças dessas distâncias (Yim et al., 2015). Para cada variação expressiva nos valores da distância euclidiana é possível realizar uma divisão de grupos, o resultado da análise visual do dendrograma definirá a quantidade de agrupamentos a ser utilizada. 3.3 Criação e modelagem estatística das séries temporais As séries temporais foram baseadas nas médias mensais de XCO2, de modo que para cada cluster foi criado uma série contemplando os anos de 2015 a 2022. Valores faltantes (NAs) das médias mensais são substituídos por interpolação linear com o uso do pacote Zoo (ZEILEIS et al., 2005), na linguagem R. Para cada série foi realizado o corte em duas janelas, entre os anos de 2015 e 2021 definida para o treinamento, e outra com o ano de 2022, utilizada para testar os modelos. O método de Gujarati e Porter (2011) foi utilizado para a retirada da tendência dos dados. Modelos de suavização exponencial e autorregressivos integrados (ARIMA) foram utilizados para prever os dados de XCO2. Os modelos de suavização exponencial são médias ponderadas de observações passadas, com os pesos diminuindo à medida que os dados se afastam dentro da série. Os modelos ARIMA propostos por Box et al. (2015), trouxe a diferenciação como método para a análise de séries temporais não estacionárias, tornando os modelos ARMA ainda mais robustos e desde então classificados também como modelos integrados ARIMA, esse método é conhecido como método Box-Jenkins. 3.3.1 Modelo Suavização Exponencial Está ténica é um modelo estatístico criado na década de 1950 (BROWN, 1959; HOLT, 1957; WINTERS, 1960), a suavização exponencial das médias ponderadas de observações anteriores é capaz de produzir previsões futuras, onde os pesos decaem exponencialmente à medida que as observações se distanciam do valor predito. Os componentes de tendencia e sazonalidade definem a técnica de suavização a ser adotado. Para dados com tendencia e sazonalidade utiliza-se o método ETS (erro, tendencia e sazonalidade), seguindo a classificação descrita na tabela abaixo: Tabela 1. tabela de classificação modelo ETS (erro, tendência e sazonalidade). Erro Tendência Sazonalidade 14 A N N M A A Z M M Z Z Em que: A = aditivo; M = multiplicativo; N = nenhum; Z = automático. Para cada arranjo de modelo é proposto uma fórmula, Hyndman et al. (2018) apresentou o framework com as diversas equações utilizadas para modelos aditivos e multiplicativos. Figura 4. Framework das equações para cada um dos modelos da estrutura ETS. Fonte:(HYNDMAN et al. 2018). O valor predito yt é função do nível (level) no instante t-1 e de um termo de erro, os níveis ℓt são os valores suavizados (smoothed value) da série no instante t, outros MODELOS ADITIVOS MODELOS MULTIPLICATIVOS 15 métodos incluem a tendência bt e o fator sazonal st. Os componentes são suavizados a partir de coeficientes, em que, para os valores de alfa estão compreendidos entre 0 ≤ α ≤ 1, beta 0 ≤ β ≤ 1, fi 0 < ϕ <1 e gama 0 ≤ γ ≤ 1 – α (HYNDMAN et al. 2018). 3.3.2 Modelo ARIMA Antes de definir os conceitos do modelo autorregressivo (AR) é importante discutir a concepção de estacionariedade de séries temporais. Uma série é considerada estacionária quando suas propriedades estatísticas não dependem do momento em que a série é observada, em outras palavras séries com tendência ou sazonalidade não são consideradas estacionárias (HYNDMAN et al. 2018). Um teste simples que nos permite inferir se a série é o ou não estacionária é o teste de autocorrelação (ACF), este método avalia a autocorrelação entre t, t-1, ..., t – n, em que séries não estacionárias apresentam valores altos que decrescem de forma lenta, e séries estacionárias apresenta valores menores que decaem rapidamente para zero. A não estacionariedade das séries resulta em dificuldades de ajuste para modelos AR, de modo que a diferenciação pode transformar séries em estacionárias, este processo se constitui em basicamente realizar a operação: 𝑦′𝑡 = 𝑦𝑡 − 𝑦𝑡−1 (9) Para exemplificar a diferenciação Hyndman et al. (2018) realizou o teste ACF para uma série temporal e posteriormente para os valores da diferença entre os dados da mesma série (Figura 5). Figura 5. Gráficos da ACF para uma série não estacionária (a) e uma estacionária (b). Fonte:(HYNDMAN et al. 2018). O modelo utilizado foi o integrado autorregressivo de médias móveis sazonais, ou ARIMA sazonal, que é complementar a suavização exponencial, visando inferir a) b) 16 observações através da autocorrelação entre os dados da série temporal modelando também os efeitos sazonais. É comum utilizar a notação ARIMA(p,d,q)(P,D,Q)m, o primeiro parênteses diz respeito ao componente não sazonal do modelo, segundo parênteses é referente ao componente sazonal do modelo e o termo m denota o número de períodos considerados. O termo “p” denota a ordem da parte autorregressiva, “d” a ordem da primeira diferenciação e “q” a ordem do componente das médias móveis. Para exemplificar a equação dos modelos ARIMA utilizou-se o modelo ARIMA (1,1,1)(1,1,1)4 como exemplo (HYNDMAN et al. 2018), sendo ele representado pela função: (1 − 𝜙1𝐵) (1 − 𝛷1𝐵4)(1 − 𝐵)(1 − 𝐵4)𝑦𝑡 = (1 + 𝜃1𝐵) (1 + 𝛩1𝐵4)𝜀𝑡 Em que B é referente aos valores anteriores (também chamado de lag) e B4 aos valores anteriores para o período sazonal m = 4. Os efeitos sazonais podem ser facilmente visualizados pelos valores da autocorrelação parcial (PACF) na Figura 6, por exemplo, para o modelo ARIMA (0,0,0) (0,0,0)12 mostrara um decaimento exponencial nos valores anteriores referentes aos períodos de 12, 24, 36, ... (HYNDMAN et al. 2018). Figura 6. Gráficos da PACF para uma série temporal com efeito sazonal. Fonte:(HYNDMAN et al. 2018). 3.3.3 Teste de independência dos resíduos Para identificar se os resíduos estão omitindo informações, ou seja, nos resíduos do modelo existem padrões que não foram captadas pela estimação. Aplicou-se o teste de Ljung-box ao nível de 5% de significância (LJUNG et al., 1978), 17 cuja hipótese nula declara que os resíduos são independentes e identicamente distribuídos (modelo não exibe falhas de ajustes). 3.3.4 Critérios para avaliação dos modelos A capacidade preditiva do modelo é avaliada pelo desempenho dos indicadores estatísticos obtidos. Foi calculado o erro médio absoluto (MEA) (Eq. 10), erro quadrático médio da raiz (RMSE) (Eq. 11), erro padrão médio absoluto (MAPE) (Eq. 12), critério de informação de Akaike (AIC) (Eq. 13), critério de informação bayesiano (BIC) (Eq. 14). 𝑀𝐸𝐴 = ∑ (𝑌𝑜𝑏𝑠1− 𝑌𝑒𝑠𝑡1)𝑁 𝑖=1 𝑁 (10) 𝑅𝑀𝑆𝐸 = √∑ (𝑌𝑜𝑏𝑠1− 𝑌𝑒𝑠𝑡1)2𝑁 𝑖=1 𝑁 (11) 𝑀𝐴𝑃𝐸 = 1 𝑁 ∑ ( |(𝐴𝑖−𝑃𝑖)| 𝐴𝑖 100)𝑁 𝑖=1 (12) 𝐴𝐼𝐶 = 2𝑘 − 2ln (�̂�) (13) 𝐵𝐼𝐶 = −2 𝑙𝑜𝑔 𝑓 (𝑥𝑛|𝜃) + 𝑘 𝑙𝑜𝑔 𝑁 (14) Nas quais: Ai = valor real; Pi = valor previsto; N = número de dados; Xobsi = valores observados de X; Yobsi = valores observados de Y; Ȳ = média observada de Ȳ; k = número de parametros do modelo; �̂� = valor máximo da função de verossimilhança; f (xn|θ) = modelo escolhido. 4 RESULTADOS 4.1 Estatistica Descritiva XCO2 para a série com tendência apresentou média de 407,55 ± 0.01 ppm, mediana 407,20 pmm e desvio padrão 5,52 ppm. Para a série sem tendência os valores foram de média 390,20 ± 0.00387 ppm, mediana 390,20 ppm e desvio padrão 2,34 ppm. A distribuição dos dados na função densidade probabilidade estão nas Figuras 6 e 7, para os dados do XCO2 foi constatado a fuga da normalidade pelo teste Shapiro-wilk (SHAPIRO et al., 1985), entretanto os dados sem efeito de tendência apresentaram aderência a normalidade, com nível de 5% de significância no mesmo teste. 18 Figura 6. histograma para os dados do XCO2, dados para toda área do estudo no intervalo de janeiro de 2015 a dezembro de 2022. Figura 7. histograma para os dados do XCO2 sem tendência, dados para toda área do estudo no intervalo de janeiro de 2015 a dezembro de 2022. 4.2 Análise Hierárquica de Clusters Os quadrantes criados para agrupar o XCO2 foram submetidos à análise de agrupamento hierárquico, o número de cluster foi dimensionado a partir da diferença dos valores euclidianos de 120 para aproximadamente 30 (Figura 8). 19 Figura 8. Dendrograma para os quadrantes do XCO2. O gráfico de distâncias euclidianas (Figura 8) revelou a possibilidade de formação de três clusters distintos, categorizando cada quadrante nos clusters 1, 2 e 3. Os agrupamentos contaram com 92, 86 e 38 quadrantes para os clusters 1, 2 e 3, respectivamente, totalizando 216 quadrantes. Essa organização em clusters nos permitiu modelar diferentes regiões do estado com padrões semelhantes (Figura 9). Figura 9. Mapa da distribuição espacial dos quadrantes agrupados. 20 Visualmente foi possível observar na Figura 9 uma predominância da presença do cluster 1 na região norte, o cluster 3 por sua vez teve sua distribuição mais ao sul do estado do Amazonas e pôr fim ao cluster 2 figurou em uma região intermediária. 4.3 Séries Temporais 4.3.1 Dados Brutos As séries temporais obtidas a partir das médias mensais do XCO2 demonstram o comportamento dos dados para todo o período analisado, sendo estas segmentadas para cada análise realizada. A série completa para toda área (Figura 10) demonstra uma um coeficiente de aumento de 2,256 ppm ano-1 do XCO2 (p < 0,05). Os dados filtrados a partir de cada cluster estão também representados na Figura 9. Para cada cluster a tendência de aumento foi estatisticamente semelhante a presente na série temporal completa (p < 0,05). Figura 10. Série temporal e boxplot do XCO2 sem agrupamento e para os cluster 1, 2 e 3, de janeiro de 2015 a dezembro de 2022. A distribuição dos dados entre anos pode ser observada no gráfico Ridgelines de cada série temporal Figura 11, a distribuição relativa dos dados para cada ano também demonstrou a tendência de aumento observada nas séries temporais (Figura 10). 21 Figura 11. Ridgeline plot das séries temporais sem agrupamento de clusters (a), cluster 1 (b), cluster 2 (c) e cluster 3 (d). 4.3.2 Dados Sem Tendência As séries do XCO2 sem a tendência (beta = 0,0046 ns, p > 0,05) estão apresentadas na Figura 12, em que a filtragem dos clusters também se aplicou. Todos os agrupamentos tiveram o valor do coeficiente angular da série não significativo (p > 0,05), confirmando a ausência de tendência. 22 Figura 12. Série temporal e boxplot sem agrupamento e para os cluster 1, 2 e 3, dos dados do XCO2 sem tendência de janeiro de 2015 a dezembro de 2022. O Ridgeline plot pode ser observado na Figura 13, a remoção da tendência fica evidente também através da distribuição dos dados para cada ano (Figura 13). Figura 13. Ridgeline plot das séries temporais sem tendência, sem agrupamentos(a), cluster 1 (b), cluster 2 (c) e cluster 3 (d). 4.4 Modelos Ets E Arima Para cada série temporal foi aplicado o modelo de suavização exponencial e ARIMA, os modelos foram classificados de acordo com suas nomenclaturas. Para os modelos ETS nas séries sem tendência houve a mesma característica de modelagem, em que com exceção do modelo ETS para o cluster 3, todos utilizaram a técnica multiplicativa para os efeitos de erro, nenhuma para tendência e aditivo para sazonalidade (M, N, A) (tabela 2). Para os modelos ARIMA foi possível identificar o efeito sazonal com uma periodicidade de 12 meses, apenas para os clusters 2 e 3 na série com tendência houve uma distribuição sazonal dispersa (Tabela 2). Tabela 2. Nomenclatura da classificação de cada modelo ETS e ARIMA. CLASSIFICAÇÃO DOS MODELOS Sem tendência Com Tendência ETS ARIMA ETS ARIMA 23 SEM FILTRO DE CLUSTER (M, N , A) (2, 0, 0)(1, 1, 1)[12] (M, A , A) (2, 0, 0)(2, 1, 0)[12] CLUSTER 1 (M, N , A) (2, 1, 1)(2, 1, 0)[12] (M, A , A) (1, 0, 1)(2, 1, 0)[12] CLUSTER 2 (M, N , A) (1, 0, 1)(0, 1, 2)[12] (A, A , A) (0,1,1) CLUSTER 3 (A, N , A) (1, 0, 0)(0, 0, 1)[12] (M, A ,N) (3,1,0) A série temporal com tendência para os quadrantes do cluster 3 apresentaram efeito de paridade dos modelos, efeito já previsto e descrito na literatura, onde um modelo ARIMA é equivalente a um modelo ETS, ocorrendo a correspondência dos efeitos modelados e, portanto, de seus resultados (HYNDMAN et al. 2018). 4.4.1 Indicadores dos Modelos Para a comparação dos modelos foi feito a separação da base de dados em treino e teste, onde o treino do modelo foi feito para o período de 2015-2021 e o teste com o ano de 2022. De maneira geral os ajustes para a etapa de treino foram semelhantes para todos os cenários, em que tanto a remoção da tendência quanto a divisão em clusters não mostrou um ganho significativo dos indicadores dos modelos (Tabela 3). O MAPE médio dos modelos, considerando todos os agrupamentos, variou de 0,1347 para os modelos sem tendência a 0,1335 para os modelos com tendência, respectivamente. De forma semelhante também não houve uma forte distinção entre o desempenho dos modelos ETS e ARIMA, indicando que ambos performaram de maneira semelhante (Tabela 3). Tabela 3. Desempenho dos índices estatísticos para a fase de calibração dos modelos ETS e ARIMA. TREINO Sem tendência Com tendência RMSE MAPE AIC BIC RMSE MAPE AIC BIC SEM FILTRO DE CLUSTER ETS 0.5143 0.0998 290.4575 326.9198 0.4977 0.0951 289.5064 330.8303 ARIMA 0.5433 0.1112 150.8100 162.1900 0.5517 0.1088 146.6700 160.3300 CLUSTER 1 ETS 0.5149 0.1091 290.6921 327.1543 0.4932 0.1002 287.1526 328.4764 ARIMA 0.6087 0.1208 158.3200 171.8900 0.5596 0.1120 148.5000 162.1600 CLUSTER 2 ETS 0.6060 0.1221 318.0481 354.5103 0.5959 0.1183 319.2117 360.5356 ARIMA 0.6435 0.1296 172.1400 183.5300 0.7373 0.1452 192.0700 199.3300 CLUSTER 3 ETS 0.8624 0.1731 377.3128 413.7750 0.9630 0.1937 375.5516 387.7057 ARIMA 1.0301 0.2122 252.0100 261.7400 0.9627 0.1950 237.4300 244.6900 24 Os valores de MAPE variaram de 0,0951 a 0,2122 e RMSE de 0,4932 a 1,0301 ppm, em que os piores indicadores foram os obtidos com a série para o modelo ARIMA na região do cluster 3. A remoção da tendência não apresentou ganhos significativos no poder de ajuste dos modelos para a etapa de calibração (p > 0,05). A serie sem filtragem de cluster teve uma boa performance comparada aos quadrantes agrupados. Para a etapa de teste foi gerado os valores preditos para cada modelo e comparado com os valores reais do ano de 2022, o desempenho dos modelos foi analisado com os indicadores MAPE e RMSE (Tabela 4). Nesse sentido as séries sem tendência apresentaram um ganho significativo (p < 0,05) em sua capacidade preditiva, a aplicação da filtragem dos quadrantes não trouxe vantagens na performance de predição (Tabela 4). Tabela 4. Desempenho dos índices estatísticos para a fase de teste dos modelos ETS e ARIMA. TESTE Sem tendência Com tendência RMSE MAPE RMSE MAPE SEM FILTRO DE CLUSTER ETS 0.7978 0.179774 1.39049 0.287723 ARIMA 0.714839 0.14915 1.173654 0.232138 CLUSTER 1 ETS 1.078871 0.186598 1.449876 0.257402 ARIMA 1.317882 0.225132 1.34225 0.221422 CLUSTER 2 ETS 0.832929 0.174612 1.359493 0.281231 ARIMA 0.788067 0.156875 1.249541 0.211697 CLUSTER 3 ETS 1.532989 0.271693 1.80192 0.35487 ARIMA 1.189341 0.24401 1.774469 0.348086 Os valores de RMSE variaram de 0,788067 a 1,80192 ppm, e para o MAPE valores indo de 0,14915 a 0,35487. Os modelos sem tendência tiveram os melhores indicadores. O método ARIMA performou melhor em termos de RMSE e MAPE, especialmente no caso de dados com tendência, e em alguns clusters. A diferença de performance entre os modelos ETS e ARIMA é menos pronunciada nos dados sem tendência. 4.4.2 TESTE ACF e teste de resíduos de Ljung-box O teste de autocorrelação dos resíduos não apresentou valores de correlação que indicassem falhas de ajuste, demonstrando que os modelos capturaram de forma satisfatória a dinâmica dos dados com tendência (Figura 14). 25 Figura 14. Gráfico ACF para o resíduo dos modelos das séries temporais Com Tendência: A) ETS para série toda; B) ARIMA para série toda; C) ETS cluster 1; D) ARIMA cluster 1; E) ETS cluster 2; F) ARIMA cluster 2; G) ETS cluster 3; H) ARIMA cluster 3. De maneira semelhante foi realizado o teste de autocorrelação para os modelos criados a partir dos dados sem tendência (Figura 15). Indicando de maneira geral que não houve falhas de ajuste decorrente da forte correlação entre os termos de erro. 26 Figura 15. Gráfico ACF para o resíduo dos modelos das séries temporais Sem Tendência: A) ETS para série toda; B) ARIMA para série toda; C) ETS cluster 1; D) ARIMA cluster 1; E) ETS cluster 2; F) ARIMA cluster 2; G) ETS cluster 3; H) ARIMA cluster 3. O método de Ljung-box também foi aplicado para avaliar falhas de ajuste nos modelos para séries temporais. Os valores para todos os modelos caíram na área de aceitação de H0 (Tabela 5), logo, os modelos não exibem falhas de ajuste. Tabela 5. valores da estatística p para o teste Ljung-box dos modelos ETS e ARIMA. Ljung-box teste Sem Tendência Com tendência p-valor p-valor SEM CLUSTER ETS 0.6697 0.7391 ARIMA 0.9743 0.5804 CLUSTER 1 ETS 0.794 0.8751 ARIMA 0.9526 0.8426 ETS 0.7506 0.5057 27 CLUSTER 2 ARIMA 0.6068 0.5124 CLUSTER 3 ETS 0.7917 0.3975 ARIMA 0.6209 0.3221 5 DISCUSSÃO Dados do XCO2 na área estudada apresentaram um efeito sazonal evidente, que ocorre entre o período seco e chuvoso do ano, compreendidos nos meses de abril a setembro e outubro a março respectivamente, esta oscilação anual é conhecida como curva de Keeling (KELLING, 1978; UPRETY e CAO, 2016; PILI e VIOLANDA, 2020). A variação do XCO2 dentro de um mesmo ano é governada pela precipitação, em que na presença da chuva a fotossíntese é estimulada, como efeito deste estímulo há o decréscimo da concentração de CO2 atmosférico, o oposto também se faz verdade (MORAIS FILHO, 2018; ROSSI e SANTOS, 2020). Sabe-se que em ecossistemas de alta umidade, como na Amazônia, também há maior frequência de chuvas (ZHOU et al., 2002). De acordo com Wang et al. (2020) essa correlação entre pluviosidade e concentração de dióxido de carbono é sempre negativa. O componente de tendência da série temporal indicou um aumento sistêmico do XCO2 ao longo do período, independentemente do agrupamento ou não da região através das técnicas não supervisionadas, esse efeito é observado em trabalhos semelhantes para outras regiões (GOLKAR et al., 2022; SHENG et al., 2023; YANG et al., 2023). Esta tendência captura o efeito global do aumento do XCO2, Yang et al. (2023) demonstrou que diferentes projetos e sensores foram capazes de reproduzir esse comportamento, comprovando a acurácia na captura das tendências para dados de GEE com sensoriamento remoto. A Modelagem estatística de dados do XCO2 vem sendo empregada em diversas pesquisas, sobre diferentes perspectivas as ferramentas matemáticas auxiliam a compreensão dos fenômenos observados para os GEE. Wefers et al. (2023) utilizou- se de métodos estatísticos para interpolar dados de satélites e compará-los com dados capturados localmente, concluindo que as abordagens estatísticas apresentaram boa concordância quanto a tendência, sazonalidade e concentração do XCO2. 28 Os Modelos ARIMA e ETS tiveram um ótimo comportamento ao analisar os componentes das séries, capturando os efeitos sazonais e de tendência do XCO2. Para a fase de teste os modelos também performaram de maneira satisfatória, demonstrando como podem ser eficientes quanto a predição dos dados de emissões de GEE, em que, resultados semelhantes são relatados na literatura (DING et al., 2023; TAWIAH et al., 2023). Os métodos autorregressivos e de suavização exponencial apresentaram estabilidade e alternância quanto a seus resultados, evidenciando que para cada situação é possível a aplicabilidade de um em detrimento ao outro. Remover a tendência trouxe ganhos significativos ao poder preditivo dos modelos. Esse efeito é resultado do melhor ajuste a séries estacionárias, em que séries não estacionárias precisam anteriormente passar pelo processo de estacionarização (ROSCA, 2011). A remoção da tendência permite observar o comportamento regional do XCO2, Da Costa et al. (2022) cita a utilização da mesma técnica na região do estado de São Paulo, Brasil, captando efeitos locais e permitindo a modelagem dos valores diários do XCO2. O desempenho da modelagem foi afetado de forma aleatória pelo agrupamento em clusters, não indicando ganhos ou perdas significativas, algo que pode estar implícito em variáveis independentes que se correlacionam com o XCO2, resultado diferente do relatado em pesquisas que utilizaram deste método não supervisionado para identificar regiões semelhantes (YUAN et al., 2012; ZHANG et al., 2024). 6 CONCLUSÕES Os modelos ARIMA e ETS são capazes de realizar a predição e a modelagem do XCO2 no estado do Amazonas, Brasil, fornecendo resultados consistentes para ambas as técnicas. Processos de preparo dos dados otimizaram seus resultados, onde a remoção da tendência permitiu um melhor desempenho na fase de teste para todos os modelos. Estes resultados sugerem sua aplicabilidade para representar e compreender a variação do XCO2, podendo gerar ações e relatórios que visam a mitigação das emissões de GEE. De maneira geral houve um predomínio do método ARIMA em detrimento do método ETS, porém é valido o teste comparativo entre ambos. 29 O sensoriamento remoto como ferramenta para aquisição de dados é uma solução simples e acessível, somada a modelagens estatísticas podem auxiliar países e centros de pesquisa a gerar informações acuradas com um baixo custo, perspectiva que tende a melhorar, devido a evolução do acesso à informação, amadurecimento dos projetos e evolução nos bancos de dados. 30 7 REFERÊNCIAS BASTOS, Terezinha Xavier. O clima da Amazônia Brasileira segundo Köppen. Belém: EMBRAPA-CPATU, 1982. BORDONAL, R. O.; LAL, R. ; RONQUIM, C. C. ; FIGUEIREDO, E. B. ; CARVALHO, J. L. N. ; MALDONADO JR., W. ; MILORI, D. M. B. P. ; LA SCALA JR., N. . Changes 44 in quantity and quality of soil carbon due to the land-use conversion to sugarcane (Saccharum officinarum) plantation in southern Brazil. Agriculture, Ecosystems & Environment (Print), v. 240, p. 54-65, 2017. BROWN, Robert Goodell. Statistical forecasting for inventory control. 1959. BUTZ, André et al. Toward accurate CO2 and CH4 observations from GOSAT. Geophysical Research Letters, v. 38, n. 14, 2011. CERRI, C.C.; BERNOUX, M.; CARVALHO, M.C.S.C. & VOLKOFF, B. Primeiro inventário brasileiro de emissões antrópicas de gases de efeito estufa: Emissões e remoções de dióxido de carbono pelos solos por mudanças de uso da terra e calagem. Brasília, Ministério da Ciência e Tecnologia, 2001. 41p. CROSTA, A. P. Processamento digital de imagens de sensoriamento remoto. UNICAMP/Instituto de Geociências, 1999. CRISP, D., FISHER, B., O'DELL, C., FRANKENBERG, C., BASILIO, R., BOSCH, H., BROWN, L.R., CASTANO, R., CONNOR, B., DEUTSCHER, N.M. and ELDERING, A. The ACOS CO2 retrieval algorithm-Part II: Global XCO2 data characterization, 2012. COELHO, Antonio Augusto Rodrigues; DOS SANTOS COELHO, Leandro. Identificação de sistemas dinâmicos lineares. 2004. 31 COELHO, M. R. Levantamento pedológico de uma área-piloto relacionada ao projeto BiosBrasil (Conservation and sustainable management of below-ground biodiversity: phase I), município de Benjamin Constant (AM). Rio de Janeiro: Embrapa Solos, 2005 COHEN, J.C.P.; BELTRÃO, J. C.; GANDU, A. W.; SILVA, R. R. Influência do desmatamento sobre o ciclo hidrológico na Amazônia. Ciência e Cultura, v. 59, p. 36- 39, 2007. CORREIA, F. W. S.; MANZI, A. O.;CÂNDIDO, L. A.; SANTOS, R. M. N.; PAULIQUEVIS, T. Balanço de umidade na Amazônia e sua sensibilidade às mudanças de cobertura vegetal. Ciência e Cultura, v. 59, p. 39-43, 2007. DE SOUZA, Amaury et al. ANÁLISE DE AGRUPAMENTO DA PRECIPITAÇÃO E DA TEMPERATURA NO MATO GROSSO DO SUL (Cluster analysis of rainfall and temperature in Mato Grosso do Sul). Acta Geográfica, v. 6, n. 12, p. 109-124, 2012. DE SOUZA, Tailan Santos; DOS SANTOS NASCIMENTO, Patricia. Análise multivariada e tendência da precipitação pluviométrica na região hidrográfica do Recôncavo Sul (BA). Geosciences= Geociências, v. 39, n. 1, p. 203-213, 2020. DA COSTA, Luis Miguel et al. An empirical model for estimating daily atmospheric column-averaged CO2 concentration above São Paulo state, Brazil. Carbon Balance and Management, v. 17, n. 1, p. 9, 2022. DING, Song; ZHANG, Huahan. Forecasting Chinese provincial CO2 emissions: A universal and robust new-information-based grey model. Energy Economics, v. 121, p. 106685, 2023. DURAN, Benjamin S.; ODELL, Patrick L. Cluster analysis: a survey. Springer Science & Business Media, 2013. 32 FÁVERO, Luiz Paulo; BELFIORE, Patrícia. Manual de análise de dados: estatística e modelagem multivariada com Excel®, SPSS® e Stata®. Elsevier Brasil, 2017. FISHER, J. B., MALHI, Y., BONAL, D., DA ROCHA, H. R., DE ARAUJO, A. C., GAMO, M., ... & KUMAGAI, T. O. The land–atmosphere water flux in the tropics. Global Change Biology, v. 15, n. 11, p. 2694-2714, 2009 FUNK, R.; PASCUAL, U.; JOOSTEN, H.; DUFFY, C.; PAN, G.; LA SCALA, N.; GOTTSCHALK, P.; BANWART, S. A.; BATJES, N.; CAI, Z.; SIX, J.; NOELLEMEYER, E. From potential to implementation: an innovation framework to realize the benefits of soil carbon. Soil carbon: Science, management and policy for multiple benefits, p. 47- 59, 2015. FORSTER, P.; RAMASWAMY, V.; ARTAXO, Paulo; BERNTSEN, T.; BETTS, R.; FAHEY, D. W.; HAYWOOD, J.; LEAN, J.; LOWE, D. C.; MYHRE, G.; NGANGA, J.; PRINN, R.; RAGA, G.; SCHULZ, M.; VAN DORLAND, R. Changes In Atmospheric Constituents And In Radiative Forcing. In: SOLOMON, S.; QIN, D.; MANNING, M.; CHEN, Z.; MARQUIS, M.; AVERYT, K.; TIGNOR, M. M. B.; MILLER, H. L. (Eds.). Climate Change 2007: The physical science basis. Cambridge: Cambridge University Press, 2007. p. 129–234. GUJARATI, Damodar N.; PORTER, Dawn C. Econometria básica-5. Amgh Editora, 2011. GOLKAR, Foroogh; MOUSAVI, Seyed Mohsen. Variation of XCO2 anomaly patterns in the Middle East from OCO-2 satellite data. International Journal of Digital Earth, v. 15, n. 1, p. 1219-1235, 2022. IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Cidades e Estados, 2022. 33 Holt, C. C. (1957). Forecasting seasonals and trends by exponentially weighted averages (ONR Memorandum No. 52). Carnegie Institute of Technology, Pittsburgh USA. Reprinted in the International Journal of Forecasting, 2004. HORTON, D. E.; JOHNSON, N. C.; SINGH, D.; SWAIN, D. L.; RAJARATNAM, B.; DIFFENBAUGH, N. S. Contribution of changes in atmospheric circulation patterns to extreme temperature trends. Nature, London, v. 522, n. 7557, p. 465–469, 2015. HOSSEINI, Seyed Mohsen et al. Forecasting of CO2 emissions in Iran based on time series and regression analysis. Energy Reports, v. 5, p. 619-631, 2019. HYNDMAN, Rob J.; ATHANASOPOULOS, George. Forecasting: principles and practice. OTexts, 2018. JENSEN, John R.; EPIPHANIO, José Carlos Neves. Sensoriamento remoto do ambiente: uma perspectiva em recursos terrestres. 2009. JOHANSSON, Rolf. System modeling and identification. Prentice-hall, 1993. KEELING, C. D. Atmospheric carbon dioxide in the 19th century. In: Science 202 (4372), STUIVER, Minze. Atmospheric carbon dioxide in the 19th century. Science, v. 202, n. 4372, p. 1109-1109, 1978. LAL, R. Forest soils and carbon sequestration. For. Ecol. Manag., 220:242-258, 2005. LE QUÉRÉ, Corinne et al. Global carbon budget 2015. Earth System Science Data, v. 7, n. 2, p. 349-396, 2015. LJUNG, Greta M.; BOX, George EP. On a measure of lack of fit in time series models. Biometrika, v. 65, n. 2, p. 297-303, 1978. 34 MAIA, MARIA ADELAIDE M. Geodiversidade do estado do Amazonas/Organização Maria Adelaide Mansini Maia [e] José Luiz Marmos. Manaus: CPRM, 2010. MALHI, Y. The carbon balance of tropical forest regions, 1990–2005. Environmental Sustainability, v. 2, p. 237-244, 2010. MARENGO, J. Climatología de la zona de Iquitos, Perú. Geoecologia y desarrollo Amazonico: estudio integrado en la zona de Iquitos, Peru, v. 35, p. 57, 1998. MARTINS, G. C. et al. Ocorrência de horizontes antrópicos (Terra Preta de Índio) em Neossolos Quartzarênicos no município de Parintins–AM-Brasil. In: Congresso Da Abequa: Estudos Do Quaternário e a Responsabilidade Socioambiental. 2007. MORAIS FILHO, Luiz Fernando Favacho. Variabilidade temporal da concentração atmosférica de CO2, fluorescência da clorofila induzida pelo sol e NDVI em áreas com diferentes usos agrícolas no centro-sul do brasil. 2018. NOBRE, Carlos A.; SELLERS, Piers J.; SHUKLA, Jagadish. Amazonian deforestation and regional climate change. Journal of climate, v. 4, n. 10, p. 957-988, 1991. OLIVEIRA, Gilvan Sampaio de; NOBRE, Carlos Afonso. Mudanças Climáticas e Amazônia. O Brasil e o Plano Nacional sobre Mudança do Clima. Fórum Brasileiro de Mudanças Climáticas, Rio de Janeiro, RJ, v. 1, n. 0, p. 43-47, 2008. Disponível em: https://cetesb.sp.gov.br/inventario-gee-sp/wp- content/uploads/sites/34/2014/04/revista_fbmc_nr0.pdf OYAFUSO, Fabiano et al. High accuracy absorption coefficients for the Orbiting Carbon Observatory-2 (OCO-2) mission: Validation of updated carbon dioxide cross- sections using atmospheric spectra. Journal of Quantitative Spectroscopy and Radiative Transfer, v. 203, p. 213-223, 2017. 35 PARAZOO, N. C., C. SWEENEY, R. CHANG, S. WOFSY, R. COMMANE, J. LINDAAS, C. KOVEN, D. LAWRENCE, C. MILLER.: Detecting Regional Patterns of Changing CO2 Flux in Alaska, Proc Natl Acad Sci, 113, 28, 7733-7738. 2016. PHILLIPS, O. L.; ARAGÃO, L.; LEWIS, S. L.; FISCHER, J. B.; LOYD, J.; LOPEZGONZALES, G.; MALHI, Y.; MONTEAGUDO, A.; PEACOCK, J.; QUESADA, C. A. Drought Sensitivity Of The Amazon Rainforest. Science, v. 323, p. 1344-1347, 2009. PILI, U. B.; VIOLANDA, R. R. Extracting Earth’s orbital period from atmospheric CO2 concentrations using the Fourier transform based on Matlab. Physics Education, v. 55, n. 5, p. 055001, 2020. PULROLNIK, K.; BARROS, N. F. D.; SILVA, I. R.; NOVAIS, R. F.; BRANDANI, C. B. Estoques de carbono e nitrogênio em frações lábeis e estáveis da matéria orgânica de solos sob eucalipto, pastagem e cerrado no Vale do Jequitinhonha-MG. Revista Brasileira de Ciência do Solo, v. 33, n. 5, p. 1125-1136, 2009. R ROSCA, Elisabeta. Stationary and non-stationary time series. The USV Annals of Economics and Public Administration, v. 10, n. 1, p. 177-186, 2011. ROSSI, Fernando Saragosa; SANTOS, Gustavo André de Araújo. Fire dynamics in Mato Grosso State, Brazil: the relative roles of gross primary productivity. Big Earth Data, v. 4, n. 1, p. 23-44, 2020. SAATCHI, S. S. et al. Distribution of aboveground live biomass in the Amazon basin. Global change biology, v. 13, n. 4, p. 816-837, 2007. SALATI, Eneas. Mudanças climáticas e o ciclo hidrológico na Amazônia. Causas e Dinâmica do Desmatamento na Amazônia. Ministério do Meio Ambiente, Brasília, DF. 436pp, p. 153-172, 2001. 36 SEEG, OBSERVATÓRIO, DO CLIMA. Sistema de estimativas de emissões e remoções de gases de efeito estufa (SEEG), 2022. SHAPIRO, S. S.; Wilk, M. B. An analysis of variance test for normality (complete samples). Biometrika, v. 52, n. 3–4, p. 591–611, 1965. DOI: 10.1093/biomet/52.3- 4.591. SHENG, Mengya et al. Global land 1° mapping dataset of XCO2 from satellite observations of GOSAT and OCO-2 from 2009 to 2020. Big Earth Data, v. 7, n. 1, p. 170-190, 2023. SMITH, P. Land use change and soil organic carbon dynamics. Nutr. Cycling Agroecosyst., 81:169-178, 2008. TAWIAH, Kassim; DANIYAL, Muhammad; QURESHI, Moiz. Pakistan CO2 emission modelling and forecasting: a linear and nonlinear time series approach. Journal of Environmental and Public Health, v. 2023, 2023. TEAM, R. Core. R: A language and environment for statistical computing. R Foundation for Statistical Computing, 2024. UNH- UNIVERSITY OF NEW HAMPSHIRE. An introduction to the Global Carbon Cycle. Disponível em: , Acesso em 20/03/2024. UPRETY, S.; CAO, C. Radiometric Comparison of 1.6-μ m CO2 Absorption Band of Greenhouse Gases Observing Satellite (GOSAT) TANSO-FTS with Suomi-NPP VIIRS SWIR Band. Journal of Atmospheric and Oceanic Technology, v. 33, n. 7, p. 1443- 1453, 2016. 37 YOKOTA, T. et al. Global concentrations of CO2 and CH4 retrieved from GOSAT: First preliminary results. Sola, v. 5, p. 160-163, 2009. YUAN, Yang et al. Regional allocation of CO2 intensity reduction targets based on cluster analysis. Advances in climate change research, v. 3, n. 4, p. 220-228, 2012. YANG, Hongji et al. Inter-comparison and evaluation of global satellite XCO2 products. Geo-spatial Information Science, p. 1-14, 2023. ZENG, Zhao-Cheng et al. Constraining the vertical distribution of coastal dust aerosol using OCO-2 O2 A-band measurements. Remote Sensing of Environment, v. 236, p. 111494, 2020. ZHANG, Tian et al. CO2 capture and storage monitoring based on remote sensing techniques: A review. Journal of Cleaner Production, v. 281, p. 124409, 2021. ZHOU, J. et al. Submicrometer aerosol particle size distribution and hygroscopic growth measured in the Amazon rain forest during the wet season. Journal of Geophysical Research: Atmospheres, v. 107, n. D20, p. LBA 22-1-LBA 22-10, 2002. WINTERS, Peter R. Forecasting sales by exponentially weighted moving averages. Management science, v. 6, n. 3, p. 324-342, 1960. WEFERS, Wolfgang Marcus et al. Approximation of multi-year time series of XCO2 concentrations using satellite observations and statistical interpolation methods. Atmospheric Research, v. 294, p. 106965, 2023. YIM, Odilia; RAMDEEN, Kylee T. Hierarchical cluster analysis: comparison of three linkage measures and application to psychological data. The quantitative methods for psychology, v. 11, n. 1, p. 8-21, 2015. 1 INTRODUÇÃO 2 REVISÃO DE LITERATURA 2.1 Área de Estudo, Amazonas Brasil 2.2 Ciclo do Carbono 2.3 Sensoriamento remoto para aquisição de dados de CO2 2.4 Técnica não supervisionada para o agrupamento de regiões 2.5 Modelagem de séries temporais 3 MATERIAL E MÉTODOS 3.1 Descrição da área de estudo 3.2 Observatório do Carbono em Órbita (OCO-2) 3.2.1 Aquisição e processamento dos dados 3.2.2 Estatística Descritiva 3.2.3 Análise hierárquica de clusters 3.3 Criação e modelagem estatística das séries temporais 3.3.1 Modelo Suavização Exponencial 3.3.2 Modelo ARIMA 3.3.3 Teste de independência dos resíduos 3.3.4 Critérios para avaliação dos modelos 4 RESULTADOS 4.1 Estatistica Descritiva 4.2 Análise Hierárquica de Clusters 4.3 Séries Temporais 4.3.1 Dados Brutos 4.3.2 Dados Sem Tendência 4.4 Modelos Ets E Arima 4.4.1 Indicadores dos Modelos 4.4.2 TESTE ACF e teste de resíduos de Ljung-box 5 DISCUSSÃO 6 CONCLUSÕES 7 REFERÊNCIAS